Z-Image – 阿里通义推出的图像生成模型,能快速生成高质量的逼真图像随着AI大模型的快速发展,越来越多的用户使用AI来辅助工作、提高效率。阿里通义大模型官方最新发布的生图模型 Z-Image 上线后迅速登顶 Hugging Face 趋势榜双榜第一,模型发布首日下载量...资讯3个月前04740
ViMax – 港大开源的多智能体视频生成框架,导演、编剧、制片人和视频生成器ViMax 是一个多智能体视频生成框架,支持自动化多镜头视频生成,并确保角色与场景的一致性。该框架集导演、编剧、制片人和视频生成器功能于一体,支持多种模式生成分钟级长视频,保持人物与场景一致性。ViM...资讯3个月前04130
FLUX.2 – Black Forest Labs开源的AI图像生成与编辑模型,支持同时参考多达10张图片视觉智能实验室 Black Forest Labs 推出了其新一代图像生成模型 FLUX.2,该模型专为实际创作工作流程设计。该模型在细节生成、风格一致性、文本渲染和复杂指令遵循方面均有显著提升。模...资讯3个月前04370
零一万物联合开源中国发布–Open AgentKit 平台,支持高效架构设计和协作,快速搭建复杂的Agent系统。零一万物与开源中国联合发布的Open AgentKit(OAK)平台,一款专为开发者打造的AI Agent一站式开发开源解决方案。该平台支持对接多种开源大模型,旨在与全球开发者共同打造一款开放、通用的...发现资讯3个月前05650
全球 首个AI原生社交平台 –焦圈儿,分支追问 与 “一键复刻” 两大核心功能全球首个AI原生社交平台——“焦圈儿” 正式亮相。通过其首创的 “分支追问” 与 “一键复刻” 两大核心功能,首次将“群体智慧”引入人机交互过程,标志着AI应用从“工具能力竞赛”迈入“使用效率革命”的...发现资讯3个月前05300
AI Research Foundations – 谷歌与UCL联合推出的AI研究基础课程,手把手教你如何构建和微调技巧。谷歌与伦敦大学学院(UCL)合作推出的“AI研究基础”(AI Research Foundations)课程是一套免费的、面向大学水平的学习资源,旨在通过实用的、专门构建的内容,赋予学习者进行高影响力...发现资讯3个月前03550
LongCat-Flash-Omni – 美团开源的实时交互全模态大模型,支持文本、语音、图像和视频的多模态输入与输出美团正式发布LongCat-Flash-Omni,业界首个实现全模态覆盖、端到端架构、大参数量高效推理于一体的开源大语言模型。,LongCat-Flash-Omni 在全模态基准测试中达到开源最先进水...发现资讯3个月前04050
SWE-1.5 – Cognition 推出的高性能AI编程模型,支持多轮交互式编程SWE-1.5 是由 AI 编程公司 Cognition 推出的最新高性能 AI 编程模型,其模型本身、推理过程与智能体框架经过协同设计,共同构成一个统一系统,以此同时实现高速与智能。旨在为软件工程任...发现资讯3个月前05940
Game-TARS -字节跳动推出的通用型游戏智能体,提升任务完成率和交互智能字节跳动Seed团队打造的通用型游戏智能体Game-TARS,打破了传统游戏AI的局限。Game-TARS的核心创新,就是彻底抛弃了这种定制化思路,让AI像人一样通过最底层的键盘和鼠标动作与游戏交互...发现资讯3个月前05500
LTX-2 – Lightricks推出的AI视频生成模型,推理效率比前代模型快2 – 3倍Lightricks推出开源AI视频模型LTX-2,支持原生4K分辨率与同步音频生成。LTX-2模型采用原生4K生成技术,无需后期放大即可输出50fps高帧率视频,生成速度超越播放速度,实现"6秒视频...发现资讯3个月前06770