Vidu Q2 – 生数科技推出的新一代图生视频模型,适合制作高质量视频生数科技推出了新一代图生视频大模型 ——Vidu Q2,为用户提供了前所未有的视觉体验。Vidu Q2的最大亮点在于其对极致表情变化的精准捕捉,结合了推拉运镜技术,提升了视频的生成速度与语义理解能力...发现资讯2周前0890
Neovate Code – 蚂蚁集团开源的AI编程助手,支持开发者用自然语言描述编程需求neovate code 是由蚂蚁集团推出的开源智能编程助手,致力于全面提升开发效率。该工具具备深度理解代码库的能力,能够遵循项目现有的编码风格,支持通过插件系统灵活扩展功能。目前以命令行工具(cli...发现资讯2周前01260
CWM – Meta开源的代码世界模型,自动化修复代码中的错误Meta 刚发布的这个 CWM,是一个 320 亿参数的开放权重 LLM,以推动基于世界模型的代码生成研究。该模型通过模拟代码执行过程,不仅生成代码,还能理解代码的动态行为,预测执行结果,并具备自我调...发现2周前01200
AI Quests – 谷歌联合斯坦福推出的AI教育工具,帮助学生理解AI的实际应用谷歌推出了一款专为11-14岁学生设计的免费教育游戏化产品“AI Quests”,旨在通过沉浸式游戏体验提升学生的AI素养。AI Quests的独特之处在于它与谷歌的实际研究紧密联系,将中学生与前沿科...发现资讯2周前01120
Mixboard – 谷歌推出的AI画板工具,快速将想法可视化谷歌推出实验性 AI 工具 Mixboard,该工具由Banana提供支持,号称能把任何想法都即时可视化。主打“开放画布”与生成式 AI 创意,可从文本提示或预制板开始,生成包括家居装饰、产品设计等多...发现资讯2周前01190
Qwen3-Max – 阿里通义推出的超大规模模型,支持灵活调用外部工具完成复杂任务阿里通义旗舰模型Qwen3 - Max重磅登场,性能超过GPT5、Claude Opus4等,位居全球前三,Qwen3-Max 能在几秒内完成成熟程序员大半天才能实现的编程任务,展现出卓越的指令理解和...发现资讯2周前01260
MiroFlow v0.2 – MiroMind开源的研究智能体框架,协调多个工具和子智能体完成任务MiroFlow v0.2是MiroMind团队开发的开源研究智能体框架,旨在将任意大型语言模型(LLM)的能力提升至媲美OpenAI深度研究级别的水平。其核心设计聚焦于高效、可靠地执行复杂工具调用任...发现资讯2周前01130
IndexTTS2 – B站开源的最新文本转语音模型,可精准模仿该音频的声线哔哩哔哩(B 站)Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0,它支持两种生成模式:一种明确指定生成的标记数量以精确控制语音持续时间;另一种以自回归的...发现资讯2周前01220
Mini-o3 – 字节联合港大推出的视觉推理模型,支持多轮交互推理自字节跳动和香港大学的研究团队推出了 Mini-o3,一个旨在复现OpenAI强大但未公开的o3模型能力的开源系统。Mini-o3的核心目标是扩展模型与工具的交互能力,使其能够执行长达数十步的深度推理...发现资讯2周前01340
WebWeaver – 阿里通义开源的双Agent框架,提高研究效率和质量WebWalker是阿里巴巴通义实验室提出的一个用于提升大型语言模型(LLM)网页信息检索能力的框架,它是一个基于阿里通义大模型(通义千问)的开源框架,旨在通过对话式AI助手(Agent)来提升用户与...发现资讯2周前01360