Spark Chemistry-X1-13B – 科大讯飞开源的化学模型,助力化学研究和药物设计科大讯飞正式宣布讯飞星火化学大模型 Spark Chemistry-X1-13B 与讯飞文生音频模型 AudioFly 全面开源,在论文研读、专业学术翻译、英文润色及文献综述生成等能力上表现优异,助力...发现资讯4个月前06210
FLM-Audio – 智源研究院开源的全双工音频对话模型,支持本地部署与二次开发flm-audio 是由北京智源人工智能研究院联合 spin matrix 与新加坡南洋理工大学共同推出的原生全双工音频对话大模型,支持中文和英文双语交互。该模型采用创新的原生全双工架构,能够在每一个...发现资讯4个月前04660
Castwise – AI播客内容转化工具,将播客音频快速转化为多种格式的内容CreateWise AI 是一款利用人工智能技术为播客提供内容生成服务的工具。其主要优点在于快速生成节目笔记、剪辑和亮点,帮助节目制作者节省大量时间和精力。 Castwise是什么 Castwise...发现资讯4个月前05760
AudioFly – 科大讯飞开源的文生音效模型,支持本地部署、推理和微调。主要介绍 AudioFly是科大讯飞推出的开源文生音效模型,基于潜在扩散模型(LDM)架构,能够根据文本描述生成高质量音频。该模型支持44.1kHz采样率,在文本与音效的匹配度上表现优异,适用于短视频...发现资讯4个月前05130
Vidu Q2 – 生数科技推出的新一代图生视频模型,适合制作高质量视频生数科技推出了新一代图生视频大模型 ——Vidu Q2,为用户提供了前所未有的视觉体验。Vidu Q2的最大亮点在于其对极致表情变化的精准捕捉,结合了推拉运镜技术,提升了视频的生成速度与语义理解能力...发现资讯4个月前05710
Neovate Code – 蚂蚁集团开源的AI编程助手,支持开发者用自然语言描述编程需求neovate code 是由蚂蚁集团推出的开源智能编程助手,致力于全面提升开发效率。该工具具备深度理解代码库的能力,能够遵循项目现有的编码风格,支持通过插件系统灵活扩展功能。目前以命令行工具(cli...发现资讯4个月前05300
CWM – Meta开源的代码世界模型,自动化修复代码中的错误Meta 刚发布的这个 CWM,是一个 320 亿参数的开放权重 LLM,以推动基于世界模型的代码生成研究。该模型通过模拟代码执行过程,不仅生成代码,还能理解代码的动态行为,预测执行结果,并具备自我调...发现4个月前04110
AI Quests – 谷歌联合斯坦福推出的AI教育工具,帮助学生理解AI的实际应用谷歌推出了一款专为11-14岁学生设计的免费教育游戏化产品“AI Quests”,旨在通过沉浸式游戏体验提升学生的AI素养。AI Quests的独特之处在于它与谷歌的实际研究紧密联系,将中学生与前沿科...发现资讯4个月前05720
Mixboard – 谷歌推出的AI画板工具,快速将想法可视化谷歌推出实验性 AI 工具 Mixboard,该工具由Banana提供支持,号称能把任何想法都即时可视化。主打“开放画布”与生成式 AI 创意,可从文本提示或预制板开始,生成包括家居装饰、产品设计等多...发现资讯4个月前05430
MiroFlow v0.2 – MiroMind开源的研究智能体框架,协调多个工具和子智能体完成任务MiroFlow v0.2是MiroMind团队开发的开源研究智能体框架,旨在将任意大型语言模型(LLM)的能力提升至媲美OpenAI深度研究级别的水平。其核心设计聚焦于高效、可靠地执行复杂工具调用任...发现资讯5个月前05130