FLM-Audio – 智源研究院开源的全双工音频对话模型,支持本地部署与二次开发flm-audio 是由北京智源人工智能研究院联合 spin matrix 与新加坡南洋理工大学共同推出的原生全双工音频对话大模型,支持中文和英文双语交互。该模型采用创新的原生全双工架构,能够在每一个...发现资讯1周前0860
Castwise – AI播客内容转化工具,将播客音频快速转化为多种格式的内容CreateWise AI 是一款利用人工智能技术为播客提供内容生成服务的工具。其主要优点在于快速生成节目笔记、剪辑和亮点,帮助节目制作者节省大量时间和精力。 Castwise是什么 Castwise...发现资讯1周前0860
AudioFly – 科大讯飞开源的文生音效模型,支持本地部署、推理和微调。主要介绍 AudioFly是科大讯飞推出的开源文生音效模型,基于潜在扩散模型(LDM)架构,能够根据文本描述生成高质量音频。该模型支持44.1kHz采样率,在文本与音效的匹配度上表现优异,适用于短视频...发现资讯1周前01270
Vidu Q2 – 生数科技推出的新一代图生视频模型,适合制作高质量视频生数科技推出了新一代图生视频大模型 ——Vidu Q2,为用户提供了前所未有的视觉体验。Vidu Q2的最大亮点在于其对极致表情变化的精准捕捉,结合了推拉运镜技术,提升了视频的生成速度与语义理解能力...发现资讯1周前0860
Neovate Code – 蚂蚁集团开源的AI编程助手,支持开发者用自然语言描述编程需求neovate code 是由蚂蚁集团推出的开源智能编程助手,致力于全面提升开发效率。该工具具备深度理解代码库的能力,能够遵循项目现有的编码风格,支持通过插件系统灵活扩展功能。目前以命令行工具(cli...发现资讯1周前01120
AI Quests – 谷歌联合斯坦福推出的AI教育工具,帮助学生理解AI的实际应用谷歌推出了一款专为11-14岁学生设计的免费教育游戏化产品“AI Quests”,旨在通过沉浸式游戏体验提升学生的AI素养。AI Quests的独特之处在于它与谷歌的实际研究紧密联系,将中学生与前沿科...发现资讯2周前0950
Mixboard – 谷歌推出的AI画板工具,快速将想法可视化谷歌推出实验性 AI 工具 Mixboard,该工具由Banana提供支持,号称能把任何想法都即时可视化。主打“开放画布”与生成式 AI 创意,可从文本提示或预制板开始,生成包括家居装饰、产品设计等多...发现资讯2周前0890
MiroFlow v0.2 – MiroMind开源的研究智能体框架,协调多个工具和子智能体完成任务MiroFlow v0.2是MiroMind团队开发的开源研究智能体框架,旨在将任意大型语言模型(LLM)的能力提升至媲美OpenAI深度研究级别的水平。其核心设计聚焦于高效、可靠地执行复杂工具调用任...发现资讯2周前0910
Qwen3-Max – 阿里通义推出的超大规模模型,支持灵活调用外部工具完成复杂任务阿里通义旗舰模型Qwen3 - Max重磅登场,性能超过GPT5、Claude Opus4等,位居全球前三,Qwen3-Max 能在几秒内完成成熟程序员大半天才能实现的编程任务,展现出卓越的指令理解和...发现资讯2周前0950
CUDA+cuDNN+pytorch安装,让你的comfyUI起飞!今天就带大家把CUDA、cuDNN还有pytorch安装一下,让 comfyUI提个速。 在没安装前,我用kontext跑了一张图,时间达到了285秒。 一、安装CUDA 1、在安装前要先确定你的电脑...科技资讯# comfyui2周前01210