Hunyuan-MT-7B - 腾讯开源的轻量级翻译模型,能快速准确地完成翻译任务Hunyuan-MT-7B是什么 Hunyuan-MT-7B 是腾讯混元发布的轻量级翻译模型,参数量为70亿,支持33个语种及5种民汉语言/方言的互译,包括粤语、维吾尔语、藏语等。模型采用完整的训练范...发现资讯1周前0280
EchoMimicV3 – 蚂蚁集团推出的多模态数字人视频生成框架,实现高效的模型训练和快速的动画生成。EchoMimicV3 是由蚂蚁集团研发的一款高效、多模态、多任务的数字人视频生成框架。该模型拥有 13 亿参数,采用任务混合与模态混合的创新范式,结合独特的训练与推理策略,能够在多种输入条件下实现快...发现资讯1周前0430
VibeVoice – 微软推出的开源文本转语音模型,支持动态对话和交互式应用近日,微软研究院提出了一种全新的语音生成模型 VibeVoice。它能够将文字脚本直接转化为流畅、自然的长对话音频。创作者无需再为音色匹配、语速调整、对话间隔等细节问题耗费精力,只需提供一份带角色标注...发现资讯1周前0470
DeepCode – 港大实验室推出的多Agent代码生成平台,支持扩展且功能丰富的后端代码DeepCode是一款全新的开源Agentic编程平台,能够将所有应用程序、工具和AI代理集中在一个统一的环境中。可将研究论文与自然语言需求自动转化为可生产部署的前端、后端或完整应用代码。 DeepC...发现资讯1周前0440
deepfig重塑企业运营,开启智能自动化新时代Deepfig是什么? Deepfig是一款领先的智能自动化工作流平台。它致力于解决企业日常运营中面临的流程碎片化、数据孤岛、人工操作效率低下等核心痛点。通过其强大的集成能力和可视化设计,Deepfi...发现资讯1周前0540
Step-Audio 2 mini - 阶跃星辰开源的端到端语音模型,能精准理解各种音频内容Step-Audio 2 mini是什么 Step-Audio 2 mini是阶跃星辰推出的开源端到端语音模型。突破传统语音模型结构,采用真端到端多模态架构,直接将原始音频输入转化为语音响应输出,时延...发现资讯1周前0540
AutoClip – 开源免费AI视频剪辑工具,自动识别高光片段,处理成功率高达95%以上AutoClip 是一个智能视频剪辑和内容推荐系统,专为内容创作者、视频编辑者和广大视频爱好者设计,工具能自动识别视频中的高光片段,精准切片并生成优化后的标题,提升内容吸引力。工具支持B站视频下载和字...发现资讯1周前01480
Elser AI –动漫创作的生成式人工智能平台 ,一键生成高质量动漫内容创作Elser AI 是一款免费且功能强大的 AI 漫画生成器,旨在帮助用户轻松创作出精美的漫画作品。它支持用户多次免费生成漫画,尤其适用于长篇漫画的创作,并采用技术手段确保人物形象的统一性。只需简单三步...发现资讯1周前01100
AIRI – 开源的AI多模态数字桌面伴侣,用户可以通过文字或语音与数字伴侣进行交流 AIRI——一个能自己部署的虚拟伴侣系统。它不只是聊天机器人,还能陪你打游戏、实时语音互动,甚至作为桌宠常驻桌面。最吸引我的是它的开源属性和可定制性,所有数据都在本地运行,隐私无忧。它基于现代W...发现资讯1周前0590
Sim – 开源的AI Agent工作流构建工具,帮助开发者提高代码质量和审查效率Sim 是开源的 AI 工作流构建工具,专为简化 AI 应用开发而设计。工具用直观的拖拽界面,让用户无需深入编码能快速搭建 AI 工作流。Sim是一个轻量级、用户友好的平台,旨在帮助用户快速构建和部署...发现资讯1周前0710