AIRI – 开源的AI多模态数字桌面伴侣,用户可以通过文字或语音与数字伴侣进行交流 AIRI——一个能自己部署的虚拟伴侣系统。它不只是聊天机器人,还能陪你打游戏、实时语音互动,甚至作为桌宠常驻桌面。最吸引我的是它的开源属性和可定制性,所有数据都在本地运行,隐私无忧。它基于现代W...发现资讯5个月前06670
Elser AI –动漫创作的生成式人工智能平台 ,一键生成高质量动漫内容创作Elser AI 是一款免费且功能强大的 AI 漫画生成器,旨在帮助用户轻松创作出精美的漫画作品。它支持用户多次免费生成漫画,尤其适用于长篇漫画的创作,并采用技术手段确保人物形象的统一性。只需简单三步...发现资讯5个月前01.3K0
AutoClip – 开源免费AI视频剪辑工具,自动识别高光片段,处理成功率高达95%以上AutoClip 是一个智能视频剪辑和内容推荐系统,专为内容创作者、视频编辑者和广大视频爱好者设计,工具能自动识别视频中的高光片段,精准切片并生成优化后的标题,提升内容吸引力。工具支持B站视频下载和字...发现资讯5个月前05.2K0
ReadyBase – AI PDF生成平台,几秒钟即可生成精美个性化文档ReadyBase AI PDF生成平台是一款利用人工智能技术自动布局生成个性化文档的强大工具。它可以帮助用户快速创建专业、美观的PDF文档,无需手动调整格式或设计,大大提高了文档制作的效率和质量。 ...发现资讯5个月前06510
DeepCode – 港大实验室推出的多Agent代码生成平台,支持扩展且功能丰富的后端代码DeepCode是一款全新的开源Agentic编程平台,能够将所有应用程序、工具和AI代理集中在一个统一的环境中。可将研究论文与自然语言需求自动转化为可生产部署的前端、后端或完整应用代码。 DeepC...发现资讯5个月前05890
VibeVoice – 微软推出的开源文本转语音模型,支持动态对话和交互式应用近日,微软研究院提出了一种全新的语音生成模型 VibeVoice。它能够将文字脚本直接转化为流畅、自然的长对话音频。创作者无需再为音色匹配、语速调整、对话间隔等细节问题耗费精力,只需提供一份带角色标注...发现资讯5个月前05510
EchoMimicV3 – 蚂蚁集团推出的多模态数字人视频生成框架,实现高效的模型训练和快速的动画生成。EchoMimicV3 是由蚂蚁集团研发的一款高效、多模态、多任务的数字人视频生成框架。该模型拥有 13 亿参数,采用任务混合与模态混合的创新范式,结合独特的训练与推理策略,能够在多种输入条件下实现快...发现资讯5个月前05000
Wav2Lip – 开源的高保真唇形同步工具,自动生成与语音同步的口型动画Wav2Lip 是一个 口型同步技术开源项目,可以在任意语音对任意说话的脸部视频进行口型同步。旨在提升视频中唇部同步的保真度。此项目通过 Wav2Lip 实现精确的唇动匹配,再利用 Real-ESRG...发现资讯5个月前07130
SpatialGen – 群核科技开源的3D场景生成模型,生成具有时空一致性的多视角图像SpatialGen是一款基于扩散模型架构的多视角图像生成模型,可根据文字、参考图和3D空间布局,生成具有时空一致性的多视角图像。SpatialGen 可根据文字描述、参考图像和3D空间布局,生成具有...发现资讯5个月前07910
Jetson Thor – 英伟达推出的机器人AI计算平台,兼容多种生成式AI框架,能构建丰富生态系统。英伟达正式发布机器人专用计算平台Jetson Thor,其AI算力达到前代产品的7.5倍(即提升6.5倍),能效提高3.5倍。 开发者套件售价3499美元,量产模组批量采购价低至2999美元。Jets...发现资讯5个月前06250