IndexTTS2 – B站开源的最新文本转语音模型,可精准模仿该音频的声线哔哩哔哩(B 站)Index 团队宣布全面开源其自主研发的文本转语音(TTS)系统 ——IndexTTS-2.0,它支持两种生成模式:一种明确指定生成的标记数量以精确控制语音持续时间;另一种以自回归的...发现资讯2周前01190
Strix – 开源AI安全测试工具,全面漏洞检测,支持多种测试场景Strix是一款由开源社区开发的AI安全测试工具,主要用于模拟黑客攻击场景,自动发现并验证软件漏洞,Strix依靠大语言模型(LLM)驱动的多智能体架构,不止能动态执行代码、操控HTTP请求,还能直接...发现资讯4周前01570
Stand-In – 腾讯微信推出的视频生成框架,支持生成具有高保真度的文本内容腾讯发布了一个全新的开源项目——Stand-In,它是一个轻量级、即插即用的身份保留视频生成框架,不仅支持生成具有高保真度的文本到视频(Text-to-Video,T2V)内容,还能进行换脸、姿态控制...发现资讯4周前01710
HuMo – 清华联合字节推出的多模态视频生成框架,实现最高级别定制和控制。字节开源的Humo模型支持文生视频、图生视频及音频生成视频,可结合文本、图像与音频多模态输入,并支持多图参考合成。HuMo 框架具备强大的多模态输入处理能力,可以同时利用文本、图像和音频三种信息,协同...发现资讯4周前01410
MiniMax Music 1.5 - MiniMax推出的新一代音乐生成模型,支持最长4分钟的音乐生成MiniMax最新发布的Music1.5音乐生成模型,如同一位多才多艺的音乐大师,能够在短短几分钟内创造出完整的4分钟歌曲作品。用户只需用日常对话的方式告诉它想要什么样的音乐,比如描述一段欢快的春日时...发现资讯4周前01660
混元图像2.1 – 腾讯开源的文生图模型,支持2K分辨率的图像生成腾讯Hunyuan团队正式开源HunyuanImage2.1,该模型支持原生2048x2048分辨率输出,并显著提升文本生成能力,尤其在双语(中英)支持和复杂语义理解上表现出色。该模型增强了语义一致性...发现资讯4周前01060
SpikingBrain-1.0 – 中国科学院推出的类脑脉冲大模型,能实现数量级的效率提升近日,中国科学院自动化研究所科研团队成功研发出首款类脑脉冲大模型SpikingBrain-1.0。SpikingBrain-1.0在多个性能方面实现突破:实现极低数据量高效训练、实现推理效率数量级提升...发现资讯4周前01300
上海AI Lab开源的大模型推理部署工具–LMDeploy ,能显著提升大语言模型的推理速度LMDeploy 是上海人工智能实验室推出的大模型推理部署工具,专注于提升大模型推理性能并优化硬件资源利用,能显著提升大模型的推理性能,支持多种硬件架构,包括 NVIDIA 的 Hopper 和 Am...发现资讯4周前01590
HeyGen一在线视频创作平台HeyGen是一个在线视频创作平台,专注于利用人工智能技术生成数字人视频。它利用生工智能的力量来简化您的视频创作过程。用HeyGen释放你的创造力-视频制作的未来。HeyGen支持40多种语言和不同的...发现资讯1个月前02410
白嫖党狂喜!GPT Plus / Business 免费试用 1 个月来啦!很多人想体验 GPT Plus,却一直舍不得开会员。现在机会来了! 官方放福利:GPT Plus 和 Business 会员限时免费试用一个月! Plus:更快更强,写论文、写代码效率直接翻倍。 Bu...资讯# GPT Plus1个月前02120