Kyutai TTS – Kyutai Labs开源最新流式文本转语音技术法国AI研究机构Kyutai Labs宣布开源其最新文本转语音(TTS)技术——Kyutai TTS,为开发者与AI爱好者带来高效、实时的语音生成解决方案。Kyutai TTS以低延迟与高保真声音为亮...发现资讯7个月前09770
Skywork MindLink:昆仑万维全新开源推理大模型,推理模型崭新探索在人工智能领域,大型语言模型(LLM)正以前所未有的速度发展,不断刷新着我们对机器智能的认知。其中,昆仑万维刚刚发文,宣布推出并开源全新推理大模型 Skywork MindLink模型,凭借其独特的自...发现资讯7个月前09760
谱乐AI – AI音乐生成平台,快速生成匹配的音乐作品,满足不同场景需求谱乐AI是一款集AI音乐生成、音频处理、混音编辑与全球发行于一体的一站式音乐创作平台,让任何人都能像专业音乐人一样,从创意到成品全流程完成音乐制作。谱乐AI是人工智能技术打造的专业音乐生成工具,致力于...发现资讯6个月前09710
微博视频下载详细教程随着智能手机的普及和社交媒体的盛行,视频已经成为了我们日常生活中不可或缺的一部分。很多时候我们都会遇到一个让人烦恼的问题:有些视频我们想保存,但却因为种种原因,无法轻松下载或者保存到设备里。对于我们这...发现7个月前09650
飞书推出的AI应用 aPaaS –低代码 高效开发智能系统平台 全新升级的飞书aPaaS专注于企业级复杂系统的AI协同开发,开创“AI辅助+PaaS平台”新范式。平台深度融入开发Agent,覆盖页面搭建、数据建模、流程配置及代码编写,并提供关键的企业级能力(权限...发现资讯7个月前09580
MineContext – 字节开源的主动式上下文感知 AI 工具,支持多模态信息处理MineContext是字节跳动开源的主动式上下文感知AI工具,通过屏幕截图和内容理解帮助用户管理数字工作环境,支持自动生成摘要、待办清单等功能,所有数据本地处理以保障隐私安全。它会根据用户的上下...发现资讯4个月前09460
Sora 2 – OpenAI 推出的新一代AI音视频生成模型,首次实现了环境音效与画面动态同步生成OpenAI推出的新一代视频生成模型Sora 2,首次实现了音频与画面的智能同步生成。新模型通过多模态融合算法,能够理解视频内容的情绪基调、场景特征和动作节奏,并据此生成匹配的背景音乐、环境音效甚至人...发现资讯4个月前09360
Matrix-Game 2.0 – 昆仑万维发布并开源自研的交互式世界模型昆仑万维发布并开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——“Matrix-Game 2.0”。为促进交互式世界模型领域的发展,「Matrix-Game 2.0」全...发现资讯7个月前09350
ThinkSound – 阿里通义开源首个CoT音频生成模型,生成音画同步的高保真音频近日,阿里语音AI团队宣布开源全球首个支持链式推理的音频生成模型ThinkSound,该模型首次将CoT(Chain-of-Thought,思维链)技术引入音频生成领域,实现通过多步骤推理模拟专业音效...发现资讯8个月前09280
Fish Audio – AI语音合成工具,精准克隆多种语音Fish.audio 是一个基于 AI 技术的音频处理与创作平台,主要提供语音克隆、AI 音效生成、文本转语音(TTS)和语音转文本等功能。该平台由 Fish Speech 开发团队开发,支持多种语言...发现资讯7个月前09270