发现 | 第7页 | up导航

发现科技资讯

排序

发布更新浏览点赞

Kyutai TTS – Kyutai Labs开源最新流式文本转语音技术

法国AI研究机构Kyutai Labs宣布开源其最新文本转语音（TTS）技术——Kyutai TTS，为开发者与AI爱好者带来高效、实时的语音生成解决方案。Kyutai TTS以低延迟与高保真声音为亮...

发现资讯

7个月前

09770

Skywork MindLink：昆仑万维全新开源推理大模型，推理模型崭新探索

在人工智能领域，大型语言模型（LLM）正以前所未有的速度发展，不断刷新着我们对机器智能的认知。其中，昆仑万维刚刚发文，宣布推出并开源全新推理大模型 Skywork MindLink模型，凭借其独特的自...

发现资讯

7个月前

09760

谱乐AI – AI音乐生成平台，快速生成匹配的音乐作品，满足不同场景需求

谱乐AI是一款集AI音乐生成、音频处理、混音编辑与全球发行于一体的一站式音乐创作平台，让任何人都能像专业音乐人一样，从创意到成品全流程完成音乐制作。谱乐AI是人工智能技术打造的专业音乐生成工具，致力于...

发现资讯

6个月前

09710

微博视频下载详细教程

随着智能手机的普及和社交媒体的盛行，视频已经成为了我们日常生活中不可或缺的一部分。很多时候我们都会遇到一个让人烦恼的问题：有些视频我们想保存，但却因为种种原因，无法轻松下载或者保存到设备里。对于我们这...

发现

7个月前

09650

飞书推出的AI应用 aPaaS –低代码高效开发智能系统平台

全新升级的飞书aPaaS专注于企业级复杂系统的AI协同开发，开创“AI辅助+PaaS平台”新范式。平台深度融入开发Agent，覆盖页面搭建、数据建模、流程配置及代码编写，并提供关键的企业级能力（权限...

发现资讯

7个月前

09580

MineContext – 字节开源的主动式上下文感知 AI 工具，支持多模态信息处理

‌MineContext是字节跳动开源的主动式上下文感知AI工具‌，通过屏幕截图和内容理解帮助用户管理数字工作环境，支持自动生成摘要、待办清单等功能，所有数据本地处理以保障隐私安全。它会根据用户的上下...

发现资讯

4个月前

09460

Sora 2 – OpenAI 推出的新一代AI音视频生成模型，首次实现了环境音效与画面动态同步生成

OpenAI推出的新一代视频生成模型Sora 2，首次实现了音频与画面的智能同步生成。新模型通过多模态融合算法，能够理解视频内容的情绪基调、场景特征和动作节奏，并据此生成匹配的背景音乐、环境音效甚至人...

发现资讯

4个月前

09360

Matrix-Game 2.0 – 昆仑万维发布并开源自研的交互式世界模型

昆仑万维发布并开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——“Matrix-Game 2.0”。为促进交互式世界模型领域的发展，「Matrix-Game 2.0」全...

发现资讯

7个月前

09350

ThinkSound – 阿里通义开源首个CoT音频生成模型，生成音画同步的高保真音频

近日，阿里语音AI团队宣布开源全球首个支持链式推理的音频生成模型ThinkSound，该模型首次将CoT（Chain-of-Thought，思维链）技术引入音频生成领域，实现通过多步骤推理模拟专业音效...

发现资讯

8个月前

09280

Fish Audio – AI语音合成工具，精准克隆多种语音

Fish.audio 是一个基于 AI 技术的音频处理与创作平台，主要提供语音克隆、AI 音效生成、文本转语音（TTS）和语音转文本等功能。该平台由 Fish Speech 开发团队开发，支持多种语言...

发现资讯

7个月前

09270

加载更多