blog | 第6页 | up导航

GLM-TTS – 智谱开源的AI文本转语音模型，支持多种方言和特殊语音的合成

智谱正式发布工业级语音合成系统 GLM-TTS，只需录音3秒，或者上传3秒-10秒的录音文件，即可快速克隆你自己的声音。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中，实现自然流畅、贴近真人...

发现资讯

3个月前

05330

GLM-ASR – 智谱开源的语音识别系列模型，模型能将语音实时转换为文字

GLM-ASR是由智谱AI开发的开源语音识别模型系列，结合了自然语言处理（NLP）和语音识别（ASR）的先进技术。不仅可以实现精准的语音转文字，还可以在输入法中直接调用大模型能力，完成翻译、改写、情绪...

发现资讯

3个月前

05290

Devstral 2 – Mistral AI开源的新一代编程模型系列，支持在大型代码库中进行复杂的代码修改和重构

Mistral AI 推出新一代编程模型家族 Devstral 2，支持端到端自动化编程，相比参数规模更大的闭源模型，其成本效率高达7倍以上，特别适合大规模自动化编码任务，其核心优势在于支持跨文件协同...

发现资讯

3个月前

05450

CyberCut – 快手StreamLake推出的AI视频剪辑工具，提升视频创作效率

快手推出 CyberCut ——一款面向短视频创作者的 AI 视频剪辑工具，专为创作者和营销团队设计。它通过智能规划、自动化剪辑和文本驱动编辑，帮助用户提升内容生产效率，尤其适合电商、营销、直播切片等...

发现资讯

3个月前

06300

NewBie-image-Exp0.1 – NewBieAi Lab开源的图像生成模型，能生成高质量动漫图像

NewBie-image-Exp0.1是一个开源的文本到图像生成模型，专为动漫风格内容创作设计，拥有35亿参数，结合了Lumina与Next-DiT双架构。采用 Google/Gemma3-4b-it...

发现资讯

3个月前

05540

Vidyard – AI营销视频生成平台，快速生成个性化视频与精准推送

Vidyard是一款基于云的视频制作和管理平台，提供丰富的视频编辑和分析工具。内置了专为营销团队设计的转录分析工具。其核心价值在于将转写功能与观众行为分析结合，支持多语言识别，能自动生成可编辑的字幕轨...

发现资讯

3个月前

04590

Piktochart – AI设计工具，支持通过文字输入快速生成多种视觉内容

Piktochart 是一款专注于信息图表设计的在线平台，专为快速创建视觉内容设计。旨在帮助用户轻松创建信息图表、报告、演示文稿、海报、传单等视觉内容。Piktochart 提供丰富的模板和资源，适合...

发现资讯

3个月前

04080

Open-AutoGLM – 智谱开源的手机端AI Agent框架，支持私有化部署

智谱AI正式宣布开源其核心AI Agent模型——AutoGLM。基于 AutoGLM 构建，能够稳定地完成外卖点单、机票预订等复杂操作流程，操作步骤可长达数十步。 AutoGLM支持私有化部署，通过...

发现资讯

3个月前

06050

GLM-4.6V – 智谱开源的多模态大模型系列，支持云端、本地及多种硬件环境部署

智谱正式上线并开源 GLM-4.6V 系列多模态大模型，该模型支持高达 128k tokens 的超长上下文，在视觉理解精度方面处于同规模模型的领先梯队，并首次将工具调用能力深度原生集成至视觉架构中...

发现资讯

3个月前

04630

LongCat-Image – 美团推出的开源图像生成模型，提供强大的图像编辑能力

美团LongCat团队宣布，开源其最新研发的LongCat-Image模型。模型采用文生图与图像编辑同源的架构，结合渐进式学习策略，成功在6B参数下实现了指令遵循精准度、生图质量与文字渲染能力的高效协...

发现资讯

3个月前

04680

加载更多

GLM-TTS – 智谱开源的AI文本转语音模型，支持多种方言和特殊语音的合成

GLM-ASR – 智谱开源的语音识别系列模型，模型能将语音实时转换为文字

Devstral 2 – Mistral AI开源的新一代编程模型系列，支持在大型代码库中进行复杂的代码修改和重构

CyberCut – 快手StreamLake推出的AI视频剪辑工具，提升视频创作效率

NewBie-image-Exp0.1 – NewBieAi Lab开源的图像生成模型，能生成高质量动漫图像

Vidyard – AI营销视频生成平台，快速生成个性化视频与精准推送

Piktochart – AI设计工具，支持通过文字输入快速生成多种视觉内容

Open-AutoGLM – 智谱开源的手机端AI Agent框架，支持私有化部署

GLM-4.6V – 智谱开源的多模态大模型系列，支持云端、本地及多种硬件环境部署

LongCat-Image – 美团推出的开源图像生成模型，提供强大的图像编辑能力

加入收藏夹

设为首页

选美大赛