GPT-5.2 – OpenAI最新推出的通用AI模型系列,能高效处理长文档,支持端到端工作流
OpenAI正式推出其迄今最强模型GPT-5.2,专为专业工作和复杂任务设计。在通用智能、长文本处理、智能体工具调用和视觉等方面得到显著提升。在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长...
Qwen3-Omni-Flash – 阿里通义推出的全模态大模型,支持119种文本语言、19种语音识别语言和10种语音合成语言
qwen3-omni-flash(qwen3-omni-flash-2025-12-01)是阿里巴巴qwen团队全新发布的全模态大语言模型。可实现文本、图像、音频和视频的无缝输入与同步输出。模型支持1...
GLM-TTS – 智谱开源的AI文本转语音模型,支持多种方言和特殊语音的合成
智谱正式发布工业级语音合成系统 GLM-TTS,只需录音3秒,或者上传3秒-10秒的录音文件,即可快速克隆你自己的声音。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中,实现自然流畅、贴近真人...
GLM-ASR – 智谱开源的语音识别系列模型,模型能将语音实时转换为文字
GLM-ASR是由智谱AI开发的开源语音识别模型系列,结合了自然语言处理(NLP)和语音识别(ASR)的先进技术。不仅可以实现精准的语音转文字,还可以在输入法中直接调用大模型能力,完成翻译、改写、情绪...
Devstral 2 – Mistral AI开源的新一代编程模型系列,支持在大型代码库中进行复杂的代码修改和重构
Mistral AI 推出新一代编程模型家族 Devstral 2,支持端到端自动化编程,相比参数规模更大的闭源模型,其成本效率高达7倍以上,特别适合大规模自动化编码任务,其核心优势在于支持跨文件协同...
CyberCut – 快手StreamLake推出的AI视频剪辑工具,提升视频创作效率
快手推出 CyberCut ——一款面向短视频创作者的 AI 视频剪辑工具,专为创作者和营销团队设计。它通过智能规划、自动化剪辑和文本驱动编辑,帮助用户提升内容生产效率,尤其适合电商、营销、直播切片等...
NewBie-image-Exp0.1 – NewBieAi Lab开源的图像生成模型,能生成高质量动漫图像
NewBie-image-Exp0.1是一个开源的文本到图像生成模型,专为动漫风格内容创作设计,拥有35亿参数,结合了Lumina与Next-DiT双架构。采用 Google/Gemma3-4b-it...
Vidyard – AI营销视频生成平台,快速生成个性化视频与精准推送
Vidyard是一款基于云的视频制作和管理平台,提供丰富的视频编辑和分析工具。内置了专为营销团队设计的转录分析工具。其核心价值在于将转写功能与观众行为分析结合,支持多语言识别,能自动生成可编辑的字幕轨...
Piktochart – AI设计工具,支持通过文字输入快速生成多种视觉内容
Piktochart 是一款专注于信息图表设计的在线平台,专为快速创建视觉内容设计。旨在帮助用户轻松创建信息图表、报告、演示文稿、海报、传单等视觉内容。Piktochart 提供丰富的模板和资源,适合...
Open-AutoGLM – 智谱开源的手机端AI Agent框架,支持私有化部署
智谱AI正式宣布开源其核心AI Agent模型——AutoGLM。基于 AutoGLM 构建,能够稳定地完成外卖点单、机票预订等复杂操作流程,操作步骤可长达数十步。 AutoGLM支持私有化部署,通过...









