资讯 | 第7页 | up导航

发现科技资讯

排序

发布更新浏览点赞

GLM-TTS – 智谱开源的AI文本转语音模型，支持多种方言和特殊语音的合成

智谱正式发布工业级语音合成系统 GLM-TTS，只需录音3秒，或者上传3秒-10秒的录音文件，即可快速克隆你自己的声音。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中，实现自然流畅、贴近真人...

发现资讯

2个月前

05030

Qwen3-Omni-Flash – 阿里通义推出的全模态大模型，支持119种文本语言、19种语音识别语言和10种语音合成语言

qwen3-omni-flash（qwen3-omni-flash-2025-12-01）是阿里巴巴qwen团队全新发布的全模态大语言模型。可实现文本、图像、音频和视频的无缝输入与同步输出。模型支持1...

发现资讯

2个月前

04020

GPT-5.2 – OpenAI最新推出的通用AI模型系列，能高效处理长文档，支持端到端工作流

OpenAI正式推出其迄今最强模型GPT-5.2，专为专业工作和复杂任务设计。在通用智能、长文本处理、智能体工具调用和视觉等方面得到显著提升。在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长...

发现资讯

2个月前

04300

Gemini Deep Research – 谷歌推出的深度研究Agent，能深入复杂信息环境中获取精准数据

谷歌推出Gemini Deep Research深度研究智能体，基于Gemini 3 Pro构建，专为长周期内容收集与综合任务优化打造，其幻觉率较此前模型降低40%，是谷歌迄今“最具事实性”的智能模型...

发现资讯

2个月前

03990

CodeFlying海外版实测，支持多种主流编程语言，应用自动部署上线

“码上飞（CodeFlying）” 是一款聚焦于提升代码开发效率的工具，专为帮助用户快速将创意转化为实际应用设计。是跨赴科技推出的AI自动化应用开发平台，主要面向程序员和开发团队，通过智能化功能简化开...

发现资讯

2个月前

03990

Seedream 4.5 – 字节跳动推出的AI图像创作模型，精准响应复杂的文字指令

字节跳动最新发布的AI图像生成模型Seedream 4.5在火山引擎上线。新模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代，进一步提升了图像生成的整体质量与稳定性。模型支持广...

发现资讯

3个月前

08380

MemMachine – 开源AI记忆系统，实现高效记忆管理

MemMachine是解决AI Agent长期记忆问题的开源项目，通过双层记忆系统实现真正的记忆功能，而非简单的RAG检索。MemMachine通过情景记忆、语义记忆和用户画像记忆，帮助AI应用学习...

发现资讯

3个月前

05210

Mistral 3 – Mistral AI推出的最新多模态大模型系列，同时处理文本和图像输入

Mistral 3 是由 mistral ai 正式发布的全新一代开源人工智能模型系列，支持256k超长上下文窗口，可轻松处理百万字长文档、模型支持多模态（文本和图像）与多语言功能。Mistral 3...

发现资讯

3个月前

08160

Z-Image – 阿里通义推出的图像生成模型，能快速生成高质量的逼真图像

随着AI大模型的快速发展，越来越多的用户使用AI来辅助工作、提高效率。阿里通义大模型官方最新发布的生图模型 Z-Image 上线后迅速登顶 Hugging Face 趋势榜双榜第一，模型发布首日下载量...

资讯

3个月前

04740

Depth Anything 3 – 字节跳动推出的视觉空间重建模型，可重建完整3D场景

自字节跳动（ByteDance Seed）的研究团队推出—Depth Anything 3 (DA3)视觉空间重建模型，旨在打破3D视觉任务之间的壁垒，实现一个“大一统”的视觉几何模型。DA3的核心思...

发现资讯

3个月前

04710

加载更多