OpenAI最新推出-GPT-5,免费开放,博士级推理能力OpenAI 最新发布的 GPT-5 在 AI 领域引发了巨大轰动,被誉为“迄今最智能、最快速、最实用的 AI 模型”。它不仅大幅提升了核心性能,还在多个关键领域实现了突破性进展,使其成为当前最先进的...发现资讯3个月前03540
ThinkSound – 阿里通义开源首个CoT音频生成模型,生成音画同步的高保真音频近日,阿里语音AI团队宣布开源全球首个支持链式推理的音频生成模型ThinkSound,该模型首次将CoT(Chain-of-Thought,思维链)技术引入音频生成领域,实现通过多步骤推理模拟专业音效...发现资讯4个月前03540
Elser AI –动漫创作的生成式人工智能平台 ,一键生成高质量动漫内容创作Elser AI 是一款免费且功能强大的 AI 漫画生成器,旨在帮助用户轻松创作出精美的漫画作品。它支持用户多次免费生成漫画,尤其适用于长篇漫画的创作,并采用技术手段确保人物形象的统一性。只需简单三步...发现资讯1个月前03470
可赞AI一办公可视化工具,支持文字一秒生成图表可赞AI是什么 可赞AI是一款专业的AI办公可视化工具,支持文字一秒生成图表、图例、卡片。可赞AI可以智能解析各类文本,丰富可视化方案,多端协作办公。无论是您导入现有文档还是AI生成的内容,可赞AI都...发现资讯2个月前03460
DeepFig-端侧推理引擎,实现“数据永不离端”:联邦学习+差分隐私构筑AI安全底座DeepFig是什么 DeepFig是一家专注于端侧人工智能(On-Device AI)解决方案的技术提供商,致力于通过本地化模型部署实现“数据不出设备”的隐私保护目标。其核心产品为端侧推理引擎,能够...发现资讯2个月前03450
Matrix-Game 2.0 - 昆仑万维发布并开源自研的交互式世界模型昆仑万维发布并开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——“Matrix-Game 2.0”。为促进交互式世界模型领域的发展,「Matrix-Game 2.0」全...发现资讯3个月前03450
FlowSpeech – AI文本转语音工具,实现文本转语音功能的自动化和定制化FlowSpeech是一款创新的AI文本转语音(TTS)工具,突破了传统TTS技术的局限,能够将书面文字自然流畅地转化为口语表达。通过上下文感知和多模态支持技术,FlowSpeech解决了传统TTS在...发现资讯3个月前03410
Skywork UniPic 2.0 – 昆仑万维开源的统一多模态模型,支持文本到图像生成和图像编辑任务Skywork UniPic 2.0是昆仑万维正式开源的多模态建模的高效训练和推理框架,围绕生成和编辑模块轻量化、连接多模态理解模型进行联合训练,构建了理解、生图、编辑一体化的核心能力,旨在实现“高效...发现资讯2个月前03400
dots.ocr - 小红书hi lab开源的文档解析模型dots.ocr 是小红书 hi lab 开源的多语言文档解析模型,能高效地进行文档布局检测和内容识别,保持良好的阅读顺序。dots.ocr 在 OmniDocBench 上表现出色,文本、表格和阅读...发现资讯3个月前03380
医疗AI革命:从辅助诊断到精准治疗,deepfig如何提升45%诊断效率作为三甲医院影像科医生,我每天需处理上百份CT、MRI影像,基层医院转诊的复杂病例常因诊断延迟影响治疗。传统AI辅助工具虽能标记病灶,但对罕见病识别率不足60%,且无法结合患者病史综合分析。 deep...发现资讯3个月前03360