GDPVAL – OpenAI开源的AI模型经济价值评估框架,衡量 AI 模型在真实经济价值任务上的表现OpenAI发布一项名为GDPval的创新AI评估基准。该基准旨在评估前GDPval的创新之处在于,它通过自上而下的方法,系统性地覆盖了对经济贡献最大的多个行业和职业,确保了任务的代表性和广度,模型在...发现资讯6天前0840
Manzano – 苹果推出的图像理解和生成模型,能同时实现图像理解和图像生成苹果的研究团队提出了Manzano模型,旨在设计一个能够和谐统一理解与生成任务的简洁、可扩展的架构。在多个行业基准测试中,该模型均表现出色。Manzano 模型不仅可完成经典图像编辑任务,还能实现提示...发现资讯1周前0800
混元图像3.0 – 腾讯开源的原生多模态图像生成模型,支持多种风格的图像生成腾讯混元最新发布并开源原生多模态生图模型——混元图像3.0,这是首个开源工业级原生多模态生图模型,也是目前效果最好的开源生图模型。混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并...发现资讯1周前01250
Qoder CLI – Qoder团队推出的AI命令行工具,响应时间不到 200 毫秒阿里巴巴正式发布Qoder CLI——一款专为命令行环境打造的AI编程代理工具。该工具基于阿里自研先进编程模型与轻量级Agent框架,支持自然语言驱动的代码生成、调试、部署、审查及自动化任务执行,显著...发现资讯1周前0810
混元3D-Omni – 腾讯混元推出的3D资产生成框架,能够生成高精度的3D模型腾讯混元团队推出了混元 3D-Omni,一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。该框架不仅支持图像作为输入,还可接受点云、体素、边界框与骨骼姿态等多种控制信号,支持...发现资讯1周前0690
Rocket.new – AI编程平台,快速构建和部署全功能的 Web 和移动应用Rocket.new致力于通过自然语言指令直接生成可投入实际使用的生产级应用。这一战略定位使其在AI驱动开发的激烈赛道中脱颖而出,展现出独特的竞争力。Rocket.new首次生成应用平均耗时约25分钟...发现资讯1周前0940
Spark Chemistry-X1-13B – 科大讯飞开源的化学模型,助力化学研究和药物设计科大讯飞正式宣布讯飞星火化学大模型 Spark Chemistry-X1-13B 与讯飞文生音频模型 AudioFly 全面开源,在论文研读、专业学术翻译、英文润色及文献综述生成等能力上表现优异,助力...发现资讯1周前01080
FLM-Audio – 智源研究院开源的全双工音频对话模型,支持本地部署与二次开发flm-audio 是由北京智源人工智能研究院联合 spin matrix 与新加坡南洋理工大学共同推出的原生全双工音频对话大模型,支持中文和英文双语交互。该模型采用创新的原生全双工架构,能够在每一个...发现资讯1周前0940
Castwise – AI播客内容转化工具,将播客音频快速转化为多种格式的内容CreateWise AI 是一款利用人工智能技术为播客提供内容生成服务的工具。其主要优点在于快速生成节目笔记、剪辑和亮点,帮助节目制作者节省大量时间和精力。 Castwise是什么 Castwise...发现资讯2周前01000
AudioFly – 科大讯飞开源的文生音效模型,支持本地部署、推理和微调。主要介绍 AudioFly是科大讯飞推出的开源文生音效模型,基于潜在扩散模型(LDM)架构,能够根据文本描述生成高质量音频。该模型支持44.1kHz采样率,在文本与音效的匹配度上表现优异,适用于短视频...发现资讯2周前01330