Lynx : 字节跳动推出的高保真个性化视频生成模型,仅需一张人物照片
Lynx是字节跳动推出的高保真个性化视频生成模型,仅需输入一张人像照片,即可生成身份高度一致的动态视频。该模型通过单张人物图像即可生成身份一致、动作自然、场景多样的动态视频,在身份保真度、动作连贯性...
JoySafety – 京东开源的大模型安全框架,支持通过 API 动态调整安全策略
京东正式推出了其开源的大模型安全框架 ——JoySafety。框架支持每日超过亿次的调用,拥有高达95% 以上的攻击拦截率,确保用户在享受高效服务的同时,数据安全和用户隐私也得到了有力保障。 JoyS...
GDPVAL – OpenAI开源的AI模型经济价值评估框架,衡量 AI 模型在真实经济价值任务上的表现
OpenAI发布一项名为GDPval的创新AI评估基准。该基准旨在评估前GDPval的创新之处在于,它通过自上而下的方法,系统性地覆盖了对经济贡献最大的多个行业和职业,确保了任务的代表性和广度,模型在...
Manzano – 苹果推出的图像理解和生成模型,能同时实现图像理解和图像生成
苹果的研究团队提出了Manzano模型,旨在设计一个能够和谐统一理解与生成任务的简洁、可扩展的架构。在多个行业基准测试中,该模型均表现出色。Manzano 模型不仅可完成经典图像编辑任务,还能实现提示...
混元图像3.0 – 腾讯开源的原生多模态图像生成模型,支持多种风格的图像生成
腾讯混元最新发布并开源原生多模态生图模型——混元图像3.0,这是首个开源工业级原生多模态生图模型,也是目前效果最好的开源生图模型。混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并...
Qoder CLI – Qoder团队推出的AI命令行工具,响应时间不到 200 毫秒
阿里巴巴正式发布Qoder CLI——一款专为命令行环境打造的AI编程代理工具。该工具基于阿里自研先进编程模型与轻量级Agent框架,支持自然语言驱动的代码生成、调试、部署、审查及自动化任务执行,显著...
混元3D-Omni – 腾讯混元推出的3D资产生成框架,能够生成高精度的3D模型
腾讯混元团队推出了混元 3D-Omni,一个基于 Hunyuan3D 2.1 构建的统一多模态可控 3D 生成框架。该框架不仅支持图像作为输入,还可接受点云、体素、边界框与骨骼姿态等多种控制信号,支持...
Rocket.new – AI编程平台,快速构建和部署全功能的 Web 和移动应用
Rocket.new致力于通过自然语言指令直接生成可投入实际使用的生产级应用。这一战略定位使其在AI驱动开发的激烈赛道中脱颖而出,展现出独特的竞争力。Rocket.new首次生成应用平均耗时约25分钟...
Spark Chemistry-X1-13B – 科大讯飞开源的化学模型,助力化学研究和药物设计
科大讯飞正式宣布讯飞星火化学大模型 Spark Chemistry-X1-13B 与讯飞文生音频模型 AudioFly 全面开源,在论文研读、专业学术翻译、英文润色及文献综述生成等能力上表现优异,助力...
FLM-Audio – 智源研究院开源的全双工音频对话模型,支持本地部署与二次开发
flm-audio 是由北京智源人工智能研究院联合 spin matrix 与新加坡南洋理工大学共同推出的原生全双工音频对话大模型,支持中文和英文双语交互。该模型采用创新的原生全双工架构,能够在每一个...









