Kairos 3.0 – 大晓机器人开源的商业应用世界模型,高效处理长视频kairos 3.0(开悟世界模型3.0)是由大晓机器人自主研发的业界首款ace具身智能研发范式,同时也是首个面向实际商业落地且完全开源的世界模型。核心亮点包括全球首创ACE技术范式,通过“环境式采集...发现资讯1个月前04980
SHARP – 苹果开源的3D场景生成AI模型,支持实时渲染高分辨率的 3D 视图Apple 近日开源了一款名为 SHARP的人工智能模型,该模型能够在不到一秒钟的时间内,仅凭一张普通的 2D 照片生成高度逼真的 3D 场景表示。它打破了传统3D 重建动辄数小时的耗时瓶颈,仅需不到...发现资讯1个月前03470
Seed1.8 – 字节跳动推出的通用Agent模型,能快速准确地获取和整合信息。字节跳动宣布正式推出通用Agent模型Seed1.8。具备强大的多模态能力,支持图文输入,能在信息检索、代码生成、GUI 交互及复杂工作流等场景中高效精准地完成任务,满足日益多元的技术需求。Seed1...发现资讯1个月前03060
MegaLLM – AI模型API聚合平台,一个API访问多个主流模型MegaLLM AI是为开发者提供统一API接口的人工智能平台,旨在简化对多个主流AI模型的访问和管理。用户可以轻松地访问和利用来自不同提供商的AI模型,从而提高开发效率并减少集成多个模型的复杂性。平...发现1个月前03200
GPT-5.2-Codex – OpenAI推出的智能体编程模型,能高效生成高质量的代码gpt-5.2-codex 是 openai 推出的面向智能体编程任务的专业级模型,聚焦于高复杂度软件工程实践与防御型网络安全场景。其核心突破在于引入了“上下文压缩”技术,让其在处理代码重构、迁移等长...发现资讯1个月前03330
TRELLIS.2 – 微软开源的40亿参数3D生成模型,支持透明度和逼真渲染微软开源了新一代AI工具TRELLIS.2,一个具备40亿参数的大型3D生成模型。专注于从单张图片高效生成高质量3D资产。该模型解决了如何生成具有复杂拓扑结构和锐利特征的3D物体,以及如何还原逼真的物...发现资讯1个月前01940
A2UI – 谷歌开源Agent生成用户界面的声明式协议,支持定制化a2ui(agent-to-user interface)是谷歌推出的开源协议,专为ai agent与用户界面之间的高效、安全交互而设计。核心是让AI生成“界面描述数据”,而非可执行代码,客户端通过预...发现资讯1个月前03320
Step-GUI – 阶跃星辰推出的AI Agent系列模型,10分钟就能在手机端部署step-gui 是阶跃星辰推出的ai agent系列模型,包含云侧模型 step-gui 和端侧模型 step-gui edge(原名:gelab-zero)。用户只需10分钟就能在手机端部署AI助...发现资讯1个月前04920
Seedance 1.5 Pro – 字节推出的音画同步多模态视频模型,整体效果自然流畅。字节跳动推出的Seedance 1.5 Pro模型,具备原生音画同步能力的多模态视频生成模型。该模型可实现精准音画同步,实现较高的视听一致性,且支持多种语言和地方方言口音,能够捕捉其独有的语音韵律与情...发现资讯1个月前03800
万相2.6 – 阿里通义推出的新一代视频生成系列模型,首个支持角色扮演模型阿里通义推出万相2.6系列模型,支持音画同步、多镜头生成及声音驱动等功能。旨在实现生成视频在画面与声音上的整体一致性。其分镜控制功能可依据语义理解,将原始素材构建为包含多镜头切换的专业叙事段落。该版本...发现资讯1个月前02990