EmbodiedGen是一个用于生成具有真实世界规模和物理真实感的交互式3D世界的工具,能够以较低成本生成多样化的3D资产,助力具身智能相关研究的泛化能力提升。
EmbodiedGen 是由多家机构(包括地平线机器人、香港中文大学、上海齐智研究院和清华大学)共同开发的开源框架,旨在为身体现智能任务生成真实且可扩展的3D 资产。该平台能够输出物理准确、密闭的3D 对象,格式为 URDF,并附带适合模拟的元数据。EmbodiedGen 拥有六个模块化组件,包括图像转3D、文本转3D、布局生成和物体重排列,能够实现可控和高效的场景创建。
EmbodiedGen 不仅是一个强大且易于访问的平台,还能够生成多样化的高质量3D 资产,专门用于身体现智能研究。

EmbodiedGen是什么
EmbodiedGen 是用于具身智能(Embodied AI)应用的生成式 3D 世界引擎和工具包。能快速生成高质量、低成本且物理属性合理的 3D 资产和交互环境,帮助研究人员和开发者构建具身智能体的测试环境。EmbodiedGen 包含多个模块,如从图像或文本生成 3D 模型、纹理生成、关节物体生成、场景和布局生成等,支持从简单物体到复杂场景的创建。生成的 3D 资产可以直接用于机器人仿真和 URDF 格式,为具身智能研究提供了强大的工具支持。

EmbodiedGen的主要功能
- 图像到 3D 转换:能从输入图像生成具有物理合理性的 3D 资产。
- 文本到 3D 生成:根据文本描述生成各种几何形状和风格的 3D 资产。
- 纹理生成功能:为 3D 网格生成视觉丰富的纹理。
- 复杂场景构建:支持从简单物体到复杂场景的创建,能生成具有真实世界比例且符合统一机器人描述格式(URDF)的高质量 3D 资产。
- 智能布局生成:提供智能布局生成能力,支持训练与评估中的下游任务。
- 物理属性支持:生成的 3D 资产具备密封的几何结构和物理上合理的属性,可以直接应用于机器人仿真和描述格式中。
EmbodiedGen的技术原理
- 生成式 AI 的应用:EmbodiedGen 基于生成式 AI 技术,能从图像或文本描述生成 3D 模型。
- 多模块协同工作:EmbodiedGen 包含六个关键模块:图像到 3D、文本到 3D、纹理生成、关节物体生成、场景生成和布局生成。模块协同工作,生成从简单物体到复杂场景的多样化 3D 世界。
- 物理真实性和真实世界比例:生成的 3D 资产具备密封的几何结构和物理上合理的属性,可以直接应用于 URDF(Unified Robot Description Format)等机器人仿真和描述格式中。
- 动态环境生成:EmbodiedGen 的生成环境是动态的,能根据 AI 的行为实时生成和修改环境。
EmbodiedGen的项目地址
- 项目官网:https://horizonrobotics.github.io/robot_lab/embodied_gen/index.html
- Github仓库:https://github.com/HorizonRobotics/EmbodiedGen
- arXiv技术论文:https://arxiv.org/pdf/2506.10600
EmbodiedGen的应用场景
- 机器人仿真与训练:EmbodiedGen 可以生成具有物理合理性和真实世界比例的 3D 资产,可以直接应用于 URDF(Unified Robot Description Format)等机器人仿真和描述格式中。
- 自动驾驶与无人机:EmbodiedGen 生成的动态 3D 环境可以用于自动驾驶和无人机的仿真训练。通过模拟复杂的道路和地形条件,帮助自动驾驶系统和无人机更好地适应现实场景。
- 虚拟社交:用户可以通过 VR 设备控制虚拟化身(Avatar)进行社交、会议等活动。
- 医疗与康复:EmbodiedGen 生成的 3D 环境可以用于医疗和康复领域的仿真和训练。通过虚拟环境进行手术操作的仿真训练。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...