Lumine – 字节跳动推出的3D开放世界通用AI智能体,提升自主思考和操作能力

发现12小时前发布 up博主
13 0

字节推出的Lumine框架,能在3D开放世界中进行实时推理与感知,为探索未知领域提供了强大的技术支持。该智能体基于qwen2-vl-7b-base模型构建,采用类人交互方式,将视觉感知、逻辑思考与操作执行深度融合。Lumine通过多阶段训练,逐步提升自主思考和操作能力,为未来具身智能的发展提供新的方向。

60014f849ca6dd081471dc106c13d1a1

t-29

Lumine的主要功能

  • 任务执行:能自主完成复杂的长周期任务,如在《原神》中完成长达数小时的主线剧情。
  • 战斗能力:动态追踪敌人、精准射击、切换角色进行连招攻击,高效开启宝箱。
  • 解谜能力:支持应对各种解谜挑战,如收集风神瞳、激活元素方碑等。
  • NPC交互:能与NPC进行稳定对话,完成任务。
  • GUI操作:像人类玩家一样进行2D界面操作,如制作物品、使用传送锚点等。
  • 跨游戏泛化:无需额外微调,能在其他游戏(如《崩坏:星穹铁道》《鸣潮》)中完成任务。

Lumine的技术原理

  • 感知空间:以每200ms处理一帧游戏画面,保留历史推理轨迹,为决策提供上下文信息。
  • 混合思考策略:在关键场景(如环境突变、计划失效)进行推理,简单场景直接输出动作,提高效率。
  • 键盘与鼠标操作建模:将所有操作定义为鼠标位移和按键序列,通过高质量数据进行三阶段训练:
    • 预训练:学习基础视觉运动能力。
    • 指令跟随训练:关联语言指令与动作。
    • 决策推理训练:学会自主规划和修正,完成长周期任务。
  • 实时优化:通过上下文管理和多维度优化,降低延迟,确保实时交互。

Lumine官网地址

  • 官网:https://www.lumine-ai.org/

Lumine的应用场景

  • 游戏开发与测试:用在游戏自动化测试,帮助开发者快速发现漏洞、性能问题及用户体验问题,同时辅助生成智能NPC行为和任务设计,提升游戏开发效率。
  • 游戏娱乐:作为AI队友或对手,为玩家提供更具挑战性和趣味性的互动体验,或在单人游戏中辅助玩家完成复杂任务,提升游戏完成度。
  • 教育与培训:用在虚拟训练环境,为学生或专业人员提供任务训练,或在教育游戏中辅助学习,通过任务和挑战帮助学生掌握知识和技能。
  • 虚拟世界与元宇宙:作为虚拟角色在元宇宙中与用户互动,提供陪伴或服务,帮助用户生成虚拟世界中的任务、剧情或互动内容,丰富用户体验。
  • 工业与制造业:在工业模拟环境中执行任务和优化流程,帮助设计高效工作模式,用在智能机器人训练,提升其自主决策和操作能力。
© 版权声明

相关文章

暂无评论

none
暂无评论...