Open-AutoGLM – 智谱开源的手机端AI Agent框架,支持私有化部署

发现1天前更新 up博主
60 0

智谱AI正式宣布开源其核心AI Agent模型——AutoGLM。基于 AutoGLM 构建,能够稳定地完成外卖点单、机票预订等复杂操作流程,操作步骤可长达数十步。 AutoGLM支持私有化部署,通过MobileRL等强化学习算法在云端虚拟手机中训练,而实际运行时,企业和开发者可以在自己的合规环境中掌控数据。Open-AutoGLM 开源目的是推动行业共同进步,保护用户隐私,加速 Agent 技术爆发。目前支持 50 多款主流中文应用,提供完整工具链和详细文档,助力开发者快速上手和二次开发。

c304544e591428d79218c94379d90f33t-9

Open-AutoGLM的主要功能

  • 自然语言理解与任务执行:用户能用自然语言描述需求,AI 自动解析意图、执行操作。
  • 多模态界面理解:通过视觉语言模型理解手机屏幕内容,识别界面元素进行操作。
  • 自动化操作:支持点击、滑动、输入文本、长按、双击等多种操作,模拟真实用户行为。
  • 敏感操作确认与人工接管:在涉及隐私或敏感操作时,AI 会请求人工确认或接管,确保安全性。
  • 远程调试与控制:支持通过 WiFi 或网络进行远程 ADB 调试,无需物理连接设备即可操作。
  • 支持多款应用:覆盖 50 多款主流中文应用,包括社交通讯、电商购物、美食外卖、视频娱乐等场景。
  • 云手机环境部署:在云端虚拟设备中运行,保障用户隐私和数据安全。

Open-AutoGLM的应用场景

  • 外卖点餐:用户只需用自然语言描述需求,Open-AutoGLM 能自动打开美团应用、搜索肯德基、选择全家桶套餐并完成下单操作。
  • 社交媒体互动:在微信、微博等社交应用中,用户可指令 AI“点赞好友的最新动态”或“评论抖音视频”,AI 将自动识别相关内容,执行点赞、评论等互动操作。
  • 办公自动化:在办公软件(如 WPS、Microsoft Office)中,用户通过语音或文字指令“创建一个名为‘项目计划’的文档并写入会议内容”,AI 能完成文档创建和内容编辑。
  • 智能家居控制:通过智能家居应用(如小米智能家居),Open-AutoGLM 能精准识别、控制相应设备,实现家居场景的自动化切换。
  • 交通出行:在地图或打车应用(如高德地图、滴滴出行)中,AI 将实时规划路线,完成叫车操作,方便快捷。
© 版权声明

相关文章

暂无评论

none
暂无评论...