智谱AutoGLM 技术:革新手机与网页交互的AI助手
智谱AutoGLM 技术是一项创新的AI解决方案,它能够通过接收简单的文字或语音指令,模拟人类操作手机,从而实现一系列自动化任务。AutoGLM 的核心能力在于其能够理解和执行在手机上进行的常见操作,例如在微信上点赞和评论、在淘宝上购买历史订单产品、在携程上预订酒店、在12306上购买火车票以及在美团上点外卖等。
智谱AutoGLM 技术的工作原理基于“基础智能体解耦合中间界面”和“自进化在线课程强化学习框架”。这些技术克服了大模型智能体在任务规划和动作执行方面存在的挑战,使得AutoGLM 能够不断学习和适应新的任务,并在实际生活中为人们提供帮助。
在手机端,智谱AutoGLM 技术已经通过“智谱清言”插件对外公开使用,并且与荣耀等手机厂商展开了深度合作。此外,AutoGLM 的 Web 能力也已经通过“智谱清言”插件对外公开使用,这是一个能模拟用户访问网页、点击网页的浏览器助手。
智谱AutoGLM 技术在任务执行过程中需要通过无障碍服务权限获取用户当前屏幕上的信息,以便进行理解和任务规划。智谱严格尊重用户隐私,不会主动获取用户的个人隐私信息,并且在涉及交易、支付等重要操作时,会向用户进一步询问是否执行。每次关闭应用在后台再次启动AutoGLM 功能,都会重新向用户申请无障碍权限,用户也可以在手机设置页面手动关闭该功能。
智谱AutoGLM 技术在 Phone Use 和 Web Browser Use 上取得了显著的性能提升,并且在实际应用中表现令人满意。这项技术为智能体的各种应用开辟了新的可能性,尤其是在网页智能体领域,它能够培养出具有真实自主智能的数字生态系统。