近日,中国人工智能领域迎来里程碑式突破!听力熊Teeni.AI杭州AI研究中心首席科学家张驰团队正式发布全球首款通用型自进化手机智能体——AppAgentX。该成果不仅以“成长型大脑”为核心,实现智能体从“工具”到“伙伴”的跨越式升级。相关技术论文已在科学预印本平台Arxiv发布,并同步开源代码,引发国际学术界与产业界的高度关注,被评价为“重塑移动端AI交互规则的颠覆性创新”。
AppAgentX的技术突破并非空中楼阁。其前身可追溯至张驰团队于2023年发布的初代智能代理工具AppAgent——这款被誉为“手机AI助手”的开创性产品,曾以革命性理念颠覆行业认知。AppAgent能通过模仿人类点击、滑动等操作,自主完成社交、金融、办公等50余个高频场景的复杂任务。它不仅能像人类一样“看懂”屏幕内容,还可通过观察用户行为自主优化操作路径,甚至被用户称为“手机里的数字同事”。
在初代产品的成功基础上,张驰团队历时18个月完成技术跃迁,将AppAgent的“单任务助手”升级为AppAgentX的“全能型大脑”。这一进化不仅体现在性能指标的指数级提升,更标志着中国团队在通用型AI Agent领域从“功能创新”到“认知革命”的跨越。
(AppAgentX的功能示意图)
当前,全球AI产业正经历从大语言模型(LLM)向通用智能体(General AI Agent)的范式跃迁。OpenAI、DeepMind等国际巨头虽在LLM领域占据先发优势,但其智能体技术仍受限于固定任务场景与高算力依赖。张驰团队瞄准行业痛点,以AppAgentX突破两大技术天花板:通用性——跨应用、跨设备的“即插即用”能力;进化性——通过自我学习将高频操作固化为“肌肉记忆”,首次实现AI智能体在移动端的长期自主进化。
技术层面,AppAgentX执行任务时,把过程分解为重叠三元组,用大语言模型生成页面和界面元素功能描述,合并重复描述,记录交互历史形成节点链。执行中,它引入进化机制,生成“捷径节点”,让智能体跳过逐步推理,直接调用高级动作,大幅提高执行效率。
(AppAgentX流程设计与功能实现示例)
实验结果显示,在多个GUI交互任务测试中,AppAgentX在单步执行效率和总体API token消耗上,均展现出显著的“降本增效”优势,技术实力强劲。
业内人士分析,AppAgentX的发布或将重构全球AI产业格局——其“自主进化”的技术路径,为端侧AI提供了可扩展、低成本的落地范式。随着中国AI团队持续突破核心领域“卡脖子”难题,一个由中国技术定义的新智能时代正加速到来。