首页 > 科技 > 正文
Qzone
微博
微信

AI智能体让科技界变得混乱,成熟的智能体应该懂得说不

科技 极客网 2026-05-29 10:55

AI领域,我们正处在一个有趣的时刻。模拟人类认知的大语言模型出现,这是第一波浪潮。它类似于谷歌搜索,只是提供、分类并处理信息。

现在行业进入第二波浪潮,出现了自主任务引擎(autonomous task engines)。人们不再执着于创造拥有自我意识的AI实体,只要它能帮我们处理日常事务就可以了。

Claude Code发布之后,智能体大量涌现,标志着第二波浪潮形成。于是乎,人们开始认真讨论一个问题:AI 将如何改变程序员这一职业。

今天的智能体已经将我们的注意力分散到了无数个方向。实际上,只有当智能体开始把注意力还给我们时,它们才算真正成功,因为智能体可以为我们筛选出真正重要的东西。

the-rise-of-ai-agents-ai-agents-explained-ee0iLCTwoIs.jpg

从Claude Code和OpenClaw开始

2025年11月,一位名叫施泰因贝格(Peter Steinberger)的39岁中年人开发了OpenClaw工具,它可以用来召唤AI agent(智能体),工具充分利用了Claude Code或其他编程工具。

OpenClaw一炮而红。在不到两周的时间里,用户疯狂下载,项目获得10万个星标。到了5月初,星标数达到36.6万个。每一个星标都意味着工具在Github受到欢迎。

随着Claude Code和OpenClaw带来突破,我们期待的智能体时代突然到来。

一位狂热分子借用威廉·吉布森(William Gibson)的名言呼喊:“通用AI(AGI)就在这里!只是分布得还不均匀。”

前微软和 Meta 高管托马斯·里尔登(Thomas Reardon)说:“很难解释这是一场多么巨大的变革,这是我在科技领域经历过的最被低估、最重大的发布。”

硅谷着名投资人马克·安德里森(Marc Andreessen)宣称:“新工具将成为人们使用计算机的新方式,几乎不可避免。”

实际上,早在2021年时,OpenAI便推出了Codex,确立AI编程工具的雏形。虽然工具提高了程序员的效率,但产品功能有限,需要仔细监督。

按照鲍里斯·切尔尼(Boris Cherny)的设想,模型应该理解编程架构,具备解决问题的能力。后来,切尔尼构建了Claude Code,并于2025年2月发布预览版本。到了2025年11月,公司推出Opus 4.5,转折点真正出现。

最开始时,团队并没有对Claude Code抱有太高期待,认为它只不过是一次渐进式改进,但到了今天,它已经可以和人类成果媲美。

Y Combinator首席执行官加里·谭(Garry Tan)说:“我一路摸索,试图搞清楚如何从Claude Code中获得最大收益。现在我的编程速度是每年400万行代码,相当于2013年产出的90倍。”

没多久,世界便出现一个新群体,他们被称为“Claudeholic”(克劳德成瘾者)。这些程序员疯狂消耗tokens,生怕被变革抛在身后。

 

科技巨头一拥而上

英伟达(Nvidia)的黄仁勋对OpenClaw赞不绝口,宣称它是下一个ChatGPT。工具的创造者彼得·施泰因贝格(Peter Steinberger)被OpenAI招揽,暴露了OpenAI的野心。

最近几个月,加入新革命的科技巨头越来越多,它们争相开发智能体技术,竞争越来越激烈,冲在最前方的是 Meta 和谷歌。

据《金融时报》报道,Meta正在为其用户构建一个高度个性化的 AI 助理,可以执行日常任务。《商业内幕》则说,谷歌正在开发一个由Gemini驱动、适用于工作、学习和日常生活的个人智能体。

Futurum Group的AI负责人尼克·佩斯(Nick Patience)认为,引爆智能体浪潮的是OpenClaw,它证明人们需要可以行动的AI,不再满足于只是给出答案的AI。

Morningstar高级分析师马利克·艾哈迈德·汗(Malik Ahmed Khan)表示,谷歌和Meta拥有庞大的广告和电商业务,对它们来说,如果智能体能够进行交易操作,便能创造巨大价值。

Gartner分析师阿伦·钱德拉塞卡兰(Arun Chandrasekaran)认为,大型科技公司最终会把AI智能体当成一种工具,用来增加订阅者,维护平台控制权。智能体可以为它们提供真实价值,为平台带来更多参与度,增强实用性,锁定客户。智能体还会持续学习,不断理解用户语境,增强用户粘性。

随着热度升高,安全和治理也成为当务之急。今年2月,一位Meta员工抱怨称,OpenClaw擅自删除大量电子邮件,该事件迅速走红。信任问题也不可忽视,如果智能体做错事,会导致严重后果,需要管控。

佩斯称:“以前是会说错话的AI,现在变成会做错事的AI,二者的风险完全不同,给从业者带来巨大挑战。大多数企业,甚至可以说大多数供应商,目前还没有能力在规模化层面应对这一挑战。”

尽管挑战重重,智能体需求是真实存在的。AMD首席执行官苏姿丰(Lisa Su)最近告诉媒体,智能体正在拉动 AI 周期中的巨大需求。

Forrester的首席分析师克雷格·勒克莱尔(Craig Le Clair)表示:“智能体开发并不是一个副业,它是 2026 年路线图的主题,代表着从‘搜索’到‘行动’的转折点。”

William Blair公司主管阿琼·巴蒂亚(Arjun Bhatia)坦言,当前各大公司都在争相打造能赚钱的AI工具,竞争只会变得越来越激烈,智能体战争已经全面打响。

 

成熟的AI智能体应该懂得说不

和任何狂潮一样,智能体大战也滋生了泡沫。据Gartner预测,40%的组织计划对智能体进行降级,甚至直接停用。

如果企业不考虑智能体的自主程度或行动范围,试图为所有智能体建立一套统一的治理体系,将会导致企业在业务自动化上失败。

智能体会调用大语言模型来理解用户的自然语言请求或指令,随后与应用数据进行交互,对其更新。除了谷歌和Meta,SAP、甲骨文(Oracle)、Workday 和 Salesforce都在炒作这一概念。

然而,Gartner警告称,绝大多数组织不太可能建立起正确的治理模型。当企业无法区分智能体的“行动能力”与“访问范围”时,智能体的落地实施就很容易出错。

Gartner高级总监分析师希瓦·瓦尔玛(Shiva Varma)警告称:“组织正将智能体的治理视为二元选择,非黑即白,要么完全锁死,要么完全信任,而这正是失败的根源。”

有时,企业会对智能体“过度限制”,从而拖慢交付速度,要么“限制不足”,导致运营成本增加,滋生安全合规风险。

瓦尔玛认为,AI智能体的行动规模和速度可能会超出人类的监管能力。一些人认为,一个成熟的AI智能体不仅要会“做事”,更要懂得在什么时候“停手”。

一本正经胡说八道是所有大语言模型的通病,如果是能执行行动的智能体呢?当它遇到缺乏上下文、情况模煳的环境时,能否客观承认自己不知道?能否知道自己没有权限处理当前情况?这些问题至关重要。

简单来说,如果不给智能体一个“弃权”选项,让它一直执行,后果极为严重。

Claude Code已经加入了类似的设计,在运行命令或修改文件之前,智能体必须获得许可。如果是低风险、可逆的工作,可以交给智能体来做;如果是永久删除文件或内容、参与大额金融交易,还是让人类接管比较好;如果请求涉及敏感数据、影响巨大,智能体应该拒绝行动。

总之,聪明的智能体应该知道何时停下,告诉用户“我没有权限处理此事”,如果做不到,便是没有成熟,没有准备好。(小刀)

 

【以上内容转自“极客网”,不代表本网站观点。如需转载请取得极客网许可,如有侵权请联系删除。】

 

延伸阅读:

 

责任编辑: fjq4191

责任编辑: fjq4191
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 新飞网版权所有