Qzone

微博

微信

AI智能体让科技界变得混乱，成熟的智能体应该懂得说不

科技极客网 2026-05-29 10:55

在AI领域，我们正处在一个有趣的时刻。模拟人类认知的大语言模型出现，这是第一波浪潮。它类似于谷歌搜索，只是提供、分类并处理信息。

现在行业进入第二波浪潮，出现了自主任务引擎（autonomous task engines）。人们不再执着于创造拥有自我意识的AI实体，只要它能帮我们处理日常事务就可以了。

Claude Code发布之后，智能体大量涌现，标志着第二波浪潮形成。于是乎，人们开始认真讨论一个问题：AI 将如何改变程序员这一职业。

今天的智能体已经将我们的注意力分散到了无数个方向。实际上，只有当智能体开始把注意力还给我们时，它们才算真正成功，因为智能体可以为我们筛选出真正重要的东西。

从Claude Code和OpenClaw开始

2025年11月，一位名叫施泰因贝格（Peter Steinberger）的39岁中年人开发了OpenClaw工具，它可以用来召唤AI agent（智能体），工具充分利用了Claude Code或其他编程工具。

OpenClaw一炮而红。在不到两周的时间里，用户疯狂下载，项目获得10万个星标。到了5月初，星标数达到36.6万个。每一个星标都意味着工具在Github受到欢迎。

随着Claude Code和OpenClaw带来突破，我们期待的智能体时代突然到来。

一位狂热分子借用威廉·吉布森（William Gibson）的名言呼喊：“通用AI（AGI）就在这里！只是分布得还不均匀。”

前微软和 Meta 高管托马斯·里尔登（Thomas Reardon）说：“很难解释这是一场多么巨大的变革，这是我在科技领域经历过的最被低估、最重大的发布。”

硅谷着名投资人马克·安德里森（Marc Andreessen）宣称：“新工具将成为人们使用计算机的新方式，几乎不可避免。”

实际上，早在2021年时，OpenAI便推出了Codex，确立AI编程工具的雏形。虽然工具提高了程序员的效率，但产品功能有限，需要仔细监督。

按照鲍里斯·切尔尼（Boris Cherny）的设想，模型应该理解编程架构，具备解决问题的能力。后来，切尔尼构建了Claude Code，并于2025年2月发布预览版本。到了2025年11月，公司推出Opus 4.5，转折点真正出现。

最开始时，团队并没有对Claude Code抱有太高期待，认为它只不过是一次渐进式改进，但到了今天，它已经可以和人类成果媲美。

Y Combinator首席执行官加里·谭（Garry Tan）说：“我一路摸索，试图搞清楚如何从Claude Code中获得最大收益。现在我的编程速度是每年400万行代码，相当于2013年产出的90倍。”

没多久，世界便出现一个新群体，他们被称为“Claudeholic”（克劳德成瘾者）。这些程序员疯狂消耗tokens，生怕被变革抛在身后。

科技巨头一拥而上

英伟达（Nvidia）的黄仁勋对OpenClaw赞不绝口，宣称它是下一个ChatGPT。工具的创造者彼得·施泰因贝格（Peter Steinberger）被OpenAI招揽，暴露了OpenAI的野心。

最近几个月，加入新革命的科技巨头越来越多，它们争相开发智能体技术，竞争越来越激烈，冲在最前方的是 Meta 和谷歌。

据《金融时报》报道，Meta正在为其用户构建一个高度个性化的 AI 助理，可以执行日常任务。《商业内幕》则说，谷歌正在开发一个由Gemini驱动、适用于工作、学习和日常生活的个人智能体。

Futurum Group的AI负责人尼克·佩斯（Nick Patience）认为，引爆智能体浪潮的是OpenClaw，它证明人们需要可以行动的AI，不再满足于只是给出答案的AI。

Morningstar高级分析师马利克·艾哈迈德·汗（Malik Ahmed Khan）表示，谷歌和Meta拥有庞大的广告和电商业务，对它们来说，如果智能体能够进行交易操作，便能创造巨大价值。

Gartner分析师阿伦·钱德拉塞卡兰（Arun Chandrasekaran）认为，大型科技公司最终会把AI智能体当成一种工具，用来增加订阅者，维护平台控制权。智能体可以为它们提供真实价值，为平台带来更多参与度，增强实用性，锁定客户。智能体还会持续学习，不断理解用户语境，增强用户粘性。

随着热度升高，安全和治理也成为当务之急。今年2月，一位Meta员工抱怨称，OpenClaw擅自删除大量电子邮件，该事件迅速走红。信任问题也不可忽视，如果智能体做错事，会导致严重后果，需要管控。

佩斯称：“以前是会说错话的AI，现在变成会做错事的AI，二者的风险完全不同，给从业者带来巨大挑战。大多数企业，甚至可以说大多数供应商，目前还没有能力在规模化层面应对这一挑战。”

尽管挑战重重，智能体需求是真实存在的。AMD首席执行官苏姿丰（Lisa Su）最近告诉媒体，智能体正在拉动 AI 周期中的巨大需求。

Forrester的首席分析师克雷格·勒克莱尔（Craig Le Clair）表示：“智能体开发并不是一个副业，它是 2026 年路线图的主题，代表着从‘搜索’到‘行动’的转折点。”

William Blair公司主管阿琼·巴蒂亚（Arjun Bhatia）坦言，当前各大公司都在争相打造能赚钱的AI工具，竞争只会变得越来越激烈，智能体战争已经全面打响。

成熟的AI智能体应该懂得说不

和任何狂潮一样，智能体大战也滋生了泡沫。据Gartner预测，40%的组织计划对智能体进行降级，甚至直接停用。

如果企业不考虑智能体的自主程度或行动范围，试图为所有智能体建立一套统一的治理体系，将会导致企业在业务自动化上失败。

智能体会调用大语言模型来理解用户的自然语言请求或指令，随后与应用数据进行交互，对其更新。除了谷歌和Meta，SAP、甲骨文（Oracle）、Workday 和 Salesforce都在炒作这一概念。

然而，Gartner警告称，绝大多数组织不太可能建立起正确的治理模型。当企业无法区分智能体的“行动能力”与“访问范围”时，智能体的落地实施就很容易出错。

Gartner高级总监分析师希瓦·瓦尔玛（Shiva Varma）警告称：“组织正将智能体的治理视为二元选择，非黑即白，要么完全锁死，要么完全信任，而这正是失败的根源。”

有时，企业会对智能体“过度限制”，从而拖慢交付速度，要么“限制不足”，导致运营成本增加，滋生安全合规风险。

瓦尔玛认为，AI智能体的行动规模和速度可能会超出人类的监管能力。一些人认为，一个成熟的AI智能体不仅要会“做事”，更要懂得在什么时候“停手”。

一本正经胡说八道是所有大语言模型的通病，如果是能执行行动的智能体呢？当它遇到缺乏上下文、情况模煳的环境时，能否客观承认自己不知道？能否知道自己没有权限处理当前情况？这些问题至关重要。

简单来说，如果不给智能体一个“弃权”选项，让它一直执行，后果极为严重。

Claude Code已经加入了类似的设计，在运行命令或修改文件之前，智能体必须获得许可。如果是低风险、可逆的工作，可以交给智能体来做；如果是永久删除文件或内容、参与大额金融交易，还是让人类接管比较好；如果请求涉及敏感数据、影响巨大，智能体应该拒绝行动。

总之，聪明的智能体应该知道何时停下，告诉用户“我没有权限处理此事”，如果做不到，便是没有成熟，没有准备好。（小刀）

【以上内容转自“极客网”，不代表本网站观点。如需转载请取得极客网许可，如有侵权请联系删除。】