跳到主要内容

单体 AI 智能体时代的终结:为什么 Coinbase 的智能体钱包正在重写 Web3 的编排栈

· 阅读需 11 分钟
Dora Noda
Software Engineer

两年多来,加密 AI 的叙事一直承诺会出现一个神一般的单一代理:一个模型持有你的密钥、读取内存池(mempool)、执行你的策略并管理你的记忆。那个代理已经过时了。2026 年 2 月,Coinbase 悄悄地埋葬了它——而行业的大部分人尚未察觉。

当 Coinbase 在 2026 年 2 月 11 日推出代理钱包(Agentic Wallets)时,头条新闻聚焦于显而易见的一点:专为自主 AI 构建的钱包基础设施。而更深层的信号是架构层面的。Coinbase 并没有发布一个更聪明的代理,它发布的是一个 被代理作为外部服务调用的钱包 —— 通过这样做,它将从单体 AI 向专业代理网络的转变,正式确立为 Web3 未来十年关键的基础设施问题。

单体代理始终是一个幻想

第一波加密代理——Virtuals、ai16z 分叉、早期的 Eliza 克隆版——将所有功能捆绑在一个运行时中。推理、内存、密钥管理、执行和风险评分都存在于同一个进程中,通常是单次 LLM 调用。这是一个漂亮的演示(demo),但却是一个糟糕的生产系统。

失败是可以预见的。持有密钥的单体代理距离全盘损失仅一步之遥。服务于多项任务的单体代理会在不同领域间产生漂移,在不同语境下产生幻觉,且无法被独立审计。而且扩展规模的计算是非常残酷的:Anthropic 自身的研究发现,在工具等效的情况下,单一代理在 64% 的基准测试任务 中匹配或超过了多代理配置——但多代理获胜的那 36% 恰恰是 Web3 关心的、高价值且高复杂性的工作负载。在这些场景中,Anthropic 的并行子代理架构比单代理 Opus 的表现高出 90.2%

换句话说:如果你的代理正在做任何有趣的事情,单一进程无法承载其重量;如果你的代理正在做任何有价值的事情,单一进程就不值得被信任。

Coinbase 的架构转型:钱包即调用服务

Coinbase 的代理钱包将钱包重新定义为代理调用的离散服务,而非代理包含的组件。其组成部分说明了这一点:

  • 代理技能(Agent Skills) —— 预构建的身份验证(Authenticate)、注资(Fund)、发送(Send)、交易(Trade)和赚取(Earn)原语,作为可调用接口公开,而非嵌入式逻辑
  • x402 支付轨道 —— 重新启用的 HTTP 402 状态码,作为机器对机器的支付协议。该网络已处理超过 7500 万笔交易,拥有 94,000 名独特买家和 22,000 名卖家
  • 基于 TEE 加固的 CDP 钱包 —— 非托管密钥保存在可信执行环境(Trusted Execution Environments)中,永远不会暴露给推理代理
  • 可编程护栏 —— 在代理的上下文窗口(context window)之外强制执行合规审查、支出限制和使用监控
  • 上线首日即支持 EVM 和 Solana,并在 Base 网络上实现无 Gas 交易

核心见解是:推理代理永远看不到私钥。它请求一个操作;钱包服务执行策略并完成执行。这种解耦与云行业从单体架构向微服务架构扩展的路径一致——独立的扩展性、隔离的故障域和安全隔板。

新兴的专业代理分类学

一旦你接受了钱包是一种服务,堆栈的其余部分就会自然分解。2026 年成熟的代理工作流看起来不像是一个单一模型,而更像是一个管弦乐队:

  • 协调代理(Coordinator agents) 负责分解任务、验证结果,并在子代理之间结算支付
  • 执行代理(Execution agents) 专注于 DeFi 策略执行、跨链路由和具备 MEV 意识的交易构建
  • 数据代理(Data agents) 处理预言机查询、链上分析和情绪信号
  • 合规代理(Compliance agents) 在签名请求之前应用 KYC、旅行规则(travel-rule)和司法管辖权检查
  • 接口代理(Interface agents) 将自然语言意图转化为结构化的工具调用

Warden Protocol 已经构建了这样的底层。其代理枢纽(Agent Hub)—— 实际上是“代理应用商店” —— 截至 2026 年 2 月已处理了 超过 6000 万个代理任务,服务约 2000 万用户。此前,它以 2 亿美元估值从 0G、Messari 和 Venice.AI 获得了 400 万美元的战略融资。Warden 的执行统计证明(SPEx)提供了加密证据,证明任务输出确实来自所声称的模型,这是协调者在将工作分包给不被信任的专家时所需的信任原语。

配套标准正在步入正轨。ERC-8004 于 2026 年 1 月 29 日在以太坊主网上线,并在六天后登陆 BNB Chain,它赋予了代理可验证的链上身份和声誉。x402 处理微支付层,使代理无需 API 密钥即可互相支付。基于 ERC-4337 账户抽象构建的会话密钥(Session keys)让所有者可以限制自主权 —— “这个代理每天可以花费 50 美元,超过该金额需要人工签名” —— 而无需交出主密钥。

身份、支付、执行证明和密钥边界:单体代理曾试图在内部伪造的这四个缺失的原语,现在已成为外部的、可组合的服务。

微服务架构的既视感 —— 痛点也如出一辙

每一位经历过 2015-2020 年微服务迁移的架构师,在目睹当前趋势时都会产生一种熟悉的焦虑感。收益是真实的,代价也是真实的。

相比单体等效系统,多智能体(Multi-agent)系统更具弹性、更易审计且更具适应性。它们隔离了故障,允许专业团队独立发布版本,并让你在无需重建钱包层的情况下更换推理模型。然而,40% 的多智能体试点项目在投入生产后的六个月内以失败告终,这通常是因为团队选择了错误的编排模式,或者未能理解系统性能是如何下降的。延迟在多个环节中累积。接口变得僵化。调试模型调用的分布式追踪比调试单体架构更难 —— 毕竟单体架构至少还有一份日志可查。

Web3 继承了这一切,并加上了一个独特的变数:执行层具有对抗性。

智能体 MEV 问题

这是大多数专业网络布道者避而不谈的残酷事实。确定性的、可组合的执行智能体比其单体前身更容易受到 MEV(最大可提取价值)的攻击,而不是更少

EVM(以太坊虚拟机)在设计上是确定性的:在每个节点上,相同的状态加上相同的交易序列会产生相同的结果。这一保证是区块链共识的基石,同时也是抢跑(Front-running)机器人的梦想。当一个专业执行智能体遵循可预测的模式 —— “在 14:00 UTC 进行再平衡,通过 Uniswap V4 路由,滑点容忍度 0.3%” —— 它就变得极其容易被观察到。夹心攻击(Sandwich)机器人会扫描内存池(Mempool)以寻找这些精确的签名。执行智能体越专业、越具确定性,其攻击面就越清晰。

具有凌乱、多样化行为的单体智能体,反而在某种程度上因其自身的混乱而受到了保护。但一个纪律严明的专业网络则不然。这意味着 MEV 保护技术栈 —— 如 CoW Protocol 等求解器网络、私有订单流、基于意图的批处理以及加密内存池 —— 不再是 DeFi 中可有可无的加分项。对于生产级的专业网络来说,这些是基本门槛。

这对 Web3 基础设施意味着什么

这种转变对任何运营底层管道的人都有直接影响。单个单体智能体产生一个 RPC 会话、一个钱包签名流和一个连贯的交易流。而在处理相同的用户意图时,专业网络产生的流量会呈几何级数增长:数据智能体轮询预言机,协调者智能体访问信誉注册表,执行智能体跨链进行预模拟,合规智能体查询制裁名单,所有这些智能体之间还通过 x402 相互结算微支付。

每一个环节都需要可靠的、多链的数据访问。API 使用者的画像从“每个用户会话调用几次 eth_call 的 dApp”转变为“在单个工作流中对以太坊、Base、Solana、Sui 和 Aptos 发起数千次低延迟请求的智能体集群”。为人类设计的速率限制会瞬间崩溃。单链 RPC 提供商会成为瓶颈。人类用户察觉不到的延迟波动,会在智能体各个环节之间串联累积,最终导致系统性失败。

BlockEden.xyz 为 25 个以上的区块链网络提供企业级 RPC 和索引基础设施,专为这种高吞吐量、多链智能体工作负载而打造。如果你正在构建跨生态系统的协调者或执行智能体,请探索我们的 API 市场,体验旨在支持智能体级流量的基础设施。

未来十八个月

筹码已经摆上桌面:Coinbase 的钱包即服务(WaaS)架构、Warden 的协调层、ERC-8004 身份协议、x402 支付、ERC-4337 会话密钥,以及日益丰富的专业智能体框架库。接下来的挑战是艰巨的 —— 不是发明新的原语,而是将现有的原语组合成可靠、可审计、抗 MEV 的生产系统。

预计行业将围绕几种主流的编排模式进行整合,那 40% 选错模式的多智能体项目将面临残酷洗牌。同时,价值将悄然从“智能体应用”转移到那些能让专业网络真正大规模运作的基础设施提供商手中。单体智能体是一个很好的演示 Demo,而专业网络才是能够真正交付的架构。

剩下的唯一问题是,Web3 领域的构建团队能否及时意识到这一转变 —— 还是会再花一年时间去交付那些在内存池面前脆弱不堪的“全能型”智能体。


参考资源: