
两年多来,加密 AI 的叙事一直承诺会出现一个神一般的单一代理:一个模型持有你的密钥、读取内存池(mempool)、执行你的策略并管理你的记忆。那个代理已经过时了。2026 年 2 月,Coinbase 悄悄地埋葬了它——而行业的大部分人尚未察觉。
当 Coinbase 在 2026 年 2 月 11 日推出代理钱包(Agentic Wallets)时,头条新闻聚焦于显而易见的一点:专为自主 AI 构建的钱包基础设施。而更深层的信号是架构层面的。Coinbase 并没有发布一个更聪明的代理,它发布的是一个 被代理作为外部服务调用的钱包 —— 通过这样做,它将从单体 AI 向专业代理网络的转变,正式确立为 Web3 未来十年关键的基础设施问题。
单体代理始终是一个幻想
第一波加密代理——Virtuals、ai16z 分叉、早期的 Eliza 克隆版——将所有功能捆绑在一个运行时中。推理、内存、密钥管理、执行和风险评分都存在于同一个进程中,通常是单次 LLM 调用。这是一个漂亮的演示(demo),但却是一个糟糕的生产系统。
失败是可以预 见的。持有密钥的单体代理距离全盘损失仅一步之遥。服务于多项任务的单体代理会在不同领域间产生漂移,在不同语境下产生幻觉,且无法被独立审计。而且扩展规模的计算是非常残酷的:Anthropic 自身的研究发现,在工具等效的情况下,单一代理在 64% 的基准测试任务 中匹配或超过了多代理配置——但多代理获胜的那 36% 恰恰是 Web3 关心的、高价值且高复杂性的工作负载。在这些场景中,Anthropic 的并行子代理架构比单代理 Opus 的表现高出 90.2%。
换句话说:如果你的代理正在做任何有趣的事情,单一进程无法承载其重量;如果你的代理正在做任何有价值的事情,单一进程就不值得被信任。
Coinbase 的架构转型:钱包即调用服务
Coinbase 的代理钱包将钱包重新定义为代理调用的离散服务,而非代理包含的组件。其组成部分说明了这一点:
- 代理技能(Agent Skills) —— 预构建的身份验证(Authenticate)、注资(Fund)、发送(Send)、交易(Trade)和赚取(Earn)原语,作为可调用接口公开,而非嵌入式逻辑
- x402 支付轨道 —— 重新启用的 HTTP 402 状态码,作为机器对机器的支付协议。该网络已处理超过 7500 万笔交易,拥有 94,000 名独特买家和 22,000 名卖家
- 基于 TEE 加固的 CDP 钱包 —— 非托管密钥保存在可信执行环境(Trusted Execution Environments)中, 永远不会暴露给推理代理
- 可编程护栏 —— 在代理的上下文窗口(context window)之外强制执行合规审查、支出限制和使用监控
- 上线首日即支持 EVM 和 Solana,并在 Base 网络上实现无 Gas 交易
核心见解是:推理代理永远看不到私钥。它请求一个操作;钱包服务执行策略并完成执行。这种解耦与云行业从单体架构向微服务架构扩展的路径一致——独立的扩展性、隔离的故障域和安全隔板。
新兴的专业代理分类学
一旦你接受了钱包是一种服务,堆栈的其余部分就会自然分解。2026 年成熟的代理工作流看起来不像是一个单一模型,而更像是一个管弦乐队:
- 协调代理(Coordinator agents) 负责分解任务、验证结果,并在子代理之间结算支付
- 执行代理(Execution agents) 专注于 DeFi 策略执行、跨链路由和具备 MEV 意识的交易构建
- 数据代理(Data agents) 处理预言机查询、链上分析和情绪信号
- 合规代理(Compliance agents) 在签名请求之前应用 KYC、旅行规则(travel-rule)和司法管辖权检查
- 接口代理(Interface agents) 将自然语言意图转化为结构化的工具调用
Warden Protocol 已经构建了这样的底层。其代理枢纽(Agent Hub)—— 实际上是“代理应用商店” —— 截至 2026 年 2 月已处理了 超过 6000 万个代理任务,服务约 2000 万用户。此前,它以 2 亿美元估值从 0G、Messari 和 Venice.AI 获得了 400 万美元的战略融资。Warden 的执行统计证明(SPEx)提供了加密证据,证明任务输出确实来自所声称的模型,这是协调者在将工作分包给不被信任的专家时所需的信任原语。
配套标准正在步入正轨。ERC-8004 于 2026 年 1 月 29 日在以太坊主网上线,并在六天后登陆 BNB Chain,它赋予了代理可验证的链上身份和声誉。x402 处理微支付层,使代理无需 API 密钥即可互相支付。基于 ERC-4337 账户抽象构建的会话密钥(Session keys)让所有者可以限制自主权 —— “这个代理每天可以花费 50 美元,超过该金额需要人工签名” —— 而无需交出主密钥。
身份、支付、执行证明和密钥边界:单体代理曾试图在内部伪造的这四个缺失的原语,现在已成为外部的、可组合的服务。
微服务架构的既视感 —— 痛点也如出一辙
每一位经历过 2015-2020 年微服务迁移的架构师,在目睹当前趋势时都会产生一种熟悉的焦虑感。收益是真实的,代价也是真实的。
相比单体等效系统,多智能体(Multi-agent)系统更具弹性、更易审计且更具适应性。它们隔离了故障,允许专业团队独立发布版本,并让你在无需重建钱包层的情况下更换推理模型。然而,40% 的多智能体试点项目在投入生产后的六个月内以失败告终,这通常是因为团队选择了错误的编排模式,或者未能理解系统性能是如何下降的。延迟在多个环节中累积。接口变得僵化。调试模型调用的分布式追踪比调试单体架构更难 —— 毕竟单体架构至少还有一份日志可查。
Web3 继承了这一切,并加上了一个独特的变数:执行层具有对抗性。
智能体 MEV 问题
这是大多数专业网络布道者避而不谈的残酷事实。确定性的、可组合的执行智能体比其单体前身更容易受到 MEV(最大可提取价值)的攻击,而不是更少。
EVM(以太坊虚拟机)在设计上是确定性的:在每个节点上,相同的状态加上相同的交易序列会产生相同的结果。这一保证是区块链共识的基石,同时也是抢跑(Front-running)机器人的梦想。当一个专业执行智能体遵循可预测的模式 —— “在 14:00 UTC 进行再平衡,通过 Uniswap V4 路由,滑点容忍度 0.3%” —— 它就变得极其容易被观察到。夹心攻击(Sandwich)机器人会扫描内存池(Mempool)以寻找这些精确的签名。执行智能体越专业、越具确定性,其攻击面就越清晰。
具有凌乱、多样化行为的单体智能体,反而在某种程度上因其自身的混乱而受到了保护。但一个纪律严明的专业网络则不然。这意味着 MEV 保护技术栈 —— 如 CoW Protocol 等求解器网络、私有订单流、基于意图的批处理以及加密内存池 —— 不再是 DeFi 中可有可无的加分项。对于生产级的专业网络来说,这些是基本门槛。
这对 Web3 基础设施意味着什么