跨链用户体验中的链抽象与意图驱动架构
引言
Layer-1 和 Layer-2 区块链的快速增长导致 Web3 用户体验变得碎片化。如今,用户为了完成跨链的复杂任务,不得不同时操作多个钱包、网络和代币桥。链抽象和意图驱动架构已成为简化这一格局的关键范式。通过抽象掉特定链的细节,并允许用户基于_意图_(期望的结果)而非手动构建每条链的明确交易来行动,这些方法有望实现统一、无缝的跨链体验。本报告深入探讨了链抽象的核心原则、以意图为中心的执行模型设计、真实世界的实现(如 Wormhole 和 Etherspot)、技术基础(中继器、智能钱包等),以及为开发者和最终用户带来的用户体验优势。我们还总结了 EthCC 2025 的见解——链抽象和意图是当时的热门话题——并提供了一个不同协议方法的比较表。
链抽象的原则
链抽象指任何将多个区块链呈现给用户和开发者,使其看起来像一个单一统一环境的技术或框架。其动机是消除由链的异构性引起的_摩擦_。在实践中,链抽象意味着:
- 统一接口: 用户 不再需要为每个区块链管理单独的钱包和 RPC 端点,而是通过一个隐藏网络细节的接口进行交互。开发者可以构建 dApp,而无需在每条链上部署单独的合约,也无需为每个网络编写自定义的桥接逻辑。
- 无需手动桥接: 在链之间移动资产或数据在幕后进行。用户无需手动执行锁定/铸造的桥接交易或兑换桥接代币;抽象层会自动处理。例如,用户可以在一个协议上提供流动性,而无需关心流动性在哪条链上,系统会自动路由资金。
- Gas 费抽象: 用户不再需要持有每条链的原生代币来支付该链上的 Gas 费。抽象层可以赞助 Gas 费或允许用用户选择的资产支付 Gas。这降低了入门门槛,因为用户不必分别获取 ETH、MATIC、SOL 等。
- 网络无关逻辑: 应用逻辑变得_链无关_。智能合约或链下服务协同工作,在任何必要的链上执行用户操作,而无需用户手动切换网络或签署多个交易。本质上,用户的体验就像一个“元链”或一个_区块链无关_的应用层。
核心思想是让用户专注于他们想要实现_什么_,而不是在_哪条链_上或_如何_实现。一个熟悉的类比是 Web 应用程序抽象掉服务器位置——正如用户不需要知道他们的请求触及哪个服务器或数据库一样,Web3 用户也不应该需要知道哪个链或桥被用于某个操作。通过统一层路由交易,链抽象减少了当今多链生态系统的碎片化。
动机: 推动链抽象源于当前跨链工作流程中的痛点。为每条链管理单独的钱包并执行多步骤的跨链操作(在链 A 上交换,桥接到链 B,再在链 B 上交换等)既繁琐又容易出错。碎片化的流动性和不兼容的钱包也限制了 dApp 在各生态系统中的增长。链抽象通过_紧密连接_生态系统来解决这些问题。重要的是,它将以太坊及其众多的 L2 和侧链视为一个统一用户体验的一部分。EthCC 2025 强调,这对于主流采用至关重要——演讲者认为,一个真正以用户为中心的 Web3 未来_“必须抽象掉区块链”_,使多链世界感觉像单一网络一样简单。
意图驱动架构:从交易到意图
传统的区块链交互是以交易为中心的:用户明确构建并签署一个交易,在选定的链上执行特定操作(调用合约函数、转移代币等)。在多链环境中,完成一个复杂目标可能需要在不同网络上进行许多此类交易,每个交易都由用户按正确顺序手动发起。意图驱动架构颠覆了这种模式。用户不再微观管理交易,而是声明一个意图——一个高层次的目标或期望的结果——然后让一个自动化系统找出完成它所需的交易。
在意图驱动的设计下,用户可能会说:“将 Base 上的 100 USDC 兑换成 Arbitrum 上的 100 USDT”。这个意图概括了_做什么_(在一个目标链上将一种资产兑换成另一种),而没有规定_如何做_。一个专门的代理(通常称为求解器 (solver))随后接手完成这项工作。求解器将决定_如何_最好地跨链执行兑换——例如,它可能会使用一个快速桥将 USDC 从 Base 桥接到 Arbitrum,然后执行兑换成 USDT 的操作,或者使用一个直接的跨链兑换协议——无论哪种方式能产生最佳结果。用户签署一个授权,求解器在后端处理复杂的序列,包括寻找最优路径、在每条链上提交必要的交易,甚至预付任何所需的 Gas 费或承担临时风险。
意图如何赋能灵活执行: 通过给予系统决定_如何满足请求_的自由,意图驱动设计使得执行层比固定的用户交易更加智能和灵活。一些优势包括:
- 最优路由: 求解器可以针对成本、速度或可靠性进行优化。例如,多个求解器可能会竞争满足用户的意图,链上拍卖可以选择提供最优价格(例如最佳汇率或最低费用)的那个。这种竞争为用户降低了成本。Wormhole 的 Mayan Swift 协议就是一个例子,它在 Solana 上为每个意图嵌入了一个链上英式拍卖,将竞争从“先到先得”的竞赛转变为基于价格的竞标,以获得更好的用户结果。能够为用户最有利地执行兑换的求解器赢得竞标并执行计划,确保用户获得最大价值。当用户在常规交易中预先指定单一路径时,这种动态价格发现是不可能的。
- 弹性和灵活性: 如果某个桥或 DEX 当下不可用或不是最优选择,求解器可以选择另一条路径。_意图_保持不变,但执行层可以适应网络条件。因此,意图允许可编程的执行策略——例如,拆分订单或通过另一条路径重试——所有这些对最终用户都是不可见的,他们只关心他们的目标是否实现。
- 原子化多链操作: 意图可以包含传统上需要在不同链上进行多次交易的操作。执行框架力求使整个序列感觉上是原子化的,或者至少是故障管理的。例如,求解器可能只有在所有子交易(桥接、兑换等)都确认后才认为意图已完成,如果任何环节失败,则回滚或补偿。这确保了用户的高层操作要么完全完成,要么根本不完成,从而提高了可靠性。
- 卸载复杂性: 意图极大地简化了用户的角色。 用户不需要了解使用哪个桥或交易所,如何分配流动性,或如何安排操作——所有这些都卸载给了基础设施。正如一份报告所说,“用户专注于做什么,而不是怎么做”。一个直接的好处是用户体验:与区块链应用交互变得更像使用 Web2 应用(用户只需请求一个结果,服务处理过程)。
本质上,意图驱动架构将抽象层次从低级的交易提升到高级的目标。以太坊社区对这种模式非常热衷,以太坊基金会已经推出了开放意图框架 (OIF),这是一个用于构建跨链意图系统的开放标准和参考架构。OIF 定义了标准接口(如 ERC-7683 意图格式),用于意图如何在链之间创建、通信和结算,以便许多不同的解决方案(桥、中继器、拍卖机制)可以模块化地接入。这鼓励了一个由_求解器_和_结算协议_组成的完整生态系统,它们可以互操作。意图的兴起源于需要让以太坊及其 rollup 从用户体验的角度感觉“像一条链”——快速且无摩擦,以至于跨 L2 或侧链的移动在几秒钟内发生,而不会给用户带来麻烦。像 ERC-7683(用于标准化意图格式和生命周期)这样的早期标准甚至得到了像 Vitalik Buterin 这样的领导者的支持,凸显了意图驱动设计背后的势头。
关键优势回顾: 总而言之,意图驱动架构带来了几个关键优势:(1)简化的用户体验——用户陈述他们想要什么,系统找出其余部分;(2)跨链流动性——跨越多个网络的操作被无缝处理,有效地将许多链视为一个;(3)开发者可扩展性——dApp 开发者可以接触到许多链上的用户和流动性,而无需为每个链重新发明轮子,因为意图层提供了标准化的跨链执行钩子。通 过将_需要做什么_与_如何/在哪里做_解耦,意图充当了用户友好创新与幕后复杂互操作性之间的桥梁。
跨链抽象的技术构建模块
实现链抽象和基于意图的执行需要一个由多种技术机制协同工作的_技术栈_。关键组件包括:
-
跨链消息中继器: 任何多链系统的核心都是一个能够可靠地在区块链之间传递数据和价值的消息层。像 Wormhole、Hyperlane、Axelar、LayerZero 等协议通过中继消息(通常带有证明或验证者证明)从源链到一个或多个目标链来提供此功能。这些消息可能携带诸如“执行此意图”或“在目标链上铸造此资产”之类的命令。一个强大的中继网络对于统一的交易路由至关重要——它充当链之间的“邮政服务”。例如,Wormhole 的 19 个 Guardian 节点网络观察连接链上的事件,并签署一个 VAA(可验证行为批准),该 VAA 可以提交到任何其他链以证明事件的发生。这将行为与任何单一链解耦,实现了链无关的行为。现代中继器专注于链无关(支持多种链类型)和去中心化以确保安全。例如,Wormhole 不仅支持基于 EVM 的链,还支持 Solana、Cosmos 链等,使其成为跨链通信的多功能选择。消息层通常还处理跨链交易的排序、重试和最终性保证。
-
智能合约钱包(账户抽象): 账户抽象(例如以太坊的 ERC-4337)用智能合约账户取代了外部拥有账户,这些账户可以用自定义验证逻辑和多步交易功能进行编程。这是链 抽象的基础,因为一个智能钱包可以作为用户在所有链上控制资产的单一_元账户_。像 Etherspot 这样的项目使用智能合约钱包来实现跨链的交易批处理和会话密钥等功能。用户的意图可能被打包成一个单一的用户操作(在 4337 术语中),然后钱包合约将其扩展为不同网络上的多个子交易。智能钱包还可以集成 paymaster(赞助商)来代表用户支付 Gas 费,实现真正的 Gas 抽象(用户可能用稳定币支付或根本不支付)。像会话密钥(具有有限权限的临时密钥)这样的安全机制允许用户批准涉及多个操作的意图而无需多次提示,同时限制了风险。简而言之,账户抽象提供了可编程的执行容器,可以解释一个高层次的意图,并(通常通过中继器)将其编排为一系列交易。
-
意图编排与求解器: 在消息和钱包层之上是意图求解器网络——负责找出_如何实现意图_的大脑。在某些架构中,这种逻辑是链上的(例如,一个链上拍卖合约,将意图订单与求解器匹配,如 Wormhole 在 Solana 上为 Mayan Swift 设定的拍卖)。在其他架构中,它是监控意图内存池或订单簿的链下代理(例如,开放意图框架提供了一个参考的 TypeScript 求解器,它监听新的意图事件,然后提交交易来完成它们)。求解器通常必须处理:寻找流动性路径(跨 DEX、桥)、价格发现(确保用户获得公平的汇率),有时还覆盖临时成本(如发布抵押品或承担_最终性风险_——在跨链转移完全最终确定之前向用户交付资金,从而以求解器承担一定风险为代价加快用户体验)。一个设计良好的意图驱动系统通常涉及求解器之间的竞争,以确保用户的意图得 到最优执行。求解器可能会受到经济激励(例如,他们通过完成意图赚取费用或套利利润)。像求解器拍卖或批处理这样的机制可以用来最大化效率。例如,如果多个用户有相似的意图,求解器可能会将它们批处理以最小化每个用户的桥接费用。
-
统一流动性与代币抽象: 跨链移动资产带来了碎片化流动性和包装代币的经典问题。链抽象层通常也抽象代币本身——旨在给用户一种单一资产可以在多条链上使用的体验。一种方法是全链代币(一个代币可以在多个链上原生存在,总供应量统一,而不是许多不兼容的包装版本)。Wormhole 推出了原生代币转移 (NTT),作为传统锁定-铸造桥的演进:NTT 框架不是无限的“桥接”IOU 代币,而是将跨链部署的代币视为一个具有共享铸造/销毁控制的资产。实际上,在 NTT 下桥接资产意味着在源链上_销毁_并在目标链上_铸造_,维持一个单一的流通供应量。这种流动性统一至关重要,这样链抽象才能“传送”资产而不会让用户对多种代币表示感到困惑。其他项目使用流动性网络或池(例如 Connext 或 Axelar),其中流动性提供者在每条链上提供资本以交换资产,因此用户可以有效地一步将一种资产换成其在另一条链上的等价物。Securitize SCOPE 基金的例子很有说明性:一个机构基金代币被制成多链,这样投资者可以在以太坊或 Optimism 上认购或赎回,而在幕后,Wormhole 的协议移动代币,甚至将其转换为生息形式,为用户消除了手动桥接或多个钱包的需求。
-
可编程执行层: 最后,某些链上创新赋能了更复杂的跨链工作流程。原子化多调用支持和交易调度有助于协调多步意图。例如,Sui 区块链的可编程交易块 (PTB) 允许将多个操作(如交换、转移、调用)捆绑到一个原子交易中。这可以通过确保所有步骤要么全部发生要么全不发生,并且只需一个用户签名,来简化 Sui 上的跨链意图实现。在以太坊中,像 EIP-7702(EOA 的智能合约代码)这样的提案扩展了用户账户的功能,以支持诸如赞助 Gas 和多步逻辑,甚至在基础层也是如此。此外,可以采用专门的执行环境或跨链路由器——例如,一些系统将所有意图路由通过一个特定的 L2 或中心,该中心协调跨链操作(用户可能只与该中心交互)。例子包括像 Push Protocol 的 L1 (Push Chain) 这样的项目,它被设计为一个专门的_结算层_,用于链无关操作,具有通用智能合约和亚秒级最终性,以加速跨链交互。虽然并非普遍采用,但这些方法说明了用于实现链抽象的技术范围:从纯粹的链下编排到部署专为跨链意图执行而构建的新链上基础设施。
总而言之,链抽象是通过分层这些组件实现的:一个路由层(跨链消息中继器)、一个账户层(可以在任何链上发起操作的智能钱包)和一个执行层(执行意图的求解器、流动性和合约)。每个部分都是必要的,以确保从用户的角度来看,跨多个区块链与 dApp 交互就像使用单链应用一样顺畅。