Celestia 的数据可用性采样如何达到每秒 1 Terabit:技术深度解析
2026 年 1 月 13 日,Celestia 以一项单一基准打破了预期:在 498 个分布式节点上实现了 每秒 1 Terabit (1 Tbps) 的数据吞吐量。作为参考,这个带宽足以在不到一秒的时间内处理以太坊最大的 Layer 2 Rollup 全天的交易量。
但真正的故事并非仅在于这个头条数字。而是在于使其成为可能的加密基础设施:数据可用性采样 (Data Availability Sampling, DAS)。这是一项突破性技术,允许资源受限的轻节点在无需下载整个区块的情况下验证区块链数据的可用性。随着 Rollup 竞相扩展到以太坊原生 Blob 存储之外,理解 Celestia 如何实现这一吞吐量——以及为什么它对 Rollup 经济学至关重要——变得前所未有的紧迫。
数据可用性瓶颈:为什么 Rollup 需要更好的解决方案
区块链的可扩展性长期以来一直受制于一个基本权衡:如何在不要求每个节点下载并存储所有数据的情况下,验证交易数据确实可用?这就是 数据可用性问题 (Data Availability Problem),它是 Rollup 扩展的主要瓶颈。
以太坊的方法——要求每个全节点下载完整区块——制造了准入门槛。随着区块大小的增长,能够负担运行全节点所需带宽和存储费用的参与者越来越少,这威胁到了去中心化。将数据发布到以太坊 L1 的 Rollup 面临着高昂的成本:在需求高峰期,单次批处理的 Gas 费用可能高达数千美元。
进入模块化数据可用性层。通过将数据可用性与执行和共识分离,像 Celestia、EigenDA 和 Avail 这样的协议承诺在保持安全保障的同时大幅降低 Rollup 成本。Celestia 的创新之处?一种采样技术 反转了验证模型:轻节点不再通过下载所有内容来验证可用性,而是通过随机采样微小的片段,从而获得对完整数据集存在的统计信心。
数据可用性采样详解:轻节点如何在不下载的情况下进行验证
DAS 的核心是一种概率验证机制。其工作原理如下:
随机采样与置信度建立
轻节点不下载整个区块。相反,它们对区块数据的极小部分进行 多轮随机采样。每次成功的采样都会增加对完整区块可用性的置信 度。
数学逻辑非常优雅:如果一个恶意的验证者隐藏了哪怕一小部分区块数据,诚实的轻节点在仅进行几轮采样后,就有极高的概率检测到不可用性。这创建了一个安全模型,即使是资源有限的设备也可以参与数据可用性验证。
具体而言,每个轻节点会在扩展数据矩阵中随机选择一组唯一的坐标,并向桥接节点请求相应的数据份额及默克尔证明 (Merkle proofs)。如果轻节点收到的每个查询都有有效的响应,则统计概率保证了整个区块的数据是可用的。
二维 Reed-Solomon 编码:数学基础
Celestia 采用 二维 Reed-Solomon 编码方案 (2-dimensional Reed-Solomon encoding scheme),使采样既高效又具备抗欺诈性。以下是技术流程:
- 区块数据被分割 成 k × k 个区块,形成一个数据方阵。
- Reed-Solomon 纠删码 (Erasure coding) 将其扩展为 2k × 2k 矩阵(增加冗余)。
- 计算默克尔根,对应扩展矩阵的每一行和每一列。
- 这些根的默克尔根 成为区块头中的区块数据承诺 (Data Commitment)。
这种方法具有一个关键特性:如果扩展矩阵的任何部分丢失,编码就会失效,轻节点在验证默克尔证明时会检测到不一致。攻击者无法在不被发现的情况下选择性地保留数据。
命名空间默克尔树:Rollup 特定数据隔离
这就是 Celestia 架构在多 Rollup 环境中脱颖而出的地方:命名空间默克尔树 (Namespaced Merkle Trees, NMTs)。
标准默克尔树会任意地对数据进行分组。然而,NMT 为每个节点标记其子节点的最小和最大命名空间标识符,并 按命名空间对叶子节点进行排序。这使得 Rollup 能够:
- 仅从 DA 层下载属于自己的数据。
- 通过默克尔证明 证明其命名空间数据的完整性。
- 完全 忽略来自其他 Rollup 的无关数据。
对于 Rollup 运营商来说,这意味着你无需支付带宽成本去下载竞争链的数据。你只需获取你真正需要的部分,用加密证明进行验证,然后继续。与所有参与者都必须处理所有数据的单体链相比,这是一个巨大的效率提升。
Matcha 升级:扩展至 128MB 区块
在 2025 年,Celestia 激活了 Matcha 升级,这是模块化数据可用性的分水岭时刻。以下是发生的变化:
区块大小扩展
Matcha 将最大区块大小从 8 MB 增加到 128 MB——实现了 16 倍的容量提升。这具体表现为:
- 数据平方大小:128 → 512
- 最大交易大小:2 MB → 8 MB
- 持续吞吐量:测试网中达到 21.33 MB/s(2025 年 4 月)
为了更直观地理解,以太坊的目标 Blob 数量为每个区块 6 个(约 0.75 MB),可扩展至 9 个 Blob。Celestia 的 128 MB 区块容量是其 100 倍以上。
高吞吐量区块传播
限制因素不仅仅是区块大小——还有 区块传播速度。Matcha 引入了一种新的传播机制 (CIP-38),可以在不引起验证者去同步的情况下,在网络中安全地分发 128 MB 的区块。
在测试网中,网络在 128 MB 区块下保持了 6 秒的区块时间,实现了 21.33 MB/s 的吞吐量。这代表了当前主网容量的 16 倍。
存储成本降低
一个最常被忽视的经济变化是:Matcha 将最小数据修剪窗口从 30 天缩短至 7 天 + 1 小时 (CIP-34)。
对于桥节点(Bridge nodes),在预期的吞吐量水平下,这将其存储需求从 30 TB 削减至 7 TB。基础设施提供商运营成本的降低,直接转化为 Rollup 更便宜的数据可用性成本。