Aptos 与 Jump Crypto 推出 Shelby : 可重塑 AI 数据基础设施的可验证热存储网络
每个 AI 模型的可信度都取决于其训练数据——然而在今天,还没有一种可靠的方法来证明这些数据的来源、归属权,以及它们在传输过程中是否保持完整。Aptos Labs 和 Jump Crypto 相信他们已经构建了这一缺失的层。他们的新协议 Shelby 是全球首个可验证的全球对象存储网络,专为 AI 读取工作负载而设计,其早期访问测试网现已上线。
尚未解决的难题:热、可验证且去中心化的存储
去中心化存储并非新鲜事。Filecoin 自 2020 年以来一直在归档艾字节(exabytes)级别的冷数据。Arweave 为不可变记录提供永久、一次性付费的存储。但这两者都不是为 2026 年 AI 经济中的主导工作负载设计的—— 这些工作负载需要毫秒级的读取速度、全球可用性,以及对每一次请求进行密码学来源证明。
想象一下,一个 AI 训练流水线从分布式数据集中提取数百万个“图像-标签”对。或者一个由 50,000 个传感器组成的 DePIN 网络实时向推理模型流式传输遥测数据。或者一个向数百万用户同时提供个性化内容推送的社交平台。在所有这些情况下,数据必须是“热”的:能够立即访问,而不是归档在磁带驱动器上等待检索交易结算。
像 AWS S3 这样的云服务商可以轻松处理热存储,但它们无法提供任何可验证性。你无法证明收到的对象与最初存储的对象完全一致,无法证明没有中间人在传输过程中篡改它,也无法证明内容创作者确实同意了其使用。随着全球范围内 AI 监管的收紧——欧盟《AI 法案》现在要求提供训练数据来源文档——这一缺口正成为一种法律风险。
Shelby 通过将三个从未集成到单一系统中的要素结合在一起来填补这一空白:云级读取性能、密码学验证收据,以及不受任何单一实体控制的去中心化基础设施。
Shelby 如何运作:新存储原语的架构
Shelby 的设计借鉴了 Web2 基础设施和区块链协议工程的经验。其架构清晰地将控制平面(协调、支付、验证)与数据平面(实际存储和交付)分离,任何运营过大规模云基础设施的人对这种模式都不会陌生。
数据平面:DoubleZero 与 Jump Crypto 的优势
物理层或许是 Shelby 最容易被低估的优势。Shelby 并不依赖于延迟不可预测且带宽共享的公共互联网,而是运行在 DoubleZero 上,这是一个横跨五大洲 30 多个城市的专用光纤骨干网。这与高频交易公司用于微秒级执行的网络基础设施属于同一级别。
作为加密领域技术最尖端的公司之一,Jump Crypto 带来了在量化交易环境中经受过考验的存储基础设施,在那种环境下,每一毫秒的数据检索延迟都会转化为真实的财务成本。专用光纤与交易级存储节点的结合,使 Shelby 能够承诺在任何地区实现亚秒级读取。
数据使用 **Clay 纠删码(erasure coding)**技术进行编码,这种技术在保持高可用性的同时最大限度地减少了副本开销。与简单的副本复制(存储三个副本)不同,纠删码将数据分割成碎片并分发到各个节点,以便任何碎片的子集都可以重建原始数据。这意味着每 GB 的存储成本更低,并且在节点下线时修复带宽需求也降至最低。
控制平面:Aptos 作为验证层
Shelby 服务的每一个读取请求都可以返回一个密码学收据——这是一个可验证的证明,记录了:
- 交付了什么(内容哈希)
- 何时交付(时间戳)
- 数据源自何处(存储节点身份)
- 基于何种权利授予访问权限(许可和同意元数据)
这些收据锚定在 Aptos 区块链上,Aptos 提供了结算和协调底层。选择 Aptos 是因为其性能特性:600 毫秒的最终确定性、每秒 30,000 笔交易以及低至 0.000005 美元的 Gas 费。这意味着每天锚定数百万份验证收据在经济上是可行的——这在以太坊主网上将昂贵得令人望而却步。
虽然 Aptos 是原生协调层,但 Shelby 被设计为链无关(chain-agnostic)。目前已计划支持以太坊、Solana 和其他链,允许任何区块链上的应用程序利用 Shelby 的验证存储,而无需迁移其整个技术栈。
经济模型:按读取付费的微支付
Shelby 通过微支付通道引入了**按读取付费(pay-per-read)**的经济模型,这有别于 Filecoin 使用的预付存储协议或 Arweave 收取的一次性永久费用。这使激励机制与实际使用情况相一致:存储提供商赚取的收入与其数据被访问的频率成正比,从而产生了保持热门数据处于“热存储”状态并可用的自然经济压力。
这种模型特别适合 AI 工作负载,因为在一次训练运行中,训练数据集可能会被读取数十亿次,但随后访问频率就会降低。在 Shelby 的模型下,成本随实际需求变动,而不是要求为归档永久性支付预付费。
为什么 AI 现在需要可验证存储
Shelby 的发布并非偶然。三种力量的汇聚正创造出对可验证数据基础设施的紧迫需求。
数据溯源危机
随着 AI 模型变得日益强大,“这个模型是用什么数据训练的?” 这个问题已从学术好奇转变为监管要求。欧盟《AI 法案》规定必须记录训练数据源。美国关于 AI 安全的行政命令强调了数据溯源。中国的生成式 AI 法规也要求内容具有可追溯性。
然而,当今的基础设施缺乏系统化的方法来执行这些要求。训练数据通常是从 S3 存储桶下载、从网站抓取,或通过不透明的协议授权,缺乏加密监管链。Shelby 的验证收据创建了一个可审计的踪迹,可以在链上证明每一份训练数据都是在获得妥善许可和授权的情况下访问的。
AI 数据市场机遇
预计到 2030 年,AI 训练数据市场规模将超过 500 亿美元。但目前的市场模式已经破碎:数据提供者无法验证买家是否遵守了使用限制,而买家也无法验证数据在交付前是否被篡改。
Shelby 催生了一类全新的 可验证数据市场,其中许可、归属和授权条款随数据对象本身一起流转。数据集所有者可以将带有嵌入式许可元数据的训练数据发布 到 Shelby,随后的每一次访问都会生成一份加密收据,用以证明合规性——或者揭露违规行为。
DePIN 数据的爆发
DePIN 领域的市值已从 2024 年的 52 亿美元增长到 2025 年的超过 190 亿美元,增长率接近 270%。CoinGecko 目前追踪了 250 多个 DePIN 项目,这些项目正在产生海量的传感器数据、遥测数据和用户内容。
这些网络需要热存储,既要快到足以支持实时推理,又要具有足够的可验证性以证明数据的真实性。一个消耗 10,000 个去中心化气象站读数的气象预测模型需要确信每个读数都是真实、未修改的,并由声称的地理位置发送。Shelby 的架构——结合了低延迟交付与单次读取验证——正是为这种用例量身定制的。
Shelby 与去中心化存储格局的对比
要理解 Shelby 的定位,需要考察去中心化存储市场的成熟过程。
| 功能 | Filecoin | Arweave | Akave Cloud | Shelby |
|---|---|---|---|---|
| 主要用例 | 归档 / 冷存储 | 永久不可变存储 | S3 兼容的企业级备份 | 用于 AI 读取的热存储 |
| 延迟 | 秒级至分钟级 | 秒级 | 亚秒级 | 亚秒级 |
| 验证方式 | 存储证明 | 访问证明(捆绑式) | 加密审计线索 | 每次读取的加密收据 |
| 成本模型 | 存储订单(预付) | 一次性永久费用 | 按需付费(比 AWS 便宜 80%) | 按次读取微付款 |
| 网络 | 公共互联网 | 公共互联网 | 公共互联网 | 专用光纤 (DoubleZero) |
| 最适合 | 长期归档、备份 | 永久记录、出版 | 企业云替代方案 | AI 流水线、DePIN、流媒体 |
核心洞察在于,这些方案是 互补 的,而非竞争关系。Filecoin 擅长长期归档。Arweave 是必须永久存在的数据的理想选择。Akave 为企业提供熟悉的 S3 兼容接口。而 Shelby 填补了此前空白的象限:去中心化存储既快到足以支持生产级 AI 工作负载,又具有足够的可验证性以满足监管要求。
开发者可以构建什么
Shelby 早期访问测试网开启了几个新的应用类别。
AI 数据市场:数据提供者发布带有嵌入式许可条款的数据集,每个模型训练者的访问都会生成可验证的合规收据。这可能会改变 AI 训练数据权利方面的法律格局。
可验证 AI 训练流水线:组织可以向监管机构和审计人员证明,他们的模型完全是基于获得妥善许可的数据训练的,并拥有从数据摄取到模型部署的完整链上审计线索。
实时 DePIN 应用:传感器网络、自动驾驶车队和物联网网格可以通过 Shelby 流式传输数据,并进行单次读取验证,使下游 AI 模 型能够在不依赖中心化守门人的情况下信任其输入数据。
去中心化内容分发:社交平台和媒体应用可以全球范围内以亚秒级延迟提供内容,同时保持内容来源和创作者权利的加密证明——这是深度伪造 (Deepfake) 归因问题的一个潜在解决方案。
前行之路
Shelby 的早期访问测试网代表了多阶段推出的开始。一个面向开发者的开发网 (devnet) 已于 2025 年底启动,目前的公开测试网允许 AI 团队和开发者开始将 Shelby 集成到实际工作负载中。预计将于 2026 年晚些时候正式上线生产环境。
更广泛的区块链 AI 基础设施市场预计将从 2024 年的 60 亿美元增长到 2030 年的 500 亿美元,复合年增长率为 42.4%。在这一市场中,可验证数据基础设施——不仅证明数据存在,而且证明数据被正确、合规且未经篡改地访问的能力——可能被证明是最有价值的原语。
如果 Shelby 兑现了其架构的承诺,它将不仅仅是另一个存储协议。它将成为 AI 经济所需但从未拥有过的信任层——连接 “数据可用” 与 “数据验证” 之间的加密桥梁。
随着区块链基础设施的不断演进,像 Shelby 这样在 Aptos 上挑战极限的协议不断涌现,开发者需要可靠地访问驱动这些创新的网络。BlockEden.xyz 为 Aptos 及其他 20 多个链提供企业级 RPC 和 API 服务,为构建者提供与下一代协议集成的基础。