Ambient 的 720 万美元博弈:Proof of Logits 如何通过 AI 推理取代基于哈希的挖矿
如果保障区块链安全的计算工作同时也能训练下一代 AI 模型,会怎样?这并非遥远的愿景——它是 Ambient 背后的核心论点。Ambient 是一家 Solana 分叉项目,刚刚从 a16z CSX 筹集了 720 万美元,旨在构建全球首个 AI 驱动的工作量证明(PoW)区块链。
传统的工作量证明通过解决任意的加密谜题来消耗电力。比特币矿工竞相寻找具有足够前导零的哈希值——这种计算工作除了维护网络安全之外没有其他价值。Ambient 完全颠覆了这一模式。其 Logits 证明(Proof of Logits, PoL)共识机制用 AI 推理、微调和模型训练取代了哈希运算。矿工不再解决谜题,而是生成可验证的 AI 输出。验证者无需重新计算整个工作负载,而是检查被称为 Logits 的加密指纹。
结果如何?一个安全性与 AI 进步在经济上达成一致的区块链:0.1% 的验证开销使共识检查近乎免费,且训练成本比中心化替代方案降低了 10 倍。如果取得成功,Ambient 可能会通过将挖矿转化为生产性的 AI 劳动,从而回应加密货币领域最古老的批评之一 ——即工作量证明浪费资源。
Logits 证明的突破:无需重新计算的可验证 AI
理解 PoL 需要了解 Logits 究竟是什么。当大型语言模型(LLM)生成文本时,它们并不直接输出单词。相反,在每一步中,它们会对整个词汇表生成一个概率分布——即代表每个可能的下一个 Token 置信水平的数值分数。
这些分数被称为 Logits。对于一个拥有 50,000 个 Token 词汇量的模型,生成一个单词意味着要计算 50,000 个 Logits。这些数字充当了独特的计算指纹。只有特定的模型、特定的权重、运行特定的输入,才会产生特定的 Logit 分布。
Ambient 的创新在于将 Logits 用作工作量证明:矿工执行 AI 推理(生成对提示词的响应),而验证者通过检查 Logit 指纹而不是重新进行整个计算来验证这项工作。
以下是验证过程的工作原理:
矿工生成输出:矿工接收到一个提示词(例如,“总结区块链共识原则”),并使用一个拥有 6000 亿参数的模型生成 4,000 个 Token 的响应。这将产生 4,000 × 50,000 = 2 亿个 Logits。
验证者抽样验证:验证者无需重新生成所有 4,000 个 Token,而是随机抽取一个位置——例如,第 2,847 个 Token。验证者在该位置运行单步推理,并将矿工报告的 Logits 与预期的分布进行比较。
加密承诺:如果 Logits 匹配(在考虑到浮点精度的可接受阈值内),矿工的工作就会得到验证。如果不匹配,该区块将被拒绝,矿工将失去奖励。
这将验证开销降低到原始计算量的约 0.1%。检查 2 亿个 Logits 的验证者只需验证 50,000 个 Logits(一个 Token 位置),从而将成本降低了 99.9%。将其与传统 PoW 相比,后者的验证意味着重新运行整个哈希函数——或者与比特币的方法相比,对比特币而言,检查单个 SHA-256 哈希是微不足道的,因为谜题本身是任意的。
Ambient 的系统比需要完全重新计算的天真“有用工作证明”方案成本呈指数级降低。它更接近比特币的效率(廉价验证),但提供了实际效用(AI 推理而非无意义的哈希)。
10 倍训练成本降低:没有数据中心垄断的去中心化 AI
中心化 AI 训练非常昂贵——对大多数机构来说高不可攀。训练 GPT-4 规模的模型需要数千万美元,数千块企业级 GPU,并将权力集中在少数科技巨头手中。Ambient 的架构旨在通过将训练分布在独立矿工网络中,使这一过程民主化。
10 倍的成本降低源于两项技术创新:
PETALS 风格的分片:Ambient 借鉴了 PETALS 的技术,这是一个去中心化推理系统,其中每个节点只存储大型模型的一个分片。Ambient 不要求矿工持有整个 6000 亿参数的模型(这需要数 TB 的显存),而是让每个矿工拥有一组层子集。提示词按顺序流经网络,每个矿工处理其分片并将激活值(Activations)传递给下一个。
这意味着拥有单块消费级 GPU (24GB 显存)的矿工也可以参与模型训练,而这类模型通常需要数据中心的数百块 GPU。通过将计算图分布在数百或数千个节点上, Ambient 消除了对传统机器学习集群中使用的昂贵高带宽互连(如 InfiniBand)的需求。
受 SLIDE 启发的稀疏性:大多数神经网络计算涉及矩阵乘法,其中大多数条目接近于零。SLIDE(亚线性深度学习引擎)利用了这一点,通过对激活值进行哈希处理来识别哪些神经元对特定输入真正起作用,从而完全跳过不相关的计算。
Ambient 将这种稀疏性应用于分布式训练。网络不再让所有矿工处理所有数据,而是根据节点的逻辑分片与当前批次的相关性动态路由工作。这减少了通信开销(分布式机器学习中的主要瓶颈),并允许硬件性能较弱的矿工通过处理稀疏子图来参与。
这种结合产生了 Ambient 所声称的比 DiLoCo 或 Hivemind 等现有分布式训练方案高出 10 倍的吞吐量。更重要的是,它降低了准入门槛:矿工不需要数据中心级别的基础设施——一台拥有不错 GPU 的游戏电脑就足以做出贡献。
Solana 分叉架构:高 TPS 与非阻塞 PoW 的结合
Ambient 并非从零开始构建。它是 Solana 的完整分叉,继承了 Solana 虚拟机 (SVM)、历史证明 (PoH) 时间戳和 Gulf Stream 内存池转发。这赋予了 Ambient Solana 级别的 65,000 TPS 理论吞吐量和亚秒级最终确认性。
但 Ambient 做出了一个关键改进:它在 Solana 的共识之上增加了一个 非阻塞工作量证明 (PoW) 层。
以下是这种混合共识的工作原理:
历史证明 (PoH) 为交易排序:Solana 的 PoH 提供了一个加密时钟,无需等待全局共识即可为交易排序。这实现了跨多核的并行执行。
Logit 证明 (Proof of Logits) 保护链的安全:矿工通过竞争产生有效的 AI 推理输出。区块链接受那些生成最有价值 AI 成果(通过推理复杂度、模型大小或质押声誉衡量)的矿工提交的区块。
非阻塞集成:与比特币不同(比特币在找到有效 PoW 之前会停止区块生产),Ambient 的 PoW 采用异步运行。验证者继续处理交易,而矿工则竞争提交 AI 成果。这防止了 PoW 成为性能瓶颈。
其结果是,该区块链既保持了 Solana 的速度(对于需要低延迟推理的 AI 应用至关重要),又确保了核心网络活动(推理、微调和训练)中的经济竞争。
这种设计还避免了以太坊早期在 “有用功” (useful work) 共识上犯下的错误。Primecoin 和 Gridcoin 曾尝试将科学计算作为 PoW,但面临一个致命缺陷:有用功的难度并不均匀。有些问题易于解决但难以验证;有些则易于不公平地并行化。Ambient 通过使 logit 验证在计算上变得廉价且标准化,巧妙地避开了这一点。每个推理任务,无论复杂度如何,都可以使用相同的抽查算法进行验证。