跳到主要内容

Ambient 的 720 万美元博弈:Proof of Logits 如何通过 AI 推理取代基于哈希的挖矿

· 阅读需 20 分钟
Dora Noda
Software Engineer

如果保障区块链安全的计算工作同时也能训练下一代 AI 模型,会怎样?这并非遥远的愿景——它是 Ambient 背后的核心论点。Ambient 是一家 Solana 分叉项目,刚刚从 a16z CSX 筹集了 720 万美元,旨在构建全球首个 AI 驱动的工作量证明(PoW)区块链。

传统的工作量证明通过解决任意的加密谜题来消耗电力。比特币矿工竞相寻找具有足够前导零的哈希值——这种计算工作除了维护网络安全之外没有其他价值。Ambient 完全颠覆了这一模式。其 Logits 证明(Proof of Logits, PoL)共识机制用 AI 推理、微调和模型训练取代了哈希运算。矿工不再解决谜题,而是生成可验证的 AI 输出。验证者无需重新计算整个工作负载,而是检查被称为 Logits 的加密指纹。

结果如何?一个安全性与 AI 进步在经济上达成一致的区块链:0.1% 的验证开销使共识检查近乎免费,且训练成本比中心化替代方案降低了 10 倍。如果取得成功,Ambient 可能会通过将挖矿转化为生产性的 AI 劳动,从而回应加密货币领域最古老的批评之一——即工作量证明浪费资源。

Logits 证明的突破:无需重新计算的可验证 AI

理解 PoL 需要了解 Logits 究竟是什么。当大型语言模型(LLM)生成文本时,它们并不直接输出单词。相反,在每一步中,它们会对整个词汇表生成一个概率分布——即代表每个可能的下一个 Token 置信水平的数值分数。

这些分数被称为 Logits。对于一个拥有 50,000 个 Token 词汇量的模型,生成一个单词意味着要计算 50,000 个 Logits。这些数字充当了独特的计算指纹。只有特定的模型、特定的权重、运行特定的输入,才会产生特定的 Logit 分布。

Ambient 的创新在于将 Logits 用作工作量证明:矿工执行 AI 推理(生成对提示词的响应),而验证者通过检查 Logit 指纹而不是重新进行整个计算来验证这项工作。

以下是验证过程的工作原理:

矿工生成输出:矿工接收到一个提示词(例如,“总结区块链共识原则”),并使用一个拥有 6000 亿参数的模型生成 4,000 个 Token 的响应。这将产生 4,000 × 50,000 = 2 亿个 Logits。

验证者抽样验证:验证者无需重新生成所有 4,000 个 Token,而是随机抽取一个位置——例如,第 2,847 个 Token。验证者在该位置运行单步推理,并将矿工报告的 Logits 与预期的分布进行比较。

加密承诺:如果 Logits 匹配(在考虑到浮点精度的可接受阈值内),矿工的工作就会得到验证。如果不匹配,该区块将被拒绝,矿工将失去奖励。

这将验证开销降低到原始计算量的约 0.1%。检查 2 亿个 Logits 的验证者只需验证 50,000 个 Logits(一个 Token 位置),从而将成本降低了 99.9%。将其与传统 PoW 相比,后者的验证意味着重新运行整个哈希函数——或者与比特币的方法相比,对比特币而言,检查单个 SHA-256 哈希是微不足道的,因为谜题本身是任意的。

Ambient 的系统比需要完全重新计算的天真“有用工作证明”方案成本呈指数级降低。它更接近比特币的效率(廉价验证),但提供了实际效用(AI 推理而非无意义的哈希)。

10 倍训练成本降低:没有数据中心垄断的去中心化 AI

中心化 AI 训练非常昂贵——对大多数机构来说高不可攀。训练 GPT-4 规模的模型需要数千万美元,数千块企业级 GPU,并将权力集中在少数科技巨头手中。Ambient 的架构旨在通过将训练分布在独立矿工网络中,使这一过程民主化。

10 倍的成本降低源于两项技术创新:

PETALS 风格的分片:Ambient 借鉴了 PETALS 的技术,这是一个去中心化推理系统,其中每个节点只存储大型模型的一个分片。Ambient 不要求矿工持有整个 6000 亿参数的模型(这需要数 TB 的显存),而是让每个矿工拥有一组层子集。提示词按顺序流经网络,每个矿工处理其分片并将激活值(Activations)传递给下一个。

这意味着拥有单块消费级 GPU(24GB 显存)的矿工也可以参与模型训练,而这类模型通常需要数据中心的数百块 GPU。通过将计算图分布在数百或数千个节点上, Ambient 消除了对传统机器学习集群中使用的昂贵高带宽互连(如 InfiniBand)的需求。

受 SLIDE 启发的稀疏性:大多数神经网络计算涉及矩阵乘法,其中大多数条目接近于零。SLIDE(亚线性深度学习引擎)利用了这一点,通过对激活值进行哈希处理来识别哪些神经元对特定输入真正起作用,从而完全跳过不相关的计算。

Ambient 将这种稀疏性应用于分布式训练。网络不再让所有矿工处理所有数据,而是根据节点的逻辑分片与当前批次的相关性动态路由工作。这减少了通信开销(分布式机器学习中的主要瓶颈),并允许硬件性能较弱的矿工通过处理稀疏子图来参与。

这种结合产生了 Ambient 所声称的比 DiLoCo 或 Hivemind 等现有分布式训练方案高出 10 倍的吞吐量。更重要的是,它降低了准入门槛:矿工不需要数据中心级别的基础设施——一台拥有不错 GPU 的游戏电脑就足以做出贡献。

Solana 分叉架构:高 TPS 与非阻塞 PoW 的结合

Ambient 并非从零开始构建。它是 Solana 的完整分叉,继承了 Solana 虚拟机 (SVM)、历史证明 (PoH) 时间戳和 Gulf Stream 内存池转发。这赋予了 Ambient Solana 级别的 65,000 TPS 理论吞吐量和亚秒级最终确认性。

但 Ambient 做出了一个关键改进:它在 Solana 的共识之上增加了一个 非阻塞工作量证明 (PoW) 层

以下是这种混合共识的工作原理:

历史证明 (PoH) 为交易排序:Solana 的 PoH 提供了一个加密时钟,无需等待全局共识即可为交易排序。这实现了跨多核的并行执行。

Logit 证明 (Proof of Logits) 保护链的安全:矿工通过竞争产生有效的 AI 推理输出。区块链接受那些生成最有价值 AI 成果(通过推理复杂度、模型大小或质押声誉衡量)的矿工提交的区块。

非阻塞集成:与比特币不同(比特币在找到有效 PoW 之前会停止区块生产),Ambient 的 PoW 采用异步运行。验证者继续处理交易,而矿工则竞争提交 AI 成果。这防止了 PoW 成为性能瓶颈。

其结果是,该区块链既保持了 Solana 的速度(对于需要低延迟推理的 AI 应用至关重要),又确保了核心网络活动(推理、微调和训练)中的经济竞争。

这种设计还避免了以太坊早期在 “有用功” (useful work) 共识上犯下的错误。Primecoin 和 Gridcoin 曾尝试将科学计算作为 PoW,但面临一个致命缺陷:有用功的难度并不均匀。有些问题易于解决但难以验证;有些则易于不公平地并行化。Ambient 通过使 logit 验证在计算上变得廉价且标准化,巧妙地避开了这一点。每个推理任务,无论复杂度如何,都可以使用相同的抽查算法进行验证。

训练链上 AGI 的竞赛:还有谁在竞争?

Ambient 并非唯一瞄准区块链原生 AI 的项目。该领域挤满了声称要实现机器学习去中心化的项目,但很少有项目能提供可验证的链上训练。以下是 Ambient 与主要竞争对手的对比:

人工超级智能联盟 (ASI):由 Fetch.AI、SingularityNET 和 Ocean Protocol 合并而成,ASI 专注于去中心化 AGI 基础设施。ASI 链支持并发代理执行和安全模型交易。与 Ambient 的 PoW 方法不同,ASI 依赖于市场模型,开发者支付计算积分。这适用于推理,但无法对齐训练的激励机制——矿工没有理由贡献昂贵的 GPU 工时,除非预先获得明确补偿。

AIVM (ChainGPT):ChainGPT 的 AIVM 路线图 目标是在 2026 年启动主网,将链外 GPU 资源与链上验证集成。然而,AIVM 的验证依赖于乐观汇总 (Optimistic Rollups)(即除非受到挑战,否则假设正确),这引入了欺诈证明延迟。Ambient 的 logit 检查是确定性的——验证者可以立即知道工作是否有效。

互联网计算机 (ICP):Dfinity 的 互联网计算机 可以在不依赖外部云基础设施的情况下,在链上原生托管大型模型。但 ICP 的容器 (Canister) 架构并非为训练而优化——它是为推理和智能合约执行而设计的。Ambient 的 PoW 在经济上激励持续的模型改进,而 ICP 则要求开发者在外部管理训练。

Bittensor:Bittensor 使用子网模型,其中专门的链训练不同的 AI 任务(文本生成、图像分类等)。矿工通过提交模型权重进行竞争,验证者根据表现对它们进行排名。Bittensor 在去中心化推理方面表现出色,但在训练协作方面面临挑战——它没有统一的全局模型,只是独立子网的集合。Ambient 的方法将训练统一在单个 PoW 机制下。

Lightchain Protocol AILightchain 的白皮书 提出了智能证明 (PoI),节点通过执行 AI 任务来验证交易。然而,Lightchain 的共识在很大程度上仍处于理论阶段,尚未宣布测试网发布。相比之下,Ambient 计划在 2025 年第二/第三季度发布测试网

Ambient 的优势在于将可验证的 AI 成果与 Solana 经过验证的高吞吐量架构相结合。大多数竞争对手要么牺牲了去中心化(中心化训练配合链上验证),要么牺牲了性能(等待欺诈证明的缓慢共识)。Ambient 基于 logit 的 PoW 同时提供了这两点:去中心化训练与近乎瞬时的验证。

经济激励:像挖掘比特币区块一样挖掘 AI 模型

Ambient 的经济模型镜像了比特币:可预测的区块奖励 + 交易费用。但矿工生产的不是空区块,而是应用程序可以消耗的 AI 输出。

以下是激励结构的工作原理:

基于通胀的奖励:早期矿工因贡献 AI 推理、微调或训练而获得区块补贴(新铸造的代币)。与比特币的减半计划类似,补贴随时间减少,确保了长期稀缺性。

基于交易的费用:应用程序为 AI 服务付费——推理请求、模型微调或访问训练好的权重。这些费用流向执行工作的矿工,在补贴下降时建立可持续的收入模型。

声誉质押:为了防止女巫攻击 (Sybil attacks)(矿工提交低质量工作以骗取奖励),Ambient 引入了质押声誉。矿工必须锁定代币才能参与;产生无效 logit 会导致惩罚 (Slashing)。这使激励机制对齐:矿工通过生成准确、有用的 AI 输出而不是钻系统空子来最大化利润。

适度的硬件门槛:与 ASIC 矿场占据主导地位的比特币不同,Ambient 的 PETALS 分片允许使用消费级 GPU 参与。拥有单个 RTX 4090(24GB VRAM,约 1,600 美元)的矿工可以通过拥有一个分片来为 6000 亿参数模型的训练做出贡献。这使参与变得民主化——无需耗资百万美元的数据中心。

这种模型解决了去中心化 AI 中的一个关键问题:搭便车问题。在传统的 PoS 链中,验证者质押资金但不贡献计算。在 Ambient 中,矿工贡献实际的 AI 工作,确保网络的效用与其安全预算成比例增长。

270 亿美元的 AI 代理板块:为什么 2026 年是转折点

Ambient 的时机与更广泛的市场趋势相吻合。AI 代理加密板块 估值已达 270 亿美元,其动力源于管理链上资产、执行交易以及跨协议协调的自主程序。

但当前的代理面临信任问题:大多数代理依赖于中心化的 AI API(如 OpenAI、Anthropic、Google)。如果一个管理着 1,000 万美元 DeFi 仓位的代理使用 GPT-4 进行决策,用户无法保证该模型未被篡改、审查或存在偏见。目前还没有审计追踪能证明该代理是自主行动的。

Ambient 通过链上验证解决了这一问题。每一次 AI 推理都记录在区块链上,通过 Logits 证明所使用的确切模型和输入。应用程序可以:

审计代理决策:DAO 可以验证其国库管理代理使用的是特定的、经社区批准的模型,而不是秘密修改过的版本。

强制合规:受监管的 DeFi 协议可以要求代理使用具有经验证安全护栏的模型,且这些护栏在链上可证明。

启用 AI 市场:开发者可以将微调后的模型作为 NFT 出售,由 Ambient 提供训练数据和权重的加密证明。

这使 Ambient 成为下一波自主代理的基础设施。随着 2026 年成为转折点,即“AI、区块链和支付汇聚成一个单一的、自我协调的互联网”,Ambient 的可验证 AI 层将成为关键的底层设施。

技术风险与悬而未决的问题

Ambient 的愿景宏大,但仍有几个技术挑战尚未解决:

确定性与浮点漂移:AI 模型使用浮点运算,这在不同硬件之间并不是完全确定的。在 NVIDIA A100 上运行的模型产生的 Logits 可能与 AMD MI250 上的略有不同。如果验证者因细微的数值漂移而拒绝区块,网络就会变得不稳定。Ambient 需要设定严格的容差范围——但如果太严,使用不同硬件的矿工就会受到不公平的惩罚。

模型更新与版本控制:如果 Ambient 协作训练一个全局模型,它如何处理更新?在比特币中,所有节点运行相同的共识规则。在 Ambient 中,矿工不断微调模型。如果一半网络更新到 2.0 版本,而另一半留在 1.9,验证就会失效。白皮书并未详细说明模型版本控制和向后兼容性如何运作。

提示词多样性与工作标准化:比特币的 PoW 是统一的——每个矿工解决相同类型的谜题。Ambient 的 PoW 则是多样的——有些矿工回答数学问题,有些编写代码,有些总结文档。验证者如何比较不同任务的“价值”?如果一名矿工生成了 10,000 个乱码 Token(简单),而另一名矿工在困难数据集上微调模型(昂贵),谁应该获得更多奖励?Ambient 需要一种类似于比特币哈希难度的 AI 工作难度调整算法,但衡量“推理难度”并非易事。

分布式训练中的延迟:PETALS 样式的分片对推理(顺序层处理)效果很好,但训练需要反向传播——梯度在网络中向后流动。如果各层分布在网络延迟各异的节点上,梯度更新就会成为瓶颈。Ambient 声称吞吐量提高了 10 倍,但实际性能取决于网络拓扑和矿工分布。

中心化风险与模型托管:如果只有少数节点能负担得起托管最有价值的模型分片(例如 6000 亿参数模型的最后几层),他们将获得不成比例的影响力。验证者可能会优先将工作分配给连接良好的节点,从而在一个本应去中心化的网络中重现数据中心的中心化现象。

这些并非致命缺陷,而是每个区块链 AI 项目都会面临的工程挑战。但 Ambient 在 2025 年第二/第三季度的测试网发布将揭示其理论在现实条件下是否成立。

下一步:测试网、主网与 AGI 终局

Ambient 的路线图目标是在 2025 年第二/第三季度启动测试网,主网随后于 2026 年上线。来自 a16z CSX、Delphi Digital 和 Amber Group 的 720 万美元种子轮融资为核心开发提供了资金保障,但该项目的长期成功取决于生态系统的采用。

值得关注的关键里程碑:

测试网挖矿参与度:有多少矿工加入网络?如果 Ambient 吸引了成千上万的 GPU 所有者(类似于早期的以太坊挖矿),则证明了其经济模式的可行性。如果只有少数实体挖矿,则预示着中心化风险。

模型性能基准:Ambient 训练的模型能否与 OpenAI 或 Anthropic 竞争?如果一个去中心化的 6000 亿参数模型达到了 GPT-4 级别的质量,就验证了整个方案的可行性。如果性能落后太多,开发者仍会选择中心化 API。

应用程序集成:哪些 DeFi 协议、DAO 或 AI 代理会构建在 Ambient 之上?只有当真实应用消耗链上 AI 推理时,其价值主张才能实现。早期用例可能包括:

  • 具有可证明决策逻辑的自主交易代理
  • 去中心化内容审核(AI 模型过滤帖子,链上可审计)
  • 可验证的 AI 预言机(链上价格预测或情绪分析)

与以太坊和 Cosmos 的互操作性:Ambient 是 Solana 的一个分叉,但 AI 代理经济跨越多个链。连接以太坊(用于 DeFi)和 Cosmos(用于 IBC 连接的 AI 链,如 ASI)的桥接将决定 Ambient 成为孤岛还是枢纽。

最终的目标宏伟:训练 去中心化的通用人工智能 (AGI),且没有任何单一实体控制该模型。如果成千上万的独立矿工协作训练一个超智能系统,并对每个训练步骤进行加密证明,这将代表第一条真正开放、可审计的 AGI 之路。

Ambient 能否实现这一目标,还是成为又一个承诺过度的加密项目,取决于执行力。但其核心创新——用可验证的 AI 工作取代无意义的加密谜题——是一项真正的突破。如果工作量证明可以是有产出的而非浪费的,Ambient 将率先证明这一点。

Proof-of-Logits 范式转移

Ambient 的 720 万美元融资不仅仅是另一场加密货币融资。这是一场赌注,赌的是区块链共识和 AI 训练可以融合成一个经济利益一致的单一系统。其影响远不止于 Ambient:

如果基于 Logit 的验证行之有效,其他链将会采用它。以太坊可以引入 PoL 作为 PoS 的替代方案,奖励那些贡献 AI 工作而非仅仅质押 ETH 的验证者。比特币可能会通过分叉来使用有用的计算,而不是 SHA-256 哈希(尽管比特币极大化主义者永远不会接受这一点)。

如果去中心化训练实现了具有竞争力的性能,OpenAI 和 Google 将失去他们的护城河。在一个任何拥有 GPU 的人都可以为 AGI 开发做出贡献,并因其工作赚取代币的世界里,中心化的 AI 寡头垄断将被根本性地颠覆。

如果链上 AI 验证成为标准,自主代理将获得可信度。用户不再信任黑盒 API,而是在链上验证确切的模型和提示词。这将解锁受监管的 DeFi、算法治理和 AI 驱动的法律合约。

Ambient 并不保证一定会赢。但它是迄今为止技术上最可靠的一次尝试,旨在让工作量证明(PoW)发挥实际效用,去中心化 AI 训练,并将区块链安全与文明进步结合起来。测试网的启动将展示理论是否符合现实——或者 Proof-of-Logits 是否会加入那些雄心勃勃的共识实验坟场。

无论如何,训练链上 AGI 的竞赛现在已不可否认地真实开启。而 Ambient 刚刚在起跑线上投入了 720 万美元。


来源: