跳到主要内容

Bittensor 的 SN3 押注网络进行万亿参数模型训练

· 阅读需 14 分钟
Dora Noda
Software Engineer

2026 年 3 月,数十名使用家庭互联网连接的匿名矿工训练出了一个拥有 720 亿参数的语言模型,其得分与 Meta 的 Llama 2 70B 仅一步之遥。六周后,领导该项目的团队退出,抛售了价值 1,000 万美元的 TAO,并称 Bittensor 的去中心化只是“演戏”。现在,幸存的社区想要再次挑战——规模是之前的 14 倍,耗时约 4 周,而整个去中心化 AI 命题的成败都系于此结果。

这是一个关于 Bittensor 子网 3(Subnet 3,在 Covenant AI 退出后最近更名为 Teutonic)如何决定启动万亿参数训练运行的故事。此次运行的时间节点恰好选在灰度(Grayscale)TAO ETF 的 SEC 审查窗口期。这是一场豪赌,赌的是协议的激励层比构建它的人更重要,赌的是这个在治理危机中幸存下来的网络,能在监管机构决定是否让华尔街入场之前,交付去中心化 AI 的“DeepSeek 时刻”。

72B 模型如何成为无许可 AI 的基准

故事始于 2026 年 3 月 10 日,当时以 Templar 之名运营的子网 3 发布了 Covenant-72B。这是一个拥有 720 亿参数的模型,由 70 多名通过公共互联网协作的独立矿工利用约 1.1 万亿个 token 训练而成。这是迄今为止完成的规模最大的去中心化 LLM 预训练运行,且领先优势巨大。

关键的基准测试:MMLU 评分为 67.1,这使 Covenant-72B 与 Meta 的 Llama 2 70B 处于同一水平——后者是由全球资金最充足的 AI 实验室之一生产的模型。英伟达(NVIDIA)首席执行官黄仁勋(Jensen Huang)公开将这一努力比作“AI 界的现代版 folding@home”。Templar 的子网代币随之飙升,其市值峰值超过了 15 亿美元。

技术突破不在于模型架构,而在于协作层。两个关键组件起到了核心作用:

  • SparseLoCo:一种高效通信的训练算法。通过稀疏化、2 位量化和错误反馈,它将节点间的带宽需求降低了 146 倍。如果没有它,在家庭互联网上进行前沿规模的训练在物理上是不可能的——仅梯度同步就会使每个矿工的连接饱和。
  • Gauntlet:Bittensor 的区块链验证激励系统。它通过损失评估和 OpenSkill 排名对每个矿工的贡献进行评分,向高质量节点支付 TAO,并对其他节点进行惩罚(Slashing)。

它们共同创造了一些真正新颖的东西:一个由匿名贡献者组成的无许可网络,仅通过加密激励进行协作,就能训练出可与价值数十亿美元的实验室产出相媲美的模型。

接着,一切都崩盘了。

Covenant 退出:12 小时内蒸发 9 亿美元

2026 年 4 月 10 日,Covenant AI 的创始人 Sam Dare 宣布离职。Covenant AI 是 Bittensor 三个最有价值子网(SN3 Templar、SN39 Basilica 和 SN81 Grail)背后的团队。几小时内,他清算了约 37,000 个 TAO(约合 1,020 万美元),并发表了一份临别指控:指责联合创始人 Jacob Steeves("Const")对协议行使中心化控制,并称 Bittensor 的去中心化只是表象,而非架构本质。

市场反应立竿见影。TAO 在 12 小时内暴跌 20–28%(取决于统计窗口),市值蒸发约 6.5 亿至 9 亿美元。子网 Alpha 代币表现更糟——Grail (SN81) 在底部下跌了 67%。约 1,000 万美元的多头仓位被清算。

两个事实缓解了恐慌:

  1. 子网并未消亡。 社区矿工利用开源代码在没有中心化运营商的情况下重启了 SN3、SN39 和 SN81。Covenant 构建的基础设施实际上可以从公开产物中恢复——这在一定程度上证明了 Dare 所质疑的去中心化论点。
  2. 70% 的 TAO 供应量在动荡中仍保持质押状态。 长期持有者并未跟随 Dare 退出。

但网络面临着信誉问题。如果交付了 Bittensor 顶级技术成就的团队 Covenant 可以在巅峰时期退出并重创代币,那么如何阻止下一个子网运营商效仿呢?

定力机制:锁住那些有能力离开的人

Const 的回应于 2026 年 4 月 20 日发布,即 Dare 离开十天后。BIT-0011 被冠以**定力机制(Conviction Mechanism)**之名,提议建立一种锁定质押制度,强制子网所有者将 TAO 锁定数月或数年,以换取与投票权和子网所有权挂钩的“定力评分”。

机制细节:

  • 定力评分从 100% 开始,如果代币没有补充到锁仓中,则每隔 30 天衰减一次
  • 投票权和所有权随衰减同步减少,使突然的资本外逃在经济上代价高昂,而不仅仅是令人尴尬。
  • 该系统首先针对成熟子网——SN3、SN39 和 SN81,正是 Covenant 运行的那三个。

一个冷笑话:据报道,BIT-0011 是 Sam Dare 本人在退出前起草的。这位离职的创始人制定了旨在防止创始人离职的规则。

该提案解决了一个真正的结构性弱点——子网运营商以前可以在不受到治理处罚的情况下抛售头寸——但它也将权力集中在长期锁定者手中,这本身也是一种中心化形式。这是否是正确的权衡,取决于你认为 Bittensor 的主要风险是什么:创始人背叛还是寡头控制。

Teutonic 与万亿参数的“登月计划”

在此背景下,更名为 Teutonic 的子网(SN3,原名 Templar)已公开承诺在 2026 年 5 月中下旬进行一次 1 万亿参数的去中心化训练。这大约是 Covenant-72B 规模的 14 倍,基于相同的基础架构,但团队是由社区重组的,而非最初的 Covenant 工程师。

这一战略时机不容忽视。灰度(Grayscale)于 2026 年 4 月 2 日在纽约证券交易所 Arca 提交了现货 Bittensor 信托 ETF(拟定代码为 GTAO)的 S-1 修正案。美国证券交易委员会(SEC)的决策窗口目前预计在 2026 年 8 月。5 月份成功的 1T 参数训练运行将恰逢监管机构审议的高峰期——这正是“这是一项真正的技术还是一个梗?”成为核心问题的时刻。4 月 7 日,灰度已将其广泛的 AI 基金中 TAO 的权重提高至 43.06%,这是该基金有史以来进行的最大单资产调仓。

看涨的理由显而易见:交付一个可信的 1T 参数去中心化模型,成为 ETF 获批所需并能证明机构资金流入合理性的“DeepSeek 时刻”,并在一个季度内重新定义整个去中心化 AI 赛道的估值。

看跌的理由则在于工程层面,而非市场营销。

为什么扩展去中心化训练的难度是前沿实验室所未见的

中心化万亿级模型——如 GPT-5、Claude 4.7 Opus、Gemini 2.5 Ultra——是在所有 GPU 都通过 NVLink 和 InfiniBand 等专用架构互联的设施中训练的,具有亚微秒级的延迟和每秒太比特级的带宽。即便在这些条件下,梯度同步也是瓶颈所在。已发表的研究一致发现,在扩展方式较为初级时,超过 90% 的 LLM 训练时间可能花费在通信上,而非计算。

Teutonic 的矿工们在 约 100ms 的广域网(WAN)延迟和住宅网络上进行协作。Covenant-72B 之所以能够实现,完全归功于 SparseLoCo 对通信量进行的 146 倍压缩。推进到 1T 参数从三个棘手的方面改变了计算逻辑:

  1. 梯度大小与参数数量呈近似线性比例增长。 一个 14 倍规模的模型意味着每一步需要同步 14 倍的数据量,这甚至还没考虑优化器状态(optimizer state)。
  2. 跨节点协作开销在历史上与工作节点数量呈超线性增长。 如果 Teutonic 将其节点池从约 70 个增加到约 256 个,其 All-reduce 通信成本不仅会翻倍,根据拓扑结构的不同,可能会增长 4-10 倍。
  3. 故障模式会叠加。 在一个包含 70 个节点的网络中,节点在运行中途掉线只是一个小型的惩罚(slashing)事件。但在运行 14 倍梯度规模的 256 节点网络中,同样的掉线可能会导致整个训练轮次停滞。

这一切并非不可解决。现有的去中心化训练研究——异构低带宽预训练、FusionLLM、通信计算重叠、延迟梯度补偿——正是针对这种场景。但几乎所有这些研究都仅在 7B-70B 规模上得到了验证。在地理分布的通用硬件上进行 1T 参数的运行,其本身就是一项重大的研究贡献,而不仅仅是一个产品发布。

坦诚地说:Teutonic 正在以市场营销级的最后期限去挑战研究级的工程难题。要么它成功并成为整个 dTAO 生态系统所需的公信力事件,要么它在 SEC 最关注的审查窗口期间公开陷入停滞。

Teutonic 必须在其中生存的去中心化 AI 训练竞争格局

Teutonic 并不是 2026 年唯一试图争夺“可信去中心化 1T 参数”里程碑的项目。竞争版图正在迅速填补:

  • Gensyn2026 年 4 月 22 日(即本文发布当天)启动了主网,并将此次发布与 Delphi Markets(一个 AI 驱动的计算任务匹配层)相结合。到当天结束时,Gensyn 报告的算力相当于 5,000 多张 NVIDIA H100。Bittensor 销售的是无需许可的协作加代币激励飞轮,而 Gensyn 则定位为一个具有正确执行密码学证明的可验证 AI 计算市场。
  • Ritual 走的是相反的方向,更侧重于推理而非训练。其 Infernet 技术允许任何智能合约请求 AI 输出,并接收证明指定模型未经修改被使用的密码学证明。这是“DeFi 中的可验证 AI”论点,而非“从零开始训练前沿模型”的论点。
  • AmbientOrigins Network 正在进行类似的押注——不同的激励设计,不同的验证策略,但共同的长期目标是打破中心化实验室在前沿模型训练上的垄断。

这些项目并不直接在同一个里程碑上竞争,但它们都在争夺同样有限的注意力碎片和资本。如果 Gensyn 的主网通过商业工作负载占据了“去中心化 AI 已至”的叙事,那么 Teutonic 在 5 月份的训练运行将成为一场公投:判定 Bittensor 的特定方法(子网竞争加代币权重激励)究竟是正确的架构,还是第一个被超越的迭代版本。

为什么这对于 TAO 之外的领域也很重要

在接下来的四到六周内,有三件事将同时受到考验:

去中心化训练是否具有可扩展性。 如果 Teutonic 取得成功,“去中心化 AI 计算的比特币” 这一论点将得以延续。如果失败,Covenant 的退出将被视为基于子网的训练达到顶峰的时刻——成为一个 72B 的天花板,而非 72B 的基石。

信念机制(Conviction Mechanism)是否是正确的治理修复方案。 锁定子网运营商可以防止再次出现类似 Covenant 式的抛售,但也会创造一种新的失败模式,即长期锁仓者可能会形成固化的既得利益集团。Bitcoin Core 的分布式维护者模型、Solana Labs 持续的中心化核心开发,以及 Sui 对 Mysten Labs 的高度集中,是针对同一个问题的三种不同答案——即协议的复杂性是否需要一个社区必须信任的强大中心化维护者。Bittensor 现在正实时运行着这一实验的自有版本。

ETF 窗口是否会迫使去中心化 AI 按照传统金融(TradFi)的时间表进行交付。 美国证券交易委员会(SEC)8 月的决策窗口是一个硬性截止日期,对于一个希望成为 “DeepSeek 时刻” 而非 “有趣的科研项目” 的叙事来说,这要么是一个健康的推动机制,要么是一个导致过度承诺的温床——这取决于最终交付的内容。

对于从基础设施端观察的开发者来说,底层信号更为简单:AI 代理和去中心化训练网络即将产生新一级的链上查询负载——包括模型注册表查询、证明验证、梯度检查点哈希、子网性能数据等——这些数据并不完全符合现有 RPC 基础设施为面向用户的 dApp 模式所构建的设计。

BlockEden.xyz 为构建 AI 与加密货币结合栈的团队提供覆盖 27+ 条链的企业级 RPC 和索引基础设施。探索我们的 API 市场,在专为人类和机器流量设计的轨道上进行构建。

来源