Bittensor 的 SN3 押注网络进行万亿参数模型训练

2026年4月22日 · 阅读需 14 分钟

Software Engineer

2026 年 3 月，数十名使用家庭互联网连接的匿名矿工训练出了一个拥有 720 亿参数的语言模型，其得分与 Meta 的 Llama 2 70B 仅一步之遥。六周后，领导该项目的团队退出，抛售了价值 1,000 万美元的 TAO，并称 Bittensor 的去中心化只是“演戏”。现在，幸存的社区想要再次挑战——规模是之前的 14 倍，耗时约 4 周，而整个去中心化 AI 命题的成败都系于此结果。

这是一个关于 Bittensor 子网 3（Subnet 3，在 Covenant AI 退出后最近更名为 Teutonic）如何决定启动万亿参数训练运行的故事。此次运行的时间节点恰好选在灰度（Grayscale）TAO ETF 的 SEC 审查窗口期。这是一场豪赌，赌的是协议的激励层比构建它的人更重要，赌的是这个在治理危机中幸存下来的网络，能在监管机构决定是否让华尔街入场之前，交付去中心化 AI 的“DeepSeek 时刻”。

72B 模型如何成为无许可 AI 的基准

故事始于 2026 年 3 月 10 日，当时以 Templar 之名运营的子网 3 发布了 Covenant-72B。这是一个拥有 720 亿参数的模型，由 70 多名通过公共互联网协作的独立矿工利用约 1.1 万亿个 token 训练而成。这是迄今为止完成的规模最大的去中心化 LLM 预训练运行，且领先优势巨大。

关键的基准测试：MMLU 评分为 67.1，这使 Covenant-72B 与 Meta 的 Llama 2 70B 处于同一水平——后者是由全球资金最充足的 AI 实验室之一生产的模型。英伟达（NVIDIA）首席执行官黄仁勋（Jensen Huang）公开将这一努力比作“AI 界的现代版 folding@home”。Templar 的子网代币随之飙升，其市值峰值超过了 15 亿美元。

技术突破不在于模型架构，而在于协作层。两个关键组件起到了核心作用：

SparseLoCo：一种高效通信的训练算法。通过稀疏化、2 位量化和错误反馈，它将节点间的带宽需求降低了 146 倍。如果没有它，在家庭互联网上进行前沿规模的训练在物理上是不可能的——仅梯度同步就会使每个矿工的连接饱和。
Gauntlet：Bittensor 的区块链验证激励系统。它通过损失评估和 OpenSkill 排名对每个矿工的贡献进行评分，向高质量节点支付 TAO，并对其他节点进行惩罚（Slashing）。

它们共同创造了一些真正新颖的东西：一个由匿名贡献者组成的无许可网络，仅通过加密激励进行协作，就能训练出可与价值数十亿美元的实验室产出相媲美的模型。

接着，一切都崩盘了。

Covenant 退出：12 小时内蒸发 9 亿美元

2026 年 4 月 10 日，Covenant AI 的创始人 Sam Dare 宣布离职。Covenant AI 是 Bittensor 三个最有价值子网（SN3 Templar、SN39 Basilica 和 SN81 Grail）背后的团队。几小时内，他清算了约 37,000 个 TAO（约合 1,020 万美元），并发表了一份临别指控：指责联合创始人 Jacob Steeves（"Const"）对协议行使中心化控制，并称 Bittensor 的去中心化只是表象，而非架构本质。

市场反应立竿见影。TAO 在 12 小时内暴跌 20–28%（取决于统计窗口），市值蒸发约 6.5 亿至 9 亿美元。子网 Alpha 代币表现更糟——Grail (SN81) 在底部下跌了 67%。约 1,000 万美元的多头仓位被清算。

两个事实缓解了恐慌：

子网并未消亡。 社区矿工利用开源代码在没有中心化运营商的情况下重启了 SN3、SN39 和 SN81。Covenant 构建的基础设施实际上可以从公开产物中恢复——这在一定程度上证明了 Dare 所质疑的去中心化论点。
70% 的 TAO 供应量在动荡中仍保持质押状态。 长期持有者并未跟随 Dare 退出。

但网络面临着信誉问题。如果交付了 Bittensor 顶级技术成就的团队 Covenant 可以在巅峰时期退出并重创代币，那么如何阻止下一个子网运营商效仿呢？

定力机制：锁住那些有能力离开的人

Const 的回应于 2026 年 4 月 20 日发布，即 Dare 离开十天后。BIT-0011 被冠以**定力机制（Conviction Mechanism）**之名，提议建立一种锁定质押制度，强制子网所有者将 TAO 锁定数月或数年，以换取与投票权和子网所有权挂钩的“定力评分”。

机制细节：

定力评分从 100% 开始，如果代币没有补充到锁仓中，则每隔 30 天衰减一次。
投票权和所有权随衰减同步减少，使突然的资本外逃在经济上代价高昂，而不仅仅是令人尴尬。
该系统首先针对成熟子网——SN3、SN39 和 SN81，正是 Covenant 运行的那三个。

一个冷笑话：据报道，BIT-0011 是 Sam Dare 本人在退出前起草的。这位离职的创始人制定了旨在防止创始人离职的规则。

该提案解决了一个真正的结构性弱点——子网运营商以前可以在不受到治理处罚的情况下抛售头寸——但它也将权力集中在长期锁定者手中，这本身也是一种中心化形式。这是否是正确的权衡，取决于你认为 Bittensor 的主要风险是什么：创始人背叛还是寡头控制。

Teutonic 与万亿参数的“登月计划”

在此背景下，更名为 Teutonic 的子网（SN3，原名 Templar）已公开承诺在 2026 年 5 月中下旬进行一次 1 万亿参数的去中心化训练。这大约是 Covenant-72B 规模的 14 倍，基于相同的基础架构，但团队是由社区重组的，而非最初的 Covenant 工程师。

这一战略时机不容忽视。灰度（Grayscale）于 2026 年 4 月 2 日在纽约证券交易所 Arca 提交了现货 Bittensor 信托 ETF（拟定代码为 GTAO）的 S-1 修正案。美国证券交易委员会（SEC）的决策窗口目前预计在 2026 年 8 月。5 月份成功的 1T 参数训练运行将恰逢监管机构审议的高峰期——这正是“这是一项真正的技术还是一个梗？”成为核心问题的时刻。4 月 7 日，灰度已将其广泛的 AI 基金中 TAO 的权重提高至 43.06%，这是该基金有史以来进行的最大单资产调仓。

看涨的理由显而易见：交付一个可信的 1T 参数去中心化模型，成为 ETF 获批所需并能证明机构资金流入合理性的“DeepSeek 时刻”，并在一个季度内重新定义整个去中心化 AI 赛道的估值。

看跌的理由则在于工程层面，而非市场营销。

为什么扩展去中心化训练的难度是前沿实验室所未见的

中心化万亿级模型——如 GPT-5、Claude 4.7 Opus、Gemini 2.5 Ultra——是在所有 GPU 都通过 NVLink 和 InfiniBand 等专用架构互联的设施中训练的，具有亚微秒级的延迟和每秒太比特级的带宽。即便在这些条件下，梯度同步也是瓶颈所在。已发表的研究一致发现，在扩展方式较为初级时，超过 90% 的 LLM 训练时间可能花费在通信上，而非计算。

Teutonic 的矿工们在 约 100ms 的广域网（WAN）延迟和住宅网络上进行协作。Covenant-72B 之所以能够实现，完全归功于 SparseLoCo 对通信量进行的 146 倍压缩。推进到 1T 参数从三个棘手的方面改变了计算逻辑：

梯度大小与参数数量呈近似线性比例增长。 一个 14 倍规模的模型意味着每一步需要同步 14 倍的数据量，这甚至还没考虑优化器状态（optimizer state）。
跨节点协作开销在历史上与工作节点数量呈超线性增长。 如果 Teutonic 将其节点池从约 70 个增加到约 256 个，其 All-reduce 通信成本不仅会翻倍，根据拓扑结构的不同，可能会增长 4-10 倍。
故障模式会叠加。 在一个包含 70 个节点的网络中，节点在运行中途掉线只是一个小型的惩罚（slashing）事件。但在运行 14 倍梯度规模的 256 节点网络中，同样的掉线可能会导致整个训练轮次停滞。

这一切并非不可解决。现有的去中心化训练研究——异构低带宽预训练、FusionLLM、通信计算重叠、延迟梯度补偿——正是针对这种场景。但几乎所有这些研究都仅在 7B-70B 规模上得到了验证。在地理分布的通用硬件上进行 1T 参数的运行，其本身就是一项重大的研究贡献，而不仅仅是一个产品发布。

坦诚地说：Teutonic 正在以市场营销级的最后期限去挑战研究级的工程难题。要么它成功并成为整个 dTAO 生态系统所需的公信力事件，要么它在 SEC 最关注的审查窗口期间公开陷入停滞。

Teutonic 必须在其中生存的去中心化 AI 训练竞争格局

Teutonic 并不是 2026 年唯一试图争夺“可信去中心化 1T 参数”里程碑的项目。竞争版图正在迅速填补：

Gensyn 于 2026 年 4 月 22 日（即本文发布当天）启动了主网，并将此次发布与 Delphi Markets（一个 AI 驱动的计算任务匹配层）相结合。到当天结束时，Gensyn 报告的算力相当于 5,000 多张 NVIDIA H100。Bittensor 销售的是无需许可的协作加代币激励飞轮，而 Gensyn 则定位为一个具有正确执行密码学证明的可验证 AI 计算市场。
Ritual 走的是相反的方向，更侧重于推理而非训练。其 Infernet 技术允许任何智能合约请求 AI 输出，并接收证明指定模型未经修改被使用的密码学证明。这是“DeFi 中的可验证 AI”论点，而非“从零开始训练前沿模型”的论点。
Ambient 和 Origins Network 正在进行类似的押注——不同的激励设计，不同的验证策略，但共同的长期目标是打破中心化实验室在前沿模型训练上的垄断。

这些项目并不直接在同一个里程碑上竞争，但它们都在争夺同样有限的注意力碎片和资本。如果 Gensyn 的主网通过商业工作负载占据了“去中心化 AI 已至”的叙事，那么 Teutonic 在 5 月份的训练运行将成为一场公投：判定 Bittensor 的特定方法（子网竞争加代币权重激励）究竟是正确的架构，还是第一个被超越的迭代版本。

为什么这对于 TAO 之外的领域也很重要

在接下来的四到六周内，有三件事将同时受到考验：

去中心化训练是否具有可扩展性。 如果 Teutonic 取得成功，“去中心化 AI 计算的比特币” 这一论点将得以延续。如果失败，Covenant 的退出将被视为基于子网的训练达到顶峰的时刻——成为一个 72B 的天花板，而非 72B 的基石。

信念机制（Conviction Mechanism）是否是正确的治理修复方案。 锁定子网运营商可以防止再次出现类似 Covenant 式的抛售，但也会创造一种新的失败模式，即长期锁仓者可能会形成固化的既得利益集团。Bitcoin Core 的分布式维护者模型、Solana Labs 持续的中心化核心开发，以及 Sui 对 Mysten Labs 的高度集中，是针对同一个问题的三种不同答案——即协议的复杂性是否需要一个社区必须信任的强大中心化维护者。Bittensor 现在正实时运行着这一实验的自有版本。

ETF 窗口是否会迫使去中心化 AI 按照传统金融（TradFi）的时间表进行交付。 美国证券交易委员会（SEC）8 月的决策窗口是一个硬性截止日期，对于一个希望成为 “DeepSeek 时刻” 而非 “有趣的科研项目” 的叙事来说，这要么是一个健康的推动机制，要么是一个导致过度承诺的温床——这取决于最终交付的内容。

对于从基础设施端观察的开发者来说，底层信号更为简单：AI 代理和去中心化训练网络即将产生新一级的链上查询负载——包括模型注册表查询、证明验证、梯度检查点哈希、子网性能数据等——这些数据并不完全符合现有 RPC 基础设施为面向用户的 dApp 模式所构建的设计。

BlockEden.xyz 为构建 AI 与加密货币结合栈的团队提供覆盖 27+ 条链的企业级 RPC 和索引基础设施。探索我们的 API 市场，在专为人类和机器流量设计的轨道上进行构建。

来源

Share on Twitter

API Marketplace Featured

72B 模型如何成为无许可 AI 的基准​

Covenant 退出：12 小时内蒸发 9 亿美元​

定力机制：锁住那些有能力离开的人​

Teutonic 与万亿参数的“登月计划”​

为什么扩展去中心化训练的难度是前沿实验室所未见的​

Teutonic 必须在其中生存的去中心化 AI 训练竞争格局​

为什么这对于 TAO 之外的领域也很重要​

来源​