Bittensor 的 SN3 押注网络进行万亿参数模型训练
2026 年 3 月,数十名使用家庭互联网连接的匿名矿工训练出了一个拥有 720 亿参数的语言模型,其得分与 Meta 的 Llama 2 70B 仅一步之遥。六周后,领导该项目的团队退出,抛售了价值 1,000 万美元的 TAO,并称 Bittensor 的去中心化只是“演戏”。现在,幸存的社区想要再次挑战——规模是之前的 14 倍,耗时约 4 周,而整个去中心化 AI 命题的成败都系于此结果。
这是一个关于 Bittensor 子网 3(Subnet 3,在 Covenant AI 退出后最近更名为 Teutonic)如何决定启动万亿参数训练运行的故事。此次运行的时间节点恰好选在灰度(Grayscale)TAO ETF 的 SEC 审查窗口期。这是一场豪赌,赌的是协议的激励层比构建它的人更重要,赌的是这个在治理危机中幸存下来的网络,能在监管机构决定是否让华尔街入场之前,交付去中心化 AI 的“DeepSeek 时刻”。
72B 模型如何成为无许可 AI 的基准
故事始于 2026 年 3 月 10 日,当时以 Templar 之名运营的子网 3 发布了 Covenant-72B。这是一个拥有 720 亿参数的模型,由 70 多名通过公共互联网协作的独立矿工利用约 1.1 万亿个 token 训练而成。这是迄今为止完成的规模最大的去中心化 LLM 预训练运行,且领先优势巨大。
关键的基准测试:MMLU 评分为 67.1,这使 Covenant-72B 与 Meta 的 Llama 2 70B 处于同一水平——后者是由全球资金最充足的 AI 实验室之一生产的模型。英伟达(NVIDIA)首席执行官黄仁勋(Jensen Huang)公开将这一努力比作“AI 界的现代版 folding@home”。Templar 的子网代币随之飙升,其市值峰值超过了 15 亿美元。
技术突破不在于模型架构,而在于协作层。两个关键组件起到了核心作用:
- SparseLoCo:一种高效通信的训练算法。通过稀疏化、2 位量化和错误反馈,它将节点间的带宽需求降低了 146 倍。如果没有它,在家庭互联网上进行前沿规模的训练在物理上是不可能的——仅梯度同步就会使每个矿工的连接饱和。
- Gauntlet:Bittensor 的区块链验证激励系统。它通过损失评估和 OpenSkill 排名对每个矿工的贡献进行评分,向高质量节点支付 TAO,并对其他节点进行惩罚(Slashing)。
它们共同创造了一些真正新颖的东西:一个由匿名贡献者组成的无许可网络,仅通过加密激励进行协作,就能训练出可与价值数十亿美元的实验室产出相媲美的模型。
接着,一切都崩盘了。
Covenant 退出:12 小时内蒸发 9 亿美元
2026 年 4 月 10 日,Covenant AI 的创始人 Sam Dare 宣布离职。Covenant AI 是 Bittensor 三个最有价值子网(SN3 Templar、SN39 Basilica 和 SN81 Grail)背后的团队。几小时内,他清算了约 37,000 个 TAO(约合 1,020 万美元),并发表了一份临别指控:指责联合创始人 Jacob Steeves("Const")对协议行使中心化控制,并称 Bittensor 的去中心化只是表象,而非架构本质。
市场反应立竿见影。TAO 在 12 小时内暴跌 20–28%(取决于统计窗口),市值蒸发约 6.5 亿至 9 亿美元。子网 Alpha 代币表现更糟——Grail (SN81) 在底部下跌了 67%。约 1,000 万美元的多头仓位被清算。
两个事实缓解了恐慌:
- 子网并未消亡。 社区矿工利用开源代码在没有中心化运营商的情况下重启了 SN3、SN39 和 SN81。Covenant 构建的基础设施实际上可以从公开产物中恢复——这在一定程度上证明了 Dare 所质疑的去中心化论点。
- 70% 的 TAO 供应量在动荡中仍保持质押状态。 长期持有者并未跟随 Dare 退出。
但网络面临着信誉问题。如果交付了 Bittensor 顶级技术成就的团队 Covenant 可以在巅峰时期退出并重创代币,那么如何阻止下一个子网运营商效仿呢?
定力机制:锁住那些有能力离开的人
Const 的回应于 2026 年 4 月 20 日发布,即 Dare 离开十天后。BIT-0011 被冠以**定力机制(Conviction Mechanism)**之名,提议建立一种锁定质押制度,强制子网所有者将 TAO 锁定数月或数年,以换取与投票权 和子网所有权挂钩的“定力评分”。
机制细节:
- 定力评分从 100% 开始,如果代币没有补充到锁仓中,则每隔 30 天衰减一次。
- 投票权和所有权随衰减同步减少,使突然的资本外逃在经济上代价高昂,而不仅仅是令人尴尬。
- 该系统首先针对成熟子网——SN3、SN39 和 SN81,正是 Covenant 运行的那三个。
一个冷笑话:据报道,BIT-0011 是 Sam Dare 本人在退出前起草的。这位离职的创始人制定了旨在防止创始人离职的规则。
该提案解决了一个真正的结构性弱点——子网运营商以前可以在不受到治理处罚的情况下抛售头寸——但它也将权力集中在长期锁定者手中,这本身也是一种中心化形式。这是否是正确的权衡,取决于你认为 Bittensor 的主要风险是什么:创始人背叛还是寡头控制。
Teutonic 与万亿参数的“登月计划”
在此背景下,更名为 Teutonic 的子网(SN3,原名 Templar)已公开承诺在 2026 年 5 月中下旬进行一次 1 万亿参数的去中心化训练。这大约是 Covenant-72B 规模的 14 倍,基于相同的基础架构,但团队是由社区重组的,而非最初的 Covenant 工程师。
这一战略时机不容忽视。灰度(Grayscale)于 2026 年 4 月 2 日在纽约证券交易所 Arca 提交了现货 Bittensor 信托 ETF(拟定代码为 GTAO)的 S-1 修正案。美国证券交易委员会(SEC)的决策窗口目前预计在 2026 年 8 月。5 月份成功的 1T 参数训练运行将恰逢监管机构审议的高峰期——这正是“这是一项真正的技术还是一个梗?”成为核心问题的时刻。4 月 7 日,灰度已将其广泛的 AI 基金中 TAO 的权重提高至 43.06%,这是该基金有史以来进行的最大单资产调仓。
看涨的理由显而易见:交付一个可信的 1T 参数去中心化模型,成为 ETF 获批所需并能证明机构资金流入合理性的“DeepSeek 时刻”,并在一个季度内重新定义整个去中心化 AI 赛道的估值。
看跌的理由则在于工程层面,而非市场营销。
为什么扩展去中心化训练的难度是前沿实验室所未见的
中心化万亿级模型——如 GPT-5、Claude 4.7 Opus、Gemini 2.5 Ultra——是在所有 GPU 都通过 NVLink 和 InfiniBand 等专用架构互联的设施中训练的,具有亚微秒级的延迟和每秒太比特级的带宽。即便在这些条件下,梯度同步也是瓶颈所在。已发表的研究一致发现,在扩展方式较为初级时,超过 90% 的 LLM 训练时间可能花费在通信上,而非计算。
Teutonic 的矿工们在 约 100ms 的广域网(WAN)延迟和住宅网络上进行协作。Covenant-72B 之所以能够实现,完全归功于 SparseLoCo 对通信量进行的 146 倍压缩。推进到 1T 参数从三个棘手的方面改变了计算逻辑: