跳到主要内容

Bittensor的720亿参数DeepSeek时刻:去中心化AI终于证明了怀疑者是错的

· 阅读需 9 分钟
Dora Noda
Software Engineer

2026年1月20日,DeepSeek悄然发布了一个震撼整个AI行业的模型:一个开源推理系统,以大约1/50的训练成本匹敌OpenAI的最佳成果。英伟达一天内市值蒸发6000亿美元。这背后的教训不仅仅是关于中国的AI进展——而是"只有大型中心化实验室才能构建前沿AI"的假设已经动摇。

六周后,2026年3月10日,70名独立贡献者组成的网络——使用普通GPU和普通家用网络连接——在没有任何数据中心的情况下完成了一个720亿参数语言模型的训练。Bittensor的Templar子网迎来了自己的DeepSeek时刻,其对去中心化AI的影响同样深远。

Bittensor生态系统中刚刚发生了什么

Covenant-72B不仅仅是一个技术里程碑。它证明了在前沿规模上进行去中心化AI训练在经济和技术上已经可行。

该模型由Bittensor的Subnet 3(即Templar)使用一种名为SparseLoCo的突破性算法进行训练。SparseLoCo由Covenant AI和Mila实验室合作开发,结合了稀疏化、2位量化和误差反馈,将节点间梯度通信压缩了超过146倍。这一单一创新解决了去中心化训练的根本瓶颈:在数千个独立节点之间同步模型更新所需的巨大带宽。

结果不言自明。Covenant-72B在MMLU基准测试中得分67.1——与Meta的Llama 2 70B处于同等性能范围,后者由地球上资金最雄厚的AI实验室之一使用数亿美元的中心化基础设施构建。Bittensor的版本由70多名贡献者使用家用网络训练完成。

英伟达CEO黄仁勋在All-In播客中称其为"现代版的folding@home"。

为什么这是去中心化AI的"DeepSeek时刻"

DeepSeek的类比比"廉价AI"更深层。两种情况下,故事都是关于效率经济学打破了原本假设的成本下限。

DeepSeek的洞见是算法性的:通过将专家混合架构与激进的推理优化相结合,他们证明了不需要10万张H100就能匹敌前沿性能。Bittensor的洞见是基础设施性的:通过将梯度通信压缩97%而不损失精度,他们证明了协调训练不需要单一数据中心的带宽。

两个突破都在攻击同一个假设——前沿AI需要大规模、中心化的资本集中。

不同之处在于接下来会发生什么。DeepSeek的效率收益流向运行该模型的任何人。Bittensor的效率收益流向网络——流向共同训练了Covenant-72B的70多个节点运营商,以及拥有他们运行协议的TAO持有者。

这是Bittensor子网模型的核心经济创新:将AI模型质量转变为分布式金融激励,而不仅仅是产品指标。

经济学:减半遇上突破

时机很重要。Bittensor的首次TAO减半发生在2025年12月14日,将每日代币发行量从7200 TAO削减至3600 TAO。这不仅仅是一个供应事件——它从根本上改变了子网运营的经济学。

减半前,子网可以通过提供慷慨的排放来吸引矿工,即使产出平庸。减半迫使了达尔文式的选择:代币减少,验证者变得更加挑剔,无法展示真实性能指标的子网看到矿工注意力(和哈希率)迁移到更好的机会。

Templar/SN3在这个环境中蓬勃发展,恰恰是因为它建立了严格的反作弊机制——"提交-揭示"梯度提交协议和通过R2桶存储进行精确时间戳——确保了矿工提交的每个梯度更新的质量。当减半压缩了排放时,高质量子网相对获得更多;低质量子网受到挤压。

2026年3月的Covenant-72B发布验证了这一模式。随着史上最大规模去中心化LLM预训练运行产生了真正具有竞争力的模型的消息传开,TAO大涨约90%,从180美元攀升至332美元以上。Templar的子网估值突破5.5亿美元。灰度将TAO在其AI基金中的权重提高至43.06%,并加快将其Bittensor信托转换为现货ETF的步伐。

机构信号一致:Polychain Capital承诺向生态系统投入2亿美元,主要实体已质押了近19%的总TAO供应量(6.91亿美元),制造了真实的稀缺性动态。

里程碑背后的网络架构

要理解Covenant-72B的重要性,需要了解Bittensor的子网架构。

Bittensor是一个Layer-1区块链(基于Polkadot Substrate构建),其中智能是被生产和定价的商品。网络运行128个活跃子网——专业化市场,每个专注于不同的AI任务。Subnet 64(Chutes)处理去中心化模型推理。Subnet 3(Templar)专注于协作模型训练。其他子网处理文本到图像、蛋白质折叠模拟、存储和金融预测。

每个子网运行自己的激励机制。矿工执行工作(运行模型、生产输出、提交梯度)。验证者根据客观指标对工作评分。Yuma共识——Bittensor的核心算法——将这些分数转化为TAO排放。工作质量越高,赚取的TAO越多。

72B训练运行之所以意义重大,是因为它需要在70多个独立节点之间同步梯度更新,每个节点运行在普通硬件上,通过公共互联网连接。以前的分布式训练系统假设你可以通过私有数据中心互连路由PB级梯度数据。SparseLoCo证明了用146倍更少的数据可以实现同样的结果。

网络现在计划到2026年底将子网容量从128扩展到256,引入新的共识增强(有时称为1.4版本),为验证者提供更好的工具,使用GraVal等指标验证矿工工作,使质量评估更客观、更难被操纵。

不可忽视的挑战

对Bittensor时刻的任何诚实评估都不能跳过艰难问题。

补贴到收入的差距是真实的。 研究公司Pine Analytics发现,Bittensor最大的子网Chutes(SN64)每年从TAO排放中获得约5200万美元,但实际外部收入仅为130万至240万美元——补贴与收入比率为22:1至40:1。如果没有TAO排放支撑价格,Chutes的推理成本将比DeepSeek和Together AI等中心化替代品高出1.6至3.5倍。该网络目前依赖代币通胀运作,而非产品市场契合度。

治理冲突正在升级。 2026年4月10日——也就是TAO突破340美元同一周——发生了一件令人震惊的事:Covenant AI公开退出Bittensor网络。该公司指控联合创始人Jacob Steeves对子网运营实施中心化控制,并称其为"去中心化剧场"。此声明引发了20%以上的价格回调和超过1000万美元的多头清算,提醒人们治理风险仍然是任何去中心化基础设施项目最大的未解决问题。

与Llama 2而非Llama 4的比较。 Covenant-72B匹敌Meta的2023年模型对于去中心化系统来说令人印象深刻。但去中心化训练能否跟上当前在10万张H100集群上训练的前沿模型是另一个问题。SparseLoCo的效率优势需要快速复利才能保持相关性。

这对2026年的去中心化AI意味着什么

"去中心化AI将永远比中心化更昂贵"的反对意见是Bittensor等网络机构采用的最大障碍之一。Covenant-72B在训练层面直接攻击了这一反对意见。

如果Bittensor在规模上有效,将涌现出真正新颖的经济模式:由数千个独立运营商训练和服务的AI模型,由代币激励协调,没有任何单一实体控制整个技术栈。Talisman AI子网在2026年第一季度已为超过10万付费客户提供服务并产生4300万美元的AI客户收入——证明至少某些子网正在从代币补贴转向外部资金支持。

对于更广泛的Web3生态系统,Bittensor的时刻代表着重要的事情:区块链可以协调复杂计算工作——不仅仅是金融交易——的论点正从白皮书走向生产。

未来12个月需要关注的关键变量:

  • 灰度的现货ETF申请是否转化为批准产品
  • 随着外部需求增长,子网收入与排放比率是否实质改善
  • 与Covenant AI的治理争议是否得到解决或加速网络分叉
  • 随着中心化实验室也采用更高效的训练算法,SparseLoCo的压缩优势能否得以维持

DeepSeek的类比在一个关键方面成立:效率突破创造了不可逆的压力。一旦证明可以在没有数据中心的情况下训练前沿规模的模型,问题就不再是"去中心化AI能否运作?"而变成"天花板在哪里?"


BlockEden.xyz为Sui、Aptos、Ethereum和20多个其他区块链提供企业级RPC和API基础设施。如果你正在构建AI驱动的DApp或需要AI代理工作流的可靠链上数据,探索我们的API市场,将你的模型连接到生产区块链基础设施。