メインコンテンツまでスキップ

Bittensor の SN3、1 兆パラメーターのトレーニング実行にネットワークの命運を賭ける

· 約 17 分
Dora Noda
Software Engineer

2026年 3月、家庭用インターネット接続を利用した数十名の匿名マイナーたちが、Meta の Llama 2 70B に迫るスコアを叩き出した 720 億パラメータの言語モデルをトレーニングしました。その 6 週間後、この取り組みを主導したチームは離脱し、1,000 万ドル相当の TAO を売却。Bittensor の分散化は「見せかけ(theatre)」であると断じました。今、生き残ったコミュニティは、その 14 倍のスケール、約 4 週間という期間で、分散型 AI という命題のすべてをその結果に賭け、再び挑もうとしています。

これは、Covenant AI の離脱後に Teutonic と改名された Bittensor の Subnet 3 が、Grayscale の TAO ETF に対する SEC の審査期間に合わせ、いかにして 1 兆パラメータのトレーニング実行へと踏み切ったかという物語です。これは、プロトコルのインセンティブ・レイヤーがそれを構築した人々よりも重要であり、ガバナンス危機を乗り越えた同じネットワークが、規制当局がウォール街による参入を許可するかどうかを決定する前に、分散型 AI における「DeepSeek 的瞬間」を提示できるかどうかの賭けでもあります。

72B モデルがいかにしてパーミッションレス AI の金字塔となったか

物語は 2026年 3月 10日に始まります。当時 Templar の名で運営されていた Subnet 3 は、パブリック・インターネットを通じて調整された 70 以上の独立したマイナーによって、約 1.1 兆トークンでトレーニングされた 720 億パラメータのモデル、Covenant-72B を発表しました。これは、これまで完了した分散型 LLM の事前学習としては、圧倒的に大規模なものでした。

重要なベンチマークとして、MMLU スコアは 67.1 を記録しました。これは、世界で最も潤沢な資金を持つ AI 研究所の一つが生み出した Meta の Llama 2 70B に匹敵する数値です。NVIDIA の CEO、ジェンスン・フアン氏は、この取り組みを「AI 版の現代版 folding@home」と公に称賛しました。Templar のサブネット・トークンは急騰し、ピーク時の時価総額は 15 億ドルを超えました。

技術的なブレークスルーはモデルのアーキテクチャではありませんでした。それはコーディネーション・レイヤーにありました。以下の 2 つの要素が大きな役割を果たしました:

  • SparseLoCo: スパース化、2 ビット量子化、エラーフィードバックを通じて、ノード間帯域幅の要件を 146倍 削減する通信効率の高いトレーニングアルゴリズム。これがなければ、家庭用インターネットでのフロンティア規模のトレーニングは物理的に不可能であり、勾配同期(gradient sync)だけで各マイナーの回線が飽和してしまいます。
  • Gauntlet: 損失評価(loss evaluation)と OpenSkill ランキングを通じて各マイナーの貢献度をスコアリングする、Bittensor のブロックチェーン検証済みインセンティブシステム。高品質なノードには TAO を支払い、それ以外はスラッシュ(削減)します。

これらが組み合わさることで、真に新しいものが生まれました。暗号的なインセンティブのみを通じて調整される、匿名投稿者によるパーミッションレスなネットワークが、数十億ドル規模の研究所の成果に匹敵するモデルをトレーニングしたのです。

しかし、その後、綻びが生じました。

Covenant の離脱:12 時間で 9 億ドルが消失

2026年 4月 10日、Bittensor の最も価値ある 3 つのサブネット(SN3 Templar、SN39 Basilica、SN81 Grail)を支えるチーム、Covenant AI の創設者である Sam Dare 氏が離脱を表明しました。数時間以内に彼は約 37,000 TAO(約 1,020 万ドル相当)を売却し、共同創設者の Jacob Steeves 氏(通称 "Const")がプロトコルに対して中央集権的な支配権を行使しており、Bittensor の分散化はアーキテクチャではなく「パフォーマンス(見せかけ)」であるという決別の告発を公開しました。

市場の反応は即座に現れました。計測期間によりますが、TAO は 20–28% 暴落し、12 時間以内に約 6 億 5,000 万ドルから 9 億ドルの時価総額が消失しました。サブネットのアルファ・トークンはさらに悲惨な状況で、Grail (SN81) は底値で 67% 下落しました。約 1,000 万ドル相当のロングポジションが清算されました。

パニックを和らげたのは 2 つの事実でした:

  1. サブネットは死ななかった。 コミュニティのマイナーたちが、中心的な運営者なしに、オープンソースコードから SN3、SN39、SN81 を再始動させました。Covenant が構築したインフラは、実際には公開された成果物から復旧可能でした。これは皮肉にも、Dare 氏が否定した分散化のテーゼを証明したことになります。
  2. TAO 供給量の 70% がステーキングされたまま残った。 混乱の中でも、長期保有者は Dare 氏に追随して離脱することはありませんでした。

しかし、ネットワークには信頼性の問題が残りました。Bittensor の看板となる技術的成果を上げた Covenant チームが、頂点で離脱してトークンを暴落させることができるのであれば、次のサブネット運営者が同じことをするのを何が止めるのでしょうか?

確信メカニズム(Conviction Mechanism):離脱の可能性がある人々をロックインする

Const 氏の回答が示されたのは、Dare 氏の離脱から 10 日後の 2026年 4月 20日でした。BIT-0011、通称「確信メカニズム(Conviction Mechanism)」は、サブネットのオーナーに対して TAO を数ヶ月から数年にわたってタイムロックすることを強制し、その引き換えに投票権やサブネット所有権に紐づく「確信スコア(conviction score)」を付与するロック・ステーク制度を提案しています。

その仕組みは以下の通りです:

  • 確信スコアは 100% から始まり、ロックアップにトークンが補充されない場合は 30 日ごとに減衰 します。
  • 投票権と所有権は減衰に連動して減少するため、突然の資本逃避は、単に体裁が悪いだけでなく、経済的に非常に高くつくようになります。
  • このシステムは、まず 成熟したサブネット(SN3、SN39、SN81)、つまり Covenant が運営していたまさにその 3 つをターゲットにしています。

ブラックジョークのような話ですが、BIT-0011 は Sam Dare 氏自身が離脱前に起案したものだと伝えられています。離脱した創設者が、創設者の離脱を防ぐためのルールを書いたのです。

この提案は、サブネット運営者がこれまでガバナンス上のペナルティなしにポジションを売却できたという、実在する構造的な弱点に対処するものです。しかし、同時に長期ロックアップを行う人々の手に権力を集中させることにもなり、それはそれ自体が一種の中央集権化といえます。これが正しいトレードオフであるかどうかは、Bittensor の主なリスクを「創設者の離反」と見るか、「寡頭制による支配(oligarchic capture)」と見るかによって決まるでしょう。

テウトニックと 1 兆パラメータのムーンショット

その背景の中で、リブランドされた Teutonic サブネット(SN3、旧 Templar)は、2026 年 5 月中旬から下旬にかけて、1 兆パラメータの分散型トレーニングの実行を公に約束しました。これは Covenant-72B の約 14 倍のスケールであり、同じ基本アーキテクチャを基に、オリジナルの Covenant エンジニアではなくコミュニティによって再建されたチームによって行われます。

この戦略的なタイミングは見逃せません。グレイスケール(Grayscale)は、2026 年 4 月 2 日に NYSE Arca で現物 Bittensor Trust ETF(提案されたティッカーは GTAO)の S-1 修正案を提出しました。SEC の決定期限は現在 2026 年 8 月になると予測されています。5 月に 1 兆パラメータのトレーニングを成功させれば、規制当局の審議がピークに達する時期に重なります。これはまさに「これは本物の技術なのか、それとも単なるミームなのか」という問いが重要な意味を持つタイミングです。グレイスケールはすでに 4 月 7 日に、広範な AI ファンド内での TAO の比重を 43.06% に引き上げました。これは同ファンドが行った単一資産の再配分としては過去最大です。

強気派のシナリオは明白です。信頼に足る 1 兆パラメータの分散型モデルをリリースし、ETF 承認が機関投資家の資金流入を正当化するために必要な「DeepSeek モーメント」となり、分散型 AI カテゴリ全体の価格を 1 四半期で再評価させることです。

弱気派の懸念は、マーケティングではなくエンジニアリングにあります。

分散型トレーニングのスケーリングが、先端ラボが直面しない形で困難な理由

GPT-5、Claude 4.7 Opus、Gemini 2.5 Ultra といった中央集権型の 1 兆超えモデルは、NVLink や InfiniBand のような専用のファブリックを通じてすべての GPU が他のすべての GPU と接続され、マイクロ秒未満のレイテンシとテラビット単位の帯域幅を持つ施設内でトレーニングされます。そのような条件下でさえ、勾配同期(gradient synchronization)がボトルネックとなります。公開されている研究では、スケーリングが単純な場合、LLM のトレーニング時間の 90% 以上が計算ではなく通信に費やされる可能性があることが一貫して指摘されています。

Teutonic のマイナーは、家庭用インターネット上の約 100ms の WAN レイテンシを介して調整を行っています。Covenant-72B がそもそも可能だった唯一の理由は、通信量を 146 倍に圧縮する SparseLoCo の存在です。しかし、1 兆パラメータへの拡大は、3 つの困難な形で計算式を変えてしまいます:

  1. 勾配のサイズは、パラメータ数とおよそ線形にスケールする。 14 倍のモデルは、オプティマイザの状態を考慮する前であっても、ステップごとに同期するデータが 14 倍になることを意味します。
  2. ノード間の調整オーバーヘッドは、歴史的にワーカー数に対して超線形にスケールする。 もし Teutonic がノードプールを約 70 から約 256 に倍増させた場合、All-reduce 通信コストは単に 2 倍になるだけでなく、トポロジーによっては 4 〜 10 倍に膨れ上がる可能性があります。
  3. 障害モードが連鎖する。 70 ノードのネットワークでステップの途中にノードが脱落するのは小さなスラッシングイベントに過ぎません。しかし、14 倍大きな勾配を実行する 256 ノードのネットワークでは、同じ脱落がトレーニングラウンド全体を停止させる可能性があります。

これらはどれも解決不可能ではありません。異種低帯域幅事前学習、FusionLLM、通信と計算のオーバーラップ、遅延勾配補正など、まさにこの状況をターゲットにした分散型トレーニングの研究体系が存在します。しかし、そのほとんどは 7B 〜 70B スケールで検証されたものです。地理的に分散された汎用ハードウェア上での 1 兆パラメータの実行は、単なる製品の発表ではなく、それ自体が研究成果としての貢献となるでしょう。

率直な見解:Teutonic は、マーケティングレベルの期限を設定しながら、研究レベルのエンジニアリング課題に挑んでいます。これが成功すれば、dTAO エコシステム全体が必要とする信頼獲得のイベントとなりますが、失敗すれば、SEC が最も注視している審査期間中に公に失速することになります。

Teutonic が生き残るべき分散型 AI トレーニングの展望

Teutonic は、2026 年に「信頼できる分散型 1 兆パラメータ」の節目を主張しようとしている唯一のプロジェクトではありません。競合マップは急速に埋まりつつあります:

  • Gensyn2026 年 4 月 22 日(この記事の公開日と同じ)にメインネットを立ち上げ、コンピューティングジョブの AI 駆動型マッチングレイヤーである Delphi Markets との提携を発表しました。当日の終業時までに、Gensyn は 5,000 枚以上の NVIDIA H100 に相当するハッシュレートを報告しています。Bittensor がパーミッションレスな調整とトークン・インセンティブのフライホイールを提供するのに対し、Gensyn は実行の正当性を暗号的に証明する、検証可能な AI コンピューティングマーケットプレイスとして位置づけています。
  • Ritual は逆の方向へ進み、**トレーニングではなく推論(inference)**に重点を置いています。同社の Infernet 技術により、あらゆるスマートコントラクトが AI の出力を要求し、指定されたモデルが改ざんされずに使用されたという暗号的証明を受け取ることができます。これは「先端モデルをゼロからトレーニングする」というテーゼではなく、「DeFi における検証可能な AI」というテーゼです。
  • AmbientOrigins Network も隣接した賭けに出ています。インセンティブ設計や検証戦略は異なりますが、先端モデルのトレーニングにおける中央集権型ラボの独占を打破するという長期的な目標は共通しています。

これらのプロジェクトは、必ずしも同じマイルストーンで直接競合しているわけではありませんが、限られた注目と資本をめぐって争っています。もし Gensyn のメインネットが商用ワークロードを通じて「分散型 AI はここに到達した」というナラティブを勝ち取れば、Teutonic の 5 月のトレーニング実行は、Bittensor の特定のアプローチ(サブネット間の競争とトークン加重インセンティブ)が正しいアーキテクチャなのか、それとも追い越される運命にある最初の試行に過ぎないのかを問う「審判」となるでしょう。

TAO を超えてこれが重要である理由

今後 4 〜 6 週間にわたって、3 つの事柄が同時に試されることになります。

分散型トレーニングがスケールするかどうか。 Teutonic が成功すれば、「分散型 AI コンピューティングのビットコイン」というテーゼは生き残ります。失敗すれば、Covenant の離脱は、サブネットベースのトレーニングが頂点に達した瞬間 —— 72B が基盤ではなく天井であった瞬間として記録されるでしょう。

コンビクション・メカニズム(Conviction Mechanism)が適切なガバナンスの修正策であるかどうか。 サブネットオペレーターをロックインすることで、Covenant のようなダンプ(投げ売り)を防ぐことができますが、長期ロックした者が既得権益化するという新たな失敗モードを生む可能性があります。Bitcoin Core の分散型メンテナーモデル、Solana Labs の継続的な中央集権的コア開発、Sui の Mysten Labs への集中は、プロトコルの複雑さがコミュニティの信頼を必要とする強力な中央メンテナーを必要とするかという、同じ問いに対する 3 つの異なる回答です。Bittensor は今、その実験の独自バージョンをリアルタイムで実行しています。

ETF の承認期間が、分散型 AI に伝統的金融(TradFi)のスケジュールでのリリースを強いるかどうか。 SEC(米国証券取引委員会)の 8 月の決定期限は、「興味深い研究プロジェクト」ではなく「DeepSeek モメント」でありたいと願うナラティブにとっての厳しいデッドラインです。これは健全な強制機能となるか、あるいはリリース内容次第では過剰な約束(オーバープロミッシング)を招く処方箋となるでしょう。

インフラ側から見守るビルダーにとって、根本的なシグナルはよりシンプルです。AI エージェントと分散型トレーニングネットワークは、新しい階層のオンチェーンクエリ負荷を生成しようとしています。 —— モデルレジストリのルックアップ、アテステーション証明、勾配チェックポイントのハッシュ、サブネットのパフォーマンスデータなど —— これらは既存の RPC インフラが想定していた人間向けの dApp パターンにはうまく適合しません。

BlockEden.xyz は、AI とクリプトのスタックを構築するチーム向けに、27 以上のチェーンにわたるエンタープライズグレードの RPC およびインデックスインフラを提供しています。人間とマシンの両方のトラフィック向けに設計された 当社の API マーケットプレイスを探索 して、開発を加速させましょう。

情報源