Gensyn RL Swarm : 検証可能な分散型 AI トレーニングの初のライブテスト
過去 10 年近くの間、「フロンティアモデルのトレーニング」は「ハイパースケール級の GPU クラスターを所有すること」と同義でした。Gensyn は、次世代の AI トレーニングが全く異なる場所、つまりイーサリアムロールアップを介して連携するインターネット接続されたノードのスウォーム(群れ)上で行われることに賭けたパブリックテストネットを公開しました。ETHGlobal は、その上にエージェントを構築できる開発者に向けて 50,000 ドルの賞金を提供しています。
もはや、分散型の機械学習トレーニングが技術的に可能かどうかという段階ではありません。RL Swarm は稼働しており、誰でもリポジトリをクローンできます。そのアーキテクチャは 2025 年 11 月から静かにリリースされ続けています。問題は、経済性、検証、そして開発者の引きが、AWS や Azure のデータセンターからトレーニングのワークロードを引き出すのに十分であるか、そして 2025 年 12 月に終了し た $AI トークンのセールが、その未来を正しく価格に反映させていたかということです。
なぜ「RL Swarm」が分散型トレーニング初のプロダクションテストなのか
Bittensor、io.net、Akash、Render など、これまでに聞いたことがある「分散型 AI」プロジェクトのほとんどは、隣接する課題を解決しています。Bittensor はサブネット間での競争的なモデルベンチマーキングを調整します。io.net と Akash はクリプトネイティブな課金機能を備えた GPU レンタルマーケットプレイスです。Render は推論のレンダリング作業を分散させます。これまでのところ、信頼できないノードが共同でモデルを トレーニング する実稼働システムは存在しませんでした。
それが Gensyn の RL Swarm が行うことです。これは Gensyn テストネットのフェーズ 0 の基盤です。単一のデータセンター内ではなく、パブリックインターネット上で強化学習(RL)エージェントが協力する分散型環境です。参加する各ノードはローカルの言語モデルを実行します。ノードは多段階の RL 推論ゲーム(ピアと連携して回答、批判、修正を行う)を実行し、すべての貢献は Gensyn テストネット上のオンチェーンアイデンティティに対して記録されます。
このアーキテクチャの転換は、言葉にすればわずかですが、実践においては大きなものです。Bittensor はマイナーに最高の出力を競わせるようインセンティブを与えますが、Gensyn は共有された成果物のトレーニングに 協力 するようノードにインセンティブを与えます。これが、競争的なマーケットプレイスと真の分散型トレーニング実行の違いであり、RL Swarm が単なる洗練されたコンピューティングレンタルレイヤーではなく、プロダクション級の分散型 ML トレーニングネットワークへの最初の信頼できる挑戦である理由です。
2025 年 11 月のリリースでは、同じピアツーピアフレームワーク上に構築された協調型コーディング環境「CodeZero」が追加されました。これら 2 つのリリースの流れを見ると、ロードマップが浮かび上がります。RL Swarm は推論のための調整プリミティブが機能することを証明し、CodeZero はそれらを構造化されたツール利用へと拡張します。2026 年 5 月 6 日のハッカソン終了時には、両方の環境が稼働しており、ウェイティングリストなしで参加可能になります。
4 層のアーキテクチャ:実行、検証、通信、調整
ユーザー向けのテストネットの背後で、Gensyn は OP Stack (Bedrock) 上に構築されたカスタムのイーサリアム Layer-2 ロールアップとして機能しています。このプ ロトコルは、分散型トレーニングの課題を 4 つの層に分解し、「インターネット経由で GPU を借りるだけ」という手法がこれまで失敗してきた特定の理由をそれぞれ解決しています。
実行 (Execution)。巨大なモデルは単一のコンシューマーノードには収まりません。そのため、Gensyn はモデルをデバイス間に分散されたパラメータブロックに断片化し、ノードごとのメモリ負荷を軽減します。より困難な問題は決定論(デターミニズム)です。異なるハードウェア(Nvidia A100 と H100 など)での浮動小数点演算は、わずかに異なる結果を生む可能性があり、不正を検出すべき検証プロトコルにとっては致命的です。Gensyn の RepOps ライブラリは浮動小数点演算の順序を固定し、ヘテロジニアスなハードウェア間でも同じ入力からビット単位で同一の出力を得られるようにします。Reproducible Execution Environment (REE) は、RepOps をカスタムの MLIR ベースのコンパイラでラップし、モデルをそれらの再現可能なカーネルにコンパイルします。
検証 (Verification)。これが、過去の分散型トレーニングの試みをすべて阻んできたレイヤーです。あるノードがトレーニングステップを実行して勾配(グラディエント)を提出したとき、自分で計算をすべてやり直すことなく、その作業が正直に行われたことをどうやって知るのでしょうか。Gensyn の答えは Verde 検証プロトコルです。これは軽量な紛争解決システムであり、トレーニングのトレースを二分探索して、証明者と検証者の意見が一致しない 単一のステップ を特定し、その演算のみを再計算します。確率的な学習証明(proof-of-learning)と組み合わせることで、ネットワークは完全な再実行のコストを支払うことなく、暗号化された保証を得ることができます。これは概念的には Truebit の対話型検証モデルに似ていますが、汎用計算から ML 特有のカーネルに移植されたものです。
通信 (Communication)。帯域幅が制限されたパブリックインターネット上でトレーニングを調整するには、教科書通りの手法を捨てる必要があります。標準的なデータセンターのプリミティブ(同期的な All-reduce)は、太い InfiniBand パイプを前提としています。Gensyn は 3 つのカスタムプリミティブに置き換えます。NoLoCo は All-reduce を低通信のゴシッププロトコルに置き換え、CheckFree は高価な定期的チェックポイントなしでフォールトトレラントなリカバリを提供し、SkipPipe はスウォーム全体でメッセージホップを最小限に抑える勾配共有アルゴリズムを導入します。それぞれが論文レベルの貢献であり、これらが組み合わさることで、「家庭用インターネットに繋がった大量のノート PC」が機能するトレーニングクラスターへと変わります。
調整 (Coordination)。イーサリアム L2 自体が経済エンジンです。参加者を特定し、トークン化された報酬を決済し、許可レスなロールアップ上で支払いを実行します。ここには $AI トークンも存在し、トレーニング実行へのあらゆる貢献が最終的に集計されます。
このスタックを理解する最も明快な方法は、クラウド GPU モデルを意図的に反転させたものと捉えることです。AWS や Azure は生のスループットにエンジニアリングを注ぎ込み、契約による信頼を前提としています。一方、Gensyn は再現性と紛争解決にエ ンジニアリングを注ぎ込み、ネットワークの反対側にいるオペレーターについては何も想定していません。
Gensyn と Bittensor、io.net、Render の違い
アーキテクチャを俯瞰すれば、競合状況は明確になります。Gensyn と並んで頻繁に言及されるプロジェクトが 3 つありますが、それらはそれぞれ異なる課題を解決しています。
- Bittensor (TAO、時価総額約 26.4 億ドル) は、競争力のあるベンチマーク・ネットワークです。サブネットがタスクを定義し、マイナーが出力を生成し、バリデーターがそれらをランク付けし、最も高いスコアを獲得した者に TAO が分配されます。モデルの品質にインセンティブを与えることには非常に優れていますが、ノード間で単一の共有トレーニング・ランを調整することはありません。Gensyn のスウォーム(群知能)ベースのトレーニングは構造的に「協調的」であるのに対し、Bittensor のサブネット・モデルは構造的に「対立的」です。
- io.net と Akash は GPU マーケットプレイスです。アイドル状態のハードウェアを持つオペレーターが、対価を支払う意思のあるユーザーに時間を販売できるようにします。決定的な違いとして、どちらのプロトコルも買い手のワークロードが正しく実行されたことを「検証」しません。それは買い手側の問題であり、通常は独自のトレーニング・スタックを実行し、レシート(領収証)を信頼することで解決されます。Gensyn の Verde と REE のペアは、まさにこれらのマーケットプレイスに欠けているレイヤーです。
- Render Network は、主にグラフィックス向けの推論レンダリング作業を分散させます。その経済モデルは Gensyn よりも io.net に近く、コンピューティングをレンタルし、出力を得て、オペレーターを信頼するというものです。Render の Dispersed サブネットは隣接する製品であり、直接の競合ではありません。
Gensyn は、Bittensor の数分の一の時価総額(約 7,160 万ドル、ランキング 368 位)でトークンをローンチしました。この差こそが投資仮説です。もし「検証可能な協調型トレーニング」が実在するカテゴリーであり、単なるコンピューティング・レンタルの精巧なバージョンではないのであれば、この差額はエントリーポイントになります。そうでなければ、この差は市場が「科学プロジェクト」を正当に評価した結果ということになります。