「cryptographic proofs」タグの記事が 7 件件あります

暗号証明システム

Gensyn の Judge が AI 最大の信頼のギャップに挑む：評価者を誰が評価するのか？

2026年3月27日 · 約 15 分

Software Engineer

GPT-4 は、同じ回答を 2 回評価するよう求められた際、40% の確率で自身と矛盾する評価を下します。Bard は、医学の系統的レビューにおいて参考文献の 91% でハルシネーション（幻覚）を起こしました。AI の誠実さを保つためのベンチマークはどうでしょうか？モデルはますます、それらをハックするように最適化されています。モデルが優れているか、安全か、あるいは真実であるかを判断するインフラである AI 評価スタック全体が、不透明で再現性がなく、足元で静かに変化し続ける基盤の上に成り立っています。

a16z crypto、CoinFund、Protocol Labs から 5,000 万ドルの出資を受けた分散型機械学習プロトコルである Gensyn は、構造的な解決策を見出したと考えています。彼らの新しいシステム Judge は、暗号技術によって検証可能な AI 評価を実用化します。ブラックボックス化した API 呼び出しを、確定的（deterministic）で異議申し立て可能な、モデル品質のオンチェーン証明に置き換えます。これが大規模に機能すれば、AI 業界が信頼を構築する方法を再定義することになるでしょう。

AgentKit：エージェンティック・コマースにおける信頼のギャップを埋める

2026年3月20日 · 約 14 分

Dora Noda

Software Engineer

AI エージェントがレストランを予約し、コンサートチケットを購入し、あるいはあなたに代わって価格交渉を行うとき、相手側のウェブサイトは、これまでに問う必要のなかった疑問に直面します。「このソフトウェアの背後に、実際に人間は存在しているのか？」という問いです。

2026 年 3 月 17 日、サム・アルトマン（Sam Altman）率いる World と Coinbase は AgentKit を発表しました。これは、AI エージェントが人間による裏付けがあるという暗号学的証明を、インターネットの決済レイヤーに直接埋め込むことができる開発者ツールキットです。

このタイミングは偶然ではありません。マッキンゼー（McKinsey）は、自律型 AI プログラムによって開始・完了される取引である「エージェンティック・コマース」が、2030 年までに世界で 3 兆ドルから 5 兆ドルに達すると予測しています。モルガン・スタンレー（Morgan Stanley）は、今世紀末までに米国の e コマース支出だけで 1,900 億ドルから 3,850 億ドルが AI エージェントを経由すると推定しています。しかし、これらのエージェントが増殖するにつれ、攻撃対象領域も拡大します。1 人の人間が 1,000 台のボットを動かしてチケットを買い占めたり、限定在庫を枯渇させたり、ロイヤリティプログラムを悪用したりする行為は、機械の背後にいる人間を確認できない限り、1,000 人の正当な顧客と見分けがつきません。

ZK-ML 革命：暗号学的証明が DeFi のリスク評価をどのように再構築しているか

2026年3月12日 · 約 23 分

Dora Noda

Software Engineer

DeFi レンディングプロトコルがポジションを清算する際、リスク計算が正しかったとどうすれば確信できるでしょうか？モデルに欠陥があったり、操作されていたり、あるいは単に不透明だった場合はどうなるでしょうか？長年、DeFi はパラドックスの上で成り立ってきました。プロトコルはオンチェーン実行の透明性を求める一方で、重要なリスク決定を下す AI モデルはブラックボックスのままです。ゼロ知識機械学習（ZK-ML）がついにこの信頼のギャップを解消しようとしています。そして、2026 年における機関投資家の DeFi 採用への影響は計り知れません。

DeFi リスクモデルにおける信頼の危機

DeFi の預かり資産総額（TVL）が 500 億ドルを超える爆発的な成長を遂げたことで、新たな課題が浮上しました。機関投資家の資本は検証可能なリスク評価を求めていますが、現在のソリューションでは透明性と機密性の間で容認しがたいトレードオフを強いられています。

従来のオラクルベースのリスクシステムは、プロトコルを 3 つの重大な脆弱性にさらしています。第一に、レイテンシ（遅延）が資本効率を損ないます。ボラティリティの高い局面では、価格フィードの遅れや不正確さがレンディングプロトコルの適時な清算を妨げ、不良債権の連鎖を引き起こします。従来のプッシュ型オラクルでは、更新の遅延を補うために、プロトコルは保守的な担保掛目（通常 50 〜 70%）を採用せざるを得ず、借り手の資本効率を直接的に低下させています。

第二に、操作のリスクが依然として蔓延しています。リスクスコアの計算方法に対する暗号学的な検証がなければ、プロトコルは中央集権的なデータプロバイダーへの信頼に依存することになります。侵害されたオラクルは、不当な清算を引き起こしたり、さらに悪いことに、システム的な破綻に至るまで過小担保のポジションを放置したりする可能性があります。

第三に、独自のプロプライエタリ・モデルが規制上の難題を引き起こします。機関投資家は、独自のアルゴリズムを公開することなく、リスク評価が健全であることを証明する必要があります。銀行はリスクロジックが完全に公開されているレンディングプロトコルを採用することはできませんが、一方で規制当局は不透明な「信頼してください」というシステムを受け入れません。この規制上のデッドロックが、機関投資家の DeFi 統合を停滞させてきました。

数字がその実態を物語っています。2025 年の DeFi 清算イベントでは 23 億ドル以上の連鎖損失が発生し、その 40% はオラクルのレイテンシと操作の脆弱性に起因しています。機関投資家が傍観しているのは、ブロックチェーンの可能性を疑っているからではなく、現在のリスクインフラを受け入れられないからです。

ゼロ知識機械学習（ZK-ML）の登場

ZK-ML はパラダイムシフトを象徴しています。これにより、基礎となるデータやモデルのパラメータを明かすことなく、AI が生成したリスク評価を暗号学的に検証することが可能になります。これは、「この清算予測は、当社の独自モデルとお客様の暗号化されたデータを使用して正しく計算されました」ということを、どちらの内容も公開せずに数学的に証明するものだと考えてください。

この技術は、機械学習の推論をゼロ知識証明に変換することで機能します。DeFi プロトコルが清算リスクを評価する必要がある場合、ZK-ML システムは以下のステップを踏みます：

暗号化されたユーザーデータ（担保ポジション、取引履歴、ウォレットの行動）に基づいて AI モデルを実行する
計算が正しく実行されたことを示す 暗号学的証明を生成する
モデルの構造や機密性の高いユーザーデータを明かすことなく、誰でも検証できるように 証明をオンチェーンで公開する
検証可能な正しいリスクスコアに基づいて、スマートコントラクトのアクション（清算など）を実行する

これは理論上の話ではありません。EZKL、Modulus Labs、Gensyn などのプロジェクトは、すでにプロダクションレベルの ZK-ML フレームワークを実証しています。EZKL の最新のベンチマークでは、以前の ZK システムよりも 65.88 倍速い検証速度を示しており、最大 1,800 万パラメータのモデルをサポートしています。Modulus Labs は複雑なニューラルネットワークのオンチェーン推論を証明し、Gensyn は検証機能を組み込んだ分散型トレーニングインフラを構築しています。

現実世界への影響はすでに現れています。ORA の Marine 清算システムは、zkOracle ベースの実装を使用して、Compound Finance 上でトラストレスな清算を実行しています。清算が可能になった瞬間にトリガーされるゼロレイテンシのオラクル更新を導入することで、Marine はレンディングプロトコルがより高い LTV 比率（最大 85 〜 90%）を提供することを可能にしつつ、従来のオラクルでは無謀とされる安全マージンを維持しています。

プライバシーを保護するクレジットスコアリング：機関投資家への開放

機関投資家による DeFi 採用において、クレジットスコアリングは「聖杯」とも言える重要な要素です。伝統的な金融は FICO スコアや信用調査機関に依存していますが、これらのシステムはブロックチェーンの匿名性の高い設計とは根本的に互換性がありません。KYC（本人確認）なしでどのように信用力を評価するのでしょうか？取引グラフを公開せずに、どのように借り手の返済履歴を証明するのでしょうか？

ZK-ML は、プライバシーを保護するクレジットスコアリングを通じてこれを解決します。IEEE や Springer の研究では、ブロックチェーンとゼロ知識証明を使用した完全なクレジットスコアシステムが実証されています。そのアーキテクチャは以下のように機能します：

複数の DeFi プロトコルにわたる 信用データ（返済履歴、清算イベント、ウォレットの経過年数、取引パターン）を暗号化する
準同型暗号や秘密計算を用いて、この暗号化されたデータ上で ML クレジットモデルを実行する
どのプロトコルがデータを提供したか、あるいはウォレットの全履歴を明かすことなく、特定のウォレットアドレスが特定のクレジットスコア範囲内にあるという ゼロ知識証明を生成する
ユーザーが検証済みの信用力をプラットフォーム間で持ち運べるようにする、ポータブルなオンチェーン・アテステーション（証明）を作成する

これは単なるプライバシーの演出ではありません。規制上の必然性です。Science Direct に掲載された最近の研究では、暗号学的な Proof-of-SQL メカニズムを備えたブロックチェーンベースの検証レイヤーにより、機関投資家が GDPR コンプライアンスを維持しながら借り手の資格を検証できることが示されました。VeriNet フレームワークは、ディープフェイク検出とフィンテックのクレジットスコアリングの両方においてこれを達成し、このアプローチが大規模に機能することを証明しました。

ビジネスケースは非常に強力です。機関投資家である貸し手は、検証可能なリスクセグメンテーションを用いて DeFi レンディングプールに資本を投入できるようになります。すべての匿名ユーザーをハイリスクとして扱い（補償のために 15 〜 25% の APY を課す）代わりに、プロトコルは差別化された金利を提供できます。たとえば、検証済みのローリスクウォレットには 8%、ミドルリスクには 12%、ハイリスクには 20% といった具合です。これらすべてを、ユーザーのプライバシーと規制コンプライアンスを維持しながら実現できるのです。

ZK-ML vs. 従来のオラクル：パフォーマンスの差

ZK-ML のレガシーオラクルシステムに対する速度の優位性は驚異的です。従来の価格オラクルは、実装によって 1 〜 60 秒ごとに更新されます（Chainlink のハートビートは通常 1 〜 3 % の価格偏差、または 1 時間ごとの更新です）。2024 年 3 月のボラティリティ急上昇時、Ethereum のガス代は 500 gwei 以上に跳ね上がり、オラクルの更新に 10 〜 15 分の遅延が発生しました。

ZK-ML システムは、一般的な DeFi リスクモデルにおいて 100 〜 500 ミリ秒で暗号証明を生成し、オンデマンドでリスク評価を計算することで、このレイテンシを排除します。Marine の zkOracle 実装は、これを本番環境で実証しました。オラクル依存のシステムでは清算に 10 〜 50 ブロックかかるのに対し、担保不足が発生してから 1 〜 2 ブロック以内に清算が実行されました。

資本効率の向上は測定可能です。保守的な見積もりでは、ZK-ML を活用したレンディングプロトコルは、LTV（融資比率）を安全に 15 〜 20 パーセントポイント引き上げることができます。TVL（預かり資産）が 10 億ドルのプロトコルであれば、これは 1 億 5,000 万〜 2 億ドルの追加融資枠に相当し、レガシーなインフラでは見逃されていた数億ドルの年間金利収益を解き放つことになります。

速度以外にも、ZK-ML はオラクルには真似できない耐操作性を提供します。従来の価格フィードは、フラッシュローン攻撃、バリデーターの結託、または API キーの漏洩によって偽装される可能性があります。ZK-ML リスクモデルは、すべての計算ステップを暗号学的に検証しながらオンチェーンで動作します。攻撃者は、単一のオラクルフィードを侵害するのではなく、基盤となるゼロ知識証明システム（離散対数問題の困難性などの核心的な暗号学的仮定を打破する必要がある）を破らなければなりません。

金融安定理事会（FSB）の 2023 年 DeFi リスクに関する報告書では、オラクル操作がシステム的な脆弱性であると明確に指摘されています。ZK-ML はこれに直接対処します。清算の決定が、信頼ベースの価格フィードではなく、暗号学的に証明されたリスクモデルに基づいている場合、攻撃対象領域（アタックサーフェス）は桁違いに縮小します。

なぜ機関投資家は透明でありながら機密性の高いモデルを必要とするのか

機関投資家による DeFi 採用のボトルネックは技術ではなく、信頼のインフラです。J.P. Morgan や State Street が DeFi レンディングプロトコルを評価する際、デューデリジェンスチームは次のように問いかけます。「清算リスクをどのように計算しているのか？」「モデルを監査できるか？」「ゲーミング（不正操作）をどう防ぐのか？」

従来の DeFi プロトコルでは、その回答は不十分なものです。

完全に透明なモデル: リスクロジックがオープンソースであることは、競合他社が清算をフロントランニングでき、マーケットメーカーがシステムを悪用でき、独自の競争優位性が失われることを意味します。
ブラックボックスモデル: 機関のコンプライアンスチームは、リスク計算を監査できないシステムを拒絶します。
オラクルへの依存: 外部の価格フィードへの依存は、銀行が受け入れられないカウンターパーティリスクをもたらします。

ZK-ML はこの行き詰まりを打破します。機関投資家は、選択的に透明なリスクモデルを備えたプロトコルを展開できるようになりました。

監査可能な検証: 規制当局や監査人は、独自のパラメータを知ることなく、清算の決定が主張通りのアルゴリズムに従っていることを検証できます。
競争力の保護: モデルのアーキテクチャとトレーニングデータは機密性が保たれ、競争上の優位性が維持されます。
オンチェーンの責任: すべてのリスク決定が不変の暗号証明を生成し、コンプライアンスのための完璧な監査証跡を作成します。
プロトコル間でのポータビリティ: ユーザーは、どのプロトコルを使用したかを明かすことなく、自身の信用力を証明できます。

規制上の意味合いは重大です。Enterprise Ethereum Alliance（EEA）の DeFi リスクアセスメントガイドライン（バージョン 1）では、「監査を可能にしながら機密性を保持する検証可能な計算フレームワーク」を明示的に求めています。ZK-ML は、この仕様を満たす唯一の技術です。

ジョージタウン大学の機関投資家向け DeFi 統合に関する最近の政策文書では、コンプライアンスの課題を次のように特定しています。「仲介者のいないシステムに従来の金融規制を後付けするのではなく、新たなソリューションはコンプライアンス機能を DeFi インフラに直接組み込んでいる」。ZK-ML はまさにこれを行っています。それは後付けの対策ではなく、コンプライアンス・ネイティブなアーキテクチャなのです。

2026 年のブレイクアウト：理論からプロダクションへ

転換点は今、ここにあります。ZK-ML の概念は 2021 年から存在していましたが、実用的な実装がプロダクションレベルの成熟度に達したのはつい最近のことです。その証拠は以下の通りです。

インフラの成熟: EZKL は、2024 年にはほとんど不可能だったアテンション・メカニズム（Attention Mechanism）のサポートを実証し、現在はプロダクション向けに最適化されています。Modulus Labs は 1,800 万パラメータのモデルのオンチェーン推論を証明し、現実世界の信用モデルが実行可能になる閾値を越えました。

資本の投入: Gensyn は、暗号検証を伴う分散型 AI トレーニングを構築するために多額の資金を調達しました。機関投資家が資金を提供しているのは研究プロジェクトではなく、プロダクションインフラです。

エコシステムの統合: ゼロ知識証明技術は、暗号学の研究段階からブロックチェーン規模のアプリケーションへと移行しました。Chainalysis や TRM Labs は、ZK 互換のコンプライアンスツールを構築しています。インフラ層は成熟しつつあります。

開発者ツールの充実: ZK-ML 実装の障壁は崩壊しました。2023 年には暗号学の博士号が必要だったことが、今では標準的なブロックチェーン開発者が EZKL、Modulus、または新興のフレームワークを使用して実装できるようになっています。開発者が ZK-ML システムを数年ではなく数週間で提供できるようになれば、採用は指数関数的に加速します。

この軌跡は DeFi 自身の進化と重なります。2020 年、DeFi は TVL 10 億ドルの研究対象に過ぎませんでした。2021 年までにインフラが成熟し、TVL は 50 倍の 500 億ドルへと急拡大しました。ZK-ML も同じ曲線を辿っています。2024 年は研究と概念実証の年、2025 年は最初のプロダクション展開が見られ、2026 年がブレイクアウトの年となります。

市場のシグナルがこれを裏付けています。PayFi セクター（プログラム可能な決済インフラ）の時価総額は 22.7 億ドルに達し、1 日の取引高は 1.48 億ドルを記録しました。機関投資家は資本を投機的な DeFi から収益を生む決済インフラへとシフトさせており、その資本投入を安全にするためのリスク管理ツールを求めています。ZK-ML は、その欠けていた最後のピースです。

今後の道のり：課題と機会

勢いはあるものの、ZK-ML は現実的な技術的および採用のハードルに直面しています。 計算オーバーヘッド は依然として大きく、複雑な ML モデルのゼロ知識証明を生成するには、標準的な推論よりも 10 〜 1000 倍多い計算量が必要です。EZKL による従来のシステムに対する 65 倍の高速化は目覚ましいものですが、ネイティブで 10ms かかるリスク計算が ZK 証明を使用すると 650ms かかることを意味します。

マイクロ秒が重要となる高頻度取引や清算システムにとって、このレイテンシは許容範囲内です。しかし、1 秒間に数千回の推論を必要とするリアルタイム・アプリケーションの場合、現在の ZK-ML システムは苦戦しています。ZK-ML がすべての DeFi ユースケースで実行可能になるには、さらに 5 〜 10 倍のパフォーマンス向上が必要です。

モデルの複雑性の限界 も現実の課題です。Modulus Labs は 1,800 万のパラメータを実証しましたが、最先端の AI モデルは現在 1,000 億（GPT-4）や、数兆（dense transformer モデル）ものパラメータを超えています。現在の ZK-ML システムでは、その規模の計算を証明することはできません。通常 100 万〜 5,000 万のパラメータである DeFi リスクモデルにとって、これは障害ではありません。しかし、フロンティア AI アプリケーションの場合、ZK-ML には根本的なアルゴリズムの突破口が必要です。

標準化 は依然として断片化されています。EZKL、Modulus、Gensyn、Worldcoin の Orion はすべて、異なる証明システム、回路設計、検証メカニズムを使用しています。この断片化は統合の悩みの種となります。EZKL 証明を使用する DeFi プロトコルは、複数の検証システムを実行しなければ、Modulus が生成したクレジットスコアを簡単に検証できません。

業界には、ERC-20 がトークンを標準化し、EIP-1559 がガス代を標準化したような ZK-ML の標準が必要です。Enterprise Ethereum Alliance（EEA）がこれに取り組んでいますが、包括的な標準が登場するのは 2026 年後半または 2027 年になるでしょう。

しかし、機会はこれらの課題を凌駕します。 クロスチェーン・クレジットスコアリング が可能になります。ZK 証明が、基礎となるトランザクショングラフを明かすことなく、複数のブロックチェーンにわたるウォレットの行動を証明できるからです。ユーザーは、「Ethereum、Polygon、Arbitrum で一度も清算されたことがない」ということを、単一の暗号学的証明で証明できるのです。

自動化されたリスクベースの貸付 は、概念から現実へと変わります。DeFi プロトコルに担保を預けると、検証可能なオンチェーン履歴に合わせて調整されたクレジットライン（与信枠）を即座に受け取ることができると想像してみてください。手動の承認も、中央集権的な信用調査機関も必要なく、数学と暗号技術だけで完結します。

規制コンプライアンスの自動化 も扱いやすくなります。コンプライアンス・チームを雇って DeFi トランザクションを手動で確認する代わりに、機関投資家は、ユーザーの身元をブロックチェーンに明かすことなく AML / KYC コンプライアンスを暗号学的に証明する ZK-ML システムを導入します。

そのビジョンは、伝統的な金融や現在の DeFi で可能なあらゆるものよりも、透明性が高く（すべての決定が検証可能で正しい）、かつプライバシーが守られた（機密データが暗号化された状態から出ることがない）金融システムです。

DeFi を超えてこれが重要である理由

その影響は、貸付プロトコルや清算をはるかに超えて広がります。プライバシーを保護しながら 検証可能な AI の決定 を必要とするあらゆるシステムが ZK-ML のユースケースとなります：

ヘルスケア AI: 患者の記録を明かすことなく、診断が正しく行われたことを証明する
サプライチェーン: 独自のサプライヤー・ネットワークをさらすことなく、ML 監査を通じて ESG コンプライアンスを検証する
保険: 保険加入者のデータの機密性を保ちながら、AI リスクモデルを使用して保険料を計算する
投票システム: 有権者のプライバシーを維持しながら、ML を使用して不正投票を検出する

しかし、DeFi はその実証の場です。DeFi には、経済的インセンティブ（リスクにさらされている数十億ドルの TVL）、技術的な洗練さ（暗号ネイティブな開発者）、そして規制の圧力（機関投資家への普及はこれにかかっている）があり、ZK-ML を研究段階から本番環境へと押し上げる原動力となっています。

現在の開発スピードに基づくと、2026 年第 4 四半期までに ZK-ML が DeFi 貸付の標準的なインフラになると予想されます。その時、この技術は実戦でテストされ、信頼できる AI が重要となるあらゆるセクターへの展開準備が整っているでしょう。

結論

ゼロ知識機械学習（ZK-ML）は単なる技術的なアップグレードではありません。それは機関投資家向け DeFi が待ち望んでいた信頼のインフラです。独自のモデルの機密性とユーザーのプライバシーの両方を維持する、暗号学的に検証可能なリスク評価を可能にすることで、ZK-ML は数十億ドルの機関投資家資本の流入を停滞させていた規制上のパラドックスを解決します。

タイムラインは明確です。2024 年は研究の年であり、2025 年には最初の本番導入が見られ、2026 年は飛躍の年となるでしょう。EZKL のようなフレームワークが 65 倍のパフォーマンス向上を達成し、Marine のようなプロトコルがゼロレイテンシの清算を実証し、機関投資家の需要がコンプライアンス準拠のリスク・インフラを中心に具体化する中で、爆発的な普及のための条件は整っています。

DeFi プロトコルにとって、戦略的な問いは ZK-ML を採用するかどうかではなく、移行をリードするか、それとも検証可能でプライバシーを保護するリスク管理に付随する機関投資家資本を競合他社に奪われるのを見守るかです。DeFi への露出を検討している機関投資家にとって、ZK-ML 対応のプロトコルは、受託者責任が要求するコンプライアンス、監査可能性、およびリスク管理基準を満たす最初の世代のブロックチェーン・ベースの金融を代表するものです。

リスク評価の革命がここにあります。唯一の問いは、誰が最初にそれを構築するかです。

BlockEden.xyz は、業界をリードする信頼性とパフォーマンスを備えたエンタープライズグレードのブロックチェーン・インフラを提供しています。持続可能な基盤の上に構築するために、当社の API サービスを探索してください。

参考文献

Filecoin のオンチェーンクラウド変革：コールドストレージからプログラマブルなインフラストラクチャへ

2026年2月26日 · 約 19 分

Dora Noda

Software Engineer

AWS が標準ストレージに対して毎月 1 テラバイトあたり 23 ドルを請求する一方で、Filecoin は同じ容量に対して 0.19 ドルしかかかりません。しかし、コストだけでインフラ戦争に勝てるわけではありません。本当の問いは、分散型ストレージが、速度、信頼性、開発者体験といった真に重要な指標において、中央集権的なクラウドプロバイダーに匹敵できるかどうかです。2025 年 11 月 18 日、Filecoin は Onchain Cloud の立ち上げによってその答えを明確にしました。これは、2.1 エクスビバイト（EiB）のアーカイブストレージを、AI ワークロードやリアルタイムアプリケーション向けに設計された、プログラム可能で検証可能なインフラへと根本的に変革するものです。

これは単なる漸進的な改善ではありません。自動支払い、暗号化検証、パフォーマンス保証を備えた「ブロックチェーンストレージネットワーク」から「分散型クラウドプラットフォーム」への Filecoin の転換点です。100 以上の開発チームとの数ヶ月にわたるテストを経て、2026 年 1 月にメインネットが稼働し、Filecoin は 120 億ドル規模の AI インフラ市場で大きなシェアを獲得する準備を整えました。

オンチェーン・クラウドのアーキテクチャ：プログラマブル・ストレージの 3 つの柱

Filecoin Onchain Cloud は、ブロックチェーンストレージに特有の複雑さを排除し、開発者が検証可能な分散型インフラ上に構築することを可能にする 3 つのコアサービスを導入しています。

Filecoin Warm Storage Service（ウォームストレージ・サービス） は、継続的なオンチェーン証明を通じて、データをオンラインで、かつ証明可能な状態で利用可能に保ちます。取得に遅延が生じるコールドアーカイブストレージとは異なり、ウォームストレージは、Filecoin の暗号化検証を活用しながら、データをアクセス可能な状態に維持します。これにより、Filecoin をバックアップやアーカイブの用途に限定していた主な制限、つまり「アクティブなワークロードに対してデータ速度が不十分である」という課題が解決されます。

Filecoin Pay は、スマートコントラクトを通じて従量課金制の支払いを自動化し、配信がオンチェーンで確認された場合にのみ取引を決済します。これは、従量課金制のクラウドサービスにとって不可欠なインフラです。サービスが証明されると支払いが自動的に行われるため、手動の請求、クレジットシステム、および信頼への依存が排除されます。すでにテストネット段階で、何千ものペイメントチャネルが取引を処理しています。

Filecoin Beam は、パフォーマンスに基づいたインセンティブを伴う、計測されたインセンティブ付きのデータ取得を可能にします。ストレージプロバイダーは、ストレージ容量だけでなく、取得速度や信頼性でも競い合います。これにより、プロバイダーがパフォーマンスに応じて報酬を得られる取得市場が形成され、分散型ストレージの歴史的な弱点であった「予測不可能な取得時間」に直接対処します。

開発者は Synapse SDK を通じてこれらのサービスにアクセスでき、Filecoin プロトコルとの直接的な対話の複雑さが抽象化されます。初期の統合事例には、ERC-8004 コミュニティ、Ethereum Name Service（ENS）、KYVE、Monad、Safe、Akave、Storacha など、ブロックチェーンの状態から分散型アイデンティティに至るまで、検証可能なストレージを必要とするプロジェクトが含まれています。

暗号学的証明：検証可能なストレージの技術的基盤

Filecoin を中央集権的なクラウドプロバイダーと区別するのは、単なる分散化ではなく、ストレージのコミットメントが遵守されているという「暗号学的証明」です。これは、プロバナンス（起源）の保証を必要とする AI 学習データセット、監査証跡を必要とする規制の厳しい業界、そしてデータの完全性が譲れないあらゆるアプリケーションにとって重要です。

Proof-of-Replication（PoRep：複製証明） は、計算負荷の高いシーリング（封印）プロセスを通じて、セクターの元のデータのユニークなコピーを生成します。これにより、ストレージプロバイダーが、単に保存しているふりをしたり、複数のクライアントに対して 1 つのコピーを使い回したりするのではなく、クライアントのデータの物理的にユニークなコピーを保存していることが証明されます。シーリングされたセクターは低速なエンコーディングを伴うため、不正なプロバイダーがストレージを偽装するためにオンデマンドでデータを再生成することは不可能です。

シーリングプロセスでは、Multi-SNARK 証明と、シーリングされたセクターを元のシーリング前のデータに関連付ける一連のコミットメント（CommR）が生成されます。これらのコミットメントはブロックチェーン上で公開検証可能であり、ストレージ取引の不変の記録を作成します。

Proof-of-Spacetime（PoSt：時空証明） は、定期的な暗号学的チャレンジを通じて、時間の経過に伴う継続的な保存を証明します。ストレージプロバイダーは、30 分の期限内に WindowPoSt チャレンジに応答し、コミットしたバイトを正確に保持し続けていることを検証する zk-SNARK 証明を提出する必要があります。これはストレージ取引の開始時だけでなく、全期間を通じて継続的に行われます。

検証プロセスでは、エンコードされたレプリカからリーフノードをランダムに選択し、Merkle 包含証明を実行して、プロバイダーが本来あるべき特定のバイトを保持していることを示します。その後、プロバイダーは非公開で保存されている CommRLast を使用して、包含証明と一致し、かつ公開されている CommR を導出できるレプリカのルートを知っていることを証明します。最終段階では、効率的なオンチェーン検証のために、これらの証明を単一の zk-SNARK に圧縮します。

30 分のウィンドウ内に WindowPoSt 証明を提出できない場合、スラッシングが発生します。ストレージプロバイダーは担保の一部を失い（f099 アドレスにバーンされる）、ストレージパワーが減少します。これにより、ストレージ障害に対して経済的なペナルティが発生し、プロバイダーのインセンティブがネットワークの信頼性と一致するようになります。

この 2 層の証明システム（初期検証のための PoRep と継続的な検証のための PoSt）は、中央集権型クラウドでは提供できない検証可能なストレージを実現します。AWS が「データを保存している」と言うとき、あなたは彼らのインフラと法的合意を信頼することになります。Filecoin がそれを言うとき、あなたは 30 分ごとに更新される暗号学的証明を手にすることになります。

AI インフラ市場：分散型ストレージが実需と出会う場所

Filecoin Onchain Cloud の立ち上げのタイミングは、AI インフラ要件の根本的な変化と一致しています。人工知能が研究対象から、産業全体を再構築する実用的なインフラへと移行するにつれ、ストレージへのニーズは明確かつ巨大なものとなっています。

AI モデルのトレーニングには膨大なデータセットが必要です。 現代の大規模言語モデルは、数千億のトークンでトレーニングされます。コンピュータビジョンモデルには、ラベル付けされた数百万の画像が必要です。レコメンデーションシステムは、ユーザーの行動データを大規模に取得します。これらのデータセットはローカルストレージには収まらず、クラウドインフラを必要とします。しかし、それらはプロバナンス（由来）の保証も必要とします。汚染されたトレーニングデータは汚染されたモデルを生み出しますが、AWS 上でデータの整合性を検証する暗号学的な方法はありません。

推論のための継続的なデータアクセス。 一度トレーニングされると、AI モデルは予測を提供するために参照データへの絶え間ないアクセスを必要とします。検索拡張生成（RAG）システムは、言語モデルの出力を裏付けるためにナレッジベースを照会します。リアルタイムのレコメンデーションエンジンは、ユーザープロファイルとアイテムカタログを取得します。これらは一回限りの取得ではなく、高速で信頼性の高いストレージを必要とする、継続的で高頻度なアクセスパターンです。

モデルポイズニングを防止するための検証可能なデータプロバナンス。 金融機関が不正検知モデルをトレーニングする場合、トレーニングデータが改ざんされていないことを知る必要があります。ヘルスケア AI が患者の記録を分析する場合、コンプライアンスと責任の観点からプロバナンスが重要になります。Filecoin の PoRep（複製証明）と PoSt（時空間証明）は、信頼できる仲介者を介さずに、中央集権型ストレージでは再現できない監査証跡を作成します。

集中リスクを回避するための分散型ストレージ。 単一のクラウドプロバイダーに依存することは、システム的なリスクを生み出します。AWS の障害はインターネットの大部分を停止させました。Google Cloud の停止は数百万のサービスに影響を与えます。重要なシステムを支える AI インフラにとって、地理的および組織的な分散は単なる哲学的な好みではなく、リスク管理上の要件です。

Filecoin ネットワークは、2.1 エキシバイト（EiB）のコミット済みストレージを保持し、さらに 7.6 EiB の raw 容量が利用可能です。ネットワーク利用率は 36%（2025 年第 2 四半期の 32% から上昇）に成長し、アクティブな保存データは 1,110 ペタバイトに迫っています。2025 年には約 2,500 のデータセットがオンボーディングされ、着実な企業採用が進んでいることを示しています。

経済的な利点は説得力があります。Filecoin の 1 テラバイトあたりの月額平均コストは 0.19 ドルであるのに対し、AWS の同容量は約 23 ドルであり、99% のコスト削減を実現しています。しかし、本当の価値提案は単に安価なストレージであることではありません。それは、開発者向けのツールを通じて提供される、プログラム可能なインフラを備えた大規模で検証可能なストレージであることです。

中央集権型クラウドとの競争：2026 年における Filecoin の立ち位置

問題は、分散型ストレージに利点（検証可能な証明、検閲耐性、コスト効率）があるかどうかではありません。それらは明白です。問題は、それらの利点が残された欠点を克服するのに十分かどうかです。主な欠点は、Filecoin のストレージと取得が、依然として中央集権的な代替手段よりも遅く、複雑であることです。

パフォーマンスの差は縮まっているが、解消はされていない。 AWS S3 は、読み取りに対して 1 桁ミリ秒のレイテンシを提供します。Filecoin Warm Storage と Beam による取得は、まだそれに匹敵することはできません。しかし、多くのワークロードはミリ秒単位のレイテンシを必要としません。AI のトレーニング実行は、シーケンシャルなバッチ読み取りで大規模なデータセットにアクセスします。コンプライアンスのためのアーカイブストレージは速度を優先しません。コンテンツ配信ネットワーク（CDN）は、元のストレージの速度に関係なく、頻繁にアクセスされるデータをキャッシュします。

Onchain Cloud のアップグレードにより、ストレージコミットメントに対して 1 分未満のファイナリティが導入されました。これは以前の数時間に及ぶシーリング時間と比較して大幅な改善です。これはレイテンシが重要なアプリケーションで AWS と競合するものではありませんが、以前は Filecoin 上で非現実的だった新しいユースケースを切り開きます。

抽象化による開発者体験の向上。 Filecoin プロトコルとの直接的な対話には、セクター、シーリング、WindowPoSt チャレンジ、ペイメントチャネルといった、AWS のシンプルな API（バケットの作成、オブジェクトのアップロード、権限の設定）に慣れた開発者には馴染みのない概念を理解する必要があります。Synapse SDK はこれらの複雑さを抽象化し、バックグラウンドで暗号学的な証明の検証を処理しながら、使い慣れたインターフェースを提供します。

ENS、KYVE、Monad、Safe からの早期採用は、開発者体験が使いやすさのしきい値を超えたことを示唆しています。これらは、思想的な理由で Filecoin を試しているブロックチェーンネイティブなストレージプロジェクトではありません。実際のストレージニーズを持つインフラプロジェクトが、中央集権的な代替手段よりも検証可能な分散型ストレージを選択しているのです。

契約上の SLA ではなく、経済的インセンティブによる信頼性。 AWS は、マルチリージョンレプリケーションと契約上のサービスレベル合意（SLA）を通じて、S3 Standard に対して 99.999999999%（11 ナイン）の耐久性を提供します。Filecoin は経済的インセンティブを通じて信頼性を実現します。WindowPoSt チャレンジに失敗したストレージプロバイダーは、担保とストレージパワーを失います。これにより、一方は企業による保証、もう一方は暗号学的証明と経済的罰則に裏打ちされた、異なるリスクプロファイルが形成されます。

暗号学的な検証と高可用性の両方を必要とするアプリケーションにとって、最適なアーキテクチャは、検証可能な記録ストレージとしての Filecoin と、高速な取得のための CDN キャッシングを組み合わせたものになるでしょう。このハイブリッドアプローチは、エッジキャッシングを通じて弱点（取得速度）を緩和しながら、Filecoin の強み（検証可能性、コスト、分散性）を活用します。

マーケットポジショニング：AWS の代替ではなく、異なるニーズへの対応。 Filecoin が汎用的なクラウドコンピューティングにおいて AWS に取って代わることはないでしょう。しかし、その必要もありません。ターゲットとなる市場は、検証可能なストレージ、検閲耐性、または分散化がコスト削減以上の価値を提供するアプリケーションです。プロバナンス要件を伴う AI トレーニングデータセット、永続的な可用性を必要とするブロックチェーンの状態、長期的な整合性の保証を必要とする科学研究データ、暗号学的な監査証跡を必要とするコンプライアンス重視の業界などがこれに該当します。

120 億ドルの AI インフラ市場は、クラウド支出全体の一部に過ぎませんが、Filecoin の価値提案が最も強力に機能する分野です。その市場の 5% を獲得するだけでも、年間 6 億ドルのストレージ需要に相当し、現在の利用レベルから大幅な成長を意味します。

2.1 EiB から検証可能なインフラの未来へ

Filecoin の総コミット済みストレージ容量は、2025 年を通じて実際には減少しました。第 1 四半期の 3.8 エクスビバイト（EiB）から、第 2 四半期には 3.3 EiB、第 3 四半期には 3.0 EiB へと減少しています。これは、Network v27「Golden Week」アップグレード後に効率の低いストレージプロバイダーが撤退したためです。利用率が向上（30% から 36% へ）する一方で容量が減少していることは、市場が成熟していることを示唆しています。つまり、総容量は減少したものの、その中での有料ストレージの割合が高まっているのです。

ネットワークは 2025 年末までに 1 エクスビバイトを超える有料ストレージディールを見込んでおり、これは投機的な容量の提供から実際の顧客需要への移行を意味しています。これは生の容量の数値よりも重要です。利用率は、マイナーが将来の需要を期待してストレージを確保しているだけではなく、実際の価値が提供されていることを示しているからです。

オンチェーンクラウドへの変革は、Filecoin を異なる成長軌道に乗せます。それは、総ストレージ容量を最大化するのではなく、開発者が実際に必要とするサービスを通じてストレージの利用率を最大化することです。ウォームストレージ、検証可能なリトリーバル、および自動決済は、Filecoin をニッチなアーカイブ用途に限定していた障壁を取り除きます。

メインネットでの初期の採用が、重要な試金石となるでしょう。開発チームはテストネットで検証を行ってきましたが、実際のデータと実際の決済を伴う本番環境へのデプロイによって、パフォーマンス、信頼性、および開発者体験が、インフラ選定に必要な基準を満たしているかどうかが明らかになります。分散型アイデンティティストレージのための ENS、ブロックチェーンデータアーカイブのための KYVE、マルチシグネチャウォレットインフラのための Safe など、すでに実験を開始しているプロジェクトは、慎重ながらも楽観的な見方を示しています。

AI インフラ市場の機会は現実のものですが、保証されているわけではありません。Filecoin は、パフォーマンスや開発者エコシステムにおいて大きな先行優位性を持つ中央集権型クラウドプロバイダーや、Arweave（永続ストレージ）や Storj（パフォーマンス重視の S3 代替）のような分散型ストレージの競合他社に直面しています。勝利するためには、本番基準を満たす信頼性の提供、ネットワーク規模に応じた競争力のある価格設定の維持、そして開発者ツールとドキュメントの継続的な改善といった「実行」が必要です。

「ブロックチェーンストレージ」から「プログラマブルなオンチェーンクラウド」への Filecoin の変革は、必要な進化を象徴しています。2026 年における問いは、分散型ストレージに理論的な利点があるかどうかではありません。それは明らかにあるからです。問いは、それらの利点が大規模な開発者の採用と顧客需要につながるかどうかです。暗号学的証明は整っています。経済的インセンティブも一致しています。ここからは困難な道のりが始まります。開発者が本番環境のワークロードを安心して任せられるクラウドプラットフォームを構築することです。

BlockEden.xyz は、検証可能な基盤の上に構築するブロックチェーン開発者向けに、エンタープライズグレードのインフラを提供しています。API マーケットプレイスを探索して、永続するように設計されたアプリケーションに必要なインフラにアクセスしてください。

出典

Gensyn の Judge：ビット単位で正確な再現性が不透明な AI API の時代をどのように終わらせるか

2026年2月11日 · 約 30 分

Dora Noda

Software Engineer

ChatGPT や Claude、あるいは Gemini にクエリを投げるたびに、ユーザーは目に見えないブラックボックスを信頼していることになります。モデルのバージョンは？不明です。正確な重みは？プロプライエタリです。出力が、自分が使用していると思っているモデルによって生成されたのか、それとも密かに更新されたバリアントによるものなのか？検証は不可能です。レシピや雑学を尋ねるカジュアルなユーザーにとって、この不透明さは単に煩わしいだけかもしれません。しかし、金融取引アルゴリズム、医療診断、法的契約の分析など、重大な意思決定を伴う AI 利用においては、これは根本的な信頼の危機となります。

2025 年後半にリリースされ、2026 年に本稼働を開始する Gensyn の Judge は、急進的な代替案を提示します。それは、すべての推論がビット単位まで再現可能な、暗号学的に検証可能な AI 評価です。正しいモデルを提供するために OpenAI や Anthropic を信頼する代わりに、Judge は、特定の合意済みの AI モデルが現実世界の入力に対して決定論的に実行されたことを、誰でも検証できるようにします。暗号学的証明により、結果を偽造することはできません。

技術的な突破口は、AI の再現性を阻む要因となっていた浮動小数点の非決定性を排除する、Gensyn の検証システム Verde です。Verde は、デバイスをまたいでビット単位で正確な計算を強制することで、ロンドンの NVIDIA A100 と東京の AMD MI250 で同じモデルを実行しても同一の結果が得られることを保証し、それをオンチェーンで証明可能にします。これにより、分散型金融（DeFi）、自律型エージェント、および透明性がオプションではなく必須であるあらゆるアプリケーションにおいて、検証可能な AI が利用可能になります。

不透明な API の問題：検証なき信頼

AI 業界は API で動いています。開発者は、REST エンドポイントを介して OpenAI の GPT-4、Anthropic の Claude、または Google の Gemini を統合し、プロンプトを送信してレスポンスを受け取ります。しかし、これらの API は根本的に不透明です。

バージョンの不確実性：gpt-4 を呼び出したとき、正確にはどのバージョンを取得しているのでしょうか？ GPT-4-0314？ GPT-4-0613？それとも密かに更新されたバリアントでしょうか？プロバイダーは、公表せずにパッチを頻繁に適用し、一夜にしてモデルの挙動を変えてしまうことがあります。

監査証跡の欠如：API のレスポンスには、どのモデルがそれを生成したかを示す暗号学的証明が含まれていません。OpenAI が特定の地域や顧客に対して、検閲された、あるいは偏ったバリアントを提供したとしても、ユーザーにはそれを検知する術がありません。

サイレントな劣化：プロバイダーは、コストを削減するためにモデルを「ロボトミー化（性能の意図的な劣化）」し、API の規約は維持したまま推論の質を下げることがあります。ユーザーからは GPT-4 が時間の経過とともに「性能が落ちた」という報告が上がりますが、透明性のあるバージョニングがなければ、そのような主張は客観的な裏付けを欠いたままとなります。

非決定的な出力：温度設定、バッチ処理、またはハードウェアレベルの浮動小数点丸め誤差により、同一の入力で同じモデルに 2 回クエリを実行しても、異なる結果が得られることがあります。これにより監査は不可能になります。出力が再現可能でない場合、どのようにして正しさを検証すればよいのでしょうか？

カジュアルな用途であれば、これらの問題は不便な程度で済みます。しかし、重大な意思決定においては、これらは致命的な障害となります。以下を考えてみてください。

アルゴリズム取引：あるヘッジファンドが、5,000 万ドルの DeFi ポジションを管理する AI エージェントを運用しているとします。このエージェントは、X（旧 Twitter）の投稿から市場センチメントを分析するために GPT-4 に依存しています。取引セッションの途中でモデルが密かに更新され、センチメントスコアが予測不能に変化すると、意図しない清算が引き起こされる可能性があります。ファンドにはモデルが誤動作したという証拠がなく、OpenAI のログは公開監査されていません。

医療診断：ある病院が癌の治療法を推奨するために AI モデルを使用しています。規制により、医師は意思決定プロセスを文書化する必要があります。しかし、AI モデルのバージョンを検証できない場合、監査証跡は不完全になります。医療過誤訴訟は「どの」モデルが推奨を生成したかを証明できるかどうかにかかっているかもしれませんが、不透明な API ではそれは不可能です。

DAO ガバナンス：分散型組織（DAO）が、トレジャリーの提案に投票するために AI エージェントを使用しています。コミュニティメンバーは、エージェントが承認されたモデルを使用したという証拠を求めます。特定の結果に有利なように改ざんされたバリアントではないという証拠です。暗号学的検証がなければ、投票の正当性が欠如してしまいます。

これこそが Gensyn がターゲットとする信頼のギャップです。AI が重要な意思決定に組み込まれるにつれ、モデルの真正性と挙動を検証できないことは、「重大な環境においてエージェンティック（自律的）AI を導入する上での根本的な障壁」となります。

Judge：検証可能な AI 評価プロトコル

Judge は、合意済みの決定論的な AI モデルを現実世界の入力に対して実行し、その結果を誰でも異議申し立てができるブロックチェーンにコミットすることで、不透明性の問題を解決します。プロトコルの仕組みは以下の通りです。

1. モデルのコミットメント：参加者は、AI モデルのアーキテクチャ、重み、および推論設定に合意します。このモデルはハッシュ化され、オンチェーンにコミットされます。このハッシュは暗号学的な指紋として機能し、合意されたモデルから少しでも逸脱すれば、異なるハッシュが生成されます。

2. 決定論的な実行：Judge は Gensyn の再現可能なランタイムを使用してモデルを実行します。これにより、デバイスをまたいでビット単位で正確な再現性が保証されます。これは、浮動小数点の非決定性を排除する、極めて重要なイノベーションです。

3. 公開コミットメント：推論後、Judge は出力（またはそのハッシュ）をオンチェーンに投稿します。これにより、特定の入力に対してモデルが何を生成したかを示す、永続的で監査可能な記録が作成されます。

4. チャレンジ期間：誰でも独立してモデルを再実行することで、結果に異議を唱えることができます。出力が異なる場合、不正証明（Fraud Proof）を提出します。Verde の参照委任メカニズム（refereed delegation mechanism）は、計算グラフの中で結果が分岐した正確な演算箇所を特定します。

5. 不正に対するスラッシング：チャレンジャーが Judge の出力が正しくないことを証明した場合、元の実行者はペナルティを受けます（ステーキングされたトークンのスラッシング）。これにより経済的インセンティブが調整され、実行者はモデルを正しく実行することで利益を最大化するようになります。

Judge は、AI 評価を「API プロバイダーを信頼する」ことから「暗号学的証明を検証する」ことへと変革します。モデルの挙動は公開され、監査可能で、強制力を持つようになり、もはやプロプライエタリなエンドポイントの背後に隠されることはありません。

Verde: 浮動小数点非決定性の排除

検証可能な AI における核心的な技術的課題は「決定性」です。ニューラルネットワークは推論中に数十億もの浮動小数点演算を行います。最新の GPU では、これらの演算は完全に再現可能ではありません。

非結合性: 浮動小数点の加算は結合法則を満たしません。丸め誤差のため、(a + b) + c は a + (b + c) とは異なる結果をもたらす可能性があります。GPU は数千のコアにわたって合計を並列化しますが、部分和が蓄積される順序はハードウェアやドライバのバージョンによって異なります。

カーネルスケジューリングの可変性: GPU カーネル（行列乗算やアテンションなど）は、ワークロード、ドライバの最適化、またはハードウェアアーキテクチャに応じて、異なる順序で実行されることがあります。同じ GPU で同じモデルを 2 回実行したとしても、カーネルスケジューリングが異なれば結果が変わる可能性があります。

バッチサイズへの依存性: 研究により、LLM 推論はシステムレベルで非決定的であることが判明しています。これは、出力がバッチサイズに依存するためです。多くのカーネル（matmul、RMSNorm、アテンション）は、同時に処理されるサンプル数に基づいて数値出力が変化します。バッチサイズ 1 での推論は、同じ入力をバッチサイズ 8 で処理した場合とは異なる値を生成します。

これらの問題により、標準的な AI モデルはブロックチェーンの検証には不向きとなっています。2 人のバリデータが同じ推論を再実行してわずかに異なる出力を得た場合、どちらが正しいのでしょうか？決定性がなければ、コンセンサスを得ることは不可能です。

Verde は、すべてのデバイスで浮動小数点演算の順序を制御し、ハードウェアの非決定性を排除するライブラリである RepOps (Reproducible Operators) によってこれを解決します。仕組みは以下の通りです。

標準的なリダクション順序: RepOps は、行列乗算などの演算において部分的な結果を合計するための決定的な順序を強制します。GPU スケジューラに任せるのではなく、RepOps はすべてのハードウェアにおいて「列 0、次に列 1、次に列 2... を合計する」と明示的に指定します。これにより、(a + b) + c は常に同じ順序で計算されます。

カスタム CUDA カーネル: Gensyn は、生の速度よりも再現性を優先した最適化済みカーネルを開発しました。RepOps の行列乗算のオーバーヘッドは、標準的な cuBLAS と比較して 30% 未満であり、決定性を得るためのトレードオフとしては妥当な範囲内です。

ドライバとバージョンの固定: Verde はバージョンを固定した GPU ドライバと標準的な構成を使用し、異なるハードウェアで実行される同じモデルがビット単位で同一の出力を生成することを保証します。あるデータセンターの NVIDIA A100 で動作するモデルは、別のデータセンターの AMD MI250 からの出力とビット単位で一致します。

これが Judge の検証を可能にする画期的な進歩です。ビット単位で正確な再現性は、バリデータが実行者を信頼することなく、独立して結果を確認できることを意味します。ハッシュが一致すれば、その推論は正しいことが数学的に証明されます。

Refereed Delegation（調停型委任）: 全再計算を伴わない効率的な検証

決定的な実行が可能であっても、AI 推論を素朴に検証するのはコストがかかります。1,000 トークンを生成する 700 億パラメータのモデルには、10 GPU 時間が必要になる場合があります。バリデータが正当性を確認するためにすべての推論を再実行しなければならない場合、検証コストは実行コストと等しくなり、分散化の目的が損なわれます。

Verde の Refereed Delegation（調停型委任）メカニズムは、検証を指数関数的に安価にします。

複数の信頼できない実行者: Judge は 1 人の実行者ではなく、複数の独立したプロバイダーにタスクを割り当てます。各プロバイダーは同じ推論を実行し、結果を提出します。

不一致が調査のトリガーに: すべての実行者が同意すれば、結果は承認され、それ以上の検証は不要です。出力が異なる場合、Verde はチャレンジゲームを開始します。

計算グラフ上での二分探索: Verde は推論全体を再実行しません。代わりに、モデルの計算グラフ上で二分探索を行い、結果が分岐した最初のオペレーターを特定します。これにより、不一致の原因となっている正確なレイヤー（例：「アテンションレイヤー 47、ヘッド 8」）をピンポイントで特定します。

最小限のレフェリー計算: レフェリー（スマートコントラクトや計算能力の限られたバリデータなど）は、フォワードパス全体ではなく、争点となっているオペレーターのみをチェックします。80 レイヤーを持つ 70B パラメータモデルの場合、これにより検証は最悪のケースでも約 7 レイヤー（log₂ 80）のチェックに削減されます。

このアプローチは、すべてのバリデータがすべてを再実行する素朴な複製よりも 1,350% 以上効率的です。Gensyn は暗号学的証明、ゲーム理論、および最適化されたプロセスを組み合わせて、冗長な計算を行うことなく正しい実行を保証します。

その結果、Judge は AI ワークロードを大規模に検証できるようになり、数千の信頼できないノードが計算を提供し、不正な実行者が摘発・処罰される分散型推論ネットワークを可能にします。

ハイステークスな AI 意思決定: なぜ透明性が重要なのか

Judge のターゲット市場はカジュアルなチャットボットではありません。検証可能性が「あれば良いもの」ではなく、規制上または経済上の要件となるアプリケーションです。不透明な API が致命的な失敗を招くシナリオを以下に示します。

分散型金融 (DeFi): 自律的なトレーディングエージェントが数十億の資産を管理しています。エージェントが AI モデルを使用してポートフォリオのリバランス時期を決定する場合、ユーザーはモデルが改ざんされていないという証拠を必要とします。Judge はオンチェーン検証を可能にします。エージェントは特定のモデルハッシュをコミットし、その出力に基づいて取引を実行し、誰でもその意思決定ロジックに異議を唱えることができます。この透明性は、悪意のあるエージェントが証拠もなく「AI が清算しろと言った」と主張するラグプルを防ぎます。

規制コンプライアンス: 信用スコアリング、不正検知、またはマネーロンダリング防止 (AML) のために AI を導入している金融機関は、監査に直面します。規制当局は「なぜモデルはこの取引にフラグを立てたのか？」という説明を求めます。不透明な API は監査証跡を提供しません。Judge はモデルのバージョン、入力、出力の不変の記録を作成し、コンプライアンス要件を満たします。

アルゴリズムガバナンス: 分散型自律組織 (DAO) は、AI エージェントを使用してガバナンスの決定を提案したり投票したりします。コミュニティメンバーは、エージェントがハッキングされたバリアントではなく、承認されたモデルを使用したことを検証する必要があります。Judge を使用すると、DAO はスマートコントラクトにモデルハッシュをエンコードし、すべての決定に正当性の暗号学的証明が含まれるようになります。

医療および法的 AI: ヘルスケアや司法制度には説明責任が必要です。AI の支援を受けて癌を診断する医師は、使用された正確なモデルバージョンを記録する必要があります。AI を使用して契約書を作成する弁護士は、出力が審査済みの偏りのないモデルからのものであることを証明しなければなりません。Judge のオンチェーン監査証跡は、このエビデンスを提供します。

予測市場とオラクル: Polymarket のようなプロジェクトは、AI を使用して賭けの結果（例：「このイベントは起こるか？」）を解決します。解決がニュース記事を分析する AI モデルに依存している場合、参加者はモデルが操作されていないという証拠を必要とします。Judge はオラクルの AI 推論を検証し、紛争を防ぎます。

どの場合においても共通しているのは、透明性のない信頼は不十分であるということです。VeritasChain が指摘しているように、AI システムには、紛争が発生したときに何が起こったかを証明する不変のログである「暗号学的フライトレコーダー」が必要なのです。

ゼロ知識証明の代替案：Verde と ZKML の比較

Judge は、検証可能な AI を実現するための唯一のアプローチではありません。ゼロ知識機械学習（ZKML）は、zk-SNARKs を使用して同様の目標を達成します。これは、入力や重みを明かすことなく、計算が正しく実行されたことを証明する暗号学的証明です。

Verde は ZKML と比較してどうでしょうか？

検証コスト: ZKML は、証明を生成するために元の推論よりも約 1,000 倍多い計算量を必要とします（研究による推定）。推論に 10 GPU 時間を要する 70B パラメータのモデルでは、証明に 10,000 GPU 時間が必要になる可能性があります。Verde の参照委譲（refereed delegation）は対数的です。80 レイヤーではなく約 7 レイヤーをチェックすることは、1,000 倍の増加ではなく 10 倍の削減を意味します。

証明者の複雑性: ZKML は、証明を効率的に生成するために専用のハードウェア（zk-SNARK 回路用のカスタム ASIC など）を必要とします。Verde は汎用 GPU で動作し、ゲーミング PC を持つマイナーなら誰でも参加できます。

プライバシーのトレードオフ: ZKML の強みはプライバシーです。証明は入力やモデルの重みについて何も明かしません。Verde の決定論的実行は透明性があります。入力と出力は公開されます（重みは暗号化可能です）。リスクの高い意思決定において、透明性はしばしば望ましいものです。トレジャリーの配分を決定する DAO の投票では、隠された証明ではなく、公開された監査トレイルが求められます。

証明の範囲: ZKML は実用上、推論に限定されています。現在の計算コストでは、トレーニングを証明することは不可能です。Verde は推論とトレーニングの両方の検証をサポートしています（Gensyn のより広範なプロトコルは分散型トレーニングを検証します）。

実世界での採用: Modulus Labs のような ZKML プロジェクトは、オンチェーンで 18M パラメータのモデルを検証するという画期的な成果を上げていますが、依然として小規模なモデルに限定されています。Verde の決定論的ランタイムは、本番環境で 70B 以上のパラメータを持つモデルを処理します。

ZKML は、虹彩スキャンを公開せずにバイオメトリック認証を検証する（Worldcoin）など、プライバシーが最優先される場合に優れています。Verde は、特定の公開モデルが正しく実行されたことを証明するという、透明性が目標である場合に適しています。これら 2 つのアプローチは競合するものではなく、補完的なものです。

Gensyn エコシステム：Judge から分散型トレーニングへ

Judge は、Gensyn のより広範なビジョンである、機械学習計算のための分散型ネットワークの一構成要素です。このプロトコルには以下が含まれます：

実行レイヤー: 異種ハードウェア（コンシューマー GPU、エンタープライズクラスター、エッジデバイス）間での一貫した ML 実行。Gensyn は推論とトレーニングのワークロードを標準化し、互換性を確保します。

検証レイヤー（Verde）: 参照委譲を用いたトラストレスな検証。不正な実行者は検出され、ペナルティを課されます。

ピアツーピア（P2P）通信: 中央集権的な調整なしでのデバイス間のワークロード分散。マイナーはタスクを受け取り、実行し、証明をブロックチェーンに直接提出します。

分散型コーディネーション: Ethereum ロールアップ上のスマートコントラクトが参加者を特定し、タスクを割り当て、許可なく支払いを処理します。

Gensyn のパブリックテストネットは 2025 年 3 月に開始され、メインネットは 2026 年に予定されています。$AI トークンのパブリックセールは 2025 年 12 月に行われ、マイナーとバリデーターのための経済的インセンティブが確立されました。

Judge は評価レイヤーとしてこのエコシステムに適合します。Gensyn のコアプロトコルがトレーニングと推論を処理する一方で、Judge はそれらの出力が検証可能であることを保証します。これにより、次のようなフライホイールが生まれます：

デベロッパーがモデルをトレーニングする: Gensyn の分散型ネットワーク上で実行されます（活用されていないコンシューマー GPU が計算を提供するため、AWS よりも安価です）。

モデルがデプロイされる: Judge が評価の完全性を保証します。アプリケーションは Gensyn の API を通じて推論を消費しますが、OpenAI とは異なり、すべての出力に暗号学的証明が含まれます。

バリデーターが報酬を得る: 証明をチェックし不正を摘発することで手数料を獲得し、経済的インセンティブをネットワークのセキュリティと一致させます。

信頼が拡大する: より多くのアプリケーションが検証可能な AI を採用するにつれて、中央集権的なプロバイダーへの依存が減少します。

最終的な目標：Big Tech だけでなく、誰もが利用できる、証明可能で正しく、分散化された AI トレーニングと推論を実現することです。

課題と今後の展望

Judge のアプローチは画期的ですが、いくつかの課題が残っています。

パフォーマンスのオーバーヘッド: RepOps による 30% の速度低下は検証には許容範囲内ですが、すべての推論を決定論的に実行する必要がある場合、レイテンシに敏感なアプリケーション（リアルタイム取引、自動運転車）は、より高速で検証不可能な代替案を好む可能性があります。Gensyn のロードマップには RepOps のさらなる最適化が含まれていると思われますが、速度と決定論の間には根本的なトレードオフが存在します。

ドライバーバージョンの断片化: Verde はバージョンが固定されたドライバーを想定していますが、GPU メーカーは常にアップデートをリリースしています。一部のマイナーが CUDA 12.4 を使い、他のマイナーが 12.5 を使うと、ビット単位の再現性が崩れます。Gensyn は厳格なバージョン管理を強制しなければならず、これはマイナーのオンボーディングを複雑にします。

モデル重みの機密性: Judge の透明性は公開モデルにとっては機能ですが、独自のモデルにとっては欠点となります。ヘッジファンドが価値のある取引モデルをトレーニングし、それを Judge にデプロイすると、オンチェーンのコミットメントを通じて競合に重みが公開されるリスクがあります。秘密のモデルには ZKML ベースの代替案が好まれる可能性があり、これは Judge がオープンまたはセミオープンな AI アプリケーションをターゲットにしていることを示唆しています。

紛争解決のレイテンシ: チャレンジャーが不正を主張した場合、バイナリサーチによる紛争解決には複数のオンチェーン取引が必要になります（各ラウンドで探索範囲が絞り込まれます）。高頻度アプリケーションは、ファイナリティ（確定）まで数時間待つことはできません。Gensyn はレイテンシを短縮するために、オプティミスティック検証（期間内に異議申し立てがない限り正しいと仮定する）を導入する可能性があります。

参照委譲におけるシビル耐性: 複数の実行者が合意しなければならない場合、単一のエンティティがシビル・アイデンティティ（偽造された複数の身元）を通じてすべての実行者を制御することをどう防ぐのでしょうか？Gensyn はおそらく、ステーク加重による選択（評判の高いバリデーターが優先的に選ばれる）とスラッシングを組み合わせて共謀を抑止すると思われますが、経済的な閾値は慎重に調整される必要があります。

これらは致命的な欠陥ではなく、エンジニアリング上の課題です。「決定論的 AI + 暗号学的検証」という核となるイノベーションは堅実です。テストネットからメインネットへと移行するにつれて、実行の詳細は成熟していくでしょう。

検証可能な AI への道：採用経路とマーケットフィット

Judge の成功は採用にかかっています。どのアプリケーションが最初に検証可能な AI を導入するのでしょうか？

自律型エージェントを備えた DeFi プロトコル: Aave、Compound、Uniswap などの DAO は、財務管理のために Judge で検証されたエージェントを統合できます。コミュニティがモデルのハッシュを承認するために投票し、すべてのエージェントの決定には証明が含まれます。この透明性は、DeFi の正当性にとって極めて重要な信頼を構築します。

予測市場とオラクル: Polymarket や Chainlink のようなプラットフォームは、賭けの解決や価格フィードの配信に Judge を使用できます。感情、ニュース、またはオンチェーンのアクティビティを分析する AI モデルは、検証可能な出力を生成し、オラクル操作をめぐる紛争を排除します。

分散型アイデンティティと KYC: AI ベースの本人確認（自撮り写真からの年齢推定、書類の真正性チェック）を必要とするプロジェクトは、Judge の監査証跡から利益を得ます。規制当局は、中央集権的なアイデンティティプロバイダーを信頼することなく、コンプライアンスの暗号学的証明を受け入れることができます。

ソーシャルメディアのコンテンツモデレーション: 分散型ソーシャルネットワーク（Farcaster、Lens Protocol）は、Judge で検証された AI モデレーターを導入できます。コミュニティメンバーは、モデレーションモデルに偏りや検閲がないことを検証でき、プラットフォームの中立性を確保できます。

AI-as-a-Service プラットフォーム: AI アプリケーションを構築する開発者は、「検証可能な推論」をプレミアム機能として提供できます。ユーザーは証明のために追加料金を支払い、不透明な代替サービスと差別化を図ることができます。

共通点：信頼のコストが高い（規制、分散化、または利害関係が大きいため）一方で、検証コストが許容される（確実性の価値と比較して）アプリケーションです。

Judge は、消費者向けのチャットボットにおいて OpenAI に取って代わるものではありません。レシピのアイデアを求めているユーザーは、GPT-4 が検証可能かどうかを気にしません。しかし、金融アルゴリズム、医療ツール、ガバナンスシステムにとって、検証可能な AI は未来そのものです。

新たな標準としての検証可能性

Gensyn の Judge はパラダイムシフトを象徴しています。AI の評価は「プロバイダーを信頼する」ことから「証明を検証する」ことへと移行しています。Verde によるビット単位で正確な再現性、参照委託を通じた効率的な検証、そしてオンチェーンの監査証跡という技術的基盤が、この移行を単なる理想ではなく現実的なものにしています。

その影響は Gensyn をはるかに超えて広がります。検証可能な AI が標準になれば、中央集権的なプロバイダーはその参入障壁（モート）を失います。OpenAI の価値提案は GPT-4 の能力だけではなく、インフラを管理しなくて済むという「利便性」にあります。しかし、もし Gensyn が分散型 AI が中央集権型と同等のパフォーマンスに「検証可能性」を加えて提供できることを証明すれば、開発者が独自の API に縛られる理由はなくなります。

競争はすでに始まっています。ZKML プロジェクト（Modulus Labs、Worldcoin のバイオメトリックシステム）はゼロ知識証明に賭けています。確実なランタイム（Gensyn の Verde、EigenAI）は再現性に賭けています。オプティミスティックなアプローチ（ブロックチェーン AI オラクル）は不正証明に賭けています。それぞれの道にはトレードオフがありますが、目的地は同じです。それは、出力が単に「もっともらしい」だけでなく「証明可能」である AI システムです。

利害関係の大きい意思決定において、これはオプションではありません。金融、ヘルスケア、または法的なアプリケーションにおいて、規制当局は AI プロバイダーからの「信じてください」という言葉を受け入れないでしょう。DAO は財務管理をブラックボックスのエージェントに委ねることはありません。そして、自律型 AI システムがより強力になるにつれ、一般市民は透明性を求めるようになるでしょう。

Judge は、この約束を果たす最初のプロダクション対応システムです。テストネットは稼働しています。暗号学的な基盤は強固です。AI エージェント関連の暗号資産 270 億ドル、アルゴリズムによって管理される数十億ドルの DeFi 資産、そして高まる規制圧力という市場の準備は整っています。

不透明な AI API の時代は終わりつつあります。検証可能な知性の時代が始まろうとしています。そして、Gensyn の Judge がその道を照らしています。

情報源:

Nillion の Blacklight が稼働開始：ERC-8004 が自律型 AI エージェントの信頼レイヤーを構築する方法

2026年2月11日 · 約 19 分

Dora Noda

Software Engineer

2026 年 2 月 2 日、AI エージェント経済は重要な一歩を踏み出しました。Nillion は、ブロックチェーンにおける最も差し迫った課題の 1 つである「一度も会ったことのない AI エージェントをどうやって信頼するか？」という問題を解決するために、ERC-8004 標準を実装した検証レイヤーである Blacklight を立ち上げました。

その答えは、単純なレピュテーションスコアや中央集権的なレジストリではありません。それは、暗号学的証明、プログラム可能な監査、そしてコミュニティが運営するノードネットワークに支えられた 5 段階の検証プロセスです。自律型エージェントが取引の実行、トレジャリーの管理、クロスチェーン活動の調整を行う機会が増える中、Blacklight は大規模なトラストレスな AI 調整を可能にするインフラを象徴しています。

AI エージェントが単独では解決できない信頼の問題

数字が物語っています。現在、AI エージェントは Polymarket の取引量の 30％に貢献しており、複数のプロトコルにわたる DeFi の収益戦略を担当し、複雑なワークフローを自律的に実行しています。しかし、根本的なボトルネックが存在します。「既存の関係がないエージェント同士が、どのようにお互いの信頼性を検証するのか？」という点です。

従来のシステムは、証明書を発行する中央集権的な権限に依存しています。Web3 の約束は異なります。つまり、暗号学とコンセンサスを通じたトラストレスな検証です。しかし、ERC-8004 が登場するまで、エージェントが自らの真正性を証明したり、行動を追跡したり、意思決定ロジックをオンチェーンで検証したりするための標準化された方法はありませんでした。

これは単なる理論上の問題ではありません。Davide Crapis 氏が説明するように、「ERC-8004 は、分散型 AI エージェントの相互作用を可能にし、トラストレスなコマースを確立し、Ethereum 上のレピュテーションシステムを強化します。」これがなければ、エージェント間のコマースは「クローズドな庭（Walled Garden）」の中に限定されるか、手動の監視が必要になり、自律性の目的が失われてしまいます。

ERC-8004：3 つのレジストリによる信頼インフラ

2026 年 1 月 29 日に Ethereum メインネットで稼働を開始した ERC-8004 標準は、3 つのオンチェーンレジストリを通じてモジュール式の信頼レイヤーを構築します。

Identity Registry（アイデンティティ・レジストリ）: ERC-721 を使用して、ポータブルなエージェント識別子を提供します。各エージェントは、固有のオンチェーン・アイデンティティを表す非代替性トークン（NFT）を受け取り、プラットフォームを跨いだ認識を可能にし、アイデンティティのなりすましを防止します。

Reputation Registry（レピュテーション・レジストリ）: 標準化されたフィードバックと評価を収集します。中央集権的なレビューシステムとは異なり、フィードバックは暗号署名と共にオンチェーンに記録され、不変の監査証跡を作成します。誰でもこの履歴を取得し、独自のレピュテーション・アルゴリズムを構築できます。

Validation Registry（バリデーション・レジストリ）: エージェントの作業の暗号学的および経済的検証をサポートします。ここではプログラム可能な監査が行われます。バリデーターは計算を再実行したり、ゼロ知識証明を検証したり、信頼実行環境（TEE）を活用してエージェントが正しく行動したことを確認したりできます。

ERC-8004 の素晴らしさは、その非固執的（Unopinionated）な設計にあります。技術仕様に記載されているように、この標準は様々な検証手法をサポートしています。「ステークによって保護されたタスクの再実行（EigenLayer のようなシステムに着想を得たもの）、ゼロ知識機械学習（zkML）証明の検証、および信頼実行環境からのアテステーション（証明）。」

この柔軟性が重要です。DeFi アービトラージ・エージェントは、アルファ（独自の情報）を明かすことなく zkML 証明を使用して取引ロジックを検証できます。サプライチェーン・エージェントは、TEE アテステーションを使用して、現実世界のデータに正しくアクセスしたことを証明できます。クロスチェーン・ブリッジ・エージェントは、誠実な実行を保証するために、スラッシング（ペナルティ）を伴う暗号経済的検証に依存することができます。

Blacklight の 5 段階の検証プロセス

Nillion による Blacklight への ERC-8004 の実装は、重要なレイヤーである「コミュニティ運営の検証ノード」を追加します。プロセスの仕組みは以下の通りです。

1. エージェント登録: エージェントは Identity Registry にアイデンティティを登録し、ERC-721 NFT を受け取ります。これにより、エージェントの公開鍵に関連付けられた固有のオンチェーン識別子が作成されます。

2. 検証リクエストの開始: 取引の実行、資金の移動、状態の更新など、検証が必要なアクションをエージェントが実行するとき、Blacklight に検証リクエストを送信します。

3. 委員会の割り当て: Blacklight プロトコルは、リクエストを監査するために検証ノードの委員会をランダムに割り当てます。これらのノードは、ネットワークの完全性のためにインセンティブが調整された、70,000 NIL トークンをステークしているコミュニティメンバーによって運営されます。

4. ノードによるチェック: 委員会のメンバーは、計算を再実行するか、暗号学的証明を検証します。バリデーターが不正な行動を検出した場合、（暗号経済的検証を使用しているシステムでは）エージェントのステークをスラッシングしたり、Reputation Registry でそのアイデンティティにフラグを立てたりすることができます。

5. オンチェーン・レポート: 結果はオンチェーンに投稿されます。Validation Registry はエージェントの作業が検証されたかどうかを記録し、実行の永続的な証明を作成します。それに応じて Reputation Registry が更新されます。

このプロセスは非同期かつノンブロッキング（非停止）で行われるため、エージェントはルーチンタスクを完了するために検証を待つ必要はありません。ただし、リスクの高いアクション（多額の送金、クロスチェーン操作）には、事前の検証が必要になる場合があります。

プログラマブルな監査：バイナリな信頼を超えて

Blacklight の最も野心的な機能は「プログラマブルな検証」です。これは、エージェントが「何をしたか」だけでなく、意思決定を「どのように」行ったかを監査する能力です。

トレジャリーを管理する DeFi エージェントを考えてみましょう。従来の監査では、資金が正しく移動したことを検証します。プログラマブルな監査では、以下を検証します：

意思決定ロジックの一貫性：エージェントは表明された投資戦略に従ったか、それとも逸脱したか？
マルチステップ・ワークフローの実行：エージェントが 3 つのチェーンにわたってポートフォリオをリバランスすることになっていた場合、すべてのステップを完了したか？
セキュリティ制約：エージェントはガスリミット、スリッページ許容度、およびエクスポージャーの上限を遵守したか？

これが可能なのは、ERC-8004 の Validation Registry が任意の証明システムをサポートしているためです。エージェントは、意思決定アルゴリズム（例：ニューラルネットワークの重みのハッシュや、そのロジックを表す zk-SNARK 回路）をオンチェーンでコミットし、独自の詳細を明かすことなく、各アクションがそのアルゴリズムに準拠していることを証明できます。

Nillion のロードマップは、これらのユースケースを明確にターゲットにしています：「Nillion は Blacklight の機能を『プログラマブルな検証』へと拡張し、エージェントの意思決定ロジックの一貫性、マルチステップ・ワークフローの実行、セキュリティ制約などの複雑な動作の分散型監査を可能にする計画です。」

これにより、検証はリアクティブ（事後にエラーを検出する）なものから、プロアクティブ（設計によって正しい動作を強制する）なものへと移行します。

ブラインド・コンピュテーション：プライバシーと検証の両立

Nillion の基盤技術である Nil Message Compute (NMC) は、エージェント検証にプライバシーの次元を加えます。すべてのデータが公開される従来のブロックチェーンとは異なり、Nillion の「ブラインド・コンピュテーション」は、復号することなく暗号化されたデータ上での操作を可能にします。

これがエージェントにとって重要な理由は次のとおりです。AI エージェントは、競合他社にアルファ（超過収益の源泉）を明かすことなく、自身の取引戦略を検証する必要があるかもしれません。あるいは、患者のデータを公開することなく、機密性の高い医療記録に正しくアクセスしたことを証明する必要があるかもしれません。または、独自のビジネスロジックを開示することなく、規制上の制約への準拠を実証する必要があるかもしれません。

Nillion の NMC は、マルチパーティ計算 (MPC) を通じてこれを実現します。MPC では、ノードが協力して、データの暗号化に使用される相関乱数である「ブラインディング・ファクター（目隠し要素）」を生成します。DAIC Capital が説明するように、「ノードはデータの処理に必要な主要なネットワークリソース、つまりブラインディング・ファクターと呼ばれる一種の相関乱数を生成し、各ノードがそのシェアを安全に保存することで、量子耐性のある方法でネットワーク全体に信頼を分散させます。」

このアーキテクチャは、設計段階から量子耐性を備えています。たとえ量子コンピュータが今日の楕円曲線暗号を解読したとしても、分散されたブラインディング・ファクターは安全なままです。なぜなら、単一のノードがデータを復号するのに十分な情報を保持していないためです。

AI エージェントにとって、これは機密性を犠牲にすることなく検証が可能であることを意味します。エージェントは、手法、データソース、および意思決定ロジックを非公開に保ちながら、タスクを正しく実行したことを証明できます。

43 億ドルのエージェント・エコノミー・インフラ戦略

Blacklight の立ち上げは、ブロックチェーン × AI セクターが急成長期に入るタイミングで行われました。市場は 2025 年の 6 億 8,000 万ドルから 2034 年には 43 億ドルへ、年平均成長率 (CAGR) 22.9% で成長すると予測されており、より広範なコンフィデンシャル・コンピューティング市場は 2032 年までに 3,500 億ドルに達すると見られています。

しかし、Nillion は単に市場の拡大に賭けているだけではありません。自らを重要なインフラとして位置づけています。エージェント・エコノミーのボトルネックは計算能力やストレージではなく、「大規模な信頼（trust at scale）」です。KuCoin の 2026 年の見通しが指摘するように、3 つの主要なトレンドが AI のアイデンティティと価値の流れを再形成しています。

Agent-Wrapping-Agent システム：エージェントが他のエージェントと連携して、複雑なマルチステップのタスクを実行するシステム。これには標準化されたアイデンティティと検証が必要であり、それこそが ERC-8004 が提供するものです。

KYA (Know Your Agent)：エージェントの認証情報を要求する金融インフラ。規制当局は、正しい動作の証明なしに、自律型エージェントが資金を管理することを承認しないでしょう。Blacklight のプログラマブルな監査は、この問題に直接対処します。

ナノ・ペイメント：エージェントはマイクロペイメントを効率的に決済する必要があります。2026 年 1 月に 2,000 万件以上のトランザクションを処理した x402 決済プロトコルは、決済を担当することで ERC-8004 を補完し、Blacklight が信頼を担保します。

Together, these standards reached production readiness within weeks of each other—a coordination breakthrough signaling infrastructure maturation. これらの一連の標準は、互いに数週間の差で本番環境への導入準備が整いました。これは、インフラの成熟を示す調整のブレイクスルーです。

Ethereum のエージェント・ファーストな未来

ERC-8004 の採用は Nillion をはるかに超えて広がっています。2026 年初頭の時点で、複数のプロジェクトがこの標準を統合しています。

Oasis Network：TEE ベースの検証を用いたコンフィデンシャル・コンピューティング向けの ERC-8004 を実装。
The Graph：分散型インデックス作成における検証可能なエージェントの相互作用を可能にするため、ERC-8004 と x402 をサポート。
MetaMask：ERC-8004 アイデンティティを内蔵したエージェント・ウォレットを検討中。
Coinbase：機関投資家向けエージェント・カストディ・ソリューションに ERC-8004 を統合。

この急速な採用は、Ethereum のロードマップにおける広範な変化を反映しています。ヴィタリック・ブテリン氏は、ブロックチェーンの役割は AI エージェントのための「単なる配管」になりつつあると繰り返し強調しています。つまり、消費者向けのレイヤーではなく、自律的な調整を可能にする信頼インフラとしての役割です。

Nillion の Blacklight は、検証をプログラマブルでプライバシーを保護し、分散化されたものにすることで、このビジョンを加速させます。中央集権的なオラクルや人間の査読者に頼る代わりに、エージェントは暗号技術を用いて自らの正確性を証明できるのです。

次に来るもの：メインネットの統合とエコシステムの拡大

Nillion の 2026 年のロードマップでは、Ethereum との互換性と持続可能な分散化を優先しています。2026 年 2 月に Ethereum ブリッジが稼働し、続いてステーキングとプライベート計算のためのネイティブ・スマートコントラクトが導入されました。

70,000 NIL トークンをステーキングしているコミュニティメンバーは、Blacklight 検証ノードを運営し、ネットワークの完全性を維持しながら報酬を得ることができます。この設計は Ethereum のバリデーター経済を反映していますが、検証に特化した役割が追加されています。

次のマイルストーンは以下の通りです：

zkML サポートの拡大：Modulus Labs などのプロジェクトと統合し、オンチェーンでの AI 推論を検証します。
クロスチェーン検証：Blacklight が Ethereum、Cosmos、Solana で動作するエージェントを検証できるようにします。
企業パートナーシップ：エンタープライズ・エージェントのデプロイメントに向けた Coinbase や Alibaba Cloud との提携。
規制コンプライアンスツール：金融サービス採用のための KYA フレームワークの構築。

おそらく最も重要なのは、Nillion が nilGPT を開発していることです。これは、ブラインド計算（Blind Computation）がいかに機密性の高いエージェントとのやり取りを可能にするかを実証する、完全プライベートな AI チャットボットです。これは単なるデモではなく、ヘルスケア、金融、政府機関における機密データを扱うエージェントの青写真となります。

トラストレスなコーディネーションの終着点

Blacklight のローンチは、エージェント経済の転換点となります。ERC-8004 以前、エージェントはサイロ化された状態で活動していました。独自のエコシステム内では信頼されていても、人間の仲介なしにはプラットフォームを越えた連携ができませんでした。ERC-8004 以降、エージェントはお互いの身元を検証し、行動を監査し、自律的に支払いを決済できるようになります。

これにより、全く新しいカテゴリーのアプリケーションが解放されます：

分散型ヘッジファンド：検証可能な投資戦略と透明性のあるパフォーマンス監査を備え、チェーンを跨いでポートフォリオを管理するエージェント。
自律型サプライチェーン：中央集権的な監視なしに、物流、支払い、コンプライアンスを調整するエージェント。
AI 搭載 DAO：暗号学的に検証された意思決定ロジックに基づいて投票、提案、実行を行うエージェントによって管理される組織。
クロスプロトコル流動性管理：プログラム可能なリスク制約の下で、DeFi プロトコル間で資産をリバランスするエージェント。

共通点は何でしょうか？それはすべて、既存の関係や中央集権的な信頼の拠り所なしに、エージェントが協力し合う能力、つまり「トラストレスなコーディネーション」を必要としている点です。

Nillion の Blacklight は、まさにそれを提供します。ERC-8004 のアイデンティティとレピュテーション（評判）インフラを、プログラム可能な検証およびブラインド計算と組み合わせることで、目前に迫った「1 兆エージェント経済」に対応できる拡張性の高い信頼レイヤーを構築します。

ブロックチェーンが AI エージェントやグローバル金融の配管（インフラ）となる中で、問題は検証インフラが必要かどうかではなく、誰がそれを構築し、それが分散型であるか、あるいは少数のゲートキーパーによって管理されるかということです。Blacklight のコミュニティ運営ノードとオープンスタンダードは、前者の正当性を証明しています。

自律的なオンチェーン・アクターの時代が到来しました。インフラは稼働しています。残された唯一の問いは、その上に何が構築されるかです。

出典：

zkMLと暗号学的証明による検証可能なオンチェーンAI

2025年4月22日 · 約 53 分

Dora Noda

Software Engineer

イントロダクション：ブロックチェーン上で検証可能なAIの必要性

AIシステムの影響力が増すにつれて、その出力が信頼できるものであることを保証することが重要になります。従来のメソッドは制度的な保証（本質的には 「ただ信頼してください」）に依存しており、暗号学的な保証は提供されません。これは、スマートコントラクトやユーザーが、重いモデルをオンチェーンで再実行することなくAI由来の結果を信頼しなければならないブロックチェーンのような分散型コンテキストでは特に問題となります。ゼロ知識機械学習 (zkML) は、ML計算の 暗号学的な検証 を可能にすることでこの問題に対処します。本質的に、zkMLはプルーバーが 「出力 $Y$ は、入力 $X$ に対してモデル $M$ を実行した結果である」 という簡潔な証明を、$X$ や $M$ の内部詳細を 明かすことなく 生成することを可能にします。これらのゼロ知識証明 (ZKP) は、誰でも（あるいはどのコントラクトでも）効率的に検証でき、AIへの信頼を 「ポリシーから証明へ」 と移行させます。

AIのオンチェーン検証可能性とは、ブロックチェーンが計算自体を実行する代わりに、正しい実行の証明を検証することによって、高度な計算（ニューラルネットワークの推論など）を組み込むことができることを意味します。これには広範な影響があります。スマートコントラクトはAIの予測に基づいて意思決定を行うことができ、分散型自律エージェントはアルゴリズムに従ったことを証明でき、クロスチェーンまたはオフチェーンの計算サービスは検証不可能なオラクルではなく 検証可能な出力 を提供できます。最終的に、zkMLは トラストレスでプライバシーを保護するAI への道を提供します。例えば、AIモデルの決定が正しく、承認されていることを、プライベートデータや独自のモデルの重みを公開することなく証明できます。これは、安全な医療分析からブロックチェーンゲーム、DeFiオラクルまで、幅広いアプリケーションにとって鍵となります。

zkMLの仕組み：ML推論を簡潔な証明に圧縮する

大まかに言うと、zkMLは暗号学的証明システムとML推論を組み合わせることで、複雑なモデル評価を小さな証明に「圧縮」できるようにします。内部的には、MLモデル（例：ニューラルネットワーク）は、多くの算術演算（行列乗算、活性化関数など）からなるサーキットまたはプログラムとして表現されます。すべての中間値を公開する代わりに、プルーバーはオフチェーンで完全な計算を実行し、その後 ゼロ知識証明プロトコル を使用して、すべてのステップが正しく行われたことを証明します。ベリファイアは、証明といくつかの公開データ（最終出力やモデルの識別子など）のみを与えられ、モデルを再実行することなく、その正当性を 暗号学的に確信 することができます。

これを達成するために、zkMLフレームワークは通常、モデルの計算をZKPに適した形式に変換します：

サーキットコンパイル： SNARKベースのアプローチでは、モデルの計算グラフは 算術サーキット または多項式制約の集合にコンパイルされます。ニューラルネットワークの各層（畳み込み、行列乗算、非線形活性化）は、入力に対して出力が正しいことを保証する制約を持つサブサーキットになります。ニューラルネットワークには、多項式に自然に適さない非線形演算（ReLU、Sigmoidなど）が含まれるため、これらを効率的に処理するために ルックアップテーブル のような技術が使用されます。例えば、ReLU（出力 = max(0, 入力)）は、input≥0の場合は出力が入力と等しく、それ以外はゼロであることを検証するカスタム制約またはルックアップによって強制できます。最終結果は、プルーバーが満たさなければならない暗号学的制約の集合であり、これによりモデルが正しく実行されたことが暗黙的に証明されます。
実行トレースと仮想マシン： 別の方法は、zkVM アプローチで行われるように、モデルの推論をプログラムトレースとして扱うことです。例えば、JOLT zkVMはRISC-V命令セットを対象としています。MLモデル（またはそれを計算するコード）をRISC-Vにコンパイルし、各CPU命令が適切に実行されたことを証明できます。JOLTは 「ルックアップ特異点」 技術を導入し、高価な算術制約を、各有効なCPU操作のための高速なテーブルルックアップに置き換えます。すべての操作（加算、乗算、ビット単位演算など）は、事前計算された有効な結果の巨大なテーブルでのルックアップを介してチェックされ、これを効率的に保つために特殊な引数（Lasso/SHOUT）が使用されます。これにより、プルーバーの作業負荷が劇的に削減されます。複雑な64ビット操作でさえ、多くの算術制約の代わりに、証明内で単一のテーブルルックアップになります。
対話型プロトコル (GKRサムチェック)： 3番目のアプローチは、GKR（Goldwasser–Kalai–Rotblum）のような対話型証明を使用して、層状の計算を検証します。ここでは、モデルの計算は層状の算術サーキットとして見なされます（各ニューラルネットワーク層はサーキットグラフの1つの層です）。プルーバーは通常通りモデルを実行しますが、その後、各層の出力がその入力に対して正しいことを証明するために サムチェックプロトコル に参加します。Lagrangeのアプローチ（DeepProve、次に詳述）では、プルーバーとベリファイアは、各層の計算を再実行することなく、その一貫性をチェックする対話型多項式プロトコル（Fiat-Shamirヒューリスティックにより非対話型にされる）を実行します。このサムチェックメソッドは、一枚岩の静的サーキットを生成するのを避け、代わりに最小限の暗号操作（主にハッシュ化または多項式評価）で段階的に 計算の一貫性 を検証します。

どのアプローチであっても、結果は推論全体の正当性を証明する 簡潔な証明（通常は数キロバイトから数十キロバイト）です。この証明は ゼロ知識 であり、秘密の入力（プライベートデータやモデルパラメータ）を隠しておくことができることを意味します。それらは証明に影響を与えますが、ベリファイアには公開されません。意図された公開出力または表明のみが公開されます。これにより、「モデル $M$ を患者データ $X$ に適用すると診断 $Y$ が得られることを、$X$ やモデルの重みを公開せずに証明する」 といったシナリオが可能になります。

オンチェーン検証の実現： 証明が生成されると、ブロックチェーンに投稿できます。スマートコントラクトには、プリコンパイルされた暗号プリミティブを使用して、証明をチェックするための検証ロジックを含めることができます。例えば、Ethereumには多くのzk-SNARKベリファイアで使用されるBLS12-381ペアリング操作のためのプリコンパイルがあり、SNARK証明のオンチェーン検証を効率的にします。STARK（ハッシュベースの証明）はサイズが大きくなりますが、慎重な最適化や、場合によってはいくつかの信頼の仮定（例えば、StarkWareのL2は、SNARKよりも高いガス代がかかるものの、オンチェーンのベリファイアコントラクトによってEthereum上でSTARK証明を検証します）によって、オンチェーンで検証することが可能です。重要なのは、チェーンがMLモデルを実行する必要がなく、元の計算よりも はるかに安価な 検証のみを実行する点です。要約すると、zkMLは 高価なAI推論を、ブロックチェーン（または任意のベリファイア）がミリ秒から数秒でチェックできる小さな証明に圧縮します。

Lagrange DeepProve：zkMLのブレークスルーのアーキテクチャとパフォーマンス

Lagrange Labsによる DeepProve は、速度とスケーラビリティに焦点を当てた最先端のzkML推論フレームワークです。2025年に発表されたDeepProveは、Ezklのような以前のソリューションよりも劇的に高速な新しい証明システムを導入しました。その設計は、サムチェック付きGKR対話型証明プロトコル とニューラルネットワークサーキット向けの特殊な最適化を中心にしています。以下にDeepProveの仕組みとそのパフォーマンス達成方法を説明します：

ワンタイム前処理： 開発者は、訓練済みのニューラルネットワーク（現在サポートされているタイプには、多層パーセプトロンや一般的なCNNアーキテクチャが含まれます）から始めます。モデルは標準的なグラフ表現であるONNX形式にエクスポートされます。次に、DeepProveのツールがONNXモデルを解析し、効率的な体演算のために 量子化（重みを固定小数点/整数形式に変換）します。この段階で、暗号プロトコルのための証明鍵と検証鍵も生成します。このセットアップはモデルごとに1回行われ、推論ごとに繰り返す必要はありません。DeepProveは統合の容易さを強調しています：「モデルをONNXにエクスポート → ワンタイムセットアップ → 証明を生成 → どこでも検証」。
証明 (推論 + 証明生成)： セットアップ後、プルーバー（ユーザー、サービス、またはLagrangeの分散型プルーバーネットワークによって実行可能）は新しい入力 $X$ を受け取り、それに対してモデル $M$ を実行して出力 $Y$ を得ます。この実行中、DeepProveは各層の計算の 実行トレース を記録します。SNARKアプローチのようにすべての乗算を事前に静的サーキットに変換するのではなく、DeepProveは 線形時間のGKRプロトコル を使用して各層をその場で検証します。各ネットワーク層について、プルーバーは層の入力と出力にコミットし（例えば、暗号学的ハッシュや多項式コミットメントを介して）、その後、出力が層の関数に従って入力から実際に得られたものであることを証明するためにサムチェック引数に参加します。サムチェックプロトコルは、実際の値を明らかにすることなく、層の計算をエンコードする多項式の評価の合計の正しさをベリファイアに繰り返し納得させます。非線形操作（ReLU、softmaxなど）は、DeepProveでは ルックアップ引数 を通じて効率的に処理されます。活性化関数の出力が計算された場合、DeepProveは各出力がその関数のために事前計算されたテーブルからの有効な入力-出力ペアに対応することを証明できます。層ごとに証明が生成され、その後、モデル全体のフォワードパスをカバーする 1つの簡潔な証明に集約 されます。暗号技術の重い処理は最小限に抑えられます。DeepProveのプルーバーは、巨大な制約システムを解くのではなく、主に通常の数値計算（実際の推論）といくつかの軽い暗号コミットメントを実行します。
検証： ベリファイアは、最終的な簡潔な証明といくつかの公開値（通常はモデルのコミットされた識別子（$M$ の重みへの暗号コミットメント）、入力 $X$（プライベートでない場合）、および主張された出力 $Y$）を使用して正しさをチェックします。DeepProveのシステムでの検証には、サムチェックプロトコルのトランスクリプトと最終的な多項式またはハッシュコミットメントの検証が含まれます。これは古典的なSNARKの検証（数回のペアリングかもしれない）よりも複雑ですが、モデルを再実行するよりもはるかに安価 です。Lagrangeのベンチマークでは、中規模のCNNに対するDeepProve証明の検証には、ソフトウェアで 0.5秒 程度かかります。これは、例えば、数十万のパラメータを持つ畳み込みネットワークが正しく実行されたことを確認するのに約0.5秒かかることを意味し、検証のためにGPUでそのCNNをナイーブに再計算するよりも 500倍以上高速 です。（実際、DeepProveはCNNで最大 521倍、MLPで 671倍 の検証高速化を再実行と比較して測定しました。）証明サイズはオンチェーンで送信するのに十分小さく（数十KB）、検証は必要であればスマートコントラクトで実行できますが、0.5秒の計算には慎重なガス最適化またはレイヤー2での実行が必要になるかもしれません。

アーキテクチャとツール： DeepProveはRustで実装されており、開発者向けにツールキット（zkml ライブラリ）を提供しています。ONNXモデルグラフをネイティブにサポートしているため、PyTorchやTensorFlowからのモデル（エクスポート後）と互換性があります。証明プロセスは現在、数百万パラメータまでのモデルを対象としています（テストには400万パラメータの密結合ネットワークが含まれます）。DeepProveは、多線形多項式コミットメント（層の出力にコミットするため）、計算を検証するためのサムチェックプロトコル、非線形操作のためのルックアップ引数など、暗号コンポーネントの組み合わせを活用しています。特筆すべきは、Lagrangeのオープンソースリポジトリが、以前の研究（ScrollのCenoプロジェクトからのサムチェックとGKRの実装）に基づいていることを認めており、zkMLとゼロ知識ロールアップ研究の交差点を示していることです。

リアルタイムのスケーラビリティを達成するために、LagrangeはDeepProveをその プルーバーネットワーク（特殊なZKプルーバーの分散型ネットワーク）と組み合わせています。重い証明生成はこのネットワークにオフロードできます。アプリケーションが推論の証明を必要とするとき、ジョブをLagrangeのネットワークに送信し、そこで多くのオペレーター（セキュリティのためにEigenLayerにステークされている）が証明を計算して結果を返します。このネットワークは、信頼性の高い証明生成を経済的にインセンティブ付けします（悪意のあるまたは失敗したジョブはオペレーターをスラッシングします）。プルーバー間で作業を分散させることで（そして潜在的にGPUやASICを活用することで）、Lagrangeプルーバーネットワーク はエンドユーザーから複雑さとコストを隠します。その結果、高速でスケーラブル、かつ分散型のzkMLサービスが実現します：「検証可能なAI推論を高速かつ手頃な価格で」。

パフォーマンスのマイルストーン： DeepProveの主張は、以前の最先端技術であるEzklに対するベンチマークによって裏付けられています。約26.4万パラメータを持つCNN（CIFAR-10スケールのモデル）に対して、DeepProveの証明時間は約1.24秒であったのに対し、Ezklでは 約196秒 であり、約 158倍高速 でした。400万パラメータを持つより大きな密結合ネットワークでは、DeepProveは約2.3秒で推論を証明したのに対し、Ezklでは約126.8秒（約54倍高速）でした。検証時間も短縮されました。DeepProveは26.4万CNNの証明を約0.6秒で検証しましたが、Ezklの証明（Halo2ベース）をCPUで検証するにはそのテストで5分以上かかりました。この高速化は、DeepProveのほぼ線形な複雑さから来ています。そのプルーバーは操作の数に対してほぼ O(n) でスケールしますが、サーキットベースのSNARKプルーバーはしばしば超線形なオーバーヘッド（FFTと多項式コミットメントのスケーリング）を持ちます。実際、DeepProveの プルーバーのスループット は、プレーンな推論ランタイムの1桁以内に収まることがあります。最近のGKRシステムは、大規模な行列乗算において生の実行よりも10倍未満の遅さであり、これはZKにおける印象的な成果です。これにより、リアルタイムまたはオンデマンドの証明 がより実現可能になり、対話型アプリケーションにおける検証可能なAIへの道が開かれます。

ユースケース： LagrangeはすでにWeb3およびAIプロジェクトと協力してzkMLを適用しています。ユースケースの例としては、検証可能なNFTの特性（ゲームキャラクターやコレクティブルのAI生成による進化が、承認されたモデルによって計算されたことを証明する）、AIコンテンツの来歴（ディープフェイクと戦うために、画像やテキストが特定のモデルによって生成されたことを証明する）、DeFiリスクモデル（独自のデータを明らかにすることなく、金融リスクを評価するモデルの出力を証明する）、および医療や金融における プライベートAI推論（病院が患者データを公開することなく、正しさを保証する証明付きでAI予測を得ることができる）などがあります。AIの出力を 検証可能かつプライバシー保護 にすることで、DeepProveは分散システムにおける 「信頼できるAI」 への扉を開きます。これは 「ブラックボックスモデルへの盲目的な信頼」 の時代から 「客観的な保証」 の時代への移行を意味します。

SNARKベースのzkML：EzklとHalo2アプローチ

zkMLへの従来のアプローチは、zk-SNARK (Succinct Non-interactive Arguments of Knowledge) を使用してニューラルネットワークの推論を証明します。Ezkl (ZKonduit/Modulus Labsによる) は、このアプローチの代表的な例です。これはHalo2証明システム（BLS12-381上の多項式コミットメントを持つPLONKスタイルのSNARK）を基盤としています。Ezklは、開発者がPyTorchやTensorFlowモデルを取得し、ONNXにエクスポートし、Ezklがそれを自動的にカスタム算術サーキットにコンパイルするツールチェーンを提供します。

仕組み： ニューラルネットワークの各層は制約に変換されます：

線形層（密結合または畳み込み）は、入力、重み、出力間のドット積を強制する乗算-加算制約の集合になります。
非線形層（ReLU、sigmoidなど）は、そのような関数が多項式ではないため、ルックアップまたは区分的制約 を介して処理されます。例えば、ReLUは、ブールセレクタ $b$ と、$y = x \cdot b$、$0 \le b \le 1$、そして $x>0$ の場合に $b=1$ を保証する制約によって実装できます（これは一つの方法です）。あるいは、より効率的には、$x$ の値の範囲に対して $x \mapsto \max(0,x)$ をマッピングするルックアップテーブルを使用します。Halo2のルックアップ引数は16ビット（またはそれ以下）の値のチャンクをマッピングできるため、大きなドメイン（すべての32ビット値など）は通常、いくつかの小さなルックアップに 「チャンク化」 されます。このチャンク化は制約の数を増やします。
大きな整数の演算や除算（もしあれば）も同様に小さな部分に分割されます。結果として、特定のモデルアーキテクチャに合わせた大規模な R1CS/PLONK制約 の集合ができあがります。

Ezklはその後、Halo2を使用して、秘密の入力（モデルの重み、プライベートな入力）と公開の出力が与えられた場合にこれらの制約が成り立つという証明を生成します。ツールと統合： SNARKアプローチの利点の一つは、よく知られたプリミティブを活用することです。Halo2はすでにEthereumのロールアップ（例：Zcash、zkEVM）で使用されているため、実戦でテストされており、オンチェーンベリファイアがすぐに利用できます。Ezklの証明はBLS12-381曲線を使用しており、これはEthereumがプリコンパイルを介して検証できるため、スマートコントラクトでEzklの証明を検証するのは簡単です。チームはまた、ユーザーフレンドリーなAPIも提供しています。例えば、データサイエンティストはPythonでモデルを扱い、EzklのCLIを使用して、サーキットに関する深い知識がなくても証明を生成できます。

長所： Ezklのアプローチは、SNARKの一般性とエコシステムから恩恵を受けます。それは合理的に複雑なモデルをサポートし、すでに 「実用的な統合（DeFiリスクモデルからゲーミングAIまで）」 を実現し、現実世界のMLタスクを証明しています。モデルの計算グラフのレベルで動作するため、ML固有の最適化を適用できます。例えば、重要でない重みを枝刈りしたり、パラメータを量子化してサーキットサイズを削減したりします。これはまた、モデルの機密性 が自然に保たれることを意味します。重みはプライベートなウィットネスデータとして扱うことができるため、ベリファイアは 何らかの 有効なモデルが出力を生成したこと、あるいはせいぜいモデルへのコミットメントしか見ることができません。SNARK証明の検証は非常に高速 であり（通常、オンチェーンで数ミリ秒以下）、証明サイズも小さい（数キロバイト）ため、ブロックチェーンでの使用に理想的です。

短所： パフォーマンスがアキレス腱です。サーキットベースの証明は、特にモデルが大きくなるにつれて、大きなオーバーヘッドを伴います。歴史的に、SNARKサーキットは、プルーバーにとってモデルを単に実行するよりも 百万倍もの作業 になる可能性があると指摘されています。Halo2とEzklはこれを最適化していますが、それでも、大規模な行列乗算のような操作は 大量の 制約を生成します。モデルに数百万のパラメータがある場合、プルーバーはそれに対応する数百万の制約を処理し、その過程で重いFFTや多重指数演算を実行する必要があります。これにより、証明時間が長くなり（重要でないモデルでもしばしば数分から数時間）、メモリ使用量も多くなります。例えば、比較的小さなCNN（例：数十万パラメータ）でさえ、Ezklを単一のマシンで実行すると証明に数十分かかることがあります。DeepProveのチームは、DeepProveが数分でできる特定のモデルの証明にEzklが数時間かかったと述べています。大規模なモデルはメモリに収まらないか、複数の証明に分割する必要があるかもしれません（その場合、再帰的な集約が必要になります）。Halo2は 「適度に最適化」 されていますが、ルックアップを「チャンク化」したり、広範なビット操作を処理したりする必要がある場合は、追加のオーバーヘッドが発生します。要約すると、スケーラビリティは限定的 です。Ezklは小から中規模のモデルにはうまく機能しますが（そして実際、ベンチマークではいくつかの初期の代替案、例えばナイーブなStarkベースのVMを 上回りました）、モデルサイズがある点を超えると苦戦します。

これらの課題にもかかわらず、Ezklや同様のSNARKベースのzkMLライブラリは重要な足がかりです。それらは、検証済みML推論がオンチェーンで可能である ことを証明し、活発に利用されています。特筆すべきは、Modulus Labs のようなプロジェクトが、SNARKを使用して（重い最適化を伴い）1800万パラメータのモデルをオンチェーンで検証したことを実証したことです。コストは些細なものではありませんでしたが、それはその軌道を示しています。さらに、Mina Protocol は独自のzkMLツールキットを持っており、SNARKを使用してMina上のスマートコントラクト（Snarkベース）がMLモデルの実行を検証できるようにしています。これは、SNARKベースのzkMLに対するマルチプラットフォームサポートの拡大を示しています。

STARKベースのアプローチ：MLのための透明でプログラム可能なZK

zk-STARK (Scalable Transparent ARguments of Knowledge) は、zkMLへのもう一つのルートを提供します。STARKはハッシュベースの暗号技術（多項式コミットメントのためのFRIなど）を使用し、信頼できるセットアップを回避します。これらはしばしばCPUやVMをシミュレートし、実行トレースが正しいことを証明することによって動作します。MLの文脈では、ニューラルネットワーク用のカスタムSTARKを構築するか、汎用STARK VMを使用してモデルコードを実行するかのいずれかが可能です。

汎用STARK VM (RISC Zero, Cairo)： 簡単なアプローチは、推論コードを書いてSTARK VMで実行することです。例えば、Risc0 はRISC-V環境を提供し、そこでは任意のコード（例：ニューラルネットワークのC++またはRust実装）を実行し、STARKを介して証明できます。同様に、StarkWareの Cairo 言語は任意の計算（LSTMやCNNの推論など）を表現でき、それらはStarkNetのSTARKプルーバーによって証明されます。利点は柔軟性です。各モデルに対してカスタムサーキットを設計する必要がありません。しかし、初期のベンチマークでは、ナイーブなSTARK VMはML用の最適化されたSNARKサーキットと比較して遅いことが示されました。あるテストでは、Halo2ベースの証明（Ezkl）はCairo上のSTARKベースのアプローチよりも約 3倍速く、2024年のあるベンチマークではRISC-V STARK VMよりも 66倍速い ことさえありました。この差は、STARKですべての低レベル命令をシミュレートするオーバーヘッドと、STARK証明の定数が大きいこと（ハッシュは速いが大量に必要、STARKの証明サイズは大きいなど）によるものです。しかし、STARK VMは改善されており、透明なセットアップ（信頼できるセットアップ不要）と ポスト量子セキュリティ という利点があります。STARKフレンドリーなハードウェアとプロトコルが進歩するにつれて、証明速度は向上するでしょう。

DeepProveのアプローチ vs STARK： 興味深いことに、DeepProveがGKRとサムチェックを使用することで得られる証明は、精神的にはSTARKに似ています。それは対話的でハッシュベースの証明であり、構造化された参照文字列を必要としません。トレードオフは、その証明がSNARKよりも大きく、検証が重いことです。しかし、DeepProveは、慎重なプロトコル設計（MLの層状構造に特化）が、証明時間において汎用STARK VMとSNARKサーキットの両方を大幅に上回ることができることを示しています。DeepProveは 特注のSTARKスタイル のzkMLプルーバーと考えることができます（彼らは簡潔さのためにzkSNARKという用語を使用していますが、0.5秒の検証は典型的なSNARK検証よりも大きいため、従来のSNARKの小さな定数サイズの検証はありません）。従来のSTARK証明（StarkNetのものなど）は、検証に数万の体演算を伴うことが多いのに対し、SNARKは数十回程度で検証します。したがって、一つの トレードオフ が明らかです：SNARKはより小さな証明とより速いベリファイアをもたらし、STARK（またはGKR）は証明サイズと検証速度を犠牲にして、より簡単なスケーリングと信頼できるセットアップ不要を提供します。

新たな改善： JOLT zkVM（前述のJOLTxで議論）は実際にはSNARK（PLONK風のコミットメントを使用）を出力していますが、STARKの文脈にも適用できるアイデアを具現化しています（Lassoルックアップは理論的にはFRIコミットメントと共に使用できます）。StarkWareなどは、一般的な操作の証明を高速化する方法を研究しています（例えば、Cairoで大きな整数演算のためにカスタムゲートやヒントを使用するなど）。また、Privacy & Scaling Explorations (PSE) による Circomlib-ML もあり、これはCNN層などのためのCircomテンプレートを提供します。これはSNARK指向ですが、概念的に類似したテンプレートをSTARK言語用に作成することもできます。

実際には、STARKを活用する 非Ethereumエコシステム には、StarkNet（誰かがベリファイアを書けばMLのオンチェーン検証が可能になるかもしれないが、コストは高い）や Risc0のBonsai サービス（様々なチェーンで検証可能なSTARK証明を発行するオフチェーン証明サービス）があります。2025年現在、ブロックチェーン上のほとんどのzkMLデモは（ベリファイアの効率性から）SNARKを好んでいますが、STARKアプローチは、その透明性と高セキュリティまたは耐量子設定での可能性から、依然として魅力的です。例えば、分散型計算ネットワークは、信頼できるセットアップなしで誰でも作業を検証できるようにSTARKを使用するかもしれません。これは長寿のために有用です。また、一部の特殊なMLタスクは、STARKフレンドリーな構造を活用するかもしれません。例えば、XOR/ビット操作を多用する計算は、SNARKの体演算よりもSTARK（ブール代数とハッシュでは安価なため）の方が速い可能性があります。

MLにおけるSNARK vs STARKの概要：

パフォーマンス： SNARK（Halo2など）はゲートあたりの証明オーバーヘッドが大きいですが、強力な最適化と検証のための小さな定数の恩恵を受けます。STARK（汎用）は定数オーバーヘッドが大きいですが、より線形にスケールし、ペアリングのような高価な暗号を回避します。DeepProveは、アプローチをカスタマイズする（サムチェック）ことで、ほぼ線形の証明時間（高速）をSTARKのような証明で実現することを示しています。JOLTは、汎用VMでさえルックアップを多用することで高速化できることを示しています。経験的に、数百万の操作までのモデルでは、十分に最適化されたSNARK（Ezkl）は処理できますが、数十分かかる可能性があり、一方DeepProve（GKR）は数秒でできます。2024年のSTARK VMは、特化されていない限り、SNARKの中間かそれ以下でした（テストではRisc0は遅く、Cairoはカスタムヒントなしでは遅かった）。
検証： SNARK証明は最も速く検証されます（ミリ秒単位、オンチェーンでのデータは最小限で約数百バイトから数KB）。STARK証明はより大きく（数十KB）、多くのハッシュステップのため検証に時間がかかります（数十ミリ秒から数秒）。ブロックチェーンの観点から言えば、SNARKの検証は例えば約20万ガスかかるかもしれませんが、STARKの検証は数百万ガスかかる可能性があり、L1には高すぎることが多く、L2や簡潔な検証スキームでは許容範囲です。
セットアップとセキュリティ： Groth16のようなSNARKはサーキットごとに信頼できるセットアップを必要としますが（任意のモデルには不親切）、ユニバーサルSNARK（PLONK、Halo2）は、特定のサイズまでの任意のサーキットに再利用できる一度きりのセットアップを持ちます。STARKはセットアップを必要とせず、ハッシュの仮定（および古典的な多項式複雑性の仮定）のみを使用し、ポスト量子セキュア です。これにより、STARKは長寿のために魅力的です。量子コンピュータが出現しても証明は安全なままですが、現在のSNARK（BLS12-381ベース）は量子攻撃によって破られます。

これらの違いを、まもなく比較表にまとめます。

MLのためのFHE (FHE-o-ML)：プライベート計算 vs. 検証可能計算

完全準同型暗号 (FHE) は、暗号化されたデータ上で直接計算を実行できる暗号技術です。MLの文脈では、FHEは一種の プライバシー保護推論 を可能にします。例えば、クライアントは暗号化された入力をモデルホストに送信し、ホストはそれを復号せずに暗号文上でニューラルネットワークを実行し、クライアントが復号できる暗号化された結果を返します。これにより データ機密性 が保証されます。モデルの所有者は入力について何も知ることができず（そして、クライアントは出力のみを知り、モデルの内部については知らない可能性があります）。しかし、FHE自体は、ZKPのように 正当性の証明を生成しません。クライアントは、モデルの所有者が実際に正直に計算を実行したと信頼しなければなりません（暗号文が操作された可能性があります）。通常、クライアントがモデルを持っているか、特定の出力分布を期待している場合、露骨な不正は検出できますが、微妙なエラーや間違ったモデルバージョンの使用は、暗号化された出力だけからは明らかになりません。

パフォーマンスのトレードオフ： FHEは計算が非常に重いことで知られています。FHE下でディープラーニング推論を実行すると、桁違いの速度低下が発生します。初期の実験（例：2016年のCryptoNets）では、暗号化されたデータ上で小さなCNNを評価するのに数十秒かかりました。2024年までに、CKKS（近似算術用） やより良いライブラリ（Microsoft SEAL、ZamaのConcrete）などの改善により、このオーバーヘッドは減少しましたが、依然として大きいです。例えば、あるユーザーは、ZamaのConcrete-MLを使用してCIFAR-10分類器を実行するのに、自分のハードウェアで推論ごとに 25〜30分 かかったと報告しています。最適化後、Zamaのチームは192コアサーバーでその推論を約40秒で達成しました。40秒でさえ、平文の推論（0.01秒かもしれない）と比較して非常に遅く、約 $10^3$–$10^4\times$ のオーバーヘッドを示しています。より大きなモデルやより高い精度は、コストをさらに増加させます。さらに、FHE操作は多くのメモリを消費し、時折 ブートストラップ（ノイズ削減ステップ）を必要とし、これは計算コストが高いです。要約すると、スケーラビリティは大きな問題 です。最先端のFHEは小さなCNNや単純なロジスティック回帰を処理できるかもしれませんが、大規模なCNNやTransformerへのスケーリングは現在の実用的な限界を超えています。

プライバシーの利点： FHEの大きな魅力は データプライバシー です。入力はプロセス全体を通じて完全に暗号化されたままでいられます。これは、信頼できないサーバーがクライアントのプライベートデータについて何も知ることなく計算できることを意味します。逆に、モデルが機密（独自）である場合、モデルパラメータを暗号化し、クライアント側でFHE推論を実行することも考えられますが、クライアントが重いFHE計算を行わなければならない場合、強力なサーバーにオフロードするという考えが無意味になるため、これはあまり一般的ではありません。通常、モデルは公開されているか、サーバーが平文で保持しており、データはクライアントの鍵で暗号化されます。そのシナリオでのモデルのプライバシーは、デフォルトでは 提供されません（サーバーはモデルを知っており、クライアントは出力を知りますが重みは知りません）。モデルとデータの両方を互いに秘密に保つことができる、よりエキゾチックな設定（安全な二者間計算やマルチキーFHEなど）もありますが、それらはさらに複雑さを増します。対照的に、ZKPを介したzkMLは、モデルのプライバシー と データのプライバシー を同時に保証できます。プルーバーはモデルとデータの両方を秘密のウィットネスとして持ち、ベリファイアに必要なものだけを明らかにします。

オンチェーン検証は不要 (そして不可能)： FHEでは、結果はクライアントに暗号化されて返されます。クライアントはそれを復号して実際の予測を取得します。その結果をオンチェーンで使用したい場合、クライアント（または復号鍵を持つ者）は平文の結果を公開し、それが正しいことを他の人に納得させる必要があります。しかし、その時点で、信頼は再びループに戻ります。ZKPと組み合わせない限り。原則として、FHEとZKPを組み合わせることは可能です。例えば、計算中にデータをプライベートに保つためにFHEを使用し、その後、平文の結果が正しい計算に対応するというZK証明を生成します。しかし、それらを組み合わせることは、FHE と ZKPのパフォーマンスペナルティを支払うことを意味し、今日の技術では非常に非現実的です。したがって、実際にはFHE-of-MLとzkMLは異なるユースケースに対応します：

FHE-of-ML： 二者間（クライアントとサーバー）の機密性 が目標である場合に理想的です。例えば、クラウドサービスがMLモデルをホストし、ユーザーはクラウドにデータを明らかにすることなく機密データでクエリできます（そしてモデルが機密である場合、FHEフレンドリーなエンコーディングを介してデプロイするかもしれません）。これはプライバシー保護MLサービス（医療予測など）に最適です。ユーザーは依然としてサービスが忠実にモデルを実行することを信頼する必要がありますが（証明がないため）、少なくとも データ漏洩 は防がれます。Zamaのような一部のプロジェクトは、スマートコントラクトが暗号化された入力で動作できる 「FHE対応EVM (fhEVM)」 を探求していますが、それらの計算をオンチェーンで検証するには、コントラクトが何らかの方法で正しい計算を強制する必要があり、これはZK証明や特殊なセキュアハードウェアを必要とする可能性が高い未解決の課題です。
zkML (ZKP)： 検証可能性と公開監査可能性 が目標である場合に理想的です。誰でも（またはどのコントラクトでも）「モデル $M$ が $X$ で正しく評価され、$Y$ を生成した」 ことを確認したい場合、ZKPが解決策です。それらはボーナスとしてプライバシーも提供しますが（必要に応じて $X$、$Y$、または $M$ を証明のプライベートな入力として扱うことで隠すことができます）、その主な特徴は正しい実行の証明です。

補完的な関係： ZKPは ベリファイア を保護し（彼らは秘密について何も知らず、計算が正しく行われたことだけを知ります）、一方FHEは計算を行う当事者から プルーバー のデータを保護することに注意する価値があります。一部のシナリオでは、これらを組み合わせることができます。例えば、信頼できないノードのネットワークがFHEを使用してユーザーのプライベートデータで計算し、その後、計算がプロトコルに従って行われたことをユーザー（またはブロックチェーン）にZK証明で提供することができます。これにより、プライバシーと正当性の両方がカバーされますが、今日のアルゴリズムではパフォーマンスコストが莫大です。近い将来、より実現可能なのは、Trusted Execution Environments (TEE) + ZKP や Functional Encryption + ZKP のようなハイブリッドです。これらは私たちの範囲を超えていますが、同様のものを提供することを目指しています（TEEは計算中にデータ/モデルを秘密に保ち、その後ZKPがTEEが正しいことを行ったことを証明できます）。

要約すると、FHE-of-MLは入力/出力の機密性を優先 し、zkMLは検証可能な正当性（プライバシーの可能性あり）を優先 します。以下の表1は、主要な特性を対比しています：

アプローチ	プルーバーのパフォーマンス (推論と証明)	証明サイズと検証	プライバシー機能	信頼できるセットアップ？	ポスト量子？
zk-SNARK (Halo2, Groth16, PLONKなど)	重いプルーバーオーバーヘッド（最適化なしで通常のランタイムの最大10^6倍、実際には10^3–10^5倍）。特定のモデル/サーキットに最適化。中規模モデルで数分、大規模モデルで数時間の証明時間。最近のzkML SNARK（GKR付きDeepProve）はこれを大幅に改善（ほぼ線形のオーバーヘッド、例：数百万パラメータモデルで数分の代わりに数秒）。	非常に小さな証明（多くは100KB未満、時には数KB程度）。検証は高速：数回のペアリングまたは多項式評価（通常、オンチェーンで50ms未満）。DeepProveのGKRベースの証明はより大きく（数十〜数百KB）、約0.5秒で検証（モデルの再実行よりはるかに高速）。	データ機密性：はい – 入力は証明内でプライベートにでき、公開されません。モデルプライバシー：はい – プルーバーはモデルの重みにコミットし、それらを公開しません。出力の隠蔽：オプション – 証明は出力を明らかにせずにステートメントについてのものであることができます（例：「出力はプロパティPを持つ」）。しかし、出力自体がオンチェーンで必要な場合、通常は公開されます。全体として、SNARKは完全なゼロ知識の柔軟性を提供します（隠したい部分を隠せます）。	スキームによる。Groth16/EZKLはサーキットごとに信頼できるセットアップが必要。PLONK/Halo2はユニバーサルセットアップ（一度きり）を使用。DeepProveのサムチェックGKRは透明（セットアップ不要）– その設計のボーナス。	古典的なSNARK（BLS12-381曲線）は PQセキュアではない（楕円曲線離散対数問題に対する量子攻撃に脆弱）。一部の新しいSNARKはPQセキュアなコミットメントを使用しますが、Ezklで使用されるHalo2/PLONKはPQセキュアではありません。GKR（DeepProve）はハッシュコミットメント（例：Poseidon/Merkle）を使用し、これらはPQセキュアであると推測されています（ハッシュの原像困難性に依存）。
zk-STARK (FRI, ハッシュベースの証明)	プルーバーのオーバーヘッドは高いが、より線形なスケーリング。通常、大規模タスクではネイティブより10^2–10^4倍遅く、並列化の余地あり。汎用STARK VM（Risc0, Cairo）は2024年にMLでSNARKと比較して遅いパフォーマンスを示した（例：一部のケースでHalo2より3倍–66倍遅い）。特殊なSTARK（またはGKR）は線形オーバーヘッドに近づき、大規模サーキットでSNARKを上回ることができます。	証明はより大きい：しばしば数十KB（サーキットサイズ/log(n)と共に増加）。ベリファイアは複数のハッシュとFFTチェックを行う必要があり、検証時間は小さなεに対して約O(n^ε)（例：証明サイズに応じて約50msから500ms）。オンチェーンでは、これはより高価です（StarkWareのL1ベリファイアは証明ごとに数百万ガスかかることがあります）。一部のSTARKは、プルーバー時間を犠牲にしてサイズを圧縮するために再帰的証明をサポートします。	データとモデルのプライバシー： STARKはトレースデータをランダム化する（多項式評価にブラインディングを追加する）ことでゼロ知識にすることができ、SNARKと同様にプライベートな入力を隠すことができます。多くのSTARK実装は完全性に焦点を当てていますが、zk-STARKの変種はプライバシーを可能にします。したがって、はい、SNARKのように入力/モデルを隠すことができます。出力の隠蔽：理論的には同様に可能ですが（プルーバーが出力を公開として宣言しない）、通常は出力が公開/検証したいものであるため、めったに使用されません。	信頼できるセットアップは不要。透明性はSTARKの特徴です – 共通のランダム文字列のみを必要とします（Fiat-Shamirが導出可能）。これにより、オープンエンドな使用（任意のモデル、いつでも、モデルごとのセレモニーなし）に魅力的です。	はい、STARKはハッシュと情報理論的なセキュリティの仮定（ランダムオラクルやFRIにおける特定のコードワード復号の困難性など）に依存しています。これらは量子攻撃者に対して安全であると考えられています。したがって、STARK証明はPQ耐性があり、検証可能なAIを将来にわたって保証する上で利点があります。
MLのためのFHE (推論に適用される完全準同型暗号)	プルーバー = 暗号化データ上で計算を行う当事者。計算時間は非常に高い：平文推論より10^3–10^5倍遅いのが一般的。ハイエンドハードウェア（多コアサーバー、FPGAなど）でこれを緩和できます。一部の最適化（低精度推論、レベル化FHEパラメータ）はオーバーヘッドを削減できますが、基本的なパフォーマンスヒットがあります。FHEは現在、小さなモデルや単純な線形モデルには実用的ですが、ディープネットワークはトイサイズを超えると依然として困難です。	証明は生成されません。結果は暗号化された出力です。正当性をチェックするという意味での検証はFHE単独では提供されません – 計算を行う当事者が不正をしないと信頼します。（セキュアハードウェアと組み合わせれば、アテステーションが得られるかもしれませんが、そうでなければ、悪意のあるサーバーは不正な暗号化結果を返し、クライアントは違いを知らずに間違った出力に復号する可能性があります）。	データ機密性：はい – 入力は暗号化されているため、計算を行う当事者はそれについて何も知りません。モデルプライバシー：モデルの所有者が暗号化された入力で計算を行っている場合、モデルは彼らの側で平文です（保護されていません）。役割が逆の場合（クライアントがモデルを暗号化して保持し、サーバーが計算する）、モデルは暗号化されたままにできますが、このシナリオはあまり一般的ではありません。FHE/MPCを組み合わせて両方を保護する安全な二者間MLのような技術もありますが、これらはプレーンなFHEを超えています。出力の隠蔽：デフォルトでは、計算の出力は暗号化されています（秘密鍵を持つ当事者、通常は入力の所有者のみが復号可能）。したがって、出力は計算サーバーから隠されています。出力を公開したい場合、クライアントは復号して公開できます。	セットアップは不要。各ユーザーは暗号化のために独自の鍵ペアを生成します。信頼は鍵が秘密に保たれることに依存します。	FHEスキーム（例：BFV, CKKS, TFHE）のセキュリティは、格子問題（Learning With Errors）に基づいており、これらは量子攻撃に耐性があると考えられています（少なくとも効率的な量子アルゴリズムは知られていません）。したがって、FHEは一般的にポスト量子セキュアと考えられています。

表1：機械学習推論のためのzk-SNARK、zk-STARK、およびFHEアプローチの比較（パフォーマンスとプライバシーのトレードオフ）。

Web3アプリケーションへのユースケースと影響

zkMLを介したAIとブロックチェーンの融合は、Web3における強力な新しいアプリケーションパターンを解き放ちます：

分散型自律エージェントとオンチェーンでの意思決定： スマートコントラクトやDAOは、正当性の保証付きでAI駆動の意思決定を組み込むことができます。例えば、取引を実行する前に市場状況を分析するためにニューラルネットワークを使用するDAOを想像してみてください。zkMLを使用すると、DAOのスマートコントラクトは、アクションが受け入れられる前に、承認されたMLモデル（既知のハッシュコミットメントを持つ）が最新のデータで実行され、推奨されたアクションを生成したというzkSNARK証明を要求できます。これにより、悪意のあるアクターが偽の予測を注入するのを防ぎます – チェーンが AIの計算を検証します。時間が経てば、DeFiやゲームで意思決定を行う完全にオンチェーンの自律エージェント（オフチェーンAIをクエリするか、簡略化されたモデルを含むコントラクト）を持つことさえ可能になり、そのすべての動きはzk証明を介して正しく、ポリシーに準拠していることが証明されます。これにより、自律エージェントの「思考」がブラックボックスではなく、透明で検証可能になるため、信頼性が向上します。
検証可能な計算市場： Lagrangeのようなプロジェクトは、効果的に 検証可能な計算マーケットプレイス を作成しています – 開発者は重いML推論をプルーバーのネットワークにアウトソースし、結果と共に証明を受け取ることができます。これは分散型クラウドコンピューティングに似ていますが、信頼が組み込まれています。サーバーを信頼する必要はなく、証明だけを信頼すればよいのです。これはオラクルやオフチェーン計算にとってパラダイムシフトです。Ethereumの今後のDSC（分散型シーケンシングレイヤー）やオラクルネットワークのようなプロトコルは、これを使用して暗号学的な保証付きのデータフィードや分析フィードを提供できます。例えば、オラクルは「入力Yに対するモデルXの結果」を提供し、誰もがオラクルの言葉を信頼するのではなく、添付された証明をオンチェーンで検証できます。これにより、ブロックチェーン上で サービスとしての検証可能なAI が可能になります。どのコントラクトも計算（「私のプライベートモデルでこれらの信用リスクをスコアリングして」など）を要求し、有効な証明がある場合にのみ回答を受け入れることができます。Gensyn のようなプロジェクトは、これらの検証技術を使用して分散型のトレーニングおよび推論マーケットプレイスを探求しています。
NFTとゲーミング – 来歴と進化： ブロックチェーンゲームやNFTコレクティブルでは、zkMLは特性やゲームの動きが正当なAIモデルによって生成されたことを証明できます。例えば、ゲームがAIにNFTペットの属性を進化させることを許可するかもしれません。ZKがなければ、賢いユーザーはAIや結果を改変して優れたペットを手に入れるかもしれません。zkMLを使用すると、ゲームは 「ペットの新しいステータスは、ペットの古いステータスに対して公式の進化モデルによって計算された」 という証明を要求でき、不正を防ぎます。ジェネレーティブアートNFTについても同様です。アーティストはジェネレーティブモデルをコミットメントとしてリリースできます。後でNFTをミントするときに、各画像が特定のシードを与えられてそのモデルによって生成されたことを証明し、真正性を保証します（そして、アーティストのIPを保護するために、正確なモデルを公開することなくそれを行うことさえできます）。この 来歴検証 は、検証可能なランダム性に似た方法で真正性を保証します – ここでは検証可能な創造性です。
機密領域におけるプライバシー保護AI： zkMLは 入力を公開することなく結果の確認 を可能にします。医療では、患者のデータがクラウドプロバイダーによってAI診断モデルに通されるかもしれません。病院は診断と、そのモデル（製薬会社が非公開で保有している可能性がある）が患者データで正しく実行された という証明を受け取ります。患者データはプライベートなままであり（証明では暗号化またはコミットされた形式のみが使用された）、モデルの重みは独自のままです – それでも結果は信頼されます。規制当局や保険会社も、承認されたモデルのみが使用されたことを検証できます。金融では、企業は監査人や規制当局に対して、そのリスクモデルが内部データに適用され、特定のメトリクスを生成した ことを、基礎となる機密性の高い財務データを明らかにすることなく証明できます。これにより、手動の信頼ではなく、暗号学的な保証によるコンプライアンスと監督が可能になります。
クロスチェーンおよびオフチェーンの相互運用性： ゼロ知識証明は基本的にポータブルであるため、zkMLは クロスチェーンAI の結果を促進できます。あるチェーンがオフチェーンで実行されるAI集約的なアプリケーションを持っているかもしれません。その結果の証明を別のブロックチェーンに投稿でき、そのブロックチェーンはそれをトラストレスに受け入れます。例えば、ソーシャルメディア全体のセンチメントを集約するためにAIを使用するマルチチェーンDAOを考えてみましょう（オフチェーンデータ）。AI分析（大規模データに対する複雑なNLP）はオフチェーンのサービスによって行われ、その後、「分析は正しく行われ、出力センチメントスコア = 0.85」 という証明を小さなブロックチェーン（または複数のチェーン）に投稿します。すべてのチェーンは、それぞれが分析を再実行する必要なく、その結果を検証し、ガバナンスロジックで使用できます。この種の 相互運用可能な検証可能計算 は、Lagrangeのネットワークが複数のロールアップやL1に同時にサービスを提供することでサポートしようとしているものです。これにより、チェーン間で結果を移動する際に、信頼できるブリッジやオラクルの仮定が不要になります。
AIアライメントとガバナンス： より未来志向の観点から、zkMLは AIガバナンスと安全性 のためのツールとして注目されています。例えば、Lagrangeのビジョンステートメントでは、AIシステムがより強力になるにつれて（超知能でさえ）、合意されたルールに従うことを保証するために暗号学的検証が不可欠になると主張しています。AIモデルにその推論や制約の証明を生成させることを要求することで、人間はある程度の制御を維持します – 「検証できないものは信頼できない」。これは推測的であり、技術的な側面だけでなく社会的な側面も関わりますが、この技術は、自律的に実行されているAIエージェントが、承認されたモデルを使用しており、改ざんされていないことを証明することを強制できます。分散型AIネットワークは、貢献を検証するためにオンチェーン証明を使用するかもしれません（例：モデルを共同でトレーニングするノードのネットワークは、各更新が忠実に計算されたことを証明できます）。したがって、zkMLは、分散型または制御されていない環境であっても、AIシステムが人間定義のプロトコルに対して説明責任を負い続けることを保証する 上で役割を果たす可能性があります。

結論として、zkMLと検証可能なオンチェーンAI は、AIアプリケーションにおける信頼、透明性、プライバシーを向上させる可能性のある、高度な暗号技術と機械学習の融合を表しています。主要なアプローチ – zk-SNARK、zk-STARK、FHE – を比較することで、パフォーマンスとプライバシーの間のトレードオフのスペクトルが見え、それぞれが異なるシナリオに適しています。EzklのようなSNARKベースのフレームワークやLagrangeのDeepProveのような革新により、実質的なニューラルネットワーク推論を現実的な労力で証明することが可能になり、検証可能なAIの現実世界での展開への扉が開かれました。STARKベースおよびVMベースのアプローチは、より大きな柔軟性とポスト量子セキュリティを約束しており、これは分野が成熟するにつれて重要になるでしょう。FHEは、検証可能性の解決策ではありませんが、機密性の高いML計算という補完的なニーズに対応し、ZKPとの組み合わせや特定のプライベートな文脈では、ユーザーがデータプライバシーを犠牲にすることなくAIを活用できるようにします。

Web3への影響 は重要です。AIの予測に反応するスマートコントラクト（それが正しいと知っている）、結果がトラストレスに販売される計算市場、zkMLによって保護された デジタルアイデンティティ（Worldcoinの虹彩AIによる人格証明のように、生体認証画像を漏らすことなく人間であることを確認する）、そして一般的にブロックチェーンアプリケーションを豊かにする新しいクラスの 「証明可能なインテリジェンス」 が予見できます。非常に大規模なモデルのパフォーマンス、開発者のエルゴノミクス、特殊なハードウェアの必要性など、多くの課題が残っていますが、その軌道は明確です。あるレポートが指摘したように、「今日のZKPは小さなモデルをサポートできるが、中規模から大規模なモデルはそのパラダイムを壊す」。しかし、急速な進歩（DeepProveによる従来技術に対する50倍–150倍の高速化）がその境界を押し広げています。継続的な研究（ハードウェアアクセラレーションや分散証明など）により、ますます大きく複雑なAIモデルが証明可能になることが期待できます。zkMLは、ニッチなデモから、信頼できるAIインフラストラクチャの不可欠なコンポーネント へとすぐに進化するかもしれません。これにより、AIがユビキタスになるにつれて、それが 監査可能で、分散化され、ユーザーのプライバシーとセキュリティに沿った 方法で行われることが保証されます。

API Marketplace Featured

DeFi リスクモデルにおける信頼の危機​

ゼロ知識機械学習（ZK-ML）の登場​

プライバシーを保護するクレジットスコアリング：機関投資家への開放​

ZK-ML vs. 従来のオラクル：パフォーマンスの差​

なぜ機関投資家は透明でありながら機密性の高いモデルを必要とするのか​

2026 年のブレイクアウト：理論からプロダクションへ​

今後の道のり：課題と機会​

DeFi を超えてこれが重要である理由​

結論​

参考文献​

オンチェーン・クラウドのアーキテクチャ：プログラマブル・ストレージの 3 つの柱​

暗号学的証明：検証可能なストレージの技術的基盤​

AI インフラ市場：分散型ストレージが実需と出会う場所​

中央集権型クラウドとの競争：2026 年における Filecoin の立ち位置​

2.1 EiB から検証可能なインフラの未来へ​

出典​

不透明な API の問題：検証なき信頼​

Judge：検証可能な AI 評価プロトコル​

Verde: 浮動小数点非決定性の排除​

Refereed Delegation（調停型委任）: 全再計算を伴わない効率的な検証​

ハイステークスな AI 意思決定: なぜ透明性が重要なのか​

ゼロ知識証明の代替案：Verde と ZKML の比較​

Gensyn エコシステム：Judge から分散型トレーニングへ​

課題と今後の展望​

検証可能な AI への道：採用経路とマーケットフィット​

新たな標準としての検証可能性​

AI エージェントが単独では解決できない信頼の問題​

ERC-8004：3 つのレジストリによる信頼インフラ​

Blacklight の 5 段階の検証プロセス​

プログラマブルな監査：バイナリな信頼を超えて​

ブラインド・コンピュテーション：プライバシーと検証の両立​

43 億ドルのエージェント・エコノミー・インフラ戦略​

Ethereum のエージェント・ファーストな未来​

次に来るもの：メインネットの統合とエコシステムの拡大​

トラストレスなコーディネーションの終着点​

イントロダクション：ブロックチェーン上で検証可能なAIの必要性​

zkMLの仕組み：ML推論を簡潔な証明に圧縮する​

Lagrange DeepProve：zkMLのブレークスルーのアーキテクチャとパフォーマンス​

SNARKベースのzkML：EzklとHalo2アプローチ​

STARKベースのアプローチ：MLのための透明でプログラム可能なZK​

MLのためのFHE (FHE-o-ML)：プライベート計算 vs. 検証可能計算​

Web3アプリケーションへのユースケースと影響​

DeFi リスクモデルにおける信頼の危機

ゼロ知識機械学習（ZK-ML）の登場

プライバシーを保護するクレジットスコアリング：機関投資家への開放

ZK-ML vs. 従来のオラクル：パフォーマンスの差

なぜ機関投資家は透明でありながら機密性の高いモデルを必要とするのか

2026 年のブレイクアウト：理論からプロダクションへ

今後の道のり：課題と機会

DeFi を超えてこれが重要である理由

結論

参考文献

オンチェーン・クラウドのアーキテクチャ：プログラマブル・ストレージの 3 つの柱

暗号学的証明：検証可能なストレージの技術的基盤

AI インフラ市場：分散型ストレージが実需と出会う場所

中央集権型クラウドとの競争：2026 年における Filecoin の立ち位置

2.1 EiB から検証可能なインフラの未来へ

出典

不透明な API の問題：検証なき信頼

Judge：検証可能な AI 評価プロトコル

Verde: 浮動小数点非決定性の排除

Refereed Delegation（調停型委任）: 全再計算を伴わない効率的な検証

ハイステークスな AI 意思決定: なぜ透明性が重要なのか

ゼロ知識証明の代替案：Verde と ZKML の比較

Gensyn エコシステム：Judge から分散型トレーニングへ

課題と今後の展望

検証可能な AI への道：採用経路とマーケットフィット

新たな標準としての検証可能性

AI エージェントが単独では解決できない信頼の問題

ERC-8004：3 つのレジストリによる信頼インフラ

Blacklight の 5 段階の検証プロセス

プログラマブルな監査：バイナリな信頼を超えて

ブラインド・コンピュテーション：プライバシーと検証の両立

43 億ドルのエージェント・エコノミー・インフラ戦略

Ethereum のエージェント・ファーストな未来

次に来るもの：メインネットの統合とエコシステムの拡大

トラストレスなコーディネーションの終着点

イントロダクション：ブロックチェーン上で検証可能なAIの必要性

zkMLの仕組み：ML推論を簡潔な証明に圧縮する

Lagrange DeepProve：zkMLのブレークスルーのアーキテクチャとパフォーマンス

SNARKベースのzkML：EzklとHalo2アプローチ

STARKベースのアプローチ：MLのための透明でプログラム可能なZK

MLのためのFHE (FHE-o-ML)：プライベート計算 vs. 検証可能計算

Web3アプリケーションへのユースケースと影響