メインコンテンツまでスキップ

MCP を通じた AI と Web3 の接続:全体像の分析

· 約21分
Dora Noda
Software Engineer

はじめに

AI と Web3 は強力な方法で融合しており、現在では AI 汎用インターフェースが分散型ウェブの結合組織として構想されています。この融合から生まれた重要な概念が MCP であり、これは (Anthropic によって導入された) 「モデルコンテキストプロトコル」の略称であるか、より広範な議論では メタバース接続プロトコルとして緩やかに説明されています。本質的に、MCP は AI システムが外部ツールやネットワークと自然で安全な方法でインターフェースするための標準化されたフレームワークであり、潜在的には AI エージェントを Web3 エコシステムの隅々まで「プラグイン」 することを可能にします。このレポートでは、AI 汎用インターフェース (大規模言語モデルエージェントやニューラルシンボリックシステムなど) が MCP を介して Web3 の世界にあるすべてを接続する方法について、歴史的背景、技術アーキテクチャ、業界の状況、リスク、そして将来の可能性を網羅的に分析します。

1. 開発の背景

1.1 Web3 の進化と未実現の約束

「Web3」という言葉は、ブロックチェーンを動力源とする分散型ウェブを説明するために 2014 年頃に作られました。そのビジョンは野心的なものでした:ユーザー所有権を中心としたパーミッションレスなインターネットです。熱狂的な支持者たちは、Web2 の中央集権的なインフラをブロックチェーンベースの代替手段、例えば Ethereum Name Service (DNS の代替)、Filecoin や IPFS (ストレージの代替)、そして DeFi (金融インフラの代替) に置き換えることを想像しました。理論上、これにより巨大テックプラットフォームからコントロールを奪い、個人にデータ、アイデンティティ、資産に対する自己主権を与えるはずでした。

現実は期待に届きませんでした。 長年の開発と誇大広告にもかかわらず、Web3 の主流への影響は限定的でした。平均的なインターネットユーザーは、分散型ソーシャルメディアに殺到したり、プライベートキーの管理を始めたりはしませんでした。主な理由としては、劣悪なユーザーエクスペリエンス、遅くて高価なトランザクション、注目を集めた詐欺事件、そして規制の不確実性が挙げられます。分散型の「所有権ウェブ」は、ニッチなコミュニティを超えて**「実現に失敗した」**と広く見なされています。2020 年代半ばには、暗号資産の支持者でさえ、Web3 が平均的なユーザーにパラダイムシフトをもたらさなかったことを認めました。

一方、AI は革命の最中にありました。資本と開発者の才能が暗号資産から AI へと移行するにつれて、ディープラーニングと基盤モデル (GPT-3, GPT-4 など) の変革的な進歩が一般の人々の想像力を捉えました。生成 AI は、暗号資産アプリケーションが苦戦していた方法で、コンテンツ、コード、意思決定を生み出すという明確な実用性を示しました。実際、大規模言語モデルがわずか数年で与えた影響は、ブロックチェーンの 10 年間のユーザー採用を著しく上回りました。この対照的な状況から、「Web3 は暗号資産に浪費された」、そして真の Web 3.0 は AI の波から生まれている、と揶揄する声も上がりました。

1.2 AI 汎用インターフェースの台頭

数十年にわたり、ユーザーインターフェースは静的なウェブページ (Web1.0) からインタラクティブなアプリ (Web2.0) へと進化しましたが、常にボタンをクリックしたりフォームに入力したりするという制約の中にありました。現代の AI、特に大規模言語モデル (LLM) の登場により、新しいインターフェースのパラダイムが生まれました:自然言語です。ユーザーは平易な言葉で意図を表現するだけで、AI システムが多くのドメインにわたって複雑なアクションを実行できるようになりました。この変化は非常に profound であり、一部では 「Web 3.0」を以前のブロックチェーン中心の定義ではなく、AI 駆動エージェントの時代 (「エージェントウェブ」) として再定義することが提案されています。

しかし、自律型 AI エージェントの初期の実験では、重大なボトルネックが露呈しました。これらのエージェント (例えば AutoGPT のようなプロトタイプ) はテキストやコードを生成できましたが、外部システムや相互に通信するための堅牢な方法を欠いていました。相互運用性のための*「共通の AI ネイティブ言語」*が存在しなかったのです。ツールやデータソースとの各統合は特注のハックであり、AI 同士の対話には標準プロトコルがありませんでした。実際には、AI エージェントは優れた推論能力を持っていても、ウェブアプリやオンチェーンサービスを使用する必要があるタスクの実行に失敗することがありました。それは単に、それらのシステムと「対話する」方法を知らなかったからです。この不一致 (強力な頭脳、原始的な I/O) は、まるで不器用な GUI の背後に閉じ込められた超賢いソフトウェアのようでした。

1.3 融合と MCP の出現

2024 年までに、AI がその潜在能力を最大限に発揮し (そして Web3 がその約束を果たす) ためには、融合が必要であることが明らかになりました:AI エージェントは Web3 の能力 (分散型アプリ、コントラクト、データ) へのシームレスなアクセスを必要とし、Web3 は AI が提供できるより多くの知性と使いやすさを必要としています。これが MCP (モデルコンテキストプロトコル) が生まれた背景です。2024 年後半に Anthropic によって導入された MCP は、LLM にとって自然に感じられる AI とツールの通信のためのオープンスタンダードです。これは、AI「ホスト」(ChatGPT, Claude など) が MCP サーバーを介してさまざまな外部ツールやリソースを見つけて使用するための、構造化され発見可能な方法を提供します。言い換えれば、MCP は、AI エージェントがウェブサービス、API、さらにはブロックチェーン機能に、各統合をカスタムコーディングすることなくプラグインできるようにする共通のインターフェースレイヤーです。

MCP を 「AI インターフェースの USB-C」 と考えてみてください。USB-C がデバイスの接続方法を標準化したように (各デバイスに異なるケーブルが不要になったように)、MCP は AI エージェントがツールやデータに接続する方法を標準化します。開発者は、各サービス (Slack vs. Gmail vs. Ethereum ノード) ごとに異なる API コールをハードコーディングする代わりに、MCP 仕様を一度実装すれば、MCP 互換の AI はそのサービスの使い方を理解できます。主要な AI プレイヤーはすぐにその重要性を認識しました:Anthropic は MCP をオープンソース化し、OpenAI や Google のような企業は自社のモデルでそのサポートを構築しています。この勢いは、MCP (または類似の 「メタ接続プロトコル」) が、ついに AI と Web3 をスケーラブルな方法で接続するバックボーンになる可能性を示唆しています。

特筆すべきは、一部の技術者が、この AI 中心の接続性こそが Web3.0 の真の実現であると主張していることです。Simba Khadder の言葉を借りれば、「MCP は LLM とアプリケーション間の API を標準化することを目指しており」、これは REST API が Web 2.0 を可能にしたのと同様です。つまり、Web3 の次の時代は、単なるブロックチェーンではなく、インテリジェントなエージェントインターフェースによって定義されるかもしれません。分散化そのものを目的とするのではなく、AI との融合によって、自然言語と自律エージェントの背後に複雑さを隠すことで、分散化を有用なものにすることができるのです。このレポートの残りの部分では、AI 汎用インターフェースが (MCP のようなプロトコルを介して) Web3 の世界にあるすべてを接続する方法について、技術的および実践的に掘り下げていきます。

2. 技術アーキテクチャ:Web3 技術を橋渡しする AI インターフェース

AI エージェントを Web3 スタックに組み込むには、ブロックチェーンネットワークとスマートコントラクト、分散型ストレージ、アイデンティティシステム、トークンベースの経済など、複数のレベルでの統合が必要です。大規模な基盤モデルからハイブリッドなニューラルシンボリックシステムまで、AI 汎用インターフェースは、これらのコンポーネントを接続する**「ユニバーサルアダプター」**として機能します。以下では、そのような統合のアーキテクチャを分析します:

図:MCP のアーキテクチャの概念図。AI ホスト (Claude や ChatGPT のような LLM ベースのアプリ) が MCP クライアントを使用して、さまざまな MCP サーバーにプラグインする様子を示しています。各サーバーは、外部ツールやサービス (例:Slack, Gmail, カレンダー, ローカルデータ) へのブリッジを提供し、これはユニバーサルハブを介して接続される周辺機器に類似しています。この標準化された MCP インターフェースにより、AI エージェントは一つの共通プロトコルを通じてリモートサービスやオンチェーンリソースにアクセスできます。

2.1 Web3 クライアントとしての AI エージェント (ブロックチェーンとの統合)

Web3 の中核には、ブロックチェーンとスマートコントラクトがあります。これらは、トラストレスな方法でロジックを強制できる分散型ステートマシンです。AI インターフェースはこれらとどのように関わることができるでしょうか?考慮すべき 2 つの方向性があります:

  • AI がブロックチェーンから読み取る: AI エージェントは、意思決定のコンテキストとしてオンチェーンデータ (例:トークン価格、ユーザーの資産残高、DAO の提案) を必要とする場合があります。従来、ブロックチェーンデータを取得するには、ノードの RPC API やサブグラフデータベースとのインターフェースが必要でした。MCP のようなフレームワークを使用すると、AI は標準化された*「ブロックチェーンデータ」* MCP サーバーにクエリを送信して、ライブのオンチェーン情報を取得できます。例えば、MCP 対応エージェントは、特定のトークンの最新の取引量を尋ねたり、スマートコントラクトの状態を問い合わせたりすることができ、MCP サーバーはブロックチェーンへの接続の低レベルな詳細を処理し、AI が使用できる形式でデータを返します。これにより、AI を特定のブロックチェーンの API 形式から切り離すことで、相互運用性が向上します。

  • AI がブロックチェーンに書き込む: より強力な機能として、AI エージェントは Web3 統合を通じてスマートコントラクトの呼び出しやトランザクションを実行できます。例えば、AI は分散型取引所で自律的に取引を実行したり、特定の条件が満たされた場合にスマートコントラクトのパラメータを調整したりすることができます。これは、AI がブロックチェーンのトランザクション機能をラップした MCP サーバーを呼び出すことで実現されます。具体的な例の一つは、EVM チェーン用の thirdweb MCP サーバーで、これにより MCP 互換の AI クライアントは、チェーン固有のメカニズムを抽象化することで、Ethereum, Polygon, BSC などと対話できます。このようなツールを使用すると、AI エージェントは*「人間の介入なしに」*オンチェーンアクションをトリガーでき、自律的な dApps を可能にします。例えば、市場状況が変化したときにトランザクションに署名して自己リバランスを行う AI 駆動の DeFi ボールトなどです。

内部的には、これらの対話は依然としてウォレット、キー、ガス代に依存しますが、AI インターフェースには (適切なセキュリティサンドボックスを備えた) ウォレットへの制御されたアクセス権が与えられ、トランザクションを実行できます。オラクルやクロスチェーンブリッジも重要な役割を果たします:Chainlink のようなオラクルネットワークは AI とブロックチェーンの間のブリッジとして機能し、AI の出力を信頼できる方法でオンチェーンに供給できます。例えば、Chainlink のクロスチェーン相互運用性プロトコル (CCIP) は、信頼できると見なされた AI モデルが、ユーザーに代わって複数の異なるチェーンにまたがる複数のコントラクトを同時にトリガーすることを可能にします。要約すると、AI 汎用インターフェースは、標準化されたプロトコルを通じてブロックチェーンデータを消費し、ブロックチェーンのトランザクションを生成できる、新しいタイプの Web3 クライアントとして機能できます。

2.2 ニューラルシンボリックの相乗効果:AI の推論とスマートコントラクトの組み合わせ

AI と Web3 の統合における興味深い側面の一つは、AI の学習能力 (ニューラルネット) とスマートコントラクトの厳密なロジック (シンボリックルール) を組み合わせたニューラルシンボリックアーキテクチャの可能性です。実際には、これは AI エージェントが非構造化された意思決定を処理し、特定のタスクを検証可能な実行のためにスマートコントラクトに渡すことを意味する可能性があります。例えば、AI が市場センチメントを分析し (曖昧なタスク)、その後、事前に設定されたリスクルールに従う決定論的なスマートコントラクトを介して取引を実行する、といった具合です。MCP フレームワークと関連する標準は、AI にコントラクト関数を呼び出したり、行動する前に DAO のルールを問い合わせたりするための共通のインターフェースを提供することで、このような引き継ぎを可能にします。

具体的な例として、SingularityNET の AI-DSL (AI ドメイン固有言語) があります。これは、彼らの分散型ネットワーク上の AI エージェント間の通信を標準化することを目指しています。これはニューラルシンボリック統合への一歩と見なすことができます:エージェントが互いに AI サービスやデータを要求するための形式言語 (シンボリック) です。同様に、DeepMind の AlphaCode のようなプロジェクトも、最終的にはスマートコントラクトがオンチェーンでの問題解決のために AI モデルを呼び出せるように接続される可能性があります。現在、大規模な AI モデルを直接オンチェーンで実行することは非現実的ですが、ハイブリッドなアプローチが登場しています。例えば、特定のブロックチェーンでは、ゼロ知識証明や信頼できる実行環境を介して ML 計算の検証が可能であり、オフチェーンの AI 結果のオンチェーン検証を可能にしています。要約すると、技術アーキテクチャは、AI システムとブロックチェーンのスマートコントラクトを補完的なコンポーネントとして想定しており、共通のプロトコルを介して編成されます:AI は知覚とオープンエンドなタスクを処理し、ブロックチェーンは完全性、メモリ、および合意されたルールの強制を提供します。

2.3 AI のための分散型ストレージとデータ

AI はデータを糧としており、Web3 はデータストレージと共有のための新しいパラダイムを提供します。分散型ストレージネットワーク (IPFS/Filecoin, Arweave, Storj など) は、AI モデルのアーティファクトのリポジトリとしても、トレーニングデータのソースとしても機能し、ブロックチェーンベースのアクセス制御を備えています。AI 汎用インターフェースは、MCP などを通じて、Web2 API からと同じくらい簡単に分散型ストレージからファイルや知識を取得できます。例えば、AI エージェントは、適切なキーや支払いがあれば、Ocean Protocol の市場からデータセットを、または分散型ストレージから暗号化されたファイルを取得することができます。

特に Ocean Protocol は、自らを**「AI データ経済」プラットフォームとして位置づけており、ブロックチェーンを使用してデータや AI サービスさえもトークン化**しています。Ocean では、データセットはアクセスをゲートするデータトークンによって表現されます。AI エージェントはデータトークンを取得し (おそらく暗号資産で支払うか、何らかのアクセス権を介して)、その後 Ocean MCP サーバーを使用して実際のデータを分析のために取得できます。Ocean の目標は、プライバシーを保護しながら共有を奨励することで、AI のために「休眠中のデータ」を解き放つことです。したがって、Web3 に接続された AI は、以前はサイロ化されていた、個人のデータ保管庫からオープンな政府データまで、広大で分散化された情報コーパスにアクセスできる可能性があります。ブロックチェーンは、データの使用が透明であり、公正に報酬が支払われることを保証し、より多くのデータが AI に利用可能になり、より多くの AI の貢献 (訓練済みモデルなど) が収益化されるという好循環を促進します。

分散型アイデンティティシステムもここで役割を果たします (次のサブセクションで詳しく説明します):これらは、誰または何が特定のデータにアクセスできるかを制御するのに役立ちます。例えば、医療 AI エージェントは、患者の個人 IPFS ストレージから医療データセットを復号化する前に、検証可能なクレデンシャル (HIPAA または同様の規制への準拠のオンチェーン証明) を提示する必要があるかもしれません。このようにして、技術アーキテクチャは、データが AI に流れることを保証しつつ、オンチェーンのガバナンスと監査証跡によって権限を強制します。

2.4 分散環境におけるアイデンティティとエージェント管理

自律型 AI エージェントが Web3 のようなオープンなエコシステムで活動する場合、アイデンティティと信頼が最も重要になります。分散型アイデンティティ (DID) フレームワークは、暗号学的に検証可能な AI エージェントのデジタルアイデンティティを確立する方法を提供します。各エージェント (またはそれを展開する人間/組織) は、DID と、その属性と権限を特定する関連する検証可能なクレデンシャルを持つことができます。例えば、AI 取引ボットは、特定の制限内で運用できることを証明する規制サンドボックスによって発行されたクレデンシャルを保持することができます。また、AI コンテンツモデレーターは、信頼できる組織によって作成され、バイアステストを受けたことを証明できます。

オンチェーンのアイデンティティレジストリと評判システムを通じて、Web3 の世界は AI の行動に対する説明責任を強制できます。AI エージェントが実行するすべてのトランザクションは、その ID にまで追跡でき、何か問題が発生した場合、クレデンシャルは誰がそれを作成したか、または誰が責任を負うかを教えてくれます。これは重大な課題に対処します:アイデンティティがなければ、悪意のある攻撃者が偽の AI エージェントを立ち上げてシステムを悪用したり、誤情報を広めたりする可能性があり、誰もボットと正当なサービスを区別できません。分散型アイデンティティは、堅牢な認証を可能にし、本物の AI エージェントと偽物を区別することで、そのリスクを軽減します。

実際には、Web3 と統合された AI インターフェースは、アイデンティティプロトコルを使用してその行動と要求に署名します。例えば、AI エージェントが MCP サーバーを呼び出してツールを使用する際、その分散型アイデンティティに紐づいたトークンや署名を含めることで、サーバーは呼び出しが承認されたエージェントからのものであることを検証できます。ブロックチェーンベースのアイデンティティシステム (Ethereum の ERC-725 や台帳にアンカーされた W3C DID など) は、この検証がトラストレスでグローバルに検証可能であることを保証します。**「AI ウォレット」**という新しい概念もこれに関連しています。これは本質的に、AI エージェントにアイデンティティにリンクされた暗号資産ウォレットを与え、キーの管理、サービスの支払い、または (不正行為に対して没収される可能性のある) 債券としてのトークンのステーキングを可能にするものです。例えば、ArcBlock は、*「AI エージェントにはウォレットが必要」*であり、分散環境で責任を持って活動するためには DID が必要であると議論しています。

要約すると、技術アーキテクチャは、AI エージェントを Web3 のファーストクラス市民として想定しており、それぞれがオンチェーンのアイデンティティとおそらくシステムへのステークを持ち、MCP のようなプロトコルを使用して対話します。これにより信頼のウェブが生まれます:スマートコントラクトは協力する前に AI のクレデンシャルを要求でき、ユーザーは特定のオンチェーン認証を満たす AI にのみタスクを委任することを選択できます。これは、AI の能力とブロックチェーンの信頼保証の融合です。

2.5 AI のためのトークン経済とインセンティブ

トークン化は Web3 の特徴であり、AI 統合の領域にも及びます。トークンを介して経済的インセンティブを導入することで、ネットワークは AI 開発者とエージェント自身の両方から望ましい行動を奨励できます。いくつかのパターンが現れています:

  • サービスへの支払い: AI モデルとサービスはオンチェーンで収益化できます。SingularityNET は、開発者が AI サービスを展開し、各呼び出しに対してネイティブトークン (AGIX) でユーザーに課金できるようにすることで、これを先駆けました。MCP が有効になった未来では、あらゆる AI ツールやモデルがプラグアンドプレイのサービスとなり、その使用がトークンやマイクロペイメントを介して計測されることが想像できます。例えば、AI エージェントが MCP を介してサードパーティのビジョン API を使用する場合、サービスプロバイダーのスマートコントラクトにトークンを転送することで、自動的に支払いを処理できます。Fetch.ai も同様に、*「自律型経済エージェント」*がサービスやデータを取引する市場を構想しており、新しい Web3 LLM (ASI-1) は価値交換のために暗号資産トランザクションを統合すると考えられます。

  • ステーキングと評判: 品質と信頼性を保証するために、一部のプロジェクトでは開発者やエージェントにトークンのステーキングを要求します。例えば、DeMCP プロジェクト (分散型 MCP サーバーマーケットプレイス) は、有用な MCP サーバーを作成した開発者に報酬を与えるためにトークンインセンティブを使用し、サーバーのセキュリティへのコミットメントの証としてトークンをステークさせることを計画しています。評判もトークンに結びつけられる可能性があります。例えば、一貫して優れた