メインコンテンツまでスキップ

見えない税金:AI はどのようにブロックチェーンの透明性を搾取しているのか

· 約 15 分
Dora Noda
Software Engineer

世界中の AI システムは、毎秒、公開されているテラバイト規模のブロックチェーンデータ(取引履歴、スマートコントラクトのインタラクション、ウォレットの挙動、DeFi プロトコルのフロー)を収集し、この生情報を数億ドル規模のインテリジェンス製品へと変換しています。皮肉なことに、Web3 の基盤である透明性とオープンデータへのコミットメントが、AI 企業がガス代を一切支払うことなく、その見返りとして膨大な価値を抽出することを可能にするメカニズムそのものになっています。

これは AI が暗号資産エコシステムに課している「見えない税金」であり、ほとんどの開発者がまだ認識していない方法で非中央集権化の経済学を再構築しています。

非対称な抽出の問題

パブリックブロックチェーンは、シンプルな前提に基づいて運営されています。それは、すべてのトランザクション、すべてのスマートコントラクトの呼び出し、すべてのトークン転送が、関心を持つすべての人に公開されているということです。この透明性は、トラストレスな検証とコミュニティによる監視を可能にするために設計されました。しかし、AI 企業は、初期のサイファーパンクたちが決して予想しなかったことを発見しました。このオープンデータは、数十億ドルの価値がある機械学習モデルにとって、完璧なトレーニングの場でもあるということです。

その規模を考えてみてください。主要なオンチェーン分析プラットフォームである Nansen は、5 億件以上のウォレットアドレスに行動パターンをラベル付けしています。Messari は DeFi エコシステム全体で AI を活用したセンチメント分析を提供しています。Chainalysis や Elliptic は、ブロックチェーンの監視において数十億ドル規模のビジネスを構築しました。これらの企業、およびそれらがトレーニングする AI モデルは、ユーザーやプロトコルが自らの取引手数料と計算リソースを通じて生成したデータから、計り知れない価値を抽出しています。

数字が物語っています。ブロックチェーン AI 市場は 2024 年の 5 億 7,000 万ドルから 2025 年には 7 億ドルへと成長し、2029 年までには 23% 以上の年平均成長率(CAGR)で 18 億 8,000 万ドルに達すると予測されています。一方、AI 主導のウェブスクレイピング市場は 2035 年までに 43 億 7,000 万ドルに達する見込みです。この成長の多くは、抽出者が無料で入手できる、自由にアクセス可能なブロックチェーンデータによって支えられています。

AI が実際に Web3 から奪っているもの

価値の抽出は、ほとんどの暗号資産ユーザーが目にすることのない複数の次元で行われています。

トランザクションパターンのインテリジェンス: Uniswap でのスワップ、GMX でのレバレッジ調整、OpenSea での NFT 入札のすべてが、AI モデルが市場の動きを予測するために使用する行動データセットに貢献しています。分析会社が特定のトークンを蓄積している「スマートマネー」ウォレットを特定するとき、彼らはユーザーがガス代を支払って作成した集合的な取引履歴から導き出されたインサイトを収益化しているのです。

DeFi プロトコルのダイナミクス: プロトコルの TVL の変化、清算パターン、イールドファーミング戦略に基づいてトレーニングされた機械学習モデルは、機関投資家が多額の費用を払ってアクセスする予測ツールを作成します。DeFiLlama は、ほぼすべての関連チェーンにわたる包括的なデータを集約していますが、そのデータは、生成するために数十億ドルのプロトコル開発費用がかかったものです。

スマートコントラクトの挙動: AI システムはスマートコントラクトのインタラクションを分析して、脆弱性の特定、ガス代最適化の機会の予測、およびユーザーの行動パターンのモデリングを行います。このインテリジェンスは、一般ユーザーから直接価値を抽出する MEV(最大抽出価値)戦略に活用されます。

ウォレットのクラスタリングとアイデンティティ: ブロックチェーンが偽名性を持っているにもかかわらず、AI を活用したエンティティ解決により、アドレスをリンクさせ、機関投資家を特定し、トレーディング企業やコンプライアンス企業が広く収益化するプロファイルデータベースを作成することができます。

トークノミクスのパラドックス

ここに、暗号資産の信奉者にとって哲学的に不快な事実があります。ブロックチェーンネットワークは、ネットワークに貢献する参加者のために価値を獲得することを目的とした、慎重に設計されたインセンティブ構造である「トークノミクス」に依存しています。バリデーターはトークンをステークして報酬を得ます。リクイディティプロバイダーは資産を預けて手数料を得ます。ユーザーはガス代を支払い、トラストレスな取引のユーティリティを受け取ります。

しかし、AI によるデータの抽出は、これらの経済的なループの完全に外側に位置しています。AI 企業がトレーニングモデルを構築するためにイーサリアムの数年分の取引履歴をスクレイピングしても、ネットワークのセキュリティ予算には一切貢献しません。分析プラットフォームが自社製品を動かすために Solana のすべてのブロックをインデックス化しても、バリデーターやステーカーに SOL が還元されることはありません。

これにより、大規模なフリーライダー問題が発生します。AI システムは、トークン保有者とバリデーターが維持しているセキュリティ、データの完全性、ネットワーク効果の恩恵を享受していますが、それらを維持するために設計された経済的メカニズムには一切参加していません。これは、近所にショッピングモールを建設し、税金で賄われている道路、警察、インフラの恩恵を受けながら、固定資産税の支払いを拒否するようなものです。

この非対称性は時間の経過とともに拡大します。AI モデルがブロックチェーンデータからアルファ(超過収益)を抽出する精度を高めるにつれて、情報の乏しい参加者から価値を抽出する取引戦略が生み出されます。ブロックチェーンを信頼できるものにしている透明性そのものが、それを作成したコミュニティに対して使われる武器となってしまうのです。

法的空白と著作権の問題

従来の知的財産権の枠組みは、ここではほとんど保護を提供しません。取引記録を「所有」しているのは誰でしょうか? 送信者でしょうか? 受信者でしょうか? それを処理したバリデータでしょうか? あるいは、それを促進したプロトコルでしょうか?

法的に言えば、その答えは通常「誰でもない」、あるいは「全員」であり、それは同じことを意味します。写真や記事、ソフトウェアコードとは異なり、ブロックチェーンのトランザクションは、創造的な意図を表現する単一の著者によって作成されたものではありません。それらは運用記録であり、一般的に運用記録は著作権保護の対象にはなりません。

これは、伝統的なテクノロジー業界で繰り広げられている争いとは対照的です。ニューヨーク・タイムズは、許可なくニュース記事でトレーニングを行ったとして OpenAI と Microsoft を提訴しました。Reddit は、モデルのトレーニングにコンテンツを提供するために Google と有料契約を結びました。Stack Overflow は、開発者の知識を AI サービスに統合するために OpenAI と提携しました。これらのコンテンツ制作者は、ブロックチェーンのデータ生成者が単純に持ち合わせていない法的レバレッジを持っています。

一部のプロジェクトは、ブロックチェーンベースのソリューションを構築しようとしています。Fox Corp. は、オンラインコンテンツの使用を追跡するためのプラットフォーム Verify を立ち上げました。IBIS フレームワークは、AI 著作権コンプライアンスのためのデータセットメタデータレジストリ(Dataset Metadata Registries)を提案しています。しかし、これらのシステムにはオプトインによる参加と強制メカニズムが必要であり、すでに公開されているブロックチェーンデータには存在しません。

新興のソリューション:データ主権プロジェクト

暗号資産のエコシステムはこの問題を完全に見逃してきたわけではありません。いくつかのプロジェクトは、ユーザーが自分のデータを制御し、収益化できるように特別に設計されたインフラストラクチャを構築しています。

Vana は、MIT 発の技術を通じて 100 万人以上の貢献者からのデータを処理する主要なソリューションとして浮上しています。ユーザーはデータを暗号化されたデジタルウォレットにアップロードし、自分の貢献によってトレーニングされた AI モデルの比例的な所有権を維持します。モデルが使用されるたびに、貢献者はそのデータがトレーニングにどれだけ役立ったかに基づいて報酬を受け取ります。

Ocean Protocol は Ethereum 上で分散型データ交換を運営しており、消費者とデータプロバイダーはプライバシーの懸念なしにデータセットを取引できます。プロトコルのネイティブトークンは、データアセットのオープンマーケットプレイスとして機能する中での取引を促進します。

Sahara は、データセット、モデル、エージェントを属性、バージョン管理、ライセンス、アクセスルールとともにメタデータでエンコードする「AI ネイティブブロックチェーン」として位置付けられており、これらすべてが時間の経過とともに監査可能な請求のためにオンチェーンで固定されています。

CARV Protocol や同様のプロジェクトは、ユーザーが自分のデータの所有者になり、「データのトークン化」を通じてリターンを得ることを可能にし、現在のブロックチェーンデータ抽出に欠けている経済的ループを生み出しています。

これらのソリューションは共通のアーキテクチャを共有しています。アイデンティティ、許可、およびライセンスはオンチェーンで固定され、重い計算は検証可能なプロトコルの下でオフチェーンで行われます。これは、ブロックチェーン上でトランスフォーマーの推論を実行することはできないが、誰が何を貢献したかを追跡し、公正な報酬を確保することはできるという現実的な認識に基づいています。

インフラストラクチャのギャップ

より深い問題はアーキテクチャにあります。パブリックブロックチェーンは、アクセス制御ではなく、検証のために設計されました。すべてのフルノードはチェーンの履歴の完全なコピーを保存します。すべてのブロックエクスプローラーはその履歴を閲覧可能にします。すべての RPC エンドポイントはデータへのプログラム的なアクセスを提供します。

一度起こったことを元に戻すことはできません。たとえ明日のブロックチェーンの設計にデータライセンスメカニズムが組み込まれたとしても、既存のテラバイト級の Ethereum、Bitcoin、Solana のトランザクション履歴は永久にアクセス可能なままです。十分なストレージと計算能力を持つ AI 企業は、コミュニティがどのような新しいプロトコルを開発したとしても、このデータでトレーニングを行うことができます。

これは、ブロックチェーンの構築者に興味深い戦略的計算を迫ります。将来のチェーンは、トランザクションの詳細がデフォルトで暗号化され、コンプライアンスや分析のために選択的に開示されるプライバシー保護のデフォルトを実装するかもしれません。しかし、これはそもそもブロックチェーンを信頼に足るものにした透明性の価値と直接衝突します。

一部のプロジェクトは中間地点を模索しています。Oasis Network や同様の機密計算プラットフォームは、TEE(Trusted Execution Environments)を使用して、オペレーターに公開することなく暗号化されたデータを処理します。ゼロ知識証明(Zero-knowledge proofs)は、トランザクションの詳細を明らかにすることなくトランザクションの有効性を検証できます。これらの技術は理論的にはデータ抽出が技術的に困難なブロックチェーンを作成できますが、それはクリプトの価値提案を定義するオープンな監査可能性を犠牲にすることになります。

これがトークノミクス設計に意味すること

先見の明のあるプロトコル設計者は、最初からデータ経済学をトークノミクスに組み込み始めています。

「データ・シャープレイ値(Data Shapley Value)」という概念(各データポイントがモデルのパフォーマンスにどれだけ寄与するかを測定する手法)をオンチェーンで実装し、公正な報酬メカニズムを作成することができます。プロトコルは、AI システムがアクセスするデータに比例してトークンをステーキングすることを要求し、抽出的な行動に対してはスラッシング条件を課すことができます。

さらに急進的なことに、一部の理論家は、ブロックチェーンネットワークがその集約データを共同所有資産として扱うべきであり、商業的利用にはバリデータ、ステーカー、およびアクティブユーザーに還元されるライセンス料が必要であると提案しています。これにより、「目に見えない税金」が明示的な収益源に変わることになります。

課題は重要です。法域を越えた強制はほぼ不可能です。特定のデータポイントへの価値の割り当ては、依然として計算コストが高くつきます。そして、いかなるアクセス制限も、そもそもブロックチェーンデータに分析的価値を与えているオープンなエコシステムを断片化させるリスクがあります。

迫りくる清算

Web3 のオープンデータ哲学と AI の搾取的経済学との間の緊張は、消え去るどころか激化しています。AI モデルがより強力になり、データの価値が高まるにつれて、経済的な非対称性は拡大する一方です。

分散型 AI スタートアップへの資金調達額は前年比 162 % 増の 87.8 億ドルに急増し、Web3 AI プロジェクトはブロックチェーン VC 投資総額の 11 % を占めています。これらのプロジェクトは、データ提供者が自らの貢献によって生み出された価値を共有できるシステムという、代替案を構築しようとするクリプトエコシステムの試みを象徴しています。

しかし、時間は刻一刻と過ぎています。日が経つにつれ、公開記録にはさらなる取引履歴が蓄積され、何も還元しない AI システムのための学習データが増え続けています。この搾取に対処できないプロトコルは、自らのネットワーク効果が競合他社の製品を活性化させる一方で、自らのトークンホルダーがそのコストを負担することになるのを目の当たりにするでしょう。

「見えない税金」は目に見えないかもしれませんが、その影響はますます現実味を帯びてきています。問題はクリプトがこれに対処するかどうかではなく、搾取が AI 経済において永続的なインフラとなる前に対処できるかどうかです。


AI とブロックチェーンの融合は、データの所有権、価値の獲得、そしてオープンシステムの経済学について根本的な問いを投げかけています。この状況を切り拓こうとするビルダーにとって、インフラストラクチャの選択はかつてないほど重要になっています。BlockEden.xyz は、次世代のデータ意識の高い Web3 アプリケーションを構築する開発者に 信頼性の高いブロックチェーン API アクセス を提供します。