AI スマートコントラクト監査の軍拡競争:特化型セキュリティ AI が DeFi 攻撃の 92 % を検出
1 コントラクトあたり $ 1.22 で、AI エージェントはスマートコントラクトをスキャンして悪用可能な脆弱性を特定できるようになりました。そして、攻撃側のエクスプロイト能力は 1.3 ヶ月ごとに倍増しています。分散型金融(DeFi)における、最も重大な軍拡競争へようこそ。
2026 年 2 月、OpenAI と Paradigm は共同で、AI エージェントがスマートコントラクトの脆弱性をいかに効果的に検出し、修正し、悪用するかを評価するオープンソースのベンチマーク EVMbench をリリースしました。その結果は驚くべきものでした。GPT-5.3-Codex は、既知の脆弱なコントラクトの 72.2 % の悪用に成功しました。これは、わずか 6 ヶ月前の 31.9 % から急上昇しています。一方、特化型の AI セキュリティエージェントは、9,680 万ドル相当の被害を出した 90 の DeFi 攻撃事例のうち 92 % で脆弱性を検出しました。これは、ベース ラインとなる GPT-5.1 コーディングエージェントの検出率 34 % の約 3 倍に相当します。
この意味するところは明白です。DeFi セキュリティの戦いは AI 対 AI の戦いとなっており、経済的には圧倒的に攻撃側に有利な状況となっています。少なくとも現時点では。
コードだけでは解決できない 170 億ドルの問題
Chainalysis によると、2025 年に仮想通貨業界はハッキングや攻撃により 34.1 億ドルを失いました。しかし、この数字は真の被害を過小評価しています。詐欺、不正、ソーシャルエンジニアリングを含めると、総損失額は推定 170 億ドルにまで膨れ上がります。北朝鮮のハッカー集団であるラザルス(Lazarus Group)だけでも 20.2 億ドルを盗み出し、前年比 51 % 増を記録、累計被害額は 67.5 億ドルに達しました。
最も壊滅的な単一事件である 2025 年 2 月の Bybit 取引所ハック(14.6 億ドルの被害)は、スマートコントラクトの脆弱性によるものではありませんでした。マルウェアによってプラットフォームが不正な取引を承認するように欺かれたのです。CoinDesk が報じたように、仮想通貨史上最悪のハッキングの年は「スマートコントラクトの問題ではなく、人の問題」でした。
この区別は重要です。なぜなら、2 つの並行する脅威の側面が明らかになるからです。スマートコントラクトの脆弱性は依然として危険ですが、ソーシャルエンジニアリング、フィッシング、なりすまし詐欺はそれを遥かに上回るスピードで増加しています。AI を活用した詐欺は 2025 年に従来の手法よりも 4.5 倍高い利益を上げ、なりすまし詐欺は前年比 1,400 % 急増しました。AI 生成のフィッシングメールは、人間が作成したメッセージよりも 4 倍高いクリック率を記録しています。
このような背景から、もはや問題は AI がブロックチェーンセキュリティを変革するかどうかではありません。防御側の AI が攻撃側のスピードに合わせて拡張できるかどうかです。
EVMbench:その差を数値化したベンチマーク
OpenAI と Paradigm は、Tempo ブロックチェーンのセキュリティ監査プロセスのいくつかのシナリオを含む、40 の専門的な監査から抽出された 117 の厳選された脆弱性を中心に EVMbench を設計しました。このベンチマークは、脆弱性の検出、修正、およびエンドツーエンドでの悪用の 3 つの能力をテストします。
結果はパラドックスを浮き彫りにしました。AI エージェントは防御よりも攻撃において遥かに優れています。
悪用モードでは、GPT-5.3-Codex は 72.2 % を記録し、2025 年半ばの GPT-5 の結果である 31.9 % の 2 倍以上となりました。しかし、検出および修正タスクではパフォーマンスが急激に低下しました。検出モ ードでは、エージェントはコードベースを徹底的に監査するのではなく、単一の脆弱性を見つけた後に停止する傾向がありました。修正モードでは、微細な脆弱性を除去しつつ、コントラクトの完全な機能を維持することは困難であることが証明されました。
OpenZeppelin は独自に EVMbench の手法を監査し、重大な欠陥を発見しました。少なくとも 4 つの無効な「高深刻度」の指摘、トレーニングデータの汚染に関する懸念、および報告されたパフォーマンスを誇張する可能性のある手法上のギャップです。このベンチマークは方向性を示す指標としては価値がありますが、セキュリティコミュニティはそのスコアを本番環境レベルの評価として扱うことには注意を促しています。
別途、Anthropic のレッドチームは、Claude Opus 4.5、Claude Sonnet 4.5、および GPT-5 が共同で、モデルの知識カットオフ以降に侵害されたコントラクトに対して 460 万ドル相当のエクスプロイトを開発したことを実証しました。これは、これらのエージェントが既知の攻撃を再現するだけでなく、斬新な脆弱性を特定できることを証明しています。
AI 駆動型攻撃の非対称な経済学
研究から得られた最も衝撃的な発見は、技術的なものではなく経済的なものです。AI を駆使したエクスプロイトスキャンのコストが 1 コントラクトあたり約 $ 1.22 であるため、イーサリアム上のすべて のスマートコントラクトを調査するコストは、高度な攻撃者にとって「小銭」程度のレベルに近づいています。
計算すると、構造的な不均衡が明らかになります。攻撃者は、スキャンしたコントラクトの脆弱性率が 0.1 % であると仮定した場合、エクスプロイトの価値がわずか 60,000 を必要とします。この 10 対 1 の非対称性は、経済性が自然に攻撃側に有利であることを意味します。
従来のスマートコントラクト監査がこの問題をさらに複雑にしています。単純なロジックの小規模なコントラクトでも手動監査には 25,000 の費用がかかり、クロスチェーンコンポーネントや大規模なコードベースを持つ複雑なプロトコルでは 250,000 を超えることもあります。これらの監査には数週間から数ヶ月かかります。1 コントラクトあたり $ 1.22 で動作する AI エージェントは、人間のチームが 1 つをレビューする間に数千のコントラクトをスキャンできます。
エクスプロイト能力の成長曲線により、この差は時間の経過とともに悪化します。攻撃側の AI 能力が 1.3 ヶ月ごとに倍増しているため、前四半期の AI エージェントに対して安全だったプロトコルであっても、次四半期のモデルに対しては脆弱になる可能性があります。
特化型セキュリティ AI:92 % 検出の突破口
すべての AI エージェントが等しく機能するわけではありません。特化型セキュリティエージェントが達成した 92 % の検出率(90 の DeFi コントラクトにわたる 9,680 万ドルの実被害額をカバー)は、汎用的な GPT-5.1 コーディングエージェントの 34 %(750 万ドル)を圧倒しました。
その違いは、より強力な基盤モデルによるものではありませんでした。それは、同じ基盤モデルの上に重ねられたドメイン固有のセキュリティ手法によるものです。特化型エージェントは、プロトコル固有の不変量、既知の攻撃パターン(リエントランシー、フラッシュローン操作、オラクル悪用)、および汎用モデルが見落とす体系的なカバレッジ要件を組み込んでいます。
この発見は実用的な教訓をもたらします。汎用 AI 監査と専門 AI 監査の差はわずかなものではありません。検出率で約 3 倍、捉えた脆弱性の金額価値で 13 倍の差があります。セキュリティを汎用 AI ツールに依存しているプロトコルは、誤った安心感を持って運用していることになります。
新たなベストプラクティスはハイブリッドモデルです。DEV Community のテクニカル分析が述べているように、「2026 年の監査は完全自動化ではなく、AI 分析に導かれた人間の専門家が、半分の時間で 10 倍の範囲をカバーするもの」になります。専門の監査人は AI を使用して候補となる脆弱性を大規模にフラグ立てし、その後、人間の判断を適用して発見内容を検証し、ビジネスロジックのリスクを評価し、修正を検証します。
2026 年版 OWASP スマートコントラクト・トップ 10
セキュリティ環境は急速に進化しており、OWASP は 2026 年版のスマートコントラクト・トップ 10 を更新しました。このリストは変化する脅威モデルを反映しています:
- アクセス制御の脆弱性は依然として主要なカテゴリであり、高額なエクスプロイトの大部分を占めています。
- オラクル操作とフラッシュローン攻撃は、外部の価格フィードに依存する DeFi プロトコルを脅かし続けています。
- クロスチェーンブリッジの弱点が最大の懸念事項として浮上しており、ブリッジのハッキングによる累積損失は数十億ドルに達しています。
- ガバナンスメカニズムのロジックエラーは、DAO がより大規模なトレジャリーを管理するようになるにつれて、ターゲットにされることが増えています。
特に、2026 年のリストには「AI 特有の攻撃対象領域」という新しいカテゴリが追加されました。これは、自動取引、リスク管理、またはガバナンスに AI エージェントを統合しているプロトコルが、2 年前には存在しなかったプロンプトインジェクション、モデル操作、および同期行動のリスクに直面していることを認めるものです。
DeFi エコシステムにとっての意味
攻撃側と防御側の AI による軍拡競争は、いくつかの実行可能な示唆を生み出します。
プロトコル開発者へ: 「一度監査してデプロイすれば終わり」という考え方はもはや通用しません。特化型 AI エージェントによる継続的な監視と、定期的な人間の専門家によるレビューを組み合わせることが、最低限必要なセキュリティ体制になりつつあります。バグバウンティプログラムは、攻撃者が同じ脆弱性を見つける前に防御側の研究者を惹きつけるため、エクスプロイトの全価値に近づける必要があります。
投資家とユーザーへ: AI で強化されたセキュリティに投資するプロトコルと、従来の監査のみに頼るプロトコルとの差は広がっていくでしょう。セキュリティへの支出は、プロトコルの耐久性を示す先行指標になりつつあります。
エコシステム全体へ: 1 コントラクトあたり $ 1.22 のスキャンコストは、最終的にすべてのデプロイされたスマートコントラクトが、攻撃側と防御側の両方の AI エージェントによって継続的に調査されることを意味します。問題は、どちらの側が先に包 括的なカバレッジを構築するかです。
AI スマートコントラクト監査の軍拡競争は、将来のシナリオではありません。それは 2026 年におけるブロックチェーンセキュリティの現在の現実であり、最も早く適応したプロトコルこそが、混乱が収まった後も生き残っているプロトコルとなるでしょう。
ブロックチェーンインフラが AI 駆動のセキュリティツールと共に進化する中で、信頼性の高いノードアクセスと API サービスは、オンチェーン資産の監視と保護のための重要な基盤となります。BlockEden.xyz は、主要なチェーンにわたってエンタープライズグレードの RPC および API サービスを提供し、開発者やセキュリティチームが、急速に変化する脅威環境の要求に対応できるよう設計されたインフラ上での構築を支援します。