ИИ-агенты только что взломали смарт-контракты на сумму $550 млн — и это стоило всего $1,22 за атаку

10 марта 2026 г. · 8 мин чтения

Software Engineer

Всего за 1,22 $ — меньше стоимости чашки кофе — ИИ-агент теперь может просканировать смарт-контракт, выявить его уязвимость и создать рабочий эксплойт. Это не теоретический сценарий из технического документа по безопасности. Это зафиксированный результат SCONE-bench — первого бенчмарка, оценивающего способность ИИ-агентов эксплуатировать реальные смарт-контракты, выпущенного Anthropic и исследователями MATS Fellows в конце 2025 года. Из 405 контрактов, которые были фактически взломаны в период с 2020 по 2025 год, десять передовых моделей ИИ коллективно создали готовые эксплойты для 207 из них, что принесло 550,1 миллиона долларов в виде симулированных украденных средств.

Последствия выходят далеко за пределы исследовательской лаборатории. В протоколах DeFi в совокупности заблокировано более 100 миллиардов долларов (TVL). Если возможности эксплойтов будут удваиваться каждые 1,3 месяца — согласно траектории данных Anthropic — предположения о безопасности, лежащие в основе ончейн-финансов, приближаются к точке перегиба.

Внутри SCONE-bench: первый бенчмарк для эксплойтов, выраженный в долларах

Традиционные бенчмарки безопасности смарт-контрактов измеряют, может ли ИИ обнаружить категорию уязвимости — повторный вход (reentrancy), манипуляции с оракулами, недостатки контроля доступа. SCONE-bench использует фундаментально иной подход.

Созданный на основе репозитория DefiHackLabs, он включает 405 контрактов в сетях Ethereum, BNB Smart Chain и Base, которые были фактически взломаны в реальных условиях в период с 2020 по 2025 год. Каждый тест запускается внутри Docker-контейнера с локальным блокчейном, форкнутым на номере блока оригинального эксплойта, что обеспечивает воспроизводимость условий.

Бенчмарк не требует от моделей классифицировать тип бага. Он требует от них украсть деньги.

Агенты взаимодействуют с песочницей через протокол Model Context Protocol (MCP), который дает им доступ к инструментам для чтения исходного кода контрактов, запроса состояния ончейн и отправки транзакций. Метрика оценки проста: общая долларовая стоимость симулированных украденных средств. Эта система оценки, выраженная в долларах, делает результаты напрямую сопоставимыми с экономикой реальных эксплойтов.

Когда исследователи задействовали десять ведущих моделей ИИ — включая Claude Opus 4.5, Claude Sonnet 4.5, GPT-5 и другие — результаты оказались отрезвляющими. В совокупности модели эксплуатировали 51,11 % контрактов бенчмарка.

Только Claude Opus 4.5 взломала 17 контрактов, которые были скомпрометированы уже после даты отсечения ее знаний в марте 2025 года, что составило 4,5 миллиона долларов в симулированном выражении. Вместе с Claude Sonnet 4.5 и GPT-5 сумма эксплойтов после отсечки достигла 4,6 миллиона долларов — это доказывает, что модели могут обнаруживать и эксплуатировать уязвимости, которые они никогда не видели во время обучения.

Экономика атак за 1,22 $, которая должна насторожить каждый протокол

Экономика эксплойтов на базе ИИ перешагнула критический порог. Тестирование GPT-5 на 2 849 недавно развернутых контрактах в BNB Smart Chain обошлось в общей сложности в 3 476 $— в среднем 1,22$ за контракт. При такой цене злоумышленник мог бы сканировать каждый новый контракт, развернутый в крупной сети, за сущие копейки.

Рост эффективности ускоряется. Анализируя четыре поколения моделей Claude, компания Anthropic обнаружила, что медианное количество токенов, необходимых для создания успешного эксплойта, сократилось на 70,2 %. На практике сегодня злоумышленник получает в 3,4 раза больше успешных эксплойтов при том же бюджете на вычисления, что и полгода назад.

Возможно, самое тревожное: когда исследователи направили GPT-5 и Claude Sonnet 4.5 на те самые 2 849 недавно развернутых контрактов — ни один из которых не имел известных уязвимостей — оба агента независимо друг от друга обнаружили два ранее неизвестных бага нулевого дня и разработали соответствующие стратегии атаки.

Потенциальная стоимость эксплойтов для этих уязвимостей нулевого дня составила 3 694 $. Незначительно по меркам DeFi, но сам принцип имеет колоссальное значение: ИИ-агенты не просто повторяют известные атаки. Они находят новые.

За последний год потенциальный доход от эксплойтов в подмножестве задач бенчмарка за 2025 год удваивался примерно каждые 1,3 месяца. Если эта траектория сохранится, окно между развертыванием контракта и способностью ИИ его взломать будет стремительно сокращаться.

От бенчмарка к реальности: инцидент с Moonwell

Переход от исследовательских бенчмарков к реальным последствиям произошел 17 февраля 2026 года, когда DeFi-протокол кредитования Moonwell сообщил о нарушении безопасности, приведшем к убыткам в размере около 1,78 миллиона долларов. Уязвимость была вызвана неправильной настройкой оракула в коде, сгенерированном ИИ — а именно, в коде, написанном в соавторстве с Claude Opus 4.6.

Техническая ошибка была обманчиво простой. Вместо того чтобы умножить обменный курс cbETH/ETH на цену ETH/USD, сгенерированный ИИ код использовал чистый коэффициент обмена так, как будто он уже был выражен в долларах. В результате цена cbETH составила примерно 1,12 $вместо реальной стоимости около 2 200$ , что вызвало каскад быстрых ликвидаций.

Инцидент с Moonwell широко обсуждается как первый крупный эксплойт в DeFi, напрямую связанный с «vibe coding» — подходом к разработке, который в значительной степени опирается на код, созданный ИИ, при минимальном контроле со стороны человека. Это наглядно демонстрирует двойную угрозу: модели ИИ одновременно совершенствуются в поиске уязвимостей в существующих контрактах и создают новые при неосторожном использовании в разработке.

Гонка оборонительных вооружений: ИИ как щит, а не только меч

Сообщество специалистов по безопасности не сидело сложа руки. В феврале 2026 года компания Cecuro, специализирующаяся на безопасности смарт-контрактов, выпустила бенчмарк, показывающий, что специализированный ИИ-агент безопасности обнаружил уязвимости в 92% из 90 взломанных DeFi-контрактов, что охватывает 96,8 млн долларов стоимости эксплойтов. Для сравнения, базовый агент для написания кода GPT-5.1, работающий на той же базовой модели, обнаружил лишь 34% уязвимостей на сумму 7,5 млн долларов. Разрыв возник не из-за чистых возможностей ИИ, а из-за наслоения специфической для предметной области методологии безопасности.

OpenAI и Paradigm совместно запустили EVMbench — фреймворк для тестирования, созданный на основе 120 тщательно отобранных уязвимостей из 40 профессиональных аудитов. Разработанный для измерения того, насколько хорошо ИИ может понимать и защищать смарт-контракты, EVMbench опирается на открытые конкурсы по аудиту и собственный процесс аудита Tempo от Paradigm, обеспечивая стандартизированный способ оценки защитных возможностей ИИ.

Сама компания Anthropic открыла исходный код SCONE-bench, рассудив, что у злоумышленников уже есть сильные финансовые стимулы для создания проприетарных инструментов для реализации эксплойтов. Сокрытие оборонительных бенчмарков только помешало бы легитимным исследователям безопасности. Делая бенчмарк по эксплуатации публичным, компания стремится позволить всей экосистеме безопасности тестировать, итерировать и создавать более надежную защиту.

Формирующаяся модель ясна: универсальные модели ИИ опасны при нацеливании на смарт-контракты, но специализированные агенты безопасности — обученные с использованием экспертных знаний в предметной области, знаний о формальной верификации и специфических инструментов безопасности — значительно превосходят их в обороне. Идет гонка между наступательными возможностями, которые улучшаются автоматически с каждым новым поколением моделей, и оборонительными возможностями, требующими осознанного проектирования под руководством экспертов.

Что командам протоколов нужно делать сейчас

Результаты SCONE-bench и инцидент с Moonwell вместе рисуют четкую картину того, куда движется безопасность смарт-контрактов. Несколько стратегий защиты становятся обязательными:

Непрерывный аудит на базе ИИ: Статических разовых аудитов недостаточно против угроз, которые развиваются с каждым выпуском новой модели. Протоколам необходим постоянный мониторинг безопасности с помощью ИИ, соответствующий темпам совершенствования наступательных возможностей.
Многослойная верификация кода, созданного ИИ: Эксплойт Moonwell демонстрирует, что код на Solidity, написанный ИИ, требует такой же — или даже большей — проверки, как и код, написанный человеком. Автоматизированная проверка оракулов, формальная верификация и состязательное тестирование должны стать стандартом для любого пути кода, затрагивающего ценообразование активов.
Экономическое моделирование стоимости атак: При стоимости сканирования контракта в 1,22 доллара цена эксплуатации теперь намного ниже минимального порога, который покрывает большинство программ баг-баунти. Протоколы должны пересмотреть свою экономику безопасности, гарантируя, что суммы вознаграждений и страховое покрытие отражают новую структуру затрат.
Состязательный бенчмаркинг: Команды должны прогонять свои контракты через SCONE-bench и аналогичные фреймворки перед развертыванием, рассматривая тестирование на эксплуатацию с помощью ИИ как часть стандартного конвейера развертывания.
Эшелонированная защита со специализированными агентами: ИИ общего назначения не может заменить специализированных агентов безопасности. Доля обнаружения 92% у специализированной системы Cecuro против 34% у базовой GPT-5.1 подчеркивает важность инструментов безопасности, специфичных для конкретной области.

Точка перегиба для ончейн-безопасности

Данные однозначны. Возможности ИИ по эксплуатации смарт-контрактов растут экспоненциально — потенциал дохода удваивается каждые 1,3 месяца, в то время как стоимость одной атаки снижается с каждым поколением моделей. 550 млн долларов, похищенных в симуляции сегодня, предвещают то, что может произойти в мейннете завтра, если защитные меры не будут поспевать.

Но те же возможности ИИ, которые позволяют совершать эксплойты, также лежат в основе самых мощных инструментов защиты, которые когда-либо были у индустрии. Вопрос не в том, изменит ли ИИ безопасность смарт-контрактов. Он уже изменил. Вопрос в том, примут ли разработчики, аудиторы и протоколы, развертывающие более 100 млрд долларов в ончейн-активах, защиту на базе ИИ с той же настойчивостью, с которой злоумышленники осваивают нападение на базе ИИ.

Скорость удвоения в 1,3 месяца оставляет мало места для самоуспокоения.

BlockEden.xyz предоставляет инфраструктуру блокчейн-API корпоративного уровня в более чем 20 сетях, помогая разработчикам создавать проекты на надежном фундаменте с надежным доступом к узлам. Изучите наш маркетплейс API, чтобы обеспечить работу ваших dApps с помощью инфраструктуры, созданной на долгосрочную перспективу.

Share on Twitter

API Marketplace Featured

Внутри SCONE-bench: первый бенчмарк для эксплойтов, выраженный в долларах​

Экономика атак за 1,22 $, которая должна насторожить каждый протокол​

От бенчмарка к реальности: инцидент с Moonwell​

Гонка оборонительных вооружений: ИИ как щит, а не только меч​

Что командам протоколов нужно делать сейчас​

Точка перегиба для ончейн-безопасности​