ИИ-агенты теперь могут обнаруживать 92% эксплойтов DeFi — но они также могут их создавать

2 апреля 2026 г. · 8 мин чтения

Software Engineer

Специализированный ИИ-агент только что обнаружил уязвимости, ставшие причиной потерь в размере $ 96,8 млн в сфере DeFi — выявив эксплойты, которые универсальный агент GPT-5.1 пропустил в 58 из 90 контрактов. Между тем, бенчмарк EVMbench от OpenAI и Paradigm показывает, что передовые модели теперь могут генерировать рабочие эксплойты для 71 % известных недостатков смарт-контрактов. Та же технология, которая защищает протоколы DeFi, может и атаковать их, и эта гонка вооружений ускоряется быстрее, чем осознает большинство команд.

Проблема на $ 3,4 млрд, которую аудиторы продолжают упускать

По данным Chainalysis, объем краж криптовалют в 2025 году достиг $3,4 млрд — и неприятная правда заключается в том, что многие взломанные контракты уже прошли профессиональный аудит. Только на взлом Bybit пришлось$ 1,4 млрд, в то время как такие протоколы, как Cetus ( $223 млн) и Balancer ($ 128 млн), пострадали от нарушений безопасности, несмотря на устоявшиеся практики защиты.

Проблема не в некомпетентности аудиторов. Она заключается в том, что люди-рецензенты сталкиваются с невозможной задачей масштабирования: общая заблокированная стоимость (TVL) в DeFi превысила $ 119 млрд, сложность кода растет, а поверхность атаки расширяется с каждым развертыванием нового протокола. Один аудитор, изучающий сложный протокол, может потратить недели на анализ взаимодействий между десятками контрактов и все равно упустить тот самый пограничный случай, который найдет решительный злоумышленник.

Именно этот пробел сейчас заполняют ИИ-агенты безопасности — и результаты первых бенчмарков указывают на фундаментальный сдвиг в том, как работает безопасность смарт-контрактов.

92 % уровень обнаружения Cecuro: что на самом деле значат эти цифры

В феврале 2026 года охранная ИИ-компания Cecuro выпустила бенчмарк с открытым исходным кодом, в котором протестировала своего специализированного агента безопасности на 90 реальных контрактах DeFi, эксплуатировавшихся в период с октября 2024 года по начало 2026 года. Результаты оказались поразительными.

Специализированный агент Cecuro выявил уязвимости в 92 % взломанных контрактов, обнаружив недостатки, связанные с подтвержденными потерями на сумму $96,8 млн. Для сравнения, базовый агент для написания кода на базе GPT-5.1 обнаружил только **34 % уязвимостей**, охватив потери лишь на$ 7,5 млн.

Разрыв в производительности в 2,7 раза — это не просто игра цифр. Он выявляет три критических режима отказа ИИ общего назначения применительно к безопасности смарт-контрактов:

1. Отсутствие верифицируемой обратной связи. Модели общего назначения выдают правдоподобно звучащий анализ, но не имеют механизма проверки того, является ли обнаруженная «уязвимость» реально эксплуатируемой. Агент Cecuro интегрирует специализированные фреймворки для тестирования, которые проверяют выводы в реальных средах выполнения.

2. Недостаточное систематическое покрытие. Агент GPT-5.1, анализирующий контракт, часто останавливается после выявления первой серьезной проблемы. Агент Cecuro реализует структурированные этапы проверки — анализ контроля доступа, проверки манипуляций с состоянием, обзор кросс-контрактных взаимодействий — обеспечивая комплексное покрытие.

3. Насыщение контекста. Сложные протоколы DeFi включают множество взаимосвязанных контрактов, зависимости от внешних оракулов и механизмы управления. Модели общего назначения упираются в ограничения контекста и начинают делать преждевременные выводы. Специализированные агенты используют специфические для DeFi эвристики, чтобы расставить приоритеты в наиболее важных взаимодействиях.

Cecuro опубликовала набор данных и систему оценки на GitHub, сохранив при этом полный код агента безопасности в секрете, чтобы предотвратить его использование в злонамеренных целях — ответственный подход к раскрытию информации, который позволяет отрасли проверять заявления, не вооружая при этом преступников.

EVMbench: OpenAI и Paradigm количественно оценивают рубежи безопасности ИИ

Бенчмарк Cecuro был не единственной крупной оценкой в начале 2026 года. В феврале OpenAI и Paradigm совместно выпустили EVMbench — бенчмарк, оценивающий ИИ-агентов по трем измерениям безопасности смарт-контрактов: обнаружение уязвимостей, исправление дефектного кода и эксплуатация известных слабых мест.

EVMbench опирается на 117 отобранных уязвимостей из 40 аудитов, полученных в основном в ходе открытых конкурсов по аудиту кода. Результаты рисуют неоднозначную картину:

Генерация эксплойтов: GPT-5.3-Codex, работающий через Codex CLI, достигает показателя 71,0 % — создавая рабочие эксплойты для почти трех четвертей известных уязвимостей. Это представляет собой резкое улучшение по сравнению с 33,3 % у GPT-5 и свидетельствует о том, что возможности создания эксплойтов стремительно растут с каждым новым поколением моделей.
Обнаружение: Агенты часто останавливаются после выявления одной проблемы вместо того, чтобы проводить исчерпывающий аудит всей кодовой базы, оставляя критические уязвимости незамеченными.
Исправление (патчинг): Поддержание полной функциональности контракта при одновременном устранении тонких уязвимостей оказывается сложной задачей — агенты часто вносят новые ошибки, исправляя старые.

Асимметрия показательна: ИИ легче ломать вещи, чем чинить их. Это отражает фундаментальную динамику в кибербезопасности, но в случае с ИИ-агентами разрыв увеличивается с беспрецедентной скоростью.

Гонка вооружений между нападением и защитой уже началась

Исследовательская группа Anthropic опубликовала результаты, показывающие, что передовые модели ИИ теперь могут автономно обнаруживать и эксплуатировать новые уязвимости нулевого дня в смарт-контрактах. При тестировании на контрактах, взломанных после даты отсечки знаний моделей (март 2025 года), такие модели, как Claude Opus 4.5 и GPT-5, коллективно сгенерировали эксплойты на сумму $ 4,6 млн в имитированных потерях.

Что еще более тревожно: и Claude Sonnet 4.5, и GPT-5 обнаружили две новые уязвимости нулевого дня с эксплойтами стоимостью $3 694 — доказательство того, что прибыльная автономная эксплуатация технически возможна. Стоимость? Всего **$ 1,22 за сканирование контракта**, при чистой прибыли в $ 109 за каждый успешно выявленный «нулевой день».

За последний год доход от эксплойтов передовых моделей в бенчмарк-задачах удваивался примерно каждые 1,3 месяца. Киберпреступник, располагающий бюджетом на вычисления в несколько сотен долларов, теперь может натравить ИИ-агента на тысячи контрактов, позволить ему просканировать их на наличие уязвимостей и сгенерировать рабочие эксплойты, не написав ни единой строчки кода.

Это создает насущную необходимость: если злоумышленники на базе ИИ могут дешево и автономно сканировать всю экосистему DeFi, защитникам нужны столь же мощные ИИ-инструменты, работающие непрерывно. Традиционная модель разовых аудитов перед развертыванием больше не является достаточной.

Специализированные решения против универсальных: Почему побеждает специализация

Бенчмарк Cecuro подчеркивает закономерность, возникающую в сфере безопасности ИИ: оптимизация под конкретную область обеспечивает 2–3-кратный прирост производительности по сравнению с моделями общего назначения. Это характерно не только для смарт-контрактов — аналогичная динамика наблюдается в медицинской визуализации, юридическом анализе и проверке кода, — но в мире DeFi ставки делают это различие экзистенциальным.

Несколько факторов объясняют, почему специализированные агенты безопасности превосходят универсальные модели:

Курирование обучающих данных. Агент Cecuro обучался на проверенных наборах данных об эксплойтах, а не просто на задачах по автодополнению кода. Он понимает специфические паттерны, которые приводят к атакам повторного входа (reentrancy), манипуляциям оракулами, эксплойтам быстрых займов (flash loans) и повышению привилегий — не как абстрактные концепции, а как конкретные программные шаблоны с известными путями реализации атак.

Структурированная методология проверки. Вместо анализа в свободной форме специализированные агенты внедряют систематические методологии аудита, аналогичные тем, которые используют такие фирмы, как Trail of Bits, OpenZeppelin и Certora. Каждый этап проверки охватывает определенные категории уязвимостей с соответствующей глубиной проработки.

Интеграция со средой выполнения. Специализированные агенты могут создавать форки состояния основной сети (mainnet), развертывать тестовые контракты и проверять эксплойты в симулированных средах. Универсальные модели анализируют код статически, упуская динамические взаимодействия, которые проявляются только во время выполнения.

Конкурентная среда стремительно развивается. AuditAgent от Nethermind уже был задействован в кейсах с UBS и LUKSO. Consensys Diligence запустила Chonky, сочетая ИИ-агентов с руководством экспертов-людей. Sherlock и Veritas Protocol предлагают инструменты автоматического скрининга. Консенсус, формирующийся в отрасли: гибридные подходы, сочетающие ИИ-скрининг с человеческим опытом, выявляют более 95% уязвимостей по сравнению с 60–70% при исключительно ручном аудите или 70–85% при аудите только с помощью ИИ.

Что это значит для команд DeFi-протоколов

Последствия для любой команды, развертывающей или поддерживающей смарт-контракты DeFi, значительны:

Непрерывный мониторинг становится обязательным. Разовые аудиты перед развертыванием необходимы, но недостаточны. ИИ-агенты, сканирующие уязвимости в режиме 24/7 и интегрированные с системами мониторинга, которые могут приостанавливать работу контрактов при обнаружении угроз, станут стандартной инфраструктурой.

Стоимость аудита снижается. Аудиты с использованием ИИ уже в 10 раз быстрее чисто ручных проверок. По мере созревания специализированных инструментов комплексная проверка безопасности станет доступной для небольших протоколов, которые ранее не могли позволить себе топовых аудиторов.

Преимущество защитника реально, но ограничено во времени. Специализированные агенты безопасности в настоящее время превосходят ИИ общего назначения в защите. Но стремительное улучшение возможностей передовых моделей по поиску эксплойтов (удвоение каждые 1,3 месяца) означает, что окно для создания оборонительной инфраструктуры закрывается.

Открытые бенчмарки ускоряют развитие всей отрасли. Как набор данных Cecuro с открытым исходным кодом, так и EVMbench от OpenAI/Paradigm позволяют любой команде оценивать и улучшать свои инструменты безопасности на реальных примерах эксплойтов. Протоколы, которые не тестируют свою защиту на соответствие этим эталонам, безнадежно отстают.

Будущее: ИИ-аудиторы как инфраструктура

Смарт-контракты регулярно обеспечивают безопасность криптоактивов с открытым исходным кодом на сумму более 100 миллиардов долларов. Сближение возможностей ИИ-атак и ИИ-защиты превращает ландшафт безопасности из периодического консалтингового взаимодействия в требование к непрерывной инфраструктуре.

Данные бенчмарка Cecuro, EVMbench и наступательных исследований Anthropic указывают на один и тот же вывод: будущее безопасности смарт-контрактов не за человеком или ИИ по отдельности — оно за управляемыми людьми ИИ-системами, использующими специализированных агентов безопасности, которые понимают DeFi на глубоком экспертном уровне.

Команды, которые относятся к ИИ-аудиту как к приятному дополнению, будут все чаще сталкиваться с необходимостью защищаться от злоумышленников, для которых это стандартная процедура. В безопасности DeFi асимметрия всегда была на стороне атакующих. Специализированные ИИ-агенты — это первая технология, способная переломить это уравнение, но только в том случае, если индустрия внедрит их до того, как наступательная сторона полностью созреет.

BlockEden.xyz предоставляет надежную инфраструктуру блокчейн-API, на которую полагаются DeFi-протоколы и команды безопасности для доступа к данным в реальном времени — это необходимо для непрерывного мониторинга и обнаружения угроз, которых требует безопасность на базе ИИ. Изучите наш маркетплейс API, чтобы строить на базе инфраструктуры, созданной для обеспечения скорости и надежности, необходимых для безопасности DeFi.

Share on Twitter

API Marketplace Featured

Проблема на $ 3,4 млрд, которую аудиторы продолжают упускать​

92 % уровень обнаружения Cecuro: что на самом деле значат эти цифры​

EVMbench: OpenAI и Paradigm количественно оценивают рубежи безопасности ИИ​

Гонка вооружений между нападением и защитой уже началась​

Специализированные решения против универсальных: Почему побеждает специализация​

Что это значит для команд DeFi-протоколов​

Будущее: ИИ-аудиторы как инфраструктура​