Saltar para o conteúdo principal

Agentes de IA já podem detectar 92% dos exploits de DeFi — mas também podem criá-los

· 10 min de leitura
Dora Noda
Software Engineer

Um agente de IA desenvolvido especificamente acaba de detetar vulnerabilidades por trás de $ 96,8 milhões em perdas no setor DeFi — capturando exploits que um agente GPT-5.1 de uso geral deixou passar em 58 de 90 contratos. Entretanto, o benchmark EVMbench da OpenAI e da Paradigm mostra que os modelos de fronteira conseguem agora gerar exploits funcionais para 71 % das falhas conhecidas em contratos inteligentes. A mesma tecnologia que protege os protocolos DeFi também pode atacá-los, e a corrida armamentista está a acelerar mais depressa do que a maioria das equipas imagina.

O problema de $ 3,4 bilhões que os auditores continuam a ignorar

O roubo de criptomoedas atingiu 3,4bilho~esem2025,deacordocomaChainalysiseaverdadedesconfortaˊveleˊquemuitoscontratosexploradosjaˊtinhampassadoporauditoriasprofissionais.OhackdaBybitsozinhofoiresponsaˊvelpor3,4 bilhões em 2025, de acordo com a Chainalysis — e a verdade desconfortável é que muitos contratos explorados já tinham passado por auditorias profissionais. O hack da Bybit sozinho foi responsável por 1,4 bilhão, enquanto protocolos como Cetus (223milho~es)eBalancer( 223 milhões) e Balancer ( 128 milhões) sofreram violações apesar das práticas de segurança estabelecidas.

O problema não é a incompetência dos auditores. É que os revisores humanos enfrentam um desafio de escala impossível: o valor total bloqueado (TVL) do DeFi ultrapassou os $ 119 bilhões, a complexidade do código está a aumentar e a superfície de ataque expande-se cada vez que um novo protocolo é implementado. Um único auditor que analise um protocolo complexo pode passar semanas a analisar interações entre dezenas de contratos e, ainda assim, deixar escapar um único caso extremo que um atacante determinado acaba por encontrar.

Esta é precisamente a lacuna que os agentes de segurança de IA estão agora a preencher — e os resultados dos primeiros benchmarks sugerem uma mudança fundamental na forma como a segurança de contratos inteligentes funciona.

Taxa de deteção de 92 % da Cecuro: O que os números realmente significam

Em fevereiro de 2026, a empresa de segurança de IA Cecuro lançou um benchmark de código aberto que testou o seu agente de segurança dedicado contra 90 contratos DeFi do mundo real explorados entre outubro de 2024 e o início de 2026. Os resultados foram impressionantes.

O agente especializado da Cecuro sinalizou vulnerabilidades em 92 % dos contratos explorados, identificando falhas ligadas a 96,8milho~esemperdasverificadas.Emcomparac\ca~o,umagentedecodificac\ca~obasealimentadopeloGPT5.1detetouapenas3496,8 milhões em perdas verificadas. Em comparação, um agente de codificação base alimentado pelo GPT-5.1 detetou apenas **34 % das vulnerabilidades**, cobrindo apenas 7,5 milhões em perdas.

A diferença de desempenho de 2,7x não é apenas um jogo de números. Revela três modos de falha críticos na IA de uso geral quando aplicada à segurança de contratos inteligentes:

1. Falta de feedback verificável. Os modelos de uso geral produzem análises que parecem plausíveis, mas não possuem um mecanismo para verificar se uma "vulnerabilidade" detetada é realmente explorável. O agente da Cecuro integra frameworks de teste específicos do domínio que validam as descobertas em ambientes de execução reais.

2. Cobertura sistemática insuficiente. Um agente GPT-5.1 que analisa um contrato para frequentemente após identificar o primeiro problema significativo. O agente da Cecuro implementa fases de revisão estruturadas — análise de controlo de acesso, verificações de manipulação de estado, revisão de interações entre contratos — garantindo uma cobertura abrangente.

3. Saturação de contexto. Os protocolos DeFi complexos envolvem múltiplos contratos interligados, dependências de oráculos externos e mecanismos de governação. Os modelos de uso geral atingem limitações de contexto e começam a tirar conclusões prematuras. Os agentes dedicados utilizam heurísticas específicas de DeFi para priorizar quais as interações que mais importam.

A Cecuro disponibilizou o conjunto de dados e a framework de avaliação em código aberto no GitHub, retendo o agente de segurança completo para evitar o uso indevido para fins ofensivos — uma abordagem de divulgação responsável que permite à indústria verificar as afirmações sem transformar a ferramenta numa arma.

EVMbench: OpenAI e Paradigm quantificam a fronteira da segurança de IA

O benchmark da Cecuro não foi a única avaliação importante a surgir no início de 2026. Em fevereiro, a OpenAI e a Paradigm lançaram conjuntamente o EVMbench, um benchmark que avalia agentes de IA em três dimensões da segurança de contratos inteligentes: deteção de vulnerabilidades, correção de código falho e exploração de fraquezas conhecidas.

O EVMbench baseia-se em 117 vulnerabilidades selecionadas de 40 auditorias, provenientes principalmente de competições de auditoria de código aberto. Os resultados apresentam um cenário detalhado:

  • Geração de exploits: O GPT-5.3-Codex, executado via Codex CLI, atinge 71,0 % — produzindo exploits funcionais para quase três quartos das vulnerabilidades conhecidas. Isto representa uma melhoria dramática em relação aos 33,3 % do GPT-5 e sugere que a capacidade de exploração está a escalar rapidamente com cada geração de modelos.
  • Deteção: Os agentes param frequentemente após identificar um único problema, em vez de auditarem exaustivamente toda a base de código, deixando vulnerabilidades críticas por descobrir.
  • Patching: Manter a funcionalidade total do contrato ao remover vulnerabilidades subtis revela-se um desafio — os agentes introduzem frequentemente novos bugs ao corrigir os antigos.

A assimetria é reveladora: é mais fácil para a IA quebrar coisas do que consertá-las. Isto reflete uma dinâmica fundamental na cibersegurança, mas com agentes de IA, a lacuna está a aumentar a uma velocidade sem precedentes.

A corrida armamentista entre ataque e defesa já começou

A equipa de investigação da Anthropic publicou descobertas que mostram que os modelos de IA de fronteira podem agora descobrir e explorar de forma autónoma novas vulnerabilidades de dia zero em contratos inteligentes. Quando testados contra contratos explorados após o corte de conhecimento dos modelos em março de 2025, modelos como o Claude Opus 4.5 e o GPT-5 geraram coletivamente exploits no valor de $ 4,6 milhões em perdas simuladas.

Ainda mais alarmante: tanto o Claude Sonnet 4.5 como o GPT-5 descobriram duas novas vulnerabilidades de dia zero com exploits no valor de 3.694provadequeaexplorac\ca~oautoˊnomalucrativaeˊtecnicamenteviaˊvel.Ocusto?Apenas 3.694 — prova de que a exploração autónoma lucrativa é tecnicamente viável. O custo? Apenas ** 1,22 por varredura de contrato**, com um lucro líquido de $ 109 por cada dia zero bem-sucedido identificado.

Ao longo do último ano, a receita de exploits de modelos de fronteira em problemas de benchmark duplicou aproximadamente a cada 1,3 meses. Um cibercriminoso com um orçamento de computação de algumas centenas de dólares pode agora apontar um agente de IA para milhares de contratos, deixá-lo varrer em busca de vulnerabilidades e gerar exploits funcionais sem escrever uma única linha de código.

Isto cria um imperativo urgente: se os atacantes movidos a IA conseguem varrer todo o ecossistema DeFi de forma barata e autónoma, os defensores precisam de ferramentas de IA igualmente capazes a correr continuamente. O modelo tradicional de auditorias únicas antes da implementação já não é suficiente.

Especializados vs. Uso Geral: Por Que a Especialização Vence

O benchmark Cecuro destaca um padrão que está surgindo na segurança de IA: a otimização específica de domínio oferece ganhos de desempenho de 2 - 3 vezes em relação aos modelos de uso geral. Isso não é exclusivo para contratos inteligentes — dinâmicas semelhantes ocorrem em imagens médicas, análise jurídica e revisão de código — mas as apostas no DeFi tornam a diferença existencial.

Vários fatores explicam por que agentes de segurança especializados superam os modelos gerais:

Curadoria de Dados de Treinamento. O agente da Cecuro foi treinado em conjuntos de dados de exploits verificados, não apenas em tarefas de conclusão de código. Ele entende os padrões específicos que levam a ataques de reentrada, manipulação de oráculos, exploits de flash loan e escalada de privilégios — não como conceitos abstratos, mas como padrões de código concretos com caminhos de exploração conhecidos.

Metodologia de Revisão Estruturada. Em vez de uma análise de forma livre, os agentes especializados implementam metodologias de auditoria sistemática semelhantes às usadas por empresas como Trail of Bits, OpenZeppelin e Certora. Cada fase de revisão cobre categorias de vulnerabilidade específicas com a profundidade adequada.

Integração com Ambiente de Execução. Agentes especializados podem fazer fork do estado da mainnet, implantar contratos de teste e validar exploits em ambientes simulados. Modelos de uso geral raciocinam sobre o código de forma estática, perdendo interações dinâmicas que só surgem em tempo de execução.

O cenário competitivo está evoluindo rapidamente. O AuditAgent da Nethermind foi implantado em estudos de caso com a UBS e LUKSO. A Consensys Diligence lançou o Chonky, combinando agentes de IA com orientação de especialistas humanos. Sherlock e Veritas Protocol oferecem ferramentas de triagem automatizadas. O consenso que surge em toda a indústria: abordagens híbridas que combinam triagem de IA com perícia humana detectam 95% + das vulnerabilidades, em comparação com 60 - 70% para auditorias apenas manuais ou 70 - 85% para auditorias apenas de IA.

O Que Isso Significa para as Equipes de Protocolos DeFi

As implicações para qualquer equipe que implante ou mantenha contratos inteligentes DeFi são significativas:

O monitoramento contínuo torna-se obrigatório. Auditorias únicas antes da implantação são necessárias, mas insuficientes. Agentes de IA verificando vulnerabilidades 24 / 7, integrados com sistemas de monitoramento que podem pausar contratos quando ameaças são detectadas, se tornarão infraestrutura padrão.

Os custos de auditoria estão comprimindo. As auditorias assistidas por IA já são 10 vezes mais rápidas do que as revisões puramente manuais. À medida que as ferramentas especializadas amadurecem, a triagem de segurança abrangente se tornará acessível a protocolos menores que anteriormente não podiam arcar com auditores de alto nível.

A vantagem do defensor é real — mas limitada no tempo. Agentes de segurança especializados superam atualmente a IA de uso geral na defesa. Mas a rápida melhoria nas capacidades de exploit de modelos de fronteira (dobrando a cada 1,3 meses) significa que a janela para estabelecer infraestrutura defensiva está se fechando.

Benchmarks abertos aceleram todo o campo. Tanto o conjunto de dados de código aberto da Cecuro quanto o EVMbench da OpenAI / Paradigm permitem que qualquer equipe avalie e melhore suas ferramentas de segurança contra exploits do mundo real. Protocolos que não estão testando suas defesas contra esses benchmarks estão ficando para trás.

O Caminho à Frente: Auditores de IA como Infraestrutura

Os contratos inteligentes protegem rotineiramente mais de $ 100 bilhões em ativos cripto de código aberto. A convergência das capacidades de ataque de IA e das capacidades de defesa de IA está remodelando o cenário de segurança, transformando-o de um compromisso de consultoria periódica em um requisito de infraestrutura contínua.

Os dados do benchmark da Cecuro, do EVMbench e da pesquisa ofensiva da Anthropic apontam para a mesma conclusão: o futuro da segurança de contratos inteligentes não é humano ou IA — são sistemas de IA guiados por humanos operando agentes de segurança especializados que entendem o DeFi em um nível específico de domínio.

As equipes que tratam a auditoria de IA como algo opcional encontrarão cada vez mais dificuldades para se defender contra atacantes que a tratam como procedimento operacional padrão. Na segurança DeFi, a assimetria sempre favoreceu os atacantes. Agentes de IA especializados são a primeira tecnologia com o potencial de inverter essa equação — mas apenas se a indústria os adotar antes que o lado da ofensiva amadureça totalmente.

BlockEden.xyz fornece infraestrutura robusta de API de blockchain na qual protocolos DeFi e equipes de segurança confiam para acesso a dados on-chain em tempo real — essencial para o monitoramento contínuo e detecção de ameaças que a segurança baseada em IA exige. Explore nosso marketplace de APIs para construir em uma infraestrutura projetada para a velocidade e confiabilidade que a segurança DeFi requer.