AI 智能体现在可以检测 92% 的 DeFi 漏洞 —— 但它们也能制造漏洞

2026年4月2日 · 阅读需 9 分钟

Software Engineer

专门构建的 AI 代理刚刚检测到了 9680 万美元 DeFi 损失背后的漏洞 —— 在 90 个合约中抓住了通用 GPT-5.1 代理错过的 58 个利用程序。同时，OpenAI 和 Paradigm 的 EVMbench 基准测试显示，前沿模型现在可以为 71% 的已知智能合约缺陷生成有效的利用程序。保护 DeFi 协议的同一技术也可以攻击它们，这场军备竞赛的加速超出了大多数团队的预料。

审计员不断错失的 34 亿美元难题

根据 Chainalysis 的数据，2025 年加密货币盗窃案达到了 34 亿美元 —— 而令人不安的真相是，许多被利用的合约之前已经通过了专业审计。仅 Bybit 黑客事件就占了 14 亿美元，而像 Cetus（2.23 亿美元）和 Balancer（1.28 亿美元）这样的协议尽管拥有成熟的安全实践，却依然遭受了漏洞攻击。

问题不在于审计员无能。而是人类审查者面临着一个无法克服的扩展性挑战：DeFi 的总锁定价值（TVL）已激增超过 1190 亿美元，代码复杂性不断增加，且每次新协议部署时攻击面都会扩大。一名审计员在审查复杂的协议时，可能需要花费数周时间分析数十个合约之间的交互，但仍可能错过某个被意志坚定的攻击者发现的边缘情况。

这正是 AI 安全代理目前填补的空白 —— 早期基准测试的结果表明，智能合约安全的工作方式正在发生根本性转变。

Cecuro 92% 的检测率：这些数字究竟意味着什么

2026 年 2 月，AI 安全公司 Cecuro 发布了一个开源基准测试，测试其专门构建的安全代理对 2024 年 10 月至 2026 年初期间被利用的 90 个真实 DeFi 合约的表现。结果令人震惊。

Cecuro 的专用代理识别出了 92% 的被攻击合约中的漏洞，发现了与 9680 万美元经证实的损失相关的缺陷。相比之下，由 GPT-5.1 驱动的基础编码代理仅检测到了 34% 的漏洞，仅覆盖了 750 万美元的损失。

2.7 倍的性能差距不仅仅是数字游戏。它揭示了通用 AI 在应用于智能合约安全时的三个关键故障模式：

1. 缺乏可验证的反馈。 通用模型会产生听起来合理的分析，但没有机制来验证检测到的“漏洞”是否真正可被利用。Cecuro 的代理集成了特定领域的测试框架，可针对真实的执行环境验证发现的结果。

2. 系统性覆盖不足。 分析合约的 GPT-5.1 代理通常在识别出第一个重大问题后就停止了。Cecuro 的代理实施了结构化的审查阶段 —— 访问控制分析、状态操纵检查、跨合约交互审查 —— 确保了全面的覆盖。

3. 上下文饱和。 复杂的 DeFi 协议涉及多个互连的合约、外部预言机依赖和治理机制。通用模型会达到上下文限制并开始得出草率的结论。专用代理使用 DeFi 特有的启发式方法来优先处理最重要的交互。

Cecuro 在 GitHub 上开源了数据集和评估框架，同时保留了完整的安全代理以防止攻击性滥用 —— 这种负责任的披露方式让行业能够在不将工具武器化的情况下验证其说法。

EVMbench：OpenAI 和 Paradigm 量化 AI 安全前沿

Cecuro 的基准测试并不是 2026 年初发布的唯一重大评估。2 月，OpenAI 和 Paradigm 联合发布了 EVMbench，这是一个从三个维度评估智能合约安全 AI 代理的基准：检测漏洞、修复缺陷代码和利用已知弱点。

EVMbench 参考了 40 次审计中的 117 个精选漏洞，主要源自公开代码审计竞赛。结果描绘了一个微妙的画面：

漏洞利用生成： 通过 Codex CLI 运行的 GPT-5.3-Codex 达到了 71.0% 的成功率 —— 为近四分之三的已知漏洞生成了有效的利用程序。这相对于 GPT-5 的 33.3% 有了显著提升，并表明漏洞利用能力正随着每一代模型的更新而迅速扩展。
检测： 代理经常在识别出单个问题后停止，而不是详尽地审计整个代码库，导致关键漏洞未被发现。
修复： 在保持合约完整功能的同时移除细微漏洞被证明极具挑战性 —— 代理在修复旧 Bug 的同时经常会引入新 Bug。

这种不对称性极具启发意义：AI 破坏事物比修复事物更容易。这反映了网络安全中的一个基本动态，但对于 AI 代理来说，这种差距正在以空前的速度扩大。

攻防军备竞赛已经拉开帷幕

Anthropic 的研究团队发布的研究结果显示，前沿 AI 模型现在可以自主发现并利用智能合约中新型的零日漏洞。在针对模型 2025 年 3 月知识截止日期之后被利用的合约进行测试时，Claude Opus 4.5 和 GPT-5 等模型集体生成了在模拟损失中价值 460 万美元的利用程序。

更令人警惕的是：Claude Sonnet 4.5 和 GPT-5 都发现了 两个新型零日漏洞，其利用程序的价值为 3694 美元 —— 证明了盈利性的自主漏洞利用在技术上是可行的。成本是多少？每次合约扫描仅需 1.22 美元，每识别出一个成功的零日漏洞，净利润为 109 美元。

在过去的一年里，前沿模型在基准问题上的漏洞利用收入大约每 1.3 个月翻一倍。一个只有几百美元计算预算的网络罪犯现在可以将 AI 代理指向数千个合约，让其扫描漏洞，并在不写一行代码的情况下生成有效的利用程序。

这产生了一个紧迫的需求：如果 AI 驱动的攻击者能够廉价且自主地扫描整个 DeFi 生态系统，防御者就需要同样强大的 AI 工具持续运行。传统的“部署前进行一次性审计”的模式已不再足够。

专用型 vs. 通用型：为什么专业化更具优势

Cecuro 基准测试揭示了 AI 安全领域出现的一个模式：特定领域的优化比通用模型能带来 2-3 倍的性能提升。这不仅限于智能合约 —— 在医学影像、法律分析和代码审查中也存在类似的动态 —— 但 DeFi 的高风险使得这种差异关乎生死存亡。

几个因素解释了为什么专用安全代理的表现优于通用模型：

训练数据策划。 Cecuro 的代理是在经过验证的漏洞利用数据集上训练的，而不仅仅是代码补全任务。它理解导致重入攻击 (reentrancy attacks)、预言机操纵 (oracle manipulation)、闪电贷攻击 (flash loan exploits) 和权限提升 (privilege escalation) 的特定模式 —— 不是将其作为抽象概念，而是作为具有已知利用路径的具体代码模式。

结构化评审方法。 专用型代理实施系统的审计方法，类似于 Trail of Bits、OpenZeppelin 和 Certora 等公司使用的方法，而不是进行自由格式的分析。每个评审阶段都涵盖了具有相应深度的特定漏洞类别。

执行环境集成。 专用型代理可以 fork 主网状态、部署测试合约并在模拟环境中验证漏洞利用。通用模型通过静态方式推理代码，忽略了仅在运行时出现的动态交互。

竞争格局正在迅速演变。Nethermind 的 AuditAgent 已在瑞银 (UBS) 和 LUKSO 的案例研究中部署。Consensys Diligence 推出了 Chonky，将 AI 代理与人类专家指导相结合。Sherlock 和 Veritas Protocol 提供自动化筛选工具。行业内达成的共识是：结合 AI 筛选和人类专业知识的混合方法可以捕获 95% 以上的漏洞，相比之下，纯人工审计为 60-70%，纯 AI 审计为 70-85%。

这对 DeFi 协议团队意味着什么

对于任何部署或维护 DeFi 智能合约的团队来说，其影响都是深远的：

持续监控成为强制要求。 一次性的部署前审计是必要的，但还不够。AI 代理 24/7 全天候扫描漏洞，并与监控系统集成，在检测到威胁时可以暂停合约，这将成为标准的基础设施。

审计成本正在压缩。 AI 辅助审计已经比纯人工评审快 10 倍。随着专用工具的成熟，全面的安全筛选将变得触手可及，即使是以前负担不起顶级审计机构费用的较小协议也能使用。

防御者优势确实存在 —— 但时间有限。 专用安全代理目前在防御方面的表现优于通用 AI。但前沿模型漏洞利用能力的快速提升（每 1.3 个月翻一番）意味着建立防御基础设施的窗口期正在关闭。

开放基准测试加速了整个领域。 Cecuro 的开源数据集和 OpenAI/Paradigm 的 EVMbench 都使任何团队能够根据现实世界的漏洞利用情况评估并改进其安全工具。不针对这些基准测试其防御能力的协议正在掉队。

未来之路：AI 审计员作为基础设施

智能合约通常保障着超过 1,000 亿美元的开源加密资产。AI 攻击能力和 AI 防御能力的融合，正在将安全格局从定期的咨询服务转变为持续的基础设施需求。

来自 Cecuro 基准测试、EVMbench 和 Anthropic 攻防研究的数据都指向同一个结论：智能合约安全的未来不是纯人类或纯 AI —— 而是由人类引导的 AI 系统，运行着理解 DeFi 领域特定知识的专用安全代理。

将 AI 审计视为“可有可无”的团队，将日益发现自己是在对抗那些将其视为标准操作程序的攻击者。在 DeFi 安全中，不对称性一直有利于攻击者。专用 AI 代理是第一种有潜力扭转这一局面的技术 —— 但前提是行业在攻击端完全成熟之前采用它们。

BlockEden.xyz 提供强大的区块链 API 基础设施，DeFi 协议和安全团队依靠这些设施获取实时链上数据 —— 这对于 AI 驱动的安全所要求的持续监控和威胁检测至关重要。探索我们的 API 市场，在为 DeFi 安全所需的速度和可靠性而设计的基础设施上进行构建。

Share on Twitter

API Marketplace Featured

审计员不断错失的 34 亿美元难题​

Cecuro 92% 的检测率：这些数字究竟意味着什么​

EVMbench：OpenAI 和 Paradigm 量化 AI 安全前沿​

攻防军备竞赛已经拉开帷幕​

专用型 vs. 通用型：为什么专业化更具优势​

这对 DeFi 协议团队意味着什么​

未来之路：AI 审计员作为基础设施​