刺破AI黑客神话漏洞转化为真实攻击的隐性壁垒

导语：伯克利发布ExploitGym基准测试，无情揭示了AI智能体在网络安全领域的真实能力边界。抛开厂商炒作的公关话术，全自动AI黑客的落地仍面临巨大的工程障碍与合规黑洞。

实验室里的数字兵器与真实的落地泥潭

当前的网络安全市场正被一种狂热的焦虑所裹挟：大大小小的初创公司都在兜售一种末日论调，声称基于大模型的AI智能体只需一条文本指令，就能如入无人之境般攻破企业内网。然而，加州大学伯克利分校最新发布的ExploitGym基准测试，像一盆冷水浇醒了处于公关幻觉中的行业。

数据不会撒谎。尽管AI在静态代码分析和CTF（夺旗赛）的沙盒环境中表现出了惊人的理解力，但当漏洞转化（Exploit）被放置到真实的、充满噪音的网络环境中时，智能体的表现可谓惨不忍睹。真实世界的攻击需要多步动态规划、对蜜罐环境的敏锐嗅觉以及对未知防御策略的即时绕过。目前的AI智能体在面对极度不确定的网络拓扑时，极易陷入“幻觉死循环”——它们不仅无法精准利用漏洞，甚至会生成带有严重逻辑错误的攻击脚本，直接导致目标系统崩溃而非被潜入。这种“莽夫式”的行动逻辑，在真实的红蓝对抗中毫无实战价值。

图源备注图片由AI生成

被刻意掩盖的合规黑洞与伦理代价

更令人警惕的是，资本在吹捧“自动化红队”概念时，刻意回避了攻击型AI在现实世界中面临的巨型合规黑洞。与生成一段代码或一张图片不同，网络渗透是一个具有高度法律敏感性的行为边界测试。

关键争议　如果一个被授权进行内部渗透测试的AI智能体，因为大模型的不可解释性产生了执行偏差，意外瘫痪了医院的维生系统或是金融交易网关，谁该为此承担刑事责任？是编写系统指令的工程师，还是提供底层API的大模型厂商？在现有法律框架下，这种权责界定是一片完全的空白。当企业引入所谓的“全自动安全智能体”时，他们买入的不仅是安全防护的护盾，更是一颗随时可能引爆自身法务灾难的定时炸弹。