您现在的位置是： > 快讯快讯

Anthropic Claude神话：严峻威胁还是过度炒作？AI安全研究所给出答案

zhoucl 2026-04-14 03:22:51 快讯已有人查阅

导读英国人工智能安全研究所评估显示新型AI具备自主网络攻击能力英国人工智能安全研究所近期对Anthropic公司研发的Claude Mythos预览版模型进行了网络安全能力评估，发现该人工智能模型能够自主执行复杂的网络攻击，且成功率达到了前所未有的水平。该模型在今年三月下旬通过网站信息泄露首次被披露。研发公司确认，这款新一

英国人工智能安全研究所评估显示新型AI具备自主网络攻击能力

英国人工智能安全研究所近期对Anthropic公司研发的Claude Mythos预览版模型进行了网络安全能力评估，发现该人工智能模型能够自主执行复杂的网络攻击，且成功率达到了前所未有的水平。

该模型在今年三月下旬通过网站信息泄露首次被披露。研发公司确认，这款新一代模型在发现和利用网络安全漏洞方面展现出远超现有任何人工智能模型的能力，据称已成功识别出现行网页浏览器及操作系统中的严重安全漏洞。

为避免该模型被公开滥用，研发方仅向数十家安全研究机构提供了有限访问权限，以便测试模型性能并提前应对其高级能力。近日有报道称，美国财政部及美联储负责人已就Claude Mythos可能带来的安全威胁向银行业高管发出警示。

测试数据揭示实际威胁

本周一公布的人工智能安全研究所测试结果表明，此前关于该模型的预警确有依据。评估显示，在专家级“夺旗”挑战任务中，Mythos预览版成功率高达73%。这类挑战任务原预测在2025年4月前没有任何人工智能模型能够完成。

尽管该技术同样可用于发现和修复系统漏洞，但其潜在的威胁范围广泛且影响深远。对于加密基础设施运营商而言，随着人工智能系统获得独立探测和利用网络漏洞的能力，这种技术进展代表着一种全新类别的潜在安全威胁。

突破性攻防演示

据研究所报告，Mythos预览版成为首个完成“终极挑战”的人工智能模型。这项包含32个步骤的企业网络攻击模拟，通常需要专业人员耗时20小时完成。该模型在十次尝试中成功三次，在所有测试中平均完成32个步骤中的22步。

这项模拟从初始侦察到完全控制网络，完整复现了现实中的企业入侵场景。作为表现次优的模型，Claude Opus 4.6仅平均完成16个步骤。英国研究所特别指出，Mythos预览版的性能会随着计算资源的增加而持续提升，单次评估运行可使用高达1亿个标记。

在受控评估环境中获得明确指令和网络访问权限后，该模型展现了无需人工指导即可执行多阶段攻击和发现系统漏洞的能力。

技术演进加速安全风险

这一进展标志着人工智能安全领域的重大转折。仅仅两年前，人工智能模型在基础网络安全演练中仍面临困难。自2023年起持续跟踪相关技术发展的英国人工智能安全研究所，记录了人工智能从入门级任务到专家级自主攻击的快速演进过程。

对于加密生态系统而言，智能合约漏洞和交易所攻击已造成每年数十亿美元损失，人工智能驱动的攻击可能进一步放大现有风险。依赖复杂互联系统的去中心化金融协议，尤其容易受到能够同时分析和攻击多个切入点的自动化攻击尝试。

本文标签：

很赞哦！ ()

上一篇：忘掉呆板卡通——Meta正在打造一个栩栩如生的扎克伯格AI克隆体

下一篇：

相关文章

随机图文

大家在看

昨夜今晨重要资讯（5月15日-5月16日）

本栏推荐

GOMBLE（GM）将上线Binance Alpha并启动空投活动

标签云

欧意交易所

欧意交易所消息

加密货币交易

区块链技术

财富直通车

比特币价格

加密货币市场

比特币行情

加密货币行情

大家喜欢