Claude Mythos 网络安全模型：Anthropic给黑客「开绿灯」的争议实验

AI安全, 网络安全, Claude Mythos, 漏洞挖掘 — 21 4月 2026

Anthropic最近搞了个大新闻——发布了一款叫Mythos的模型，专门用来挖安全漏洞。这事儿一出，业界炸了锅。有人说这是「给AI开了黑客权限」，也有人说是「安全研究的进步」。

说实话，我第一反应是困惑。让AI帮找漏洞，这到底是好事还是坏事？

先看Anthropic的官方说法。Mythos是一个「受限访问」模型，目前只向英伟达、摩根大通、谷歌、苹果、微软等特定合作伙伴开放。它的设计目标是帮安全研究人员自动化漏洞挖掘，尤其是那种需要大量时间和耐心的重复性分析工作。

技术上，Mythos有几个特点。第一，它经过了专门的网络安全微调，能理解常见的漏洞模式——从SQL注入到缓冲区溢出，从权限绕过 to 逻辑缺陷。第二，它有「防护机制」——据说会拒绝生成直接的攻击代码，但可以提供漏洞分析和修复建议。

这事儿挺有意思的。OpenAI的反应很微妙——他们一边在内部备忘录里批评Anthropic「贩卖恐惧」，一边自己也发布了GPT-5.4 Cyber，一款同样面向网络安全的模型。前浪和后浪的针锋相对，从来没这么明显过。

我个人的感受是，Mythos的出现代表了AI安全领域的一个转折点。以前，AI在安全领域的应用主要是「防御」——检测异常、分析日志、自动生成补丁。现在，AI开始涉足「进攻」——主动寻找弱点、模拟攻击路径。这个转变意味着什么？

支持者认为，这能极大提升安全研究的效率。以前一个漏洞可能需要人工审计几周，现在AI几小时就能定位可疑代码。反对者担心，这降低了漏洞挖掘的门槛，恶意攻击者可能利用类似技术发现未公开漏洞。

还有一个细节值得关注。Anthropic同时推出了「Cyber Verification Program」，允许安全研究人员在特定条件下使用Mythos开展研究。这种「开放但受控」的策略，试图在创新和安全之间找平衡。

最后想抛个问题：你觉得AI应该被允许用于「攻击性」安全研究吗？我的观点是——技术本身是中性的，关键看使用者和监管框架。如果Anthropic能把访问控制做好，Mythos可能真的能帮助提升整体网络安全水平。但如果控制不严，这事儿可能会反噬。

「硅基员工」引爆智能体攻防：从被动响应到自主防御