Claude Mythos被「锁进保险箱」：Anthropic亲手封印自己的最强模型

Anthropic, AI安全, 网络安全, Claude Mythos — 21 4月 2026

Anthropic做了一件很奇怪的事。

他们发布了自己有史以来最强的模型Claude Mythos，然后把它锁进了保险箱。

不是开玩笑。目前只有英伟达、摩根大通、谷歌、苹果、微软这几家公司能接触到完整版本。普通开发者？想都别想。

官方给出的理由是「安全考虑」。具体来说，是这个模型在网络安全方面的能力「过于强大」，需要「严密的管控措施」到位之后才能逐步放开。

我第一反应是：这是不是有点夸张了？

但看完白宫管理和预算办公室（OMB）流出的邮件，我沉默了。

邮件是OMB联邦首席信息官Gregory Barbaccia发给内阁部门官员的，说正在搭建「保护措施」，让各机构能够使用这款「严密管控」的AI工具。措辞很谨慎，但透露出的信息很明确：美国政府对Mythos的能力既垂涎又恐惧。

这让我想起去年Claude Opus 4.7发布时的争议。当时Anthropic就搞了个Cyber Verification Program，让安全研究人员在特定条件下用模型做漏洞研究。看来那次是Mythos的「预演」。

问题是：Mythos到底强到什么程度，值得这么严防死守？

公开的信息不多。但据接触过内测版本的人透露，这个模型在代码审计、漏洞挖掘、渗透测试这些「敏感领域」的表现，已经超越了市面上绝大多数专业工具。

有个说法让我印象深刻：「它就像一个24小时不眠的安全工程师，而且永远不会犯错。」

听起来很美好，对吧？但反过来想，如果这样的能力落入坏人手里呢？

这其实是AI安全领域的老难题了——dual-use（双重用途）。

同样的技术，可以用来保护系统，也可以用来攻击系统。以前这个矛盾还没那么尖锐，因为AI的能力还不够强。但现在，我们似乎走到了一个临界点。

Anthropic的选择很极端：既然分不清好人坏人，那就先谁都不给。

这种做法在业界引发了激烈争论。

支持者认为，这是负责任的表现。OpenAI当年要是也这么谨慎，说不定就不会闹出那么多乱子。

反对者则认为，这是变相的垄断。把最强模型锁起来只给大公司用，中小企业和独立开发者怎么办？安全能力变成了少数人的特权，这不是解决问题，而是在制造新的不平等。

我个人的感受比较复杂。

一方面，我理解Anthropic的担忧。我在安全领域有一些朋友，他们讲过太多「AI被滥用」的真实案例。从深度伪造到自动化攻击，技术的恶意使用确实在升级。

但另一方面，我也觉得「锁起来」不是长久之计。

历史上有太多例子证明，技术封锁往往适得其反。你把好东西藏起来，黑市就会出现。与其让地下渠道泛滥，不如建立透明的使用规范和监管框架。

而且说实话，我对「只有少数大公司才能用」这件事本身就有疑虑。

这些公司的安全措施真的比小公司更好吗？历史告诉我们，大公司的安全漏洞往往更多、影响更大。Equifax、Target、Yahoo…哪一次不是巨头中招？

Anthropic这次还发布了一个公开版本叫Claude Opus 4.7，用来测试新的网络安全防护机制。说白了，就是拿这个「阉割版」做小白鼠，验证安全策略的有效性。

这种「分层开放」的策略，我觉得方向是对的。但执行起来有很多细节需要打磨。

比如，什么标准才能进入「可信合作伙伴」名单？谁来审核？透明度如何保证？这些Anthropic都没有给出明确答案。

白宫的介入也让事情变得更复杂。

理论上，政府介入有助于建立统一的监管标准。但实际操作中，政府部门的效率和对技术的理解程度，往往跟不上行业发展的速度。

我很担心最后变成：官僚程序走完了，技术也过时了。

回到最根本的问题：AI能力与安全的边界，到底在哪里？

以前我们认为，等到AGI（通用人工智能）来临的时候，才需要认真面对这个问题。但Mythos的出现说明，危险可能比预期来得更早。

不是那种「AI觉醒毁灭人类」的科幻场景，而是更现实的、渐进的风险累积。

一个模型可以帮安全工程师找漏洞，也可以帮黑客找漏洞。两者的区别，只是使用者的意图。而意图是最难判断的东西。

Anthropic选择了最保守的路径。我不确定这是明智还是过度反应。但至少，他们把这个问题摆到了台面上，逼整个行业认真思考。

作为开发者，我关心的是：这会影响我的日常工作吗？

短期来看，影响不大。毕竟大部分人本来也用不到Mythos这么高端的模型。Opus 4.7和Sonnet系列已经能满足绝大多数需求。

但长期来看，这种「安全优先」的趋势可能会改变行业格局。

如果越来越多的能力被「锁起来」，开源社区和小团队会不会被边缘化？AI的创新活力会不会因此受损？

这些问题没有标准答案。但至少，Anthropic的这次「自我封印」，让我们有机会重新讨论一个被忽视已久的话题：

技术的进步，到底应该以什么为代价？

2026年AI战国时代：谁在「造神」，谁在「守夜」，谁在「缝补」