Claude Mythos被「锁进保险箱」:Anthropic亲手封印自己的最强模型
Anthropic做了一件很奇怪的事。
他们发布了自己有史以来最强的模型Claude Mythos,然后把它锁进了保险箱。
不是开玩笑。目前只有英伟达、摩根大通、谷歌、苹果、微软这几家公司能接触到完整版本。普通开发者?想都别想。
官方给出的理由是「安全考虑」。具体来说,是这个模型在网络安全方面的能力「过于强大」,需要「严密的管控措施」到位之后才能逐步放开。
我第一反应是:这是不是有点夸张了?
但看完白宫管理和预算办公室(OMB)流出的邮件,我沉默了。
邮件是OMB联邦首席信息官Gregory Barbaccia发给内阁部门官员的,说正在搭建「保护措施」,让各机构能够使用这款「严密管控」的AI工具。措辞很谨慎,但透露出的信息很明确:美国政府对Mythos的能力既垂涎又恐惧。
这让我想起去年Claude Opus 4.7发布时的争议。当时Anthropic就搞了个Cyber Verification Program,让安全研究人员在特定条件下用模型做漏洞研究。看来那次是Mythos的「预演」。
问题是:Mythos到底强到什么程度,值得这么严防死守?
公开的信息不多。但据接触过内测版本的人透露,这个模型在代码审计、漏洞挖掘、渗透测试这些「敏感领域」的表现,已经超越了市面上绝大多数专业工具。
有个说法让我印象深刻:「它就像一个24小时不眠的安全工程师,而且永远不会犯错。」
听起来很美好,对吧?但反过来想,如果这样的能力落入坏人手里呢?
这其实是AI安全领域的老难题了——dual-use(双重用途)。
同样的技术,可以用来保护系统,也可以用来攻击系统。以前这个矛盾还没那么尖锐,因为AI的能力还不够强。但现在,我们似乎走到了一个临界点。
Anthropic的选择很极端:既然分不清好人坏人,那就先谁都不给。
这种做法在业界引发了激烈争论。
支持者认为,这是负责任的表现。OpenAI当年要是也这么谨慎,说不定就不会闹出那么多乱子。
反对者则认为,这是变相的垄断。把最强模型锁起来只给大公司用,中小企业和独立开发者怎么办?安全能力变成了少数人的特权,这不是解决问题,而是在制造新的不平等。
我个人的感受比较复杂。
一方面,我理解Anthropic的担忧。我在安全领域有一些朋友,他们讲过太多「AI被滥用」的真实案例。从深度伪造到自动化攻击,技术的恶意使用确实在升级。
但另一方面,我也觉得「锁起来」不是长久之计。
历史上有太多例子证明,技术封锁往往适得其反。你把好东西藏起来,黑市就会出现。与其让地下渠道泛滥,不如建立透明的使用规范和监管框架。
而且说实话,我对「只有少数大公司才能用」这件事本身就有疑虑。
这些公司的安全措施真的比小公司更好吗?历史告诉我们,大公司的安全漏洞往往更多、影响更大。Equifax、Target、Yahoo…哪一次不是巨头中招?
Anthropic这次还发布了一个公开版本叫Claude Opus 4.7,用来测试新的网络安全防护机制。说白了,就是拿这个「阉割版」做小白鼠,验证安全策略的有效性。
这种「分层开放」的策略,我觉得方向是对的。但执行起来有很多细节需要打磨。
比如,什么标准才能进入「可信合作伙伴」名单?谁来审核?透明度如何保证?这些Anthropic都没有给出明确答案。
白宫的介入也让事情变得更复杂。
理论上,政府介入有助于建立统一的监管标准。但实际操作中,政府部门的效率和对技术的理解程度,往往跟不上行业发展的速度。
我很担心最后变成:官僚程序走完了,技术也过时了。
回到最根本的问题:AI能力与安全的边界,到底在哪里?
以前我们认为,等到AGI(通用人工智能)来临的时候,才需要认真面对这个问题。但Mythos的出现说明,危险可能比预期来得更早。
不是那种「AI觉醒毁灭人类」的科幻场景,而是更现实的、渐进的风险累积。
一个模型可以帮安全工程师找漏洞,也可以帮黑客找漏洞。两者的区别,只是使用者的意图。而意图是最难判断的东西。
Anthropic选择了最保守的路径。我不确定这是明智还是过度反应。但至少,他们把这个问题摆到了台面上,逼整个行业认真思考。
作为开发者,我关心的是:这会影响我的日常工作吗?
短期来看,影响不大。毕竟大部分人本来也用不到Mythos这么高端的模型。Opus 4.7和Sonnet系列已经能满足绝大多数需求。
但长期来看,这种「安全优先」的趋势可能会改变行业格局。
如果越来越多的能力被「锁起来」,开源社区和小团队会不会被边缘化?AI的创新活力会不会因此受损?
这些问题没有标准答案。但至少,Anthropic的这次「自我封印」,让我们有机会重新讨论一个被忽视已久的话题:
技术的进步,到底应该以什么为代价?