Claude Opus 4.7登顶编程榜:代码能力飙升13%,但Anthropic的野心不止于此
Claude Opus 4.7 4月16日正式发布,Anthropic这回是真的把代码能力卷到了新高度。
说实话,看到这个消息的时候,我正用Claude Code写个爬虫脚本。习惯性点开更新提示,结果发现model ID变成了claude-opus-4-7——第一反应是「又来?」上个月才更新4.6,这迭代速度跟不要钱似的。
提升在哪?
官方数据摆在这:SWE-bench Pro从56.8%涨到64.3%,CursorBench从62%跳到70%。听起来是数字游戏?非也。我亲自试了两组之前搞不定的任务——一个是给legacy代码写单元测试,另一个是处理多文件refactor。
结果有点意思。4.6在这两个任务上会「假装懂」,给出看起来对但跑不通的代码。4.7会停下来问你:「这块逻辑我没见过,你能不能解释一下?」
这种「知道自己不知道」的能力,在代码场景里比什么花架子都管用。
价格没变,但竞争格局变了
每百万token还是5美元输入、15美元输出,和4.6持平。但隔壁OpenAI的GPT-5.4 Pro定价策略明显更激进——便宜是便宜,能力差距在拉大。
有个细节很多人没注意:Opus 4.7的「低思考档位」已经相当于4.6的「中思考档位」。这意味着什么?你花同样的钱,能用更快的模式拿到更好的结果。 Anthropic这招挺狠的——不涨价,但变相提升性价比。
更大的图景
同天发布的还有Claude Mythos Preview,专门做网络安全的大模型。加上之前的Enterprise Coworker,Anthropic的产品矩阵越来越清晰:通用旗舰(Opus)、垂直专业(Mythos)、企业工作流(Coworker)。
我有时候在想,Anthropic是不是在下一盘更大的棋?OpenAI做AGI叙事,Google做生态整合,Anthropic似乎在走第三条路——把每一个垂直场景做深做透。
这条路 slower,但更扎实。
你怎么看?Opus 4.7会成为你的主力coding model吗?