Claude Opus 4.7登顶AI模型排行榜:这次Anthropic做对了什么

4月17日那天,AI圈一下子发了好几个大招。OpenAI发GPT-6,昆仑万维更新天工,智元机器人开大会…但我还是想先聊聊Anthropic的Claude Opus 4.7。

原因很简单:它登顶了

在最新的权威评测中,Claude Opus 4.7超过了GPT-6和Gemini,坐上了「地表最强模型」的位子。作为一个从Claude 2.0就开始用的老用户,我感触挺深的。

这次更新三个点最让我惊喜。

第一是视觉理解的清晰度。以前用Claude分析图片,它经常会把细节搞混——比如把「红色的按钮」说成「橙色的」。现在它会主动「自我检查」,如果发现描述有歧义,会重新「看」一遍图片再回答。我试了一张复杂的UI设计稿,它居然能准确识别出每个组件的状态(默认态、hover态、禁用态)。

第二是代码自检能力。写代码的时候,它会像有经验的程序员那样,写完一段先自己review一下。如果发现潜在bug,会主动说「等等,这里可能有空指针风险」。这种「程序员思维」的拟合,比其他模型的「直给」要靠谱得多。

第三是实时交互。延迟明显降低了,打字的感觉更接近在跟真人对话。

但说实话,Claude的问题还是老样子——贵。Opus 4.7的定价让我每次调用都得掂量掂量,生怕月底账单吓到自己。

Anthropic做对的事,我觉得是坚持「质量优先」的路线。当别的公司在疯狂扩参数、追规模的时候,他们在打磨细节体验。这种「慢工出细活」的策略,现在看来是赌对了。

接下来我想看看,OpenAI会怎么反击。模型竞争这事儿,真的越来越有意思了。