Opus 4.7 价格比 4.6 贵 50%,但全网在喊「还我 4.6」:Anthropic 的定价逻辑有问题吗?

Claude Opus 4.7 发布后,最热闹的地方不是 Anthropic 的官网,是 Reddit。

标题大家都学会了:「还我 4.6」「4.7 还我钱」「涨价 50% 性能还变差了,Anthropic 你在干嘛」。

说实话,这个吐槽是有数据支撑的。

根据多个开发者的测试,Opus 4.7 在某些复杂任务上的表现并没有比 4.6 明显提升,甚至在某些场景下还有倒退。价格涨了 50%,体验反而没有同比例提升——这个账怎么算都是亏的。

我之前在脉脉上看到有人发过一句话:「订阅制服务最怕的不是涨价,是涨价的时候用户觉得不值。」

这句话用来形容现在 Anthropic 的处境,刚刚好。

Anthropic 的定价逻辑是什么?

要搞清楚这个问题,先要理解 AI 公司的定价到底是怎么定的。

主流的 AI 模型定价基于 token 计算。Anthropic 的 Opus 系列是面向高端用户的,定价本来就比 Sonnet 和 Haiku 高一大截。而 4.6 到 4.7 的升级,据说是在推理成本上有显著增加——不是训练成本,是推理成本。

这意味着什么?

模型每次「思考」和「回答」都需要消耗算力。推理成本上升,定价自然要跟着涨。

但问题是,用户感知到的「值不值」和实际的算力消耗之间,往往存在巨大的落差。

开发者们不会去算你的 GPU 用了多少张、你的电费是多少。他们只关心:这个模型能不能帮我解决我的问题?解决得够不够快?够不够准?

4.7 在这两个维度上,没有给出让所有人满意的答案。

「降智」才是核心问题

让我说实话。

一个模型被用户说「降智」,这不是一个能用「定价策略」来解释的问题。

Claude 4.6 之所以被骂,不是因为它不够好,而是因为它「变乖了」。那种敢下手、敢预测、敢给激进方案的感觉没有了。取而代之的是保守、中庸、给「安全」答案。

这不是能力退化,这是模型 behavior 的调整——可能是出于安全考虑,可能是出于合规要求,也可能就是 alignment 过程中的副产品。

用户不傻。他们感受得到。

所以当 4.7 发布的时候,大家本来期待的是:「把 4.6 初期的『聪明劲儿』找回来」。

结果呢?

4.7 是有提升,但还不够。至少没有达到「值回票价」的程度。

我的想法

我觉得 Anthropic 现在的处境,本质上是一个「不可能三角」:

能力强的版本 → 用户觉得太「野」/不安全 → 调整 alignment → 变保守 → 用户说降智 → 出新版本修 → 能力强的版本 → …

循环往复。

要在「安全」「能力」「成本」三者之间找到平衡点,这可能是 AI 公司永恒的难题。

至于 4.7 值不值得买——我的建议是:先等一两周,让社区跑出更完整的 benchmark。如果确实有明显提升,入手不亏;如果还是老样子,4.6 的价格更香。

等等党永远不会输。


倾向性问题

你觉得 AI 模型的定价应该和「用户感知价值」挂钩,还是和「实际算力成本」挂钩?这两者之间怎么平衡?