OpenAI和Anthropic突然达成共识:2026年,「能力溢出」比「模型更强」更重要
上周刷推的时候,看到OpenAI发了一条挺有意思的推文。
他们提了一个概念,叫「能力溢出」(capability overhang)。简单说就是:现在的AI模型能做的事,和大多数人实际在用它做的事,中间差了十万八千里。
有意思的是,就在同一周,Anthropic的联合创始人Jack Clark也在他的Import AI周刊里写了几乎同样的观点。
做ChatGPT的和做Claude的,在同一个时间点,达成了同一个共识。
这事儿本身就值得琢磨。
什么叫「能力溢出」?
举个例子。GPT-4级别的模型,理论上可以帮你完成很多复杂任务:分析长篇文档、写代码、做数据分析、甚至帮你起草商业计划书。
但现实中,大部分人用它干嘛?
写个邮件、改个简历、问几个问题。
不是说这些用途不好,而是——模型的天花板远远高过大多数人的使用习惯。
OpenAI的原话是:「2026年,AGI的进展不只看模型有多强,还要看普通人能不能真的用好它。」
这话说得很实在。
为什么两边同时说这个?
我猜测有几个原因。
第一,模型迭代的速度开始放缓。不是说不再进步了,而是边际效用在递减。GPT-4到GPT-5的提升,远没有GPT-3到GPT-4那么惊艳。
第二,竞争格局在变化。Anthropic的Claude在企业级市场做得不错,Google的Gemini也在追赶。大家的模型能力越来越接近,差异化就不在「谁更聪明」,而在「谁更好用」。
第三,也是最实际的——商业压力。训练大模型太烧钱了,如果用户只是拿来写个周报,ROI根本算不过来。必须让用户挖掘出模型的深层能力,才能justify这个成本。
这对普通人意味着什么?
说实话,我觉得这是个好消息。
过去一年,很多人都有这种焦虑:「AI发展这么快,我是不是要被取代了?」
但「能力溢出」这个现象说明——问题不是AI不够强,而是大部分人还不会用。
换句话说,掌握AI的使用方法,本身就是一种竞争力。
同样的模型,在不同人手里,产出可能天差地别。
怎么挖揭模型的深层能力?
我分享几个自己实践下来的经验。
第一,从「一问一答」转向「多轮协作」。
不要期待一次prompt就能得到完美答案。把AI当成一个实习生,给它背景信息、反馈中间结果、逐步 refine。
第二,尝试复杂任务。
很多人用AI只敢让它干简单的事,比如「帮我改个标题」。试着让它干点复杂的:「分析这篇报告的三个核心结论,并指出数据支撑的薄弱环节」。
第三,建立个人prompt库。
好的prompt是重复使用的。把自己常用的场景整理成模板,下次直接用。
写在最后
OpenAI和Anthropic达成共识这件事,某种程度上标志着AI行业的一个转折点。
以前大家比的是「我的模型比你强」,现在开始比的是「我的用户比你更会用它」。
这个转变,其实对用户更友好。
毕竟,我们不需要知道引擎怎么造,只需要知道怎么把车开好。