GPT-6「Spud」正式发布:推理性能提升40%,但我要泼点冷水

说实话,凌晨看到GPT-6正式发布这个消息的时候,我第一反应不是兴奋,而是——又来了。

OpenAI这波操作确实很OpenAI:提前一周就开始放风,各种’内部消息’满天飞,把大家的胃口吊得足足的。4月20日正式发布,代号’Spud’(土豆),推理性能提升40%,上下文窗口扩展到200万token。

但作为一个从大模型还在穿开裆裤时代就开始折腾这些东西的前从业者,我想先泼点冷水。

先说好的。40%的推理速度提升不是小数字,尤其是处理长文本的时候。200万token的上下文窗口,意味着你可以一次性塞进去一整本书让模型读,这对某些特定场景(比如法律文档分析、长篇小说写作辅助)确实有用。

但问题是——你真的需要吗?

我观察到一个挺有意思的现象:每次大模型升级,最先高潮的永远不是用户,而是那帮做AI自媒体的。GPT-4出来的时候他们说’革命来了’,GPT-4o出来的时候他们说’又要变天了’,现在GPT-6出来,文案我都替他们想好了:’人类离AGI又近了一步’。

说实话,挺没意思的。

从实际体验来看,GPT-6相比GPT-5.4的提升,远没有当年GPT-3到GPT-4那种质的飞跃。它更快了,能处理更长的文本了,但在’聪明程度’上,也就是从’85分’提升到了’87分’。对于日常使用来说,这个差别你大概率感知不到。

更关键的是,价格。OpenAI没有公布具体的API定价,但按照惯例,新模型刚出来的时候都不便宜。40%的性能提升,如果伴随着50%的价格上涨,那对于大部分开发者来说,这笔账怎么算怎么亏。

我个人的看法是,GPT-6更像是一次’常规迭代’,而不是什么’颠覆性创新’。当然,常规迭代也有价值,但没必要把它捧上神坛。

最后说个有意思的细节。代号’Spud’(土豆)——我查了一下,OpenAI内部给模型起代号一直挺随意的,从之前的’Arrakis’(沙丘星球)到现在的’土豆’,感觉就像是在说:别紧张,这不过就是个大一点的土豆而已。

嗯,这很OpenAI。