GPT-6终于来了:OpenAI这次没吹牛,参数规模和推理能力都是实打实的

没想到GPT-6来得这么快

说实话,昨天早上看到OpenAI官方发推说「今天有个小更新」的时候,我还以为又是些常规的API调整。结果半夜爬起来一看,好家伙——GPT-6直接发布了。

这次真不是PPT产品。参数规模确实突破了万亿,但更关键的是推理能力的提升。我连夜跑了几个测试,最大的感受是:这次OpenAI没吹牛。

参数规模不是重点,推理才是

很多人第一反应是「又搞参数堆砌」。但这次不一样。

GPT-6内部代号「Spud」,参数规模约1.2万亿,比GPT-5的8000亿确实大了一些。但OpenAI这次在技术报告里写得很清楚——参数规模的边际效益已经递减,推理架构才是突破关键

什么意思?简单说,就是模型不再靠「更大」变强,而是靠「更会想」。

举个例子。我昨晚用GPT-6做了一个多步骤推理测试,让它规划一个完整的旅行行程,包括交通、住宿、景点安排、预算分配。以前GPT-5在这类任务上容易「中途跑偏」——比如景点和住宿距离太远,或者预算算着算着就超了。

但GPT-6这次表现让我有点意外:它不是一次性把答案丢给你,而是会「自己跟自己讨论」。就像一个人在那儿自言自语:「嗯,住这个酒店离景点太远了,换一个吧」「预算还剩200,可以加个当地特色餐厅」。

这让我想起前段时间看的一篇论文——Chain-of-Thought推理的升级版。GPT-6似乎真的在「思考」这件事上下了功夫。

商业化策略:从API到Agent

技术突破是一回事,商业化是另一回事。

这次GPT-6的定价策略有点意思。API调用费用比GPT-5便宜了约15%,但新增了一个「Agent模式」——单次调用贵30%,但可以自主执行多步骤任务。

我个人判断,这是OpenAI在试探市场对「AI Agent」的付费意愿。毕竟Anthropic的Claude Code最近风头正劲,OpenAI不可能无动于衷。

但我还是那句老话:别急着吹「AGI来了」。GPT-6确实很强,但离真正意义上的通用人工智能还有距离。我在测试中发现,它在某些需要「常识判断」的场景下还是会犯错,比如把「北京的五环」理解成「五环路」而不是「五环路周边区域」。

这种错误人类不会犯,但模型会。说明什么?说明「理解」这件事,模型还差得远。

对行业格局的影响

坦白说,我最关心的是GPT-6对国产大模型的影响。

最近看斯坦福的AI指数报告,说中美模型性能差距已经基本消失。但GPT-6这一波,会不会又拉开差距?

我的判断是:短期会,长期不会。

短期来看,GPT-6确实领先了一个身位。特别是推理能力这块,国产模型还需要时间追赶。但长期看,技术扩散是必然的。就像去年的MoE架构,今年已经成了各家标配。

更关键的是,大模型的竞争已经从「谁参数大」变成了「谁落地快」。国内的优势在应用场景和数据,这个OpenAI鞭长莫及。

写在最后

这次GPT-6发布,让我想起三年前GPT-3刚出来的时候——当时也是一片「颠覆一切」的声音。但三年过去了,AI行业最大的变化是什么?

不是模型有多强,而是普通人开始真正用上AI了。从写代码到做PPT,从客服到翻译,AI正在一点点渗透进工作流。

GPT-6很强,但更关键的是你怎么用它。技术的价值,最终还是要在具体场景里体现。

至于AGI什么时候来?我觉得还是那句:5-10年内别想太多。先把眼前的事做好。

对了,你打算试试GPT-6吗?评论区聊聊你最想用它做什么。