GPT-6要来了:代号「土豆」,OpenAI这次憋了什么大招?

说实话,看到GPT-6内部代号叫「Spud」(土豆)的时候,我愣了一下。

OpenAI这帮人是真的皮。从GPT-4的「Strawberry」到GPT-5的「Orion」,再到现在的「土豆」——感觉他们的命名体系从水果天文转向了菜市场。

但这颗「土豆」可一点都不土。

根据目前曝光的信息,GPT-6的预训练已经在2026年第一季度完成,正式进入后期优化阶段。这意味着什么?意味着我们可能在接下来的3-6个月内就会看到官方发布。

我整理了一下目前流传出来的核心参数和特性,说实话,有些东西挺让人意外的。

首先是模型规模。传闻GPT-6的参数规模是GPT-5的3-4倍,训练数据量更是翻了近5倍。但OpenAI这次似乎并没有一味追求「更大就是更好」——据内部人士透露,他们在架构上做了不小的改动,引入了一种新的注意力机制变体,目标是让长文本推理能力有质的飞跃。

这让我想起之前Claude 3的长上下文表现。当时我用它分析一本300页的技术文档,结果居然真的能记住开头提到的细节——这种「记忆力」在GPT-5上并不稳定。看来OpenAI是被逼着要在这一块补课了。

其次是多模态能力的整合。GPT-4V的视觉理解已经很不错了,但GPT-6据说会把视频理解也做进去,而且不是简单的帧级分析,而是真正的时间序列理解。换句话说,它可能真的能「看懂」一个视频在讲什么,而不只是识别画面里的物体。

这听起来很酷,但我不禁要问:我们真的需要这么强的多模态能力吗?

作为一个前算法工程师,我知道这种能力的背后是什么——是天文数字般的推理成本。GPT-5的API价格已经不便宜了,GPT-6如果再把视频理解做进去,那调用成本得多高?

OpenAI显然也意识到了这个问题。据说他们在训练GPT-6的时候,就把「推理效率」作为一个核心优化目标。具体怎么做的不得而知,但有传言说他们在尝试一种新的模型压缩技术,能在保持性能的同时大幅降低推理时的计算量。

如果这个技术真的成熟,那对整个行业都是个好消息。

不过说实话,我对GPT-6最感兴趣的不是技术参数,而是它的定位问题。

现在的AI市场已经跟两年前完全不一样了。Claude、Gemini、Kimi、文心——各家都在拼命追赶,而且差距正在缩小。GPT-4刚出来的时候那种「碾压式领先」已经不存在了。

OpenAI现在面临的是一个战略选择:是把GPT-6做成一个「全能选手」,还是专注于某些特定场景的极致优化?

从目前的信息来看,他们似乎选择了前者。但这可能是个陷阱——追求全能往往意味着在所有领域都只能做到「还不错」,而不是「最顶尖」。

我更好奇的是定价策略。如果GPT-6的成本真的降下来,OpenAI会不会直接降价抢市场?还是会继续维持高价,把GPT-6作为「奢侈品」来卖?

这个问题其实关系到整个AI行业的商业模式。

说到底,GPT-6这颗「土豆」能不能种出好收成,还得看OpenAI怎么施肥。技术只是基础,产品化能力、定价策略、生态建设——这些才是决定成败的关键。

作为用户,我当然是希望它快点来、便宜点用。但作为一个在行业里待过的人,我知道好东西从来都不会太便宜。

反正我先把钱包准备好了。你呢?