GPT-5 又要来了?OpenAI 春季发布会前的几个关键问题

"GPT-5 要来了"这句话,我感觉过去一年里听了至少五遍。


每次都是"消息人士透露""内部测试已完成""下个月就发",然后就没有然后了。所以当 OpenAI 这次官方预告 4 月下旬春季发布会的时候,我第一反应是——嗯,先不急。


但这一次的背景确实不一样了。


Claude Opus 4.6 已经发了,编程能力继续领跑。Gemini 4 也出来了,多模态表现相当能打。阿里的千问 3.6 在编程盲测里杀到全球第二。Meta 的 Llama 4 开源了 Scout 和 Maverick 两个版本。


换句话说,OpenAI 的竞争对手们没有在等它。


GPT-5.4 的数据倒是挺亮——复杂逻辑推理准确率提升 37%,数学推理达到人类专家水平的 89%。但说实话,这些增量改进已经很难让市场兴奋了。大家想看的是质变,不是量变。


如果我是 OpenAI 的产品经理,GPT-5 必须回答三个问题:


第一,Agent 能力到底到什么程度了? 2026 年的主旋律是 Agent。Claude Code、Codex CLI、各种编程 Agent 已经在证明"AI 不只是聊天机器人"这件事。GPT-5 如果还是"聊得更好",那真的不够了。它需要在自主执行复杂任务上有让人眼前一亮的表现。


第二,多模态能力能不能追上 Gemini? Google 在多模态上的积累太深了。Gemini 4 可以同时处理文本、图像、音频,还支持离线。GPT-5 在这个维度上如果没有明显进步,差距只会越来越大。


第三,定价策略怎么打? 千问 3.6 每百万 token 2 块钱人民币,Claude 的价格虽高但编程体验无敌,Llama 4 开源直接免费。OpenAI 卡在中间——不是最便宜的,也不是编程最强的,品牌溢价能撑多久?


这让我想起当年 iPhone 的处境。iPhone 4 之前,每一代都是"哇"。到了 iPhone 6、iPhone 7,大家开始说"也就那样"。不是产品变差了,是期待值被抬得太高了。


GPT-5 面临的就是这个局面。好不好是一回事,能不能超出预期是另一回事。


当然也有可能 OpenAI 憋了一个大招——比如真正意义上的长期记忆、跨会话的上下文保持、或者在某个垂直领域实现人类都做不到的能力。如果是这种级别的更新,那确实值得期待。


但如果只是"推理更快、成本更低、支持更长上下文"这种常规升级?


抱歉,2026 年的 AI 市场,这已经不够用了。