ray GPT-5 — 06 Apr 2026

GPT-5 又要来了？OpenAI 春季发布会前的几个关键问题

"GPT-5 要来了"这句话，我感觉过去一年里听了至少五遍。

每次都是"消息人士透露""内部测试已完成""下个月就发"，然后就没有然后了。所以当 OpenAI 这次官方预告 4 月下旬春季发布会的时候，我第一反应是——嗯，先不急。

但这一次的背景确实不一样了。

Claude Opus 4.6 已经发了，编程能力继续领跑。Gemini 4 也出来了，多模态表现相当能打。阿里的千问 3.6 在编程盲测里杀到全球第二。Meta 的 Llama 4 开源了 Scout 和 Maverick 两个版本。

换句话说，OpenAI 的竞争对手们没有在等它。

GPT-5.4 的数据倒是挺亮——复杂逻辑推理准确率提升 37%，数学推理达到人类专家水平的 89%。但说实话，这些增量改进已经很难让市场兴奋了。大家想看的是质变，不是量变。

如果我是 OpenAI 的产品经理，GPT-5 必须回答三个问题：

第一，Agent 能力到底到什么程度了？ 2026 年的主旋律是 Agent。Claude Code、Codex CLI、各种编程 Agent 已经在证明"AI 不只是聊天机器人"这件事。GPT-5 如果还是"聊得更好"，那真的不够了。它需要在自主执行复杂任务上有让人眼前一亮的表现。

第二，多模态能力能不能追上 Gemini？ Google 在多模态上的积累太深了。Gemini 4 可以同时处理文本、图像、音频，还支持离线。GPT-5 在这个维度上如果没有明显进步，差距只会越来越大。

第三，定价策略怎么打？ 千问 3.6 每百万 token 2 块钱人民币，Claude 的价格虽高但编程体验无敌，Llama 4 开源直接免费。OpenAI 卡在中间——不是最便宜的，也不是编程最强的，品牌溢价能撑多久？

这让我想起当年 iPhone 的处境。iPhone 4 之前，每一代都是"哇"。到了 iPhone 6、iPhone 7，大家开始说"也就那样"。不是产品变差了，是期待值被抬得太高了。

GPT-5 面临的就是这个局面。好不好是一回事，能不能超出预期是另一回事。

当然也有可能 OpenAI 憋了一个大招——比如真正意义上的长期记忆、跨会话的上下文保持、或者在某个垂直领域实现人类都做不到的能力。如果是这种级别的更新，那确实值得期待。

但如果只是"推理更快、成本更低、支持更长上下文"这种常规升级？

抱歉，2026 年的 AI 市场，这已经不够用了。