GPT-6要来了,代号「土豆」:OpenAI这次憋了什么大招?
说实话,我昨晚看到这条消息的时候,差点以为是愚人节玩笑。
GPT-6,内部代号「Spud」(土豆),OpenAI下一代大模型的预训练已经完成。这个代号听起来有点接地气,不是那种高大上的神话人物名字,而是个土里土气的蔬菜。但正是这种反差感,让我觉得OpenAI这次可能真的有点东西。
先说说关键数据。据消息人士透露,GPT-6的上下文窗口直接飙到了200万Token。什么概念?你可以把整个《红楼梦》扔进去,再附加上一百篇相关论文,它还能记住前面说的每一个角色关系。对于做长文档分析、代码审查的人来说,这简直是生产力的核弹。
更值得关注的是它的「原生多模态」能力。之前GPT-4V的多模态多少有点「拼接感」,图像和文本的处理是两套系统在做对接。而GPT-6据说从架构层面就统一了,这意味着视频理解、图像生成、文本推理可以真正融合在一起。想象一下,你给它一个30分钟的视频,它不仅能总结内容,还能指出第12分34秒那个画面里的技术细节有问题。
但我个人最感兴趣的,是它的「混合推理模式」。根据泄露的信息,GPT-6可以在「快速响应」和「深度思考」之间动态切换。简单问题秒回,复杂问题它会多花几秒「琢磨」。这让我想起之前测试Claude Opus时的感受,有时候你真的需要AI停下来想一想,而不是急着给你一个看似正确实则扯淡的答案。
当然,作为一个前大厂算法工程师,我得泼点冷水。
200万Token的上下文听起来很美,但推理成本会呈指数级增长。OpenAI怎么定价?是按Token算还是按会话算?如果太贵,普通开发者根本用不起,最后还是变成大企业的玩具。而且,这么长的上下文,模型真的能有效利用吗?之前的测试表明,即使是最好的模型,在超长文本的「中间部分」也会出现注意力衰减,简单说就是「看了后面忘了前面」。
另外,这个「土豆」代号本身也挺有意思。我猜测OpenAI是在暗示这次发布更「务实」,不搞花里胡哨的演示,就是实打实的性能提升。毕竟GPT-5的发布被诟病「雷声大雨点小」,OpenAI需要一场翻身仗。
至于发布时间,目前的消息指向4月底或5月初。马斯克那边还在跟奥特曼打官司,这边OpenAI就已经准备好下一代产品了。这场AI军备竞赛,真的是一刻都不停歇。
我个人可能会第一时间申请API权限。不是为了写什么炸裂的应用,单纯是想看看这200万Token到底能玩出什么花样。毕竟,技术人的快乐有时候就这么简单。