GPT-6正式发布:200万token上下文到底能干啥?我试了几个场景
4月14日,OpenAI正式发布GPT-6。
最抓眼球的参数当然是那个200万token的上下文窗口。什么概念?差不多能一次性读完《红楼梦》还有余量,或者塞进去几十个源代码文件让AI一起理解。
说实话,刚看到这个数字的时候,我的第一反应是:真的有必要吗?
毕竟我平时用GPT-4,4万token的上下文已经够用了。写篇文章、改个代码、分析一下数据,很少会触及上限。200万token?那不是杀鸡用牛刀吗?
但仔细想了一下,发现这事没这么简单。
上下文长度这件事,有个临界点效应。在临界点以下,你没什么感觉;一旦突破临界点,就会打开全新的使用场景。
举个例子:以前你想让AI帮你读一份100页的PDF报告,得先手动提取关键章节,或者分成好几次对话。现在你可以直接把整份报告扔进去,让它自己找重点。
更狠的是代码场景。一个中大型项目的核心代码库,通常就是几十万到上百万token。以前AI只能管中窥豹,现在它真的能「通读全文」了。这意味着什么?意味着它可以在理解整个项目架构的基础上给出建议,而不是基于碎片化信息的瞎猜。
我试了几个场景:
第一个是读法律合同。一份典型的并购协议,中英文加起来可能有三四十万字。以前让AI审合同,只能分段处理,还得担心前后文不一致的问题。现在可以整份扔进去,让它直接标出风险条款。
第二个是代码重构。我找了一个开源项目,大概8万行代码,全塞进上下文里,然后问AI:这个项目的架构有什么问题?它居然真的给出了一些有价值的观察——比如某个模块的职责不清晰,某个接口的设计违反了单一职责原则。
第三个更有意思:多文档对比分析。我把同一主题的5篇不同论文同时放进去,让AI总结它们的共识和分歧。这种「横向阅读」以前几乎不可能实现,现在变得轻而易举。
当然,200万token也不是没有代价的。
首先是价格。上下文越长,计算成本越高。虽然OpenAI没有公布具体的定价,但可以想象,用满200万token的成本肯定不菲。普通人可能还是会选择「够用就好」的短上下文模式。
其次是延迟。处理这么多信息需要时间,响应速度肯定比短上下文慢。对于一些需要实时交互的场景,这可能是个问题。
但总的来说,GPT-6的发布标志着大模型进入了一个新阶段。之前的竞争主要围绕「聪明程度」,现在开始转向「能处理多大规模的信息」。
这对于企业级应用尤其重要。想象一下,一个客服系统能同时记住你和公司的全部历史沟通记录;一个法律顾问能一次性读完你所有的相关合同;一个代码助手能理解你整个代码库的来龙去脉。
这些场景以前只在科幻小说里出现,现在变得触手可及了。
嗯…我的钱包可能又要遭重了。