OpenAI Codex升级叫板Claude Code:AI编程工具的世纪大战才刚开始
OpenAI Codex升级叫板Claude Code:AI编程工具的世纪大战才刚开始
4月17日,OpenAI宣布对Codex进行全面升级。
消息一出,我朋友圈里的开发者群体分成了两派:一派是Claude Code的忠实拥趸,觉得「Anthropic这波稳了」;另一派是OpenAI的老用户,觉得「OpenAI出手,大事不好说」。我自己呢,先不站队,实事求是来看。
Codex这次升级,到底升级了什么?
根据官方公告,这次Codex的升级主要在三个方向:
桌面控制能力:Codex现在可以直接操控你的桌面环境了——点击按钮、填写表单、操作浏览器。这些以前是专门给那种「Computer Use」类模型准备的,现在OpenAI把它塞进了Codex。
多智能体协作:新版Codex支持多智能体并行工作。你可以同时让一个智能体写测试,一个智能体审查代码,一个智能体跑CI——虽然这套机制目前还比较初级,但方向是对的。
上下文理解升级:对大型代码仓库的理解能力有明显提升,官方说代码库超过10万行的时候,Claude Code的优势就不明显了。
Claude Code的真实护城河是什么?
但是说真的,Claude Code在开发者群体中的口碑,不是靠功能多寡建立的。
Claude Code真正的护城河,我认为是两点:
第一,SWE-bench的跑分。80.8%的得分在这个基准上已经是断层领先,Claude Code不是靠宣传,是靠这个硬数字说话。
第二,工具调用的稳定性。我自己在项目里用Claude Code,遇到工具调用失败的情况极少。但用其他工具的时候,「AI返回了工具调用的指令,但实际没执行」这种尴尬情况并不少见。
Codex这次的升级,在我看来更像是在补短板,而不是在建立新的优势。
那开发者到底该选谁?
我的建议是:不要做单选题。
我认识的大多数认真用AI编程工具的开发者,现在都是「组合模式」:Claude Code主力开发,遇到复杂的多步骤任务或者需要深度代码理解的场景切到Codex,GitHub Copilot处理日常的简单补全。
这个组合的逻辑是:每个工具取它最强的那个能力,而不是追求用一个工具解决所有问题。
Codex升级之后,这个组合的边界会怎么调整?我的判断是:Codex会抢走一部分「需要桌面自动化的任务」的场景,但对复杂代码理解和生成的场景,Claude Code的优势短期内很难被撼动。
5月份可能还会有新的变数。各位,先别急着站队,让子弹再飞一会儿。