AI写代码连干13小时:这个「程序员」有点猛
看到这个数据的时候,我下意识地看了眼自己的IDE。
有个新出的开发者模型,声称可以不间断编码13小时,完成超过4000行代码的编写与优化。在SWE-Bench Pro、SWE-Lite这些代码评测基准上,甚至持平或超越了GPT-5.4和Claude Opus 4.6。
13小时,4000行——这什么概念?
我查了一下自己的代码提交记录,过去一年平均每天写大约200-300行有效代码(不算复制粘贴和自动生成的)。照这个速度,4000行相当于我两周的工作量。AI用13小时干完了。
当然,直接比行数有点耍流氓。代码质量、架构设计、业务理解——这些AI现在还做不到人类的水平。但不可否认的是,在「纯编码」这件事上,AI的效率已经拉开了数量级的差距。
我上周亲自试了一个AI编码工具。
让它帮我重构一个老项目的登录模块,原本我估计得花大半天。结果AI生成的初版代码只用了10分钟,虽然有几处需要调整(主要是业务逻辑的边界case),但整体架构还算合理。我最后花了不到一小时就完成了整个重构,比预期快了至少三倍。
但有个问题让我有点在意。
AI生成的代码,虽然能跑,但「味道」跟人写的不太一样。怎么说呢,它更像是「教科书式的标准答案」——每个变量命名都中规中矩,每个函数都符合最佳实践,但少了一点「个人风格」。这不是坏事,只是如果你习惯了某种编码习惯,可能会觉得AI的代码有点「生硬」。
另一个问题是调试。
AI生成的代码出了Bug,排查起来比人写的更麻烦。因为AI的「思路」你不太能预测,有时候它会在很奇怪的地方加一行代码,然后告诉你这是「优化」。我有次花了半小时才找到AI埋的一个坑,最后发现是它过度优化导致的一个边界条件bug。
这事儿对开发者意味着什么?
我觉得不是「AI会取代程序员」,而是「会用AI的程序员会取代不会用的」。就像当年IDE取代了纯文本编辑器、Git取代了手动备份,AI编程工具本质上是效率工具。你可以选择不用,但你的竞争对手在用——这就是现实。
哪些场景最适合AI辅助?
我观察了几类:
一是重复性高的任务。比如CRUD接口、测试用例、文档生成——这些AI做得又快又好,而且不容易出错。
二是探索性的原型开发。你想快速验证一个想法,AI可以帮你把框架搭起来,你只需要在关键逻辑上做调整。
三是代码审查。AI可以帮你扫描潜在的性能问题、安全隐患、代码风格不一致——这个功能我最近用得特别多。
哪些场景AI还不太行?
复杂的架构设计、需要深入理解业务逻辑的功能、涉及性能调优的底层代码——这些还是得靠人。AI可以给建议,但最终的决策和验证还是得你来做。
有个朋友问我:既然AI能写代码,那我是不是不用学编程了?
我说恰恰相反,现在更需要学好编程基础。因为AI生成的代码你得能看懂、能修改、能判断对错——这不就是编程能力吗?如果完全依赖AI,等到出了问题你解决不了,那就真的「翻车」了。
回到开头那个「13小时4000行」的数据。
我觉得这个数字最大的意义不是炫耀AI有多强,而是说明AI编程正在从「辅助工具」变成「生产力主体」。以前我们说「AI帮我写代码」,现在可能要改成「我帮AI调试代码」——虽然有点反直觉,但这就是趋势。
对开发者来说,现在最值得做的事是:熟悉这些AI工具的使用,搞清楚它们的边界,然后找到「人机协作」的最佳模式。别抵触,也别迷信——把它当成你工具箱里的新工具,该用就用,该人工就人工。