GPT Image 2来了:文字渲染99%准确率,终于能好好写字了

我先问一个问题:你在用AI生成图片的时候,有没有”鬼画符”般的文字气到过?

我有过。之前用某款AI生图工具,让它生成一张”上面写着Hello World的T恤”,结果出来的是”Hel1o W0r1d”,字母全是错的。当时我就想,这玩意儿离真正能用还远着呢。

但4月21日OpenAI发布的GPT Image 2,让我感觉这事终于有救了。

99%文字渲染准确率是什么概念

根据OpenAI官方数据,GPT Image 2的文字渲染准确率达到了99%。这意味着什么?

意味着你让它生成一张带文字的图片,99%的概率文字是对的。剩下那1%,大概率是你描述不够清楚,而不是模型的问题。

而且支持4K分辨率输出。这对需要高质量素材的设计师来说,是实打实的需求。

从”能看”到”能用”

我之前说过,AI生图最大的问题不是画得漂不漂亮,而是能不能准确表达你的意图。文字渲染就是最典型的例子。

以前AI生图生成文字,成功率大概在60-70%左右,而且错误率很高——字母缺失、拼写错误、字体混乱,这些都是常见问题。现在99%的准确率,基本可以算”可用了”。

这不仅仅是技术进步,更是产品定位的转变。OpenAI给ChatGPT Images 2.0的定位已经从”创意工具”转向”可交付的视觉工作流平台”。换句话说,它开始认真对待”输出物”这件事了。

多语言能力也有了

根据官方介绍,GPT Image 2的多语言能力也有了显著提升。以前中文生成经常会出现字体混乱、字符错误的问题,这次据说有了很大改善。

不过这个我还没亲测。等我实际跑一遍再来报告。

你们有用过ChatGPT Images 2.0的吗?文字渲染真的有那么神吗?