ChatGPT Images 2.0 炸场发布:首个会「思考」的AI生图模型
说实话,我看到这个消息的时候,第一反应是:OpenAI这次真的把活儿做实了。
4月22日,OpenAI正式发布了ChatGPT Images 2.0。官方名称是「ChatGPT Images 2.0」,不是之前大家猜测的「DALL-E 4」或者什么别的花哨名字。这个命名挺有意思的——OpenAI把图像生成能力直接集成到了ChatGPT里面,而不是单独作为一个产品线运营。
GPT Image 2的核心升级:第一个会「思考」的图像模型
根据官方介绍,ChatGPT Images 2.0有几个关键突破:
第一,它是全球首个具备「思考」能力的图像生成模型。什么意思?就是说它在生成图像之前,会先搜索网页获取实时信息,然后对输出结果进行复核。这意味着模型可以理解更复杂的上下文,生成更精准的内容。
第二,中文渲染终于不乱码了。之前的AI生图工具,中文文字渲染一直是个痛点——要么乱码,要么直接吞字。GPT Image 2据说解决了这个问题。
第三,多尺寸支持和最高2K分辨率。这次GPT Image 2支持多种宽高比,从竖屏到横屏都可以,还能输出2K分辨率的图。
性能方面,OpenAI直接亮数据:
官方说,GPT Image 2在文本到图像任务中,「断层领先第二名Nano Banana 2 240分」。这个Nano Banana 2我查了一下,应该是Google的产品。240分的差距,这个数字挺吓人的。
对市场的影响:Midjourney要被抢生意了
之前AI生图市场,Midjourney一直是头部玩家。但现在GPT Image 2直接免费向所有ChatGPT用户开放,这对Midjourney的冲击是巨大的。
怎么说呢——轻度用户流失几乎不可避免。Midjourney现在最便宜的套餐也要10美元/月,而GPT Image 2只要你有个ChatGPT账号就能用。
我的感受
说实话,这次GPT Image 2的发布,让我最感慨的不是技术本身,而是OpenAI的策略。他们选择把图像生成能力集成到ChatGPT里面,而不是单独做一个产品。这说明OpenAI认为,AI生图不是一个独立场景,而是大语言模型能力的一个自然延伸。
有意思的是,Anthropic在4月16日刚发布了Claude 4.7系列,OpenAI这边紧接着就甩出GPT Image 2。这两家的竞争,已经从文字领域蔓延到了多模态领域。2026年的AI竞争,真的越来越精彩了。