阿里「欢乐马」登顶:Sora倒下后,国产AI视频终于扬眉吐气
Sora关停才半个月,阿里就扔了个重磅炸弹。
4月中旬,阿里巴巴正式发布世界模型HappyOyster,内部代号「欢乐马」。这个名字虽然听起来有点可爱,但它的实力可一点都不含糊——在多个权威评测基准上,直接把Sora 2按在地上摩擦。
说实话,看到这个消息的时候,我的心情有点复杂。
一方面,国产AI终于在世界级赛场上拿到了第一名,这确实值得高兴。但另一方面,我也在想:为什么是阿里?为什么是现在?
先聊聊HappyOyster到底强在哪。
根据阿里发布的官方数据,这个模型在视频生成的连贯性、物理规律模拟、以及长视频稳定性上都有显著提升。最夸张的是,它能生成长达2分钟的一致视频,而且画面里的人物动作、光影变化、物理碰撞都基本符合常识。
这听起来可能没什么,但如果你试过用早期的AI视频工具,就知道「符合物理常识」这六个字有多难。
我以前用某国产视频模型生成过一个「人走路」的视频,结果那人的腿直接穿过了自己的身体。当时我还截图发到了群里,大家笑得前仰后合。但笑完之后,其实挺无奈的——这就是当时的技术现状。
HappyOyster的出现,似乎意味着这种尴尬正在成为历史。
更重要的是,阿里这次发布的不只是模型,而是一整套世界模型的技术框架。
什么是世界模型?简单说,就是AI不仅能生成视频,还能「理解」视频里的物理规律。比如,它知道球抛出去会下落,知道水往低处流,知道人走路不会穿模。这种对世界运作方式的内在理解,是通往更高级AI的关键一步。
OpenAI当年发布Sora的时候,打的也是「世界模型」的概念。但讽刺的是,Sora最后因为商业化困难而被关停,反而是阿里的HappyOyster接过了这面大旗。
这里有一个值得思考的问题:为什么国产AI视频能在Sora倒下后快速崛起?
我觉得有几个原因。
第一,是工程化能力。国内大厂在模型优化、成本控制、以及产品化方面的经验,确实比OpenAI更丰富。Sora每天的运行成本据说高达1500万美元,而收入只有210万美元——这种烧钱速度,连OpenAI都扛不住。
阿里的HappyOyster从设计之初就把成本控制作为一个核心目标。他们没有盲目追求最大参数规模,而是在模型架构和推理优化上下功夫。这种务实的做法,反而是更可持续的。
第二,是场景驱动。国内的AI视频工具,从可灵到即梦,再到现在的HappyOyster,都是带着明确的商业场景去做的。短视频创作、电商直播、广告制作——这些场景的需求很明确,也更容易变现。
相比之下,Sora的定位一直有点模糊。它是给专业创作者用的,还是给普通用户玩的?OpenAI自己似乎也没想清楚。
第三,是生态协同。阿里做HappyOyster,不是单打独斗,而是和旗下的淘宝、天猫、优酷等业务深度协同。这意味着HappyOyster从一开始就有丰富的应用场景和数据反馈,能快速迭代优化。
这种「模型+场景」的打法,是国内大厂的优势所在。
当然,我也不是无脑吹国产。HappyOyster虽然很强,但它和真正的「世界模型」还有距离。现在的它,更像是一个「物理规律模拟器」,而不是真正理解世界的AI。
但不管怎样,Sora倒下、HappyOyster崛起,这个转折点的象征意义是很大的。它标志着中美AI视频技术路线的正式分道扬镳——OpenAI选择收缩战线,国内玩家选择继续冲锋。
接下来的竞争,会更加激烈。字节、快手、百度,肯定都在憋大招。谁能最终胜出,还要看产品化能力和商业闭环的速度。
作为用户,我只希望这些竞争能带来更多好用的工具,和更便宜的价格。
毕竟,工具再牛,用不起也是白搭。