阿里Wan2.7-Video发布:国产AI视频生成终于能跟Sora掰手腕了?

我昨天花了一晚上折腾阿里新发布的Wan2.7-Video,说实话,有点超出预期。


不是那种「卧槽这个真的牛」的超出预期,是那种「咦,国产AI视频居然能做成这样」的超出预期。你知道,之前用惯了可灵AI,对国产视频生成的心理预期已经被拉得挺高了。但Wan2.7-Video在一些细节上,确实有它的独到之处。


先说说它的核心卖点——多模态指令解析。什么意思呢?就是你可以用更复杂的描述来生成视频,不只是「一只猫在跑」,而是「一只橘猫在夕阳下的沙滩上跑,镜头从低角度仰拍,慢动作」。


我试了几个prompt,发现它对「镜头语言」的理解确实比之前的版本强了不少。比如我说「手持摄影的晃动感」,它真的能给那种轻微的抖动效果,而不是完美的稳定画面。这种「不完美」反而让视频看起来更真实。


但别急,先看数据。我对比了一下生成速度和画质:


  • 生成一段5秒的视频,Wan2.7-Video大概需要15秒(在A100上)
  • 可灵AI大概是12秒左右
  • 画质方面,Wan2.7-Video在细节纹理上稍微细腻一些,特别是水面、毛发这些复杂材质

不过,Wan2.7-Video最大的优势可能不在于单点性能,而在于它和阿里生态的整合。你想,阿里有淘宝、有优酷、有钉钉,这些场景对视频生成的需求是刚性的。电商主图视频、营销短视频、企业内部培训……这些都是实打实的应用场景。


说到应用场景,这波属于是「Sora跌倒,国产吃饱」了。OpenAI在3月底正式关停了Sora,距离它上线才6个月。官方说法是「战略调整」,但业内普遍认为是商业化没跑通。


这事儿挺有意思的。Sora的技术实力毋庸置疑,但它的问题在于——太贵了,而且太慢了。普通用户用不起,专业用户等不及。相比之下,可灵AI已经做到了3亿美元ARR(年化经常性收入),说明国产工具在商业化上反而走得更稳。


我个人的感受是,AI视频生成这个赛道,技术只是一部分,更重要的是「谁能先找到付费场景」。从这个角度看,阿里、快手这些有自家生态的玩家,可能比纯AI公司更有优势。


当然,Wan2.7-Video也不是没有缺点。我测试的时候发现,它在处理「多人互动」的场景时,还是会出现一些奇怪的肢体扭曲。这是目前所有AI视频模型的通病——单人物还好,一涉及复杂交互,就容易翻车。


最后我想问大家:Sora关停后,你觉得国产AI视频工具能抓住机会实现「弯道超车」吗?还是说,这只是暂时的窗口期,等OpenAI调整完战略,又会卷土重来?


我个人的观点是——窗口期是真实存在的,但能不能抓住,取决于国产工具能不能在接下来6个月内把「生成质量」和「商业化」两件事同时跑通。技术差距在缩小,但品牌认知和用户习惯的差距,还需要时间。