国产大模型4月「三连发」:阿里智谱字节轮番上阵,价格战真要来了?

4月的国产AI圈,热闹得像过年。

阿里一周内连发三款模型,智谱GLM-5.1号称「全球首个8小时持续工作开源模型」,字节跳动的全双工语音大模型也悄然上线。算上月初的腾讯混元3.0预告,国产第一梯队几乎全员出动。

这事儿挺有意思的。我数了一下,4月前20天就有12款新模型发布,平均1.6天一款。这密度,比2023年大模型元年还高。

先看阿里。Qwen3.6-Plus的定位很清晰——「面向Agentic Engineering的下一代旗舰」。MIT协议开源,这是要跟Meta的Llama抢开发者生态。我测了一下在Agent场景的表现,工具调用准确率确实比3.5版本提升不少。但说实话,最吸引我的是他们的定价:输入0.5元每百万token,输出2元每百万token。这价格,比GPT-4 Turbo便宜了近90%。

智谱的GLM-5.1走了一条不一样的路。主打「长时自主工作」,号称能在无人干预的情况下连续工作8小时。我试了一下,让它处理一个复杂的数据分析pipeline,确实能自己拆解任务、执行、纠错、再执行。虽然中间还是出了几次「幻觉」,但整体可用性比上一代强太多了。

字节的全双工语音模型最让我意外。不是因为它技术多先进,而是它的落地场景选得很准——客服、教育、陪伴。全双工意味着AI可以边听边说,不像现在的语音助手那样「你说完我再说」。这种「打断友好」的交互,对用户体验来说是质变。

但价格战真的来了吗?我的判断是:还没有完全开打,但火药味已经很浓了。

阿里的定价明显是「赔本赚吆喝」,用低价换市场份额和开发者生态。智谱走高端路线,但也在推免费额度。字节暂时没公布价格,但按照他们一贯的打法,估计也不会贵。

我个人的感受是,国产大模型正在经历从「参数竞赛」到「工程落地」的转型。以前大家比的是「我家模型多少亿参数」,现在开始比「你家模型在实际场景里好不好用、便不便宜」。这是一个健康的转变。

不过,也有隐忧。价格战一旦开打,小厂可能会快速出局。最后剩下来的,可能还是那几家有云计算业务托底的大厂。对开发者来说是好事——模型更便宜、选择更多。但对创业公司来说,生存空间会被进一步压缩。

这波操作属于是「明修栈道,暗度陈仓」。表面上是在发新模型,实际上是在抢未来AI基础设施的入口。

最后问一句:你现在用国产大模型多,还是海外模型多?我觉得随着差距越来越小,这个选择会越来越纠结。