Meta Llama 4发布:开源大模型进入新纪元
说实话,Meta 这次是真的「放了大招」。Llama 4 这次一口气发了三个型号——Scout、Maverick 和旗舰 Opus,最强的那个直接在 MMLU 上干到了 92 分,超越了我之前测过的所有开源模型,甚至比部分闭源模型还猛。
最让我意外的是上下文窗口。Llama 4 Opus 支持 200 万 token 上下文,这是什么概念?相当于能一口气读完一整本《三体》三部曲还有余。之前的开源模型在长上下文上一直是软肋,这次 Meta 直接把天花板捅穿了。
当然,我比较关注的是实际部署成本。Mavernick 只有 17B 参数,但性能逼近 GPT-4o,这意味着在消费级 GPU 上跑出顶级模型表现不再是梦。我个人比较期待在本地用 4090 跑一个试试,毕竟这才是开源的真正意义——让所有人都能用得起。
不过最让我好奇的还是 Llama 4 的开源协议调整。之前 Llama 3 那个「不允许商用」的条款被骂得很惨,这次 Meta 会怎么改?我估计会有一个真正开源的版本,一个偏向商用的版本。商业公司肯定不希望自己的核心竞争力建立在有法律风险的模型上。
总的来看,这次 Meta 的打法很清晰:用开源模型倒逼闭源厂商降价,同时吸引开发者生态。我个人的感受是,开源这事儿一旦形成了规模效应,闭源模型的溢价空间会被严重压缩。对我们这种天天和大模型打交道的人来说,这是好事。