DeepSeek V4 来了:1万亿参数,华为昇腾处理器,国产大模型终于硬了

这事儿挺有意思的。

路透社4月10日报道,DeepSeek 预计在4月下旬发布最新大模型 V4,拥有约1万亿参数,采用混合专家架构(MoE),并确认将运行在华为昇腾(Ascend)处理器上。

为什么我说「有意思」?因为这是首款达到前沿性能的中国AI模型,将完全摆脱对英伟达GPU的依赖。

1万亿参数是什么概念?

先别急着说「参数大有什么用」。我知道很多人对参数竞赛已经疲劳了,但 DeepSeek V4 的1万亿参数,和 GPT-4 的参数量是同一量级的。

更重要的是,DeepSeek 用的是 MoE(混合专家)架构。这种架构的核心思路是:不是所有参数都在每次推理时都被激活,而是根据输入动态选择激活一部分「专家」网络。换句话说,虽然模型有1万亿参数,但实际推理时可能只用到几百亿参数——这既保证了大模型的能力,又控制了计算成本。

这也是为什么 DeepSeek 能把价格压得这么低:模型大,但推理成本低。

华为昇腾:从「能用」到「好用」

我更关注的,其实是「华为昇腾处理器」这个信息点。

过去几年,国产大模型训练和推理基本都依赖英伟达GPU。不是不想用国产芯片,而是国产芯片在软件生态、算力稳定性、易用性上都有差距。用华为昇腾训练大模型,过去更多是「政治正确」而非「技术最优」。

但 DeepSeek V4 确认将运行在华为昇腾上,说明华为的芯片能力已经从「能用」进化到「好用」——至少对于 DeepSeek 这种前沿大模型来说,昇腾已经能满足需求。

这事儿的意义,不亚于大模型本身。因为这意味着:中国大模型终于有了自己的「算力底座」。

DeepSeek 的「性价比」策略

说实话,DeepSeek 这家公司我一直挺关注的。

他们的策略很清晰:用远低于竞争对手的价格,提供接近前沿性能的服务。DeepSeek V3 就已经证明了这一点——性能接近 GPT-4,但价格只有对方的十分之一。

V4 如果真的达到前沿性能,同时运行在华为昇腾上,成本优势会更明显。因为华为芯片的价格,肯定比英伟达GPU便宜得多。

我个人的判断是:DeepSeek 正在用「性价比」策略,倒逼整个大模型行业降价。这对用户是好事,但对同行来说,压力就大了。

国产大模型的「独立性」

这里我要说一个可能有点争议的观点:DeepSeek V4 运行在华为昇腾上,比它本身的性能更重要。

为什么?因为过去国产大模型虽然做得好,但训练和推理都依赖英伟达GPU。一旦美国制裁升级,断供高端GPU,国产大模型就会面临「算力卡脖子」的风险。

但 DeepSeek V4 完全运行在华为昇腾上,意味着中国大模型终于有了「独立性」——不受外部供应链制约,能自己掌控算力底座。

这事儿的价值,短期看不出来,但长期来看,可能会改变整个大模型产业的格局。

写在最后

DeepSeek V4 还没发布,我现在说「国产大模型终于硬了」可能有点早。但至少,这事儿让我看到了一个信号:中国大模型正在从「追求数量」转向「追求独立性」。

这不只是技术问题,更是战略问题。

接下来,我会持续关注 V4 发布后的实际性能表现。如果真的达到前沿水平,那国产大模型就真的站稳脚跟了。