DeepSeek V4 来了：1万亿参数，华为昇腾处理器，国产大模型终于硬了

DeepSeek, 国产大模型, 华为昇腾 — 23 4月 2026

这事儿挺有意思的。

路透社4月10日报道，DeepSeek 预计在4月下旬发布最新大模型 V4，拥有约1万亿参数，采用混合专家架构（MoE），并确认将运行在华为昇腾（Ascend）处理器上。

为什么我说「有意思」？因为这是首款达到前沿性能的中国AI模型，将完全摆脱对英伟达GPU的依赖。

1万亿参数是什么概念？

先别急着说「参数大有什么用」。我知道很多人对参数竞赛已经疲劳了，但 DeepSeek V4 的1万亿参数，和 GPT-4 的参数量是同一量级的。

更重要的是，DeepSeek 用的是 MoE（混合专家）架构。这种架构的核心思路是：不是所有参数都在每次推理时都被激活，而是根据输入动态选择激活一部分「专家」网络。换句话说，虽然模型有1万亿参数，但实际推理时可能只用到几百亿参数——这既保证了大模型的能力，又控制了计算成本。

这也是为什么 DeepSeek 能把价格压得这么低：模型大，但推理成本低。

我更关注的，其实是「华为昇腾处理器」这个信息点。

过去几年，国产大模型训练和推理基本都依赖英伟达GPU。不是不想用国产芯片，而是国产芯片在软件生态、算力稳定性、易用性上都有差距。用华为昇腾训练大模型，过去更多是「政治正确」而非「技术最优」。

但 DeepSeek V4 确认将运行在华为昇腾上，说明华为的芯片能力已经从「能用」进化到「好用」——至少对于 DeepSeek 这种前沿大模型来说，昇腾已经能满足需求。

这事儿的意义，不亚于大模型本身。因为这意味着：中国大模型终于有了自己的「算力底座」。

说实话，DeepSeek 这家公司我一直挺关注的。

他们的策略很清晰：用远低于竞争对手的价格，提供接近前沿性能的服务。DeepSeek V3 就已经证明了这一点——性能接近 GPT-4，但价格只有对方的十分之一。

V4 如果真的达到前沿性能，同时运行在华为昇腾上，成本优势会更明显。因为华为芯片的价格，肯定比英伟达GPU便宜得多。

我个人的判断是：DeepSeek 正在用「性价比」策略，倒逼整个大模型行业降价。这对用户是好事，但对同行来说，压力就大了。

这里我要说一个可能有点争议的观点：DeepSeek V4 运行在华为昇腾上，比它本身的性能更重要。

为什么？因为过去国产大模型虽然做得好，但训练和推理都依赖英伟达GPU。一旦美国制裁升级，断供高端GPU，国产大模型就会面临「算力卡脖子」的风险。

但 DeepSeek V4 完全运行在华为昇腾上，意味着中国大模型终于有了「独立性」——不受外部供应链制约，能自己掌控算力底座。

这事儿的价值，短期看不出来，但长期来看，可能会改变整个大模型产业的格局。

DeepSeek V4 还没发布，我现在说「国产大模型终于硬了」可能有点早。但至少，这事儿让我看到了一个信号：中国大模型正在从「追求数量」转向「追求独立性」。

这不只是技术问题，更是战略问题。

接下来，我会持续关注 V4 发布后的实际性能表现。如果真的达到前沿水平，那国产大模型就真的站稳脚跟了。