DeepSeek V4 要来了：1万亿参数跑在华为昇腾上，国产大模型这回真「硬」了

DeepSeek V4, 国产大模型, 华为昇腾 — 22 4月 2026

路透社4月10日放了个消息，DeepSeek V4 要来了。

说实话，看到「运行在华为昇腾处理器上」这几个字的时候，我愣了一下。不是性能参数——1万亿参数、MoE架构这些都在预期之内——而是这个「完全国产化」的信号，比我想象中来得更快。

从「能用」到「真硬」

之前聊国产大模型，大家都在说「差距在缩小」「追赶速度很快」。但说实话，绝大部分模型还是在英伟达GPU上跑出来的。这就像你造了一辆性能很好的车，但发动机是人家的——车是你的，核心技术还是卡在别人手里。

这次 DeepSeek V4 最关键的点，不是参数规模，不是架构设计，而是从训练到推理全在华为昇腾上完成。这意味着什么？意味着我们的AI基础设施真正形成了闭环。

我之前在腾讯云试过昇腾910，性能确实能打，但生态还是短板。这次 DeepSeek 能在昇腾上训练出万亿参数模型，说明华为的CANN（Compute Architecture for Neural Networks）软件栈已经成熟到能支撑这种级别的任务了。这事儿比单纯拼模型性能更有意义。

参数量不是万能的，但确实是个硬指标。DeepSeek V4 用的是混合专家架构（MoE），这种架构的好处是能用更少的计算资源实现更强的性能。简单说，模型有1万亿参数，但每次推理只激活其中的一部分——就像你有100个专家，遇到不同问题只找最相关的几个问，而不是把所有人都叫来开会。

根据目前披露的信息，DeepSeek V4 在代码生成、数学推理、多模态理解上都达到了前沿水平。具体的benchmark数据要等正式发布才知道，但从DeepSeek一贯的风格来看，他们不会搞虚的——之前V3在代码能力上已经打了好多人的脸，这次V4应该会更进一步。

我之前写过一篇文章，聊的是「国产AI芯片到底行不行」。当时我的判断是：硬件追上了，软件生态还是问题。现在看来，这个问题正在被快速解决。

DeepSeek V4 的发布，相当于给国产AI基础设施打了一针强心剂。它证明了一件事：用纯国产算力，也能训练出世界级的大模型。这个信号，比任何PR文案都有力。

这不是说英伟达不重要——人家还是行业标杆。但至少我们有了「备胎」，而且这个「备胎」不是凑合用的，是真的能扛事儿的。

我在几个技术群里看到有人讨论这事儿，大部分人的反应是「卧槽，真的假的」。说实话，我也有点意外。不是因为质疑华为昇腾的能力，而是没想到这么快就能落地到万亿参数模型上。

技术的进步速度，有时候比我们想象的还要快。

DeepSeek V4 预计4月下旬发布，到时候我会第一时间实测，看看这个「纯国产训练」的模型到底能打几分。但至少从目前的信号来看，国产大模型这回是真的「硬」了——不是吹出来的，是用代码和算力堆出来的。

别急，等正式发布了再看数据。

注：本文基于公开信息分析，具体性能数据以DeepSeek官方发布为准。