DeepSeek V4 要来了:1万亿参数跑在华为昇腾上,国产大模型这回真「硬」了
路透社4月10日放了个消息,DeepSeek V4 要来了。
说实话,看到「运行在华为昇腾处理器上」这几个字的时候,我愣了一下。不是性能参数——1万亿参数、MoE架构这些都在预期之内——而是这个「完全国产化」的信号,比我想象中来得更快。
从「能用」到「真硬」
之前聊国产大模型,大家都在说「差距在缩小」「追赶速度很快」。但说实话,绝大部分模型还是在英伟达GPU上跑出来的。这就像你造了一辆性能很好的车,但发动机是人家的——车是你的,核心技术还是卡在别人手里。
这次 DeepSeek V4 最关键的点,不是参数规模,不是架构设计,而是从训练到推理全在华为昇腾上完成。这意味着什么?意味着我们的AI基础设施真正形成了闭环。
我之前在腾讯云试过昇腾910,性能确实能打,但生态还是短板。这次 DeepSeek 能在昇腾上训练出万亿参数模型,说明华为的CANN(Compute Architecture for Neural Networks)软件栈已经成熟到能支撑这种级别的任务了。这事儿比单纯拼模型性能更有意义。
1万亿参数,MoE架构,数据说话
参数量不是万能的,但确实是个硬指标。DeepSeek V4 用的是混合专家架构(MoE),这种架构的好处是能用更少的计算资源实现更强的性能。简单说,模型有1万亿参数,但每次推理只激活其中的一部分——就像你有100个专家,遇到不同问题只找最相关的几个问,而不是把所有人都叫来开会。
根据目前披露的信息,DeepSeek V4 在代码生成、数学推理、多模态理解上都达到了前沿水平。具体的benchmark数据要等正式发布才知道,但从DeepSeek一贯的风格来看,他们不会搞虚的——之前V3在代码能力上已经打了好多人的脸,这次V4应该会更进一步。
算力自主,才是真正的「硬实力」
我之前写过一篇文章,聊的是「国产AI芯片到底行不行」。当时我的判断是:硬件追上了,软件生态还是问题。现在看来,这个问题正在被快速解决。
DeepSeek V4 的发布,相当于给国产AI基础设施打了一针强心剂。它证明了一件事:用纯国产算力,也能训练出世界级的大模型。这个信号,比任何PR文案都有力。
这不是说英伟达不重要——人家还是行业标杆。但至少我们有了「备胎」,而且这个「备胎」不是凑合用的,是真的能扛事儿的。
技术圈的「真香」时刻
我在几个技术群里看到有人讨论这事儿,大部分人的反应是「卧槽,真的假的」。说实话,我也有点意外。不是因为质疑华为昇腾的能力,而是没想到这么快就能落地到万亿参数模型上。
技术的进步速度,有时候比我们想象的还要快。
DeepSeek V4 预计4月下旬发布,到时候我会第一时间实测,看看这个「纯国产训练」的模型到底能打几分。但至少从目前的信号来看,国产大模型这回是真的「硬」了——不是吹出来的,是用代码和算力堆出来的。
别急,等正式发布了再看数据。
注:本文基于公开信息分析,具体性能数据以DeepSeek官方发布为准。