DeepSeek终于融资了:3亿美元估值破百亿,国产大模型的独立之路能走多远?

说实话,看到这条消息的时候,我第一反应是——终于来了。

DeepSeek这波融资,传了大半年,一直没落地。业内都在猜是不是模式不被资本看好,或者技术路线出了问题。结果人家憋了个大的:3亿美元,估值破百亿。

这个数字放在整个AI圈什么水平?OpenAI那边刚拿了1220亿美金(虽然大部分是基建钱),DeepSeek这边拿了3亿美金。体量差了不少,但对于一个国产团队来说,这已经是里程碑了。

不站队的代价

我之前写文章提过,DeepSeek是这个圈子里少有的「不站队派」。

大厂做模型,要么背靠云厂商(阿里的千问、字节豆包),要么背靠硬件厂商(华为、小米)。这样的好处是——算力不用愁,场景不用愁,钱也不用愁。

坏处呢?你永远在给云厂商打工,或者在给硬件厂商做配套。真正的独立产品?难。

DeepSeek不一样。他们从一开始就走独立路线,开源模型、开源技术栈,甚至把自己的训练方法都写成论文公开了。

这种路线的好处是——你有独立的产品调性,有忠实的开发者社区,有真正的技术品牌。

坏处是——没钱。

训练一个GPT-4级别的模型,算力成本就得上亿美金。DeepSeek靠什么撑着?早期融资+开源社区的口碑+几个商业化项目。

但开源这事儿,情怀归情怀,资本不认啊。投资人会问:你的护城河在哪?你的商业模式在哪?你凭什么不亏钱?

所以这次融资落地,某种程度上是在回答这些问题。

国产大模型的「第三条路」

现在国产大模型,基本走了两条路:

一条是「生态派」,比如阿里千问。模型免费,算力收费,云服务收费,生态里的其他产品收费。这条路看起来热闹,但前提是你得有个强大的云生态托底。

另一条是「应用派」,比如字节豆包。模型是工具,真正的产品是C端应用。通过应用来变现,反哺模型研发。这条路的问题是——你的模型能力可能被应用场景限制住,很难做到真正的通用。

DeepSeek在尝试第三条路:技术服务商。

模型开源,但企业版收费。API服务收费。定制化解决方案收费。

这条路听起来像传统软件公司的模式,但在AI时代,真的走得通吗?

我个人的感受是——难,但有可能。

难的地方在于,大模型这个赛道,技术迭代太快了。你今天领先,明天可能就被别人追上。开源社区的更新频率,商业化团队很难跟上。

可能的地方在于,企业级服务是个慢生意。客户一旦用上你的方案,迁移成本很高。只要你的模型能力不拉胯,服务不掉链子,就能活得不错。

估值破百亿,意味着什么?

这个估值水平,在国产大模型圈子里,已经是头部了。

但我更关心的是——投资人投的是什么?

如果只是投技术,那风险很大。因为技术这东西,今天领先不代表明天领先。

如果是投团队,那还有点道理。DeepSeek这个团队,从技术到商业化,能力还是比较均衡的。而且他们的开源策略,确实建立了一个不错的开发者生态。

如果是投赛道,那就更有意思了。国产大模型,真正能做到独立发展、不依赖大厂输血的,其实不多。DeepSeek如果能证明这条路走得通,对整个行业都是个示范。

接下来的挑战

融资拿到手,不代表就稳了。

DeepSeek接下来要面对的,是更激烈的竞争。

国内这边,阿里千问刚登顶全球调用榜,字节豆包在C端疯狂铺量,华为小米在端侧发力。大家都在抢场景、抢用户、抢开发者。

国外那边,GPT-6刚发布,性能提升40%,上下文窗口干到200万Token。Anthropic的新模型也在路上。开源圈,Llama 4的消息时不时就传出来。

DeepSeek的技术能力,能不能持续领先?他们的商业模式,能不能跑通?他们的独立路线,能不能撑住?

这些问题,不是融到钱就能解决的。

说实话,我个人挺希望DeepSeek能走出来的。

不是因为我站队国产,而是因为——这个圈子里,需要一些真正独立的声音。不是大厂的附庸,不是资本的傀儡,就是做技术的,把技术做扎实,把产品做对路。

这种人,不多了。

3亿美元,是个不错的开始。但路还长着呢。