大模型开源影响力榜单:中国这次不是「陪跑」,是「领跑」

4月17日,奇点智能技术大会上,CSDN联合多家机构发布了《大模型技术体系综合开源影响力榜单》。

看到榜单的那一刻,说实话,我有点意外。

阿里巴巴和北京智源人工智能研究院包揽了综合榜单前两名。这意味着什么?在全球AI开源生态中,中国机构不再只是「参与者」,而是开始「领跑」。

这事儿让我想起两年前的一个场景。那时候我还在大厂做算法,每次开会讨论开源,大家的第一反应都是「国外的开源项目怎么样」。Stable Diffusion、Llama、Falcon——这些名字基本定义了当时AI开源的格局。国产开源项目?有是有,但总感觉差点意思。

但这次榜单,彻底改变了这个叙事。

榜单的评估体系很细致,分成了数据、模型、系统、评测四大维度,总共53项细分指标,分析了13541条公开数据链路。这种颗粒度的评估,我觉得比单纯的「star数排名」要靠谱得多。

具体来看,中国机构在「数据」和「系统」两个维度表现尤其突出。这是什么意思呢?

「数据」维度,指的是开源数据集的质量、规模、多样性。我看了下榜单的数据部分,阿里巴巴的魔搭社区(ModelScope)和智源的WuDaoCorpora都在前列。这两个数据集,我一个都用过,质量确实不错,而且覆盖面很广。

「系统」维度,指的是AI基础设施和工具链。这里就不得不提DeepSeek的开源工具链了——他们开源的训练框架和推理引擎,在开发者社区里口碑很好。我之前试过他们的推理引擎,速度确实快。

但更让我觉得有意思的是,这次榜单传递了一个信号:AI开源的竞争,正在从「模型本身」转向「全栈生态」。

什么叫「全栈生态」?就是不光有模型,还有数据、工具、评测体系。一个孤立的开源模型,如果没有配套的数据和工具,很难真正落地。而中国这次能领跑,恰恰是因为在「全栈」方面做得比较系统。

我个人感受是,这背后反映了中国AI产业的一个变化:从「单点突破」到「系统建设」。

两年前,我们讨论中国AI,关注的往往是一个个独立的模型:这个模型参数多大、那个模型性能如何。但现在,我们开始关注整个技术体系:数据从哪来、工具链完不完善、评测标准是什么。

这种转变,我觉得是好事。因为AI的落地,从来不是靠一个模型就能解决的。你需要数据、需要算力、需要工具、需要人才。中国这次在开源榜单上的表现,恰恰说明我们开始在这些「基础设施」上发力了。

当然,我也得说句实话:榜单只是一时的成绩,开源生态的建设是长期的过程。中国机构这次能领跑,不代表以后也能一直领跑。国外的开源社区也在快速进化,竞争只会越来越激烈。

但至少,这次榜单给了我们一个信号:中国AI开源,不再是「陪跑」了。

这事儿,我觉得值得骄傲一下。

不过话说回来,对于开发者来说,榜单是榜单,实际好不好用还得自己试。我现在的建议是:如果你在做AI相关项目,不妨多关注一下这些国产开源项目。说不定,你会发现一些惊喜。

毕竟,开源的意义,不是看谁排在前面,而是看能不能真正解决问题。