阿里通义千问登顶全球调用榜:这事儿说明不了什么,但也说明了很多

前几天看到一个数据,阿里通义千问的API调用量登顶全球榜首了。

我的第一反应是:这数据怎么算的?

调用量这东西,太容易做文章了。是按token算?按请求次数算?按独立用户算?不同的统计口径,结论可能完全不一样。阿里官方没有公布具体的计算方式,所以我只能基于公开信息做一些推测。

但抛开统计口径的争议,这个成绩本身还是值得说说的。

首先,这说明国产大模型在国际市场上开始有存在感了。

以前提到大模型,大家第一反应就是OpenAI、Anthropic、Google,国产模型连被比较的资格都没有。现在通义千问能在调用量这个指标上做到第一,至少说明两件事:第一,技术上已经达到可用水平;第二,市场策略上足够 aggressive。

说到市场策略,就不得不提价格战。

阿里的API定价向来是「卷王」级别的,同等性能下比OpenAI便宜几倍是常态。这种打法在扩张期很有效,能快速抢占市场份额。但问题是,调用量第一不代表收入第一,更不代表技术第一。如果都是靠低价换来的调用量,那这个第一的含金量就要打折扣了。

我有个做SaaS的朋友,他们公司内部系统接了好几个大模型的API。他的原话是:「通义千问确实便宜,但有些复杂任务还是得用GPT-4o,便宜归便宜,搞不定需求也是白搭。」

这就引出了第二个问题:调用量第一,能不能转化为技术领先?

我的看法是,短期很难。调用量大确实能带来数据飞轮——更多的使用场景、更多的反馈、更多的优化机会。但这个飞轮要转起来,需要时间和投入。而且,OpenAI、Anthropic也不是站着不动,人家的技术迭代速度同样很快。

不过,我觉得通义千问登顶这件事,意义可能不止于技术层面。

从地缘政治的角度看,国产AI能力的崛起是一个必然趋势。不管你是不是技术民族主义,事实就是——在中美科技竞争的背景下,中国市场需要有自己的大模型选项。通义千问能在调用量上做到第一,某种程度上也是这种「本土替代」需求的体现。

当然,作为一个理性的观察者,我不想过度解读。

调用量第一不等于模型最好,不等于用户体验最好,更不等于商业化最成功。阿里的下一步挑战是:怎么把这些调用量转化为真正的技术护城河?怎么在价格战的泥潭里找到可持续的商业模式?

我个人的感觉是,国产大模型正在经历一个「从可用到好用」的转型期。通义千问的这个第一,是一个阶段性的里程碑,但绝不是终点。

说到底,市场终究是理性的。模型好不好,开发者用钱包投票。

通义千问能在这个时间点做到调用量第一,说明它至少在「性价比」这个维度上做到了足够好。至于能不能在「绝对性能」上追平甚至超越海外头部模型,那是下一个阶段的故事了。

我会继续观察。