阿里通义千问登顶全球调用榜:这事儿说明不了什么,但也说明了很多
前几天看到一个数据,阿里通义千问的API调用量登顶全球榜首了。
我的第一反应是:这数据怎么算的?
调用量这东西,太容易做文章了。是按token算?按请求次数算?按独立用户算?不同的统计口径,结论可能完全不一样。阿里官方没有公布具体的计算方式,所以我只能基于公开信息做一些推测。
但抛开统计口径的争议,这个成绩本身还是值得说说的。
首先,这说明国产大模型在国际市场上开始有存在感了。
以前提到大模型,大家第一反应就是OpenAI、Anthropic、Google,国产模型连被比较的资格都没有。现在通义千问能在调用量这个指标上做到第一,至少说明两件事:第一,技术上已经达到可用水平;第二,市场策略上足够 aggressive。
说到市场策略,就不得不提价格战。
阿里的API定价向来是「卷王」级别的,同等性能下比OpenAI便宜几倍是常态。这种打法在扩张期很有效,能快速抢占市场份额。但问题是,调用量第一不代表收入第一,更不代表技术第一。如果都是靠低价换来的调用量,那这个第一的含金量就要打折扣了。
我有个做SaaS的朋友,他们公司内部系统接了好几个大模型的API。他的原话是:「通义千问确实便宜,但有些复杂任务还是得用GPT-4o,便宜归便宜,搞不定需求也是白搭。」
这就引出了第二个问题:调用量第一,能不能转化为技术领先?
我的看法是,短期很难。调用量大确实能带来数据飞轮——更多的使用场景、更多的反馈、更多的优化机会。但这个飞轮要转起来,需要时间和投入。而且,OpenAI、Anthropic也不是站着不动,人家的技术迭代速度同样很快。
不过,我觉得通义千问登顶这件事,意义可能不止于技术层面。
从地缘政治的角度看,国产AI能力的崛起是一个必然趋势。不管你是不是技术民族主义,事实就是——在中美科技竞争的背景下,中国市场需要有自己的大模型选项。通义千问能在调用量上做到第一,某种程度上也是这种「本土替代」需求的体现。
当然,作为一个理性的观察者,我不想过度解读。
调用量第一不等于模型最好,不等于用户体验最好,更不等于商业化最成功。阿里的下一步挑战是:怎么把这些调用量转化为真正的技术护城河?怎么在价格战的泥潭里找到可持续的商业模式?
我个人的感觉是,国产大模型正在经历一个「从可用到好用」的转型期。通义千问的这个第一,是一个阶段性的里程碑,但绝不是终点。
说到底,市场终究是理性的。模型好不好,开发者用钱包投票。
通义千问能在这个时间点做到调用量第一,说明它至少在「性价比」这个维度上做到了足够好。至于能不能在「绝对性能」上追平甚至超越海外头部模型,那是下一个阶段的故事了。
我会继续观察。