斯坦福AI报告里的一个数字让我睡不着:95%的企业AI投资零回报
说实话,看完斯坦福HAI刚发布的2026年AI指数报告,我关掉PDF对着天花板发了会儿呆。
423页,涵盖模型发布、资本流动、劳动力市场、能源消耗、公众态度——数据详实得像个体检报告。但最让我坐不住的是一个数字:95%的企业AI投资没有产生可衡量的回报。
不是50%,不是70%,是95%。
这什么概念?相当于你砸了100块钱进去,5块钱听到响,95块石沉大海。那些炫酷的AI项目、大模型部署、智能客服改造——大部分都在烧钱表演。
但等等,报告里还有另一个数据:中国顶级模型与美国的性能差距只剩2.7%。Anthropic的Claude在综合基准测试上,只比字节跳动的模型高不到3个百分点。
一边是大模型能力突飞猛进,一边是企业落地一地鸡毛。这个反差太魔幻了。
问题出在哪?
我翻了翻报告的细节,发现一个被很多人忽略的事实:大多数企业的AI项目,死在「最后一公里」。
什么意思?模型API调用起来了,PoC(概念验证)跑通了,Demo做得漂漂亮亮,但一到真实业务场景就崩。数据质量不行、员工不会用、流程接不进去、ROI算不清楚——这些问题比训练模型难多了。
我有个朋友在某制造业公司做数字化,去年上了个大模型项目,预算七位数。结果半年后发现,产线工人根本不会 Prompt Engineering,问的问题模型答不上来,答上来的又不敢直接用。最后变成IT部门的「政绩工程」,业务部门该干嘛干嘛。
这种故事我听太多了。
报告里还有个细节让我印象深刻:美国顶级模型虽然还领先,但优势正在快速稀释。2024年的时候差距可能还有15%,现在只剩2.7%。这意味着什么?对于绝大多数企业应用场景来说,开源模型或者国产模型,性能已经够用了。
但企业还在盲目追求「最强模型」,好像不用GPT-4o就不好意思跟人打招呼。
我个人的感受是,企业AI落地正在经历一个「祛魅期」。前两年大家被ChatGPT震撼到,觉得AI万能,先上了再说。现在第一批项目该交作业了,成绩单惨不忍睹。
接下来会发生什么?
我觉得会有三个趋势:
第一,从「大模型崇拜」转向「场景优先」。企业会更关注「这个AI能解决我哪个具体痛点」,而不是「我用的模型参数量多少」。
第二,AI项目评估会更严格。以前是那种「创新探索」心态,现在是「投产比必须算清楚」。报告里的95%零回报数据一出来,CFO们肯定坐不住了。
第三,服务商洗牌。那些只会套壳API、做Demo演示的公司会被淘汰,真正有行业know-how、能帮企业解决最后一公里问题的团队会脱颖而出。
最后想说,这95%的零回报数字虽然吓人,但我反而觉得是好事。泡沫挤掉,真金白银才会进来。AI的价值是真实的,只是需要更务实的落地方式。
别急,先看数据——这份报告值得每个做AI的人认真读一遍。