商汤绝影Sage:把32B多模态大模型塞进车里的技术野心
汽车行业的朋友最近一定注意到了:商汤绝影发了个新模型叫Sage,说是要在车端跑多模态智能体。
我的第一反应是:终于有人认真做这件事了。
车端AI一直是个被忽视的巨大市场。
想想看,现在的新车动不动就号称「智能汽车」,但实际上,车载语音助手和真正的「智能」差得远了。问个天气、调个空调还行,稍微复杂一点的任务就露馅。根本原因是——车端算力有限,没法跑大模型。
商汤这次搞的Sage,核心突破就在这里。
32B总参数,3B激活参数,MoE架构。这组数字意味着什么?意味着它可以在英伟达Orin X这种车规级芯片上流畅运行,不需要联网,延迟低,隐私还好。
更厉害的是,这模型在PinchBench上的性能居然能「领跑全球一线云端大模型」。也就是说,车端部署的模型,性能不输云端——这要是真的,那就是颠覆性的。
我特意去看了下PinchBench的测试结果。Sage在多模态理解、视觉问答、复杂指令跟随这几个维度上确实表现不错。虽然和GPT-4V、Claude 3 Opus还有差距,但考虑到它是在车端跑的,这个成绩已经很能打了。
但说实话,我对「车端智能体」这个定位有点担忧。
智能体(Agent)意味着自主决策、多步推理、工具调用。这些能力在车端场景下,容错率极低。你想想,如果AI助手在规划路线的时候「自主决策」错了,后果可能很严重。
商汤的技术实力毋庸置疑,但产品化这条路不好走。
不过换个角度看,Sage的出现至少说明一件事:端侧大模型的技术瓶颈正在被打破。
以前大家都觉得,大模型必须跑在云端,靠强大的GPU集群支撑。但现在,32B参数的模型都能在车载芯片上跑了,那手机、平板、智能家居这些场景就更不在话下了。
这对整个行业的影响是深远的。
我的判断是:2026年将是端侧AI的爆发元年。
Sage只是一个开始。接下来,我们会看到更多针对端侧优化的模型出现,参数效率会越来越高,应用场景会越来越广。
对于开发者来说,这意味着新的机会。车端、移动端、IoT端,每一个都是潜在的蓝海市场。云端AI的格局已经基本确定,但端侧AI的竞争才刚刚开始。
你怎么看商汤这次的技术突破?觉得车端AI真的能在今年爆发吗?