商汤绝影Sage：把32B多模态大模型塞进车里的技术野心

多模态, 端侧AI, 商汤绝影, Sage模型, 车端智能体 — 22 4月 2026

汽车行业的朋友最近一定注意到了：商汤绝影发了个新模型叫Sage，说是要在车端跑多模态智能体。

我的第一反应是：终于有人认真做这件事了。

车端AI一直是个被忽视的巨大市场。

想想看，现在的新车动不动就号称「智能汽车」，但实际上，车载语音助手和真正的「智能」差得远了。问个天气、调个空调还行，稍微复杂一点的任务就露馅。根本原因是——车端算力有限，没法跑大模型。

商汤这次搞的Sage，核心突破就在这里。

32B总参数，3B激活参数，MoE架构。这组数字意味着什么？意味着它可以在英伟达Orin X这种车规级芯片上流畅运行，不需要联网，延迟低，隐私还好。

更厉害的是，这模型在PinchBench上的性能居然能「领跑全球一线云端大模型」。也就是说，车端部署的模型，性能不输云端——这要是真的，那就是颠覆性的。

我特意去看了下PinchBench的测试结果。Sage在多模态理解、视觉问答、复杂指令跟随这几个维度上确实表现不错。虽然和GPT-4V、Claude 3 Opus还有差距，但考虑到它是在车端跑的，这个成绩已经很能打了。

但说实话，我对「车端智能体」这个定位有点担忧。

智能体（Agent）意味着自主决策、多步推理、工具调用。这些能力在车端场景下，容错率极低。你想想，如果AI助手在规划路线的时候「自主决策」错了，后果可能很严重。

商汤的技术实力毋庸置疑，但产品化这条路不好走。

不过换个角度看，Sage的出现至少说明一件事：端侧大模型的技术瓶颈正在被打破。

以前大家都觉得，大模型必须跑在云端，靠强大的GPU集群支撑。但现在，32B参数的模型都能在车载芯片上跑了，那手机、平板、智能家居这些场景就更不在话下了。

这对整个行业的影响是深远的。

我的判断是：2026年将是端侧AI的爆发元年。

Sage只是一个开始。接下来，我们会看到更多针对端侧优化的模型出现，参数效率会越来越高，应用场景会越来越广。

对于开发者来说，这意味着新的机会。车端、移动端、IoT端，每一个都是潜在的蓝海市场。云端AI的格局已经基本确定，但端侧AI的竞争才刚刚开始。

你怎么看商汤这次的技术突破？觉得车端AI真的能在今年爆发吗？

阿里「小酒窝」出道：憋了两年的大招，我扒开了看