商汤绝影Sage发布：端侧智能体终于能「上车」了

端侧AI, 商汤绝影, 智能座舱 — 22 4月 2026

终于有人把AI塞进车里了，而且不是那种「只能播歌导航」的智能助手。

商汤绝影昨天发布了Sage，一个专门为车端设计的多模态智能体基座大模型。32B总参数，但激活参数只有3B——这个设计挺巧妙的，用MoE（混合专家）架构，让模型在保持大参数规模的同时，推理时只激活一小部分，省资源。

这事儿挺有意思的。我个人的感受是，端侧AI这两年一直是个「看起来很美」的概念。大家都知道把AI放在本地运行有好处：延迟低、隐私安全、不依赖网络。但真正能跑起来的场景，其实不多——手机上的语音助手，还是得连云端；智能音箱，也是云端处理为主。

车载场景不一样。车里的算力是实打实的，英伟达Orin X这种芯片，算力摆在那，不用白不用。而且车端对延迟的要求，比手机高得多——你跟车机说「打开天窗」，等它转两圈圈才反应过来，用户体验就崩了。

上周我还跟一个做自动驾驶的朋友聊，他说现在车企的痛点是：智能座舱的「智能」程度，跟不上消费者的预期。屏幕越来越大，功能越来越多，但核心交互还是「语音指令」那一套，没有真正的「智能体」能力——那种能理解上下文、能自主规划、能多步执行的AI。

Sage这次主打的就是「智能体基座」。什么意思？就是它不是简单地「听懂你的话」，而是能像个人助手一样，帮你规划、执行、反馈。比如你说「我有点冷」，它不只是调高空调温度，而是可能会先检查车窗是否关闭、座椅加热是否打开，然后综合调整。

说实话，我对商汤的印象，在这几年里变了不少。以前觉得它就是个人脸识别公司，后来安防业务收缩，又转型做大模型，我还挺怀疑的——这转型跨度有点大。但Sage这个产品，至少说明他们在端侧AI这块，是有实际思考的，不是盲目跟风。

不过话说回来，端侧AI最大的挑战，从来不是技术，而是生态。Sage能跑在Orin X上，这很好，但有多少车企愿意用？有多少开发者愿意基于它开发应用？这些才是决定它能不能活下来的关键。

对了，还有个数据值得一提：Sage在PinchBench上的表现，据说「领跑全球一线云端大模型」。这个说法有点吓人，但我个人的感受是，benchmark归benchmark，实际体验才是关键。端侧模型的优势在于「够用就行」，而不是「碾压云端」——如果能在车里跑出云端级别的体验，那才是真正的突破。

最后留个问题：你觉得车载AI智能体，最应该具备什么能力？是「听懂你的需求」，还是「主动为你服务」？还是说，你根本不想让AI介入太多，只要车能开好就行？

Google Gemma 4开源发布：小模型的春天来了？