商汤绝影Sage发布:端侧智能体终于能「上车」了

终于有人把AI塞进车里了,而且不是那种「只能播歌导航」的智能助手。

商汤绝影昨天发布了Sage,一个专门为车端设计的多模态智能体基座大模型。32B总参数,但激活参数只有3B——这个设计挺巧妙的,用MoE(混合专家)架构,让模型在保持大参数规模的同时,推理时只激活一小部分,省资源。

这事儿挺有意思的。我个人的感受是,端侧AI这两年一直是个「看起来很美」的概念。大家都知道把AI放在本地运行有好处:延迟低、隐私安全、不依赖网络。但真正能跑起来的场景,其实不多——手机上的语音助手,还是得连云端;智能音箱,也是云端处理为主。

车载场景不一样。车里的算力是实打实的,英伟达Orin X这种芯片,算力摆在那,不用白不用。而且车端对延迟的要求,比手机高得多——你跟车机说「打开天窗」,等它转两圈圈才反应过来,用户体验就崩了。

上周我还跟一个做自动驾驶的朋友聊,他说现在车企的痛点是:智能座舱的「智能」程度,跟不上消费者的预期。屏幕越来越大,功能越来越多,但核心交互还是「语音指令」那一套,没有真正的「智能体」能力——那种能理解上下文、能自主规划、能多步执行的AI。

Sage这次主打的就是「智能体基座」。什么意思?就是它不是简单地「听懂你的话」,而是能像个人助手一样,帮你规划、执行、反馈。比如你说「我有点冷」,它不只是调高空调温度,而是可能会先检查车窗是否关闭、座椅加热是否打开,然后综合调整。

说实话,我对商汤的印象,在这几年里变了不少。以前觉得它就是个人脸识别公司,后来安防业务收缩,又转型做大模型,我还挺怀疑的——这转型跨度有点大。但Sage这个产品,至少说明他们在端侧AI这块,是有实际思考的,不是盲目跟风。

不过话说回来,端侧AI最大的挑战,从来不是技术,而是生态。Sage能跑在Orin X上,这很好,但有多少车企愿意用?有多少开发者愿意基于它开发应用?这些才是决定它能不能活下来的关键。

对了,还有个数据值得一提:Sage在PinchBench上的表现,据说「领跑全球一线云端大模型」。这个说法有点吓人,但我个人的感受是,benchmark归benchmark,实际体验才是关键。端侧模型的优势在于「够用就行」,而不是「碾压云端」——如果能在车里跑出云端级别的体验,那才是真正的突破。

最后留个问题:你觉得车载AI智能体,最应该具备什么能力?是「听懂你的需求」,还是「主动为你服务」?还是说,你根本不想让AI介入太多,只要车能开好就行?