特斯拉车机突然「说人话」了:接入豆包大模型这件事,比你想的有意思
说实话,看到特斯拉车机要接入豆包大模型的消息,我的第一反应是:啊?
不是我不看好豆包,而是特斯拉这步棋走得有点让人意外。要知道,马斯克可是那个在推特上跟OpenAI互怼、扬言要自己做TruthGPT的人。现在突然转头接入国产大模型,这剧情反转得比美剧还快。
但仔细一想,这事其实挺有意思的。
根据网信上海发布的备案信息,特斯拉车机语音大模型服务于4月20日完成备案,备案单位是特斯拉(上海)有限公司。注意这个细节——是上海公司备案,不是美国总部。这意味着什么?意味着这是针对中国市场的本土化方案,而不是全球统一的架构调整。
说白了,这就是个「入乡随俗」的本地化策略。
但你别小看这个本地化。车机语音助手这玩意儿,用过的人都知道,现在的体验基本介于「人工智障」和「能凑合用」之间。你让它导航到某个地方,它听成我要吃汉堡;你问它空调能不能调低一点,它给你打开了座椅加热。
大模型进来之后,理论上会好很多。上下文理解能力强了,多轮对话能连贯了,甚至能理解一些模糊指令。比如你说我有点冷,它知道要关空调而不是给你讲个冷笑话。
不过我倒是有个疑问:特斯拉为什么选豆包,而不是文心一言或者通义千问?
从能力上说,几家头部国产模型的基础能力差距已经不大了。但从商业角度考虑,字节跳动和特斯拉之间似乎并没有直接的竞争关系——字节不做车,特斯拉不做短视频。相比之下,百度有Apollo,阿里有斑马,选它们反而有点微妙。
当然,这只是我的猜测。真实的原因可能很简单:谁性价比高选谁。
这件事更大的意义在于,它标志着大模型正在从「云端应用」向「端侧场景」渗透。车机是一个非常特殊的场景——它需要实时响应、需要离线可用、需要车规级稳定性。大模型能在这上面跑起来,说明工程化已经做得相当不错了。
接下来就看实际体验如何了。如果特斯拉+豆包的组合能把车机语音做到「真·可用」的程度,那其他车企肯定坐不住。毕竟,语音交互是智能座舱的核心入口,谁能把这个做好,谁就能在用户体验上甩开对手一条街。
说实话,我还挺期待的。毕竟我的车机助手现在最擅长的事情就是装聋作哑。