智元机器人一口气发4款新品:大模型+机器人深度融合成真了?

上周在上海参加完智元的合作伙伴大会,我最想说的第一句话是:这次不一样。

不是那种「PPT发布」的不一样,是真的把东西拿到现场、让你摸、让你跑代码的不一样。

智元在4月17日的大会上,一口气发布了:4款本体新品、4大AI大模型、7大解决方案,外加一个开放数据集。2500人参会,34个国家——这个规模本身就说明了一些问题。

4款新本体里,最值得关注的是哪款?

我个人的关注点在一个细节:会上有个四足机器人亮相,智元酷拓D2系列。这个四足不是那种「实验室展示用的四足」,而是已经在工业场景里实际部署的四足——粮仓平仓、海缆探测这类特种作业。

这说明什么问题?具身智能正在从「能走能跑」进化到「能干活」。

机器人半程马拉松比赛当然很热血,但真正商业化落地比跑马拉松难得多。走10公里是一回事,在真实工业环境里完成一次探测任务是另一回事。智元这次把重点放在「作业能力」而不是「表演能力」上,我认为是正确的优先级排序。

大模型和机器人到底能不能深度融合?

以前大家都在说「大模型+机器人」,但实际落地的时候,语言模型和控制系统基本上是两套东西,语言模型负责「想」,控制系统负责「动」,两者之间有一道巨大的鸿沟。

这次智元的方案里,有一个我比较关注的技术方向:把大模型的推理能力和机器人的运动控制能力在底层打通。不是简单的「语言模型输出指令,机器人执行」,而是让机器人在运动过程中就能调用大模型的思维链能力。

翻译成人话就是:机器人不只是「听令行事」,而是能够边做边想,遇到问题能够自主推理下一步该怎么做。

这个方向能不能成,我不知道。但至少在方向上,比「给机器人装个ChatGPT」要深刻得多。

我的一点保留意见

说了这么多好听的,我也有一个担忧:这么多「发布」,真正落地的是多少?

机器人行业每年都有各种发布会、各种「首款」「独创」「突破」。但最后能在工厂里稳定运行两年以上的,少之又少。智元这次发布的东西,有多少是工程上真正Ready的,有多少是为了拉合作、融资用的,还是需要观察。

不过话说回来,4月19日的机器人半马确实是个挺好的验证机会——虽然不完美,但让机器人公开跑21公里,本身就是对工程能力的一次硬核检验。

结果怎么样大家都看到了。摔的摔,停的停,没有一个完美完赛的。

但这恰恰说明,具身智能还在非常早期的阶段,还有一段路要走。