AI 走进现实的一步
作者:微信文章很长一段时间里,人形机器人给人的感觉始终有些分裂。
一方面,它们的身体令人惊叹。以 Atlas 为例:奔跑、跳跃、翻转,动作干净利落,几乎没有犹豫。另一方面,它们对世界的理解却十分有限——环境稍有变化,能力边界便立刻显现出来。它们更像是被精心排练过的表演者,而不是生活在现实中的行动者。
直到 Google 将 Gemini 模型接入 Boston Dynamics 的机器人系统,这种割裂才第一次显得有可能被缓慢弥合。这并不是一次引人注目的炫技升级,更像是一次方向上的调整,机器人开始被要求理解环境,而不只是完成动作。
过去我们看到的大多数机器人演示,几乎都发生在被高度安排好的空间里。地面平整,物体位置固定,动作路径提前规划。在这样的世界中,机器人当然很少犯错,但现实从来不是这样运行的。真实环境里,东西会被随手挪动,人会突然出现,空间关系不断变化。对人来说,这些只是背景;对机器人而言,却是持续不断的干扰。
也正因为如此,机器人长期停留在“会做,却不太知道为什么这么做”的阶段。
Gemini 带来的变化,并不在于让机器人显得更聪明,而在于让它少一些依赖预设,多一些现场判断的能力。它能够同时处理视觉、语言和空间信息,并在其中做出推断。这意味着机器人不再只是识别“这是一个物体”,而是开始判断这个物体是否适合抓取、应当如何操作,以及是否需要根据环境变化调整动作。这些判断对人类来说几乎是本能,但对机器而言,却是一道长期难以跨越的门槛。
这次合作中一个很值得注意的细节,是测试场景的选择。不是实验室,也不是展示舞台,而是真实运转中的工厂。那里没有人为机器人放慢节奏,也不会替错误预留余地。人和机器并肩工作,环境持续变化,如果机器人无法稳定应对,就很难谈得上真正的落地应用。
在这样的环境中,机器人是否还能保持可靠,比任何精彩的翻滚动作都更有说服力。
人们常常会问,人形机器人究竟要不要“像人”。但真正的问题或许并不在外形,而在理解。机器人如果要进入人类的世界,它需要理解的不是人长什么样,而是人如何移动、何时停顿、什么时候会做出不完全理性的选择。这些都不是单靠机械结构可以解决的,而更接近认知层面的挑战。
当机器人开始具备一定程度的判断能力,关于安全和责任的讨论自然会随之而来。这些担忧并不多余。只是,与以往不同的是,如今这些问题不再停留在概念层面,而是在真实环境中被一条条拆解、测试、修正。技术真正成熟的标志,往往不是风险消失,而是风险被清楚地看见,并被认真对待。
换一个角度看,这次合作的意义或许在于:人工智能正在获得“身体”。过去的 AI 更多存在于语言、图像和数据之中,而现在,它开始面对重力、摩擦、空间,以及错误所带来的现实后果。
当智能进入物理世界,对它的要求也随之改变。它不再只是要“正确”,还需要稳妥、克制、可靠。
这一步让人第一次隐约看到,AI 在展示未来的想象的同时也在尝试融入现实。
页:
[1]