谷歌的新人工智能模型控制机器人

发布时间：2024-01-02 11:36:02 来源：

标签：

导读忘记可以画画的人工智能吧，谷歌最新的人工智能模型可以控制机器人。周五，谷歌推出了RoboticsTransformer2(RT2)，这是一种视觉-语言-动作(

忘记可以画画的人工智能吧，谷歌最新的人工智能模型可以控制机器人。周五，谷歌推出了RoboticsTransformer2(RT2)，这是一种视觉-语言-动作(VLA)模型，可以获取文本和图像并将其输出为机器人动作。

“就像语言模型通过网络文本进行训练来学习一般思想和概念一样，RT-2也可以从网络数据中转移知识来告知机器人行为，”GoogleDeepMind机器人技术主管VincentVanhoucke在一篇博客文章中解释道。“也就是说，RT-2可以和机器人说话。”

Vanhoucke表示，虽然可以通过向聊天机器人提供有关某个主题的信息来训练聊天机器人，但机器人需要更进一步，在现实世界中“扎根”。他提供的例子是一个红苹果。虽然你可以简单地向聊天机器人解释苹果是什么，但机器人需要了解它的一切，以及如何将其与类似的物品(例如红球)区分开来，而且它们还必须学习如何识别苹果。应该把那个苹果捡起来。

RT-2通过使用网络数据，比Google的RT-1和其他模型更进一步。例如，如果您希望以前的模型扔掉一些东西，您需要培训他们什么是垃圾以及如何使用垃圾。对于RT-2，也许您还没有解释垃圾是什么以及如何使用它，但机器人可以使用网络数据自行找出该部分。

借助RT-2，机器人能够学习并获取学到的知识并将其应用于未来的情况。也就是说，谷歌指出，在目前的形式下，限制意味着RT-2只能帮助机器人更好地完成它已经知道如何做的物理任务，而不能从头开始学习它们。

尽管如此，这仍然是向前迈出的一大步，并向我们展示了未来的可能性。如需了解更多信息，Google在其DeepMind博客上详细介绍了RT-2的工作原理。

猜你喜欢

最新文章