机器人ChatGPT来了,谷歌发布又一AI大模型黑科技

AI资讯11个月前发布 fengdao
18 0

Google DeepMind再次展示了其在人工智能领域的领先地位,推出了一款全新的机器人模型Robotic Transformer 2(RT-2)。这款机器人模型相当于机器人版ChatGPT,是Google DeepMind视觉-语言-动作(VLA)模型的新版本。RT-2可以教会机器人更好地识别视觉和语言模态,能够解释人类用自然语言发出的指令,并推断出如何做出相应的行动。这意味着RT-2可以理解英语以外的语言的指示,从而更好地服务于全球用户。

RT-2不仅可以执行简单的任务,如找一把临时用的简易锤子,给疲惫的人选一款饮料,还可以执行更加复杂的任务,如将可乐罐移到泰勒·斯威夫特的照片上。这得益于RT-2的多阶段语义推理能力,即使是一些抽象概念,RT-2也能理解并指挥机械臂做出正确的动作。这种能力的实现离不开RT-2模型基于网络和机器人数据进行训练,利用了谷歌自己的Bard等大型语言模型的研究进展,并将其与机器人数据相结合,然后将这些知识转化为机器人控制的通用指令,同时保留web-scale能力。

RT-2的推出,不仅是Google DeepMind在人工智能领域的又一次突破,也为未来机器人的发展提供了更加广阔的空间。随着人工智能技术的不断发展,我们相信RT-2这样的机器人模型将会越来越普及,为人类带来更多的便利和惊喜。

© 版权声明

相关文章

暂无评论

暂无评论...