(资料图)
谷歌“深度思维”公司研究人员最近将人工智能与一款名为“机器猫”的机器人结合起来,预计它将在自我训练机器人的世界中实现一大飞跃。利用大型语言模型背后的相同技术研发的“机器猫”,不仅可快速学习新任务,还可通过构建自己的性能数据来提高性能。研究论文发表在预印本服务器arXiv上。
到目前为止,机器人通常执行特定的、预先编程的任务。随着大型语言模型的引入,机器人技能集开始扩大。研究人员表示,“机器猫”具有良性的训练循环。学习的新任务越多,它学习更多新任务的能力就越好。
“机器猫”领会新任务的速度非常快,例如学会将各种形状的拼图块放入适当的孔中或将水果放入碗中。随后它还能够“基于数百万条轨迹的数据集” 继续前进并执行更复杂的任务,这些数据集来自先前的任务和新的自生成数据,这类似于人类在特定领域加深学习时发展出的更多样化的技能。
随着“机器猫”技术的改进,其新学到的行为将被转移到其他机器人上,而其他机器人又以这些技能为基础。演示中,该机器人通过人类控制的机械臂进行了100到1000次演示,微调了其性能,然后对衍生模型进行特定任务的训练,并将数据输入到通用指令池中。
“机器猫”最初在接触以前未学过的任务时,有36%的成功率,但随着时间的推移,通过自我训练,它的成功率提高了一倍。目前它只需100次演示就可完成一项新任务。
研究人员表示,这一研发成果减少了对人类监督训练的需求,是创建通用机器人的重要一步。