这只机器狗逆天了!在哪跌倒就在哪站起(视频)

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

【新智元导读】瑞士苏黎世机器人系统实验室为他们的ANYmal机器狗开发了新的训练方法,利用强化学习,机器人学习的速度提升了1000倍,动作灵活性和速度都大幅增强,而且任踢不倒,或者在哪里跌倒就在哪里站起。

一提到机器狗,大家可能首先想到的是波士顿动力的SpotMini。

这只黄色小狗会跑会跳,还会上下楼梯,随音乐热舞,崎岖地面行走如履平地,甚至还会帮“兄弟”开门,简直成精了!难怪每回波士顿动力放出新视频都会抢尽眼球。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

波士顿动力的SpotMini会开门

不过这次,抢占眼球的是一只“在哪里跌倒就在哪里站起来”的黑色机器狗。这只机器狗来自瑞士苏黎世机器人系统实验室,相关论文周三发表在Science Robotics杂志上。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

ANYmal机器狗

要知道,先进的机器人是很昂贵的,要教它们学会一项任务非常耗时。来自瑞士苏黎世机器人系统实验室的一个研究小组称,他们找到一种方法,通过适当的模拟,可以训练他们的机器人快速学习。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

任踢不倒

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

摔了个狗啃泥,但没关系,翻个身就能起来

在论文中,他们描述了一种系统,这种系统可以训练机器人以比以往任何时候都要快的速度移动,同时仍然能够抵抗试图将其撞倒的企图。如果它真的被撞倒了,它甚至可以通过自身的力量重新站起来

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

ANYmal跑过房间

这台机器狗名为ANYmal,最初是由位于苏黎世联邦理工学院(ETH Zurich)机器人系统实验室的研究人员开发的,后来成为2016年成立的ANYbotics公司的一部分,开始商业化。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

ANYmal可用于搜救任务,例如火灾搜救

不像现在的许多四足机器人,ANYmal有防水能力,是专门为穿越不太理想的环境而设计的,比如森林、工业场所和雪地。根据ANYbotics的说法,这款机器人已经可以在现实世界中用于人类无法到达的危险地区,包括搜救任务。它去年甚至出现在最近一集《X档案》里,扮演一个攻击机器人。

利用强化学习,训练速度提升1000倍

虽然在没有人类输入的情况下,四条腿的机器人比两条腿的机器人在模仿真实生物的灵活性和协调性方面要领先得多,但仍有很大的改进空间。

机器人专家已经转向的一个潜在的解决方案是一种称为强化学习的机器学习形式。这种方法可以让机器人通过反复试验来训练自己,找到执行任务的最佳方式,比如走路。

简而言之,强化学习可以让机器人几乎像能动物一样“思考”和学习,具有自己的内在逻辑。

然而,在一个有腿的、真实的机器人身上使用强化学习并不容易,因为它们本身和它们的运动都非常复杂。因此,目前为止,科学家们主要依靠计算机模拟机器人学习。但是,该研究论文的第一作者、苏黎世联邦理工学院机器人系统实验室的科学家Jemin Hwangbo说,使用这些模拟数据来训练ANYmal这样的真实机器人也很困难。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

利用模拟数据训练

他说:“为复杂的腿式系统开发控制策略是极具挑战性的。机器人面临的情况数不胜数,几乎不可能设计出能涵盖所有情况的控制逻辑。”

在这篇新论文中,Hwangbo和他的团队写道,他们开发出一种神经网络,使他们能够更好、更容易地将仿真数据转换到机器人上。让机器人利用模拟数据学习的速度比在现实世界学习快了近1000倍

研究人员让模拟机器狗自己训练了11个小时,然后将结果下载到物理机器人上。测试表明,该方法运行良好,改进版的ANYmal机器狗更加灵活,速度也更快。

研究小组还表示,他们能够降低类似系统所需的计算力,只需要一台普通PC就能执行模拟。

上面的视频展示了这一研究的最终结果,看起来确实令人印象深刻,也有点可怕。

使用模拟数据训练的ANYmal跑得更快,更节能,比它以往的最快跑步速度快了25%,同时也能更好地按照指令以一定的速度移动。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

虽然它原本已经是相当强壮的机器人,但在研究人员尽力将其踢翻的过程中,新的训练仍然使它能够保持直立。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

它甚至可以从跌倒中翻身站起,研究人员称,在类似复杂度的四足机器人上从未能做到这一点。

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

ANYmal机器狗的不同落体配置

这只机器狗逆天了!在哪跌倒就在哪站起(视频)

从各种方向跌倒,ANYmal都能翻身站起

Hwango说,他们的新训练技术不是仅适用于ANYmal。他们认为该技术可以帮助任何四足机器人更好地站立。但要训练机器人在各种各样的环境下都能如此敏捷,仍有很多工作要做。

他说:“这篇论文提出的方法只针对平坦的地形。为了穿越崎岖不平、非结构化的地形,我们需要使用视觉传感器和适当的政策来处理这些信息。我们正在朝这个方向努力,希望不久能提出一个更全面的解决办法。”

与此前的ANYmal机器人控制器相比,新的训练方法在使用更少的扭矩和功率的情况下,能使ANYmal行走更加精确。

相关推荐