谷歌提供新框架 帮助机器人规划路线自主“远程出行”

谷歌机器人研究部门在一篇博客文章中表示,他们正在研究如何让机器人自己进行长距离移动。研究科学家aleksandra faust和机器人软件工程师anthony francis表示:“仅在美国,就有300万人患有行动障碍,无法出门,机器可以帮助行动不便的人做一些简单的事情,比如拿食品、药品或包裹等。”
谷歌提供新框架 帮助机器人规划路线自主“远程出行”
在某种程度上,通过使用强化学习(rl)可以做到这一点,这是一种人工智能训练技术,它利用奖励来驱动个体朝着目标前进。福斯特、弗朗西斯和他的同事们将强化学习与长距离规划路线结合起来,编出能够安全穿越短距离(约15米)且不会撞上移动障碍物的程序。他们利用autorl,一个自动搜索强化学习奖励和神经网络架构的工具,在模拟环境中进行训练,再使用经过训练的程序构建路线图,或由节点(位置)和边组成图。
使用传统rl方法的训练,仍存在许多问题,比如它需要花费时间迭代和手工调整奖励,并在人工智能架构方面不够明智,更不用说减轻遗忘,这种现象是指人工智能系统在学习新信息时,突然忘记了以前学过的信息。
autorl试图通过两个阶段来解决这个问题,奖励搜索和神经网络架构搜索。在阶段, 每个奖励功能略有不同,在这个阶段的后,通常会选择将带到其目的地的奖励。神经网络架构搜索阶段本质上是阶段的重复,但使用选定的奖励来优化网络,并对累积奖励进行优化。
这个自动化的训练过程,可以减轻模型的遗忘情况,并且与现有技术相比,由此产生的策略的质量更高(导航任务的质量提高了26%),它们甚至足够强大,可以在非结构化环境中引导机器人。
autorl制定的策略,对本地导航很有帮助,但远程导航就需要用到概率路线图了,它们是基于采样的规划器的一个子类,对机器人的姿态进行采样,创建符合机器人特性的路线图。
福斯特和弗朗西斯解释说:“首先,我们在一个通用的模拟训练环境中对机器人进行训练,训练一个本地规划策略。再根据该策略构建一个prm,称为prm-rl,它位于部署环境的平铺图之上,相同的平面图可以用于任何机器人。”
为了评估prm-rl,谷歌的研究人员使用比培训环境大200倍的办公室楼层地图构建了一个路线图,在20次试验中,成功率达90%以上。
(原标题:谷歌提供新框架 帮助机器人规划路线自主“远程出行”)

深度剖析锅炉醇基燃料油大卡测试检测仪的系统性能
电缆防火封堵包 阻火包厂家价格
制作一颗硅晶圆需要多少种半导体设备?光刻机仅仅是九牛一毛
大力推广餐饮业安装油烟在线监测监控设备的好处
地磅称重系统更智能高效率的进行车辆称重
谷歌提供新框架 帮助机器人规划路线自主“远程出行”
超声波探伤仪如何清洁
涟水地磅—80吨地磅—14米地磅
国产氮气发生器的故障检修主要包括以下几个步骤及具有的优点
实验型提取浓缩设备的特点
ROSS双联阀W7057A8332*
厂家告诉你橡塑阻热材料绝热材料与保温材料的区别
关于检测仪表的产品分类
FG工业过滤(原MAHLE工业过滤)在工厂的应用
空气热交换器的水流速范围
一体化膜生物反应器的未来前景
德国LAUDA Scientific 光学接触角测量仪的测量性能
COMET AG射线管、射线发生器、高压电缆产品介绍
绞肉机过热后不转动了要怎么解决?
陪你聊高压匀浆机的转速问题