机器人自主导航
机器人通过传感器实时感知周围环境、通过导航算法生成动作指令,躲避障碍物的同时移动到指定的目标点或寻找到指定目标。导航作为机器人和人工智能的一项基本任务,研究如何提高导航性能、实现更加拟人的智能导航十分重要。
导航的关键在于如何确定机器人自身在环境中的位置、如何理解周围环境、如何到达目标地点。
传统导航与基于深度学习导航
n 传统导航框架
¡ 传统导航框架将上述问题划分为三大研究方向:定位Location、地图构建Mapping和路径规划Navigation;
¡ 基于即时定位与地图构建(SLAM)生成环境地图,再通过定位算法确定机器人在环境中的位置,最后由路径规划算法控制机器人移动到指定目标点。
这种将导航任务分为三个模块的方法,存在很多难点:
1. 是对每一部分都需要单独研究,最终彼此配合共同完成导航任务,因此模块集成时会面临很多问题,如集成过程中的误差累加问题。
2. 是传统导航框架十分依赖地图构建,对传感器噪声十分敏感,以至在未知动态环境中表现较差。
3. 是基于地图作路径规划的方法其特征学习能力有限,会产生较大的回环误差。
n 基于深度学习导航
随着深度学习、强化学习的成功,以及其在低成本和高效的无监督学习方面的良好表现,基于学习的导航方法也愈发流行。此类方法将感知信息作为输入,无需构建环境地图来做定位、路径规划,而是依赖神经网络直接输出动作指令。因此这类方法更加智能、模块间的冗余和耦合调试成本更小、网络的计算效率和鲁棒性更高,在未知动态环境中的表现也更加优 秀。
智能导航-赋予记忆和推断
常规导航只是感知到决策的映射,本质上是基于避障能力来完成导航任务,仍缺乏人类大脑的思维方式、认知能力。人类完成导航任务,主要基于记忆能力和推断能力。记忆能力,一方面是对环境信息的记忆,如人类会对自己曾经探索过的环境十分熟悉;另一方面,也是对导航过程的记忆,如在某个房间内未发现目标物体,人类一般不会再次进入重复寻找。而推断能力是指人类会根自身多年来构建的先验知识推断出有利于完成导航任务的信息,如目标物最可能在哪个房间、最可能在哪些物体附近,又如,为了找到水果我们会尝试前往冰箱,而当发现微波炉时我们会认为冰箱很可能就在附近。
提升机器人导航性能,使导航更加智能化的关键在于,如何令机器人在导航过程中模仿人类的思维方式,即拥有记忆能力和推断能力,以及如何实现二者的有机结合。
通过语义图谱和拓扑地图的在线交互实现了记忆能力和推断能力的有机结合,从而实现了更加拟人的智能导航。
n 拓扑记忆
地图是对环境信息的记录,可以看作为机器人提供了环境记忆能力。传统导航框架中,需要首先构建环境地图,再基于地图作定位、路径规划,这种将地图作为参考的导航方式在一定程度上就赋予了机器人记忆环境的能力。
其中,地图可以是预先构建的,也可以是在导航的过程中同步构建;可以使用能够精 确表示环境信息的度量地图,如3D 点云图,也可以使用由节点和边构成的拓扑地图,此外还可将拓扑地图和度量地图相结合,以进一步提升机器人导航效果。
而随着神经网络的发展,直接使用神经网络搭建记忆模块,隐式地记录环境特征也可以帮助机器人获取记忆能力。一般来说,内部记忆仅依赖导航网络自身来记录环境信息,其网络容量有限,在对长期记忆要求较高的导航任务中性能有限。而外部记忆可通过单独的外部记忆模块来将外部内存资源与神经网络耦合,以此提高神经网络记忆容量、扩展网络的功能。
n 语义推断
图谱也由节点和边构成,节点代表环境中的各类物体,边表示物体间的相关性。首先在数据集上构建环境中各类物体的语义关系图谱,然后在线导航过程中,根据当前观测到的物体来更新语义图谱节点向量,再通过图神经网络提取语义信息用于导航策略生成。提取到的语义信息便可以提供一种语义倾向性,帮助机器人获取推断能力。
设计图谱信息与视觉信息的融合机制,以提取出和导航任务最为相关的信息;同时通过设置子目标,将一条轨迹划分为多条,以加快训练过程、提高数据效率。在物体间构建了父类子类关系并用于设计奖励,训练时传播回图神经网络层,以学习到这种层次关系。此外,除了语义图谱预构建的方法,还提出了图谱邻接矩阵可训练的方法,使得无需预先定义语义图谱中各物体之间的关系