一个稳健高效的同步定位与映射(SLAM)系统对于机器人的自主性至关重要。对于视觉SLAM算法来说,虽然理论框架已经在大多数方面得到了很好的建立,但在大多数情况下,特征提取和关联仍然是经验性设计,在复杂的环境中可能是脆弱的。本文表明,利用深度卷积神经网络(CNN)进行特征提取可以无缝地融入到现代SLAM框架中。所提出的SLAM系统利用一个最先进的CNN来检测每个图像帧中的关键点,不仅给出关键点描述符,还给出整个图像的全局描述符。这些局部和全局特征然后被不同的SLAM模块使用,与使用手工制作的特征相比,对环境变化和视角变化的鲁棒性大大提高。我们还用词袋法(Bag of Words,BoW)训练了一个局部特征的视觉词汇表。基于局部特征、全局特征和词汇,我们建立了一个高可靠的闭环检测方法。实验结果表明,所有提出的模块都显著优于基线,在所有评估数据上,完整系统实现了更低的轨迹误差和更高的正确率。此外,通过使用英特尔OpenVINO工具包优化CNN,并利用Fast BoW库,系统从现代CPU中的SIMD(单指令-多数据)技术中大大受益。整个系统可以在没有任何GPU或其他加速器的情况下实时运行。代码在这个https****上公开。
https://arxiv.org/abs/2008.05416
DXSLAM.pdf