对救援人员和户外运动爱好者来说,穿越荒野小径是一项有用的技能,但对机器人来说却很难。这并不是说这些机械野兽在爬上山坡的同时没有能力避开倒下的树枝,最先进的机器学习算法可以做到这一点。问题在于它们缺乏通用性:人工智能驱动的机器人经常在它们从未见过的环境中挣扎。
科罗拉多大学的研究人员最近在预印本服务器Arxiv.org上发表了一篇论文(“荒野小径上机器人从虚拟到现实转移学习”)。提出了一个解决方案。他们的方法利用各种深度学习模型 - 即神经元模拟数学函数层 - 来帮助机器人从相机镜头中判断远足路线的方向。
“机器人在许多涉及户外使用的场景中都有前途,例如搜索和救援,野生动植物管理以及收集数据以改善环境、气候和天气预报。”研究人员写道,“然而,户外步道的自主导航仍然是一个具有挑战性的问题......在许多情况下,收集和训练训练数据集可能不太可行或不实用,特别是由于季节性天气变化、风暴和自然侵蚀,路径条件可能会发生变化。”
正如该论文的作者指出的那样,户外路径存在很多变化。它们由任何数量的材料(如砾石,泥土和覆盖物)定义,并且它们跨越不同的生物群落,例如森林、草地和山脉。此外,它们的外观随着季节、天气和一天中的时间而变化,并且它们通常被茂密的植被部分遮挡。
收集和标记训练强大系统所需的真实数据将非常耗时,因此研究人员采购了虚拟户外路径的合成图像。为了制作它们,他们组装了一个阿尔卑斯山的场景,在Unity中有泥土小径,点缀着Unity Asset Store的树木、岩石和草的3D模型。然后,他们放置了一个带有三个摄像头的虚拟机器人,每个摄像头分别具有400×400像素的分辨率和80度的视野,可以收集20,269张景观图像。
该团队将图像调整为100×100×3像素的分辨率,以实现更快的处理速度和更低的内存消耗。然后他们将集合分成三个独立的集合:一个用于训练,一个用于验证,第三个用于测试。
训练数据集被馈送到具有不同架构的三个不同神经网络:深度神经网络(DNN),卷积神经网络(CNN)和递归神经网络(RNN)。在AI完全控制虚拟机器人的实验中,一个模型 - RNN - 设法以95.02%的准确度预测正确的轨迹方向。重要的是,在一个单独的测试中,研究人员在4,000个真实世界图像的数据集上训练了所有三种AI算法,DNN模型的准确度达到了58.41%,超过了基线,并表明虚拟到现实的转移学习有潜力超越一些传统的计算机视觉方法。
“观察到机器人在导航路径方面取得了很大的成功,包括那些急转弯,巨石等障碍物。”研究人员写道,“此外,我们观察了几个'智能'决策的实例;在一次试验中,机器人在与一个大障碍物碰撞后短暂地偏离了小径,然后导航回到小径并恢复其行程。”
这三个神经网络表现得都不差。机器人偶尔将特定的地形区域误认为是路径特征,这导致它偏离航线。研究人员承认,Unity的低质量地形包不允许物体之间存在“足够的差异”。 (他们留待未来探索技术,以提高普遍性,如程序性地生成具有不同条件的地形。)
但他们认为,自己的工作为加速机器人地形导航AI训练的方法奠定了基础。
“机器人电池寿命,人体疲劳和安全考虑是手动数据采集的主要挑战;然而,通过我们的方法,这些问题可能会被规避,因为标签数据的生成可以在虚拟环境中快速有效地执行。”研究人员写道。 “然后机器人可以进行虚拟训练,以驾驭难以进入和/或危险的地形,包括目前无法访问的新型地形,甚至从未接触过这些环境,并(例如,火星)中收集真实数据。”