近年来,计算机科学家开发了越来越先进的算法来控制机器人代理的运动。其中包括模型预测控制(MPC)技术,该技术使用代理的动态模型来优化其针对给定目标的未来行为,同时满足许多约束条件(例如,不能撞到障碍物)。
慕尼黑工业大学和苏黎世大学的研究人员最近创建了实时神经MPC,该框架将基于人工神经网络(ANN)的复杂模型架构集成到敏捷机器人(即四旋翼无人机——具有四个旋翼的无人机)的MPC框架中.这个概念在IEEE机器人和自动化快报中提出,它建立在苏黎世大学机器人和感知小组以前开发的方法的基础上。
“我们看到了由DavideScaramuzza领导的机器人和感知小组的出色工作,并立即着迷于建立他们的核心思想,即让数据驱动(学习)组件促进‘传统’控制算法,”TimSalzmann和MarkusRyll,慕尼黑工业大学自主航空系统组的研究人员告诉TechXplore。
“在我们制定出概念验证以将他们使用高斯过程(GP)的方法推广到通用神经网络(深度学习模型)之后,我们向苏黎世大学的机器人和感知小组提出了我们的想法。从那时起,两个实验室共同推进了技术工作和实验,引发了新的合作。”
Salzmann、Ryll和他们的同事提出的新框架结合了深度学习模型和MPC的在线优化。富有表现力的深度学习模型计算量大。然而,通过实时在线逼近它们,该框架可以利用专用硬件(GPU)有效地处理这些模型,从而使他们的系统能够实时预测机器人的最佳动作。
“实时神经MPC框架允许将两个领域、最优控制和深度学习结合起来,同时允许这两个部分利用各自高度优化的框架和计算设备,”Salzmann和Ryll解释道。“因此,我们可以在GPU上的PyTorch/Tensorflow中执行深度学习计算,而控制优化是在CPU上编译的C代码中执行的。这允许在以前无法实现的应用程序中使用深度学习的力量——例如在板载优化控制中四旋翼飞行器的。”
研究人员在模拟和真实环境中通过一系列实验评估了他们的框架。在这些测试中,他们专门使用它来实时控制高度敏捷的四旋翼飞行器的动作。
他们的结果非常有希望,因为他们可以利用神经网络架构的预测能力,其参数容量比以前用于实时控制敏捷机器人运动的神经网络架构大4,000倍以上。他们还发现,与没有深度学习组件的传统MPC方法相比,他们的框架可以减少高达82%的位置跟踪误差。
“在机器人技术中,我们寻求受控系统动力学及其与环境相互作用(例如,空气动力学效应、轮胎摩擦等)的表达模型,”Salzmann和Ryll说。“虽然这些通常很难通过分析来表述,但基于学习的方法,尤其是神经网络,可以捕获动态和交互效应。但是,模型的准确性随神经网络的大小而变化。实时神经MPC可以使用深度与模型预测控制中以前可行的模型相比,学习模型的功能和性能要强大得多。”
正如最近发布的NvidiaJetson平台所展示的那样,GPU芯片正逐渐进入嵌入式系统。由这支研究团队创建的框架很快就能让开发人员利用先进的数据驱动人工智能技术的高预测能力,更好地模拟集成GPU芯片的机器人的动力学及其与环境的交互,降低事故风险并提高他们的能力。导航功能。
“未来的研究有很多开放的途径,”Salzmann和Ryll补充道。“深度学习方法的一个问题是,对于不属于训练数据的情况(OutOfDistributionOOD),它们的输出可能会不稳定。检测这些情况并为控制提供回退以稳定系统将导致鲁棒性OOD情况。”