现有的人工智能代理和机器人只有在明确指示时才会帮助人类。换句话说,他们不会凭直觉确定在特定时刻他们如何提供帮助,而是等待人类告诉他们他们需要什么帮助。
麻省理工学院(MIT)的研究人员最近开发了NOPA(神经引导在线概率辅助),这是一个框架,可以让人工代理自主决定如何在不同时间最好地帮助人类用户。该框架在arXiv上预发表的一篇论文中介绍,并将在ICRA2023上展示,它可以使机器人和家庭助理的开发更具响应性和社交智能。
“我们对研究可以帮助人类在模拟的家庭环境中完成任务的代理很感兴趣,因此最终这些机器人可以帮助人们在家中工作,”开展这项研究的研究人员之一泽维尔·普伊格(XavierPuig)告诉TechXplore。“要实现这一目标,一个大问题是如何向这些代理指定我们希望他们帮助我们完成的任务。一种选择是通过语言描述或演示来指定此任务,但这需要额外的工作人类用户。”
Puig和他的同事最近工作的远大目标是构建AI驱动的代理,这些代理可以同时推断人类用户正在尝试解决的任务并适当地帮助他们。他们将这个问题称为“在线观察和帮助”。
可靠地解决这个问题可能很困难。这样做的主要原因是,如果机器人过早开始帮助人类,它可能无法识别人类总体上想要实现的目标,因此它对任务的贡献可能适得其反。
“例如,如果人类用户在厨房里,机器人可能会尝试帮助他们将餐具存放在橱柜中,而人类则想摆好桌子,”Puig解释道。“然而,如果代理等待太久才明白人类的意图是什么,那么他们可能就来不及提供帮助了。在上述情况下,我们的框架将允许机器人代理通过递盘子来帮助人类,无论这些菜是干什么用的。”
本质上,研究人员创建的框架不是预测人类用户试图解决的单一目标,而是允许代理预测一系列目标。这反过来又允许机器人或人工智能助手以符合这些目标的方式提供帮助,而无需等待太久才介入。
“像Alexa这样的普通家庭助理只会在被要求时提供帮助,”进行这项研究的另一位研究员TianminShu告诉TechXplore。“然而,人类可以通过更复杂的方式互相帮助。例如,当你看到你的伙伴从杂货店提着沉重的袋子回家时,你可能会直接帮助他们提这些袋子。如果你等到你的伙伴要求你帮忙,那么你的伴侣可能会不高兴。”
大约二十年前,马克斯普朗克进化人类学研究所的研究人员表明,人类帮助有需要的人的天生倾向很早就发展起来了。在一系列实验中,年仅18个月大的孩子就可以准确地推断出他人的简单意图,并采取行动帮助他们实现目标。
助攻策略的出现源于团队的方法。在顶部,辅助代理(蓝色)决定将物体交给人类(橙色)是最好的策略。在底部,辅助代理在观察人类行为后将对象返回到其原始位置,保持厨房。图片来源:Puig等人。
Puig、Shu和他们的同事希望利用他们的框架为家庭助理配备这些相同的“帮助能力”,让他们能够通过观察自动推断出人类正在尝试做什么,然后以适当的方式采取行动。这样,人类将不再需要不断地向机器人发出指令,而只需专注于手头的任务。
“NOPA是一种同时推断人类目标并帮助他们实现这些目标的方法,”Puig和Shu解释道。“为了推断目标,我们首先使用一个神经网络,它根据人类所做的事情提出多个目标。然后我们使用一种称为逆向规划的推理方法评估这些目标。这个想法是,对于每个目标,我们可以想象人类为实现该目标而采取的理性行动是什么;如果想象的行动与观察到的行动不一致,我们将拒绝该目标提案。”
从本质上讲,NOPA框架不断维护人类可能试图解决的一组可能目标,并随着观察到新的人类行为不断更新这组目标。在不同的时间点,一个帮助计划者然后搜索一个共同的子目标,这将是解决所有当前可能目标的一步。最后,它搜索有助于解决此子目标的具体操作。
“例如,目标可能是将苹果放入冰箱,或将苹果放在桌子上,”Puig和Shu说。“我们的AI助手不会随机猜测目标位置并将苹果放在那里,而是会拿起苹果并将它们交给人类。这样,我们就可以避免因帮助错误的目标而弄乱环境,同时还能节省时间和人类的能量。”
到目前为止,Puig、Shu和他们的同事在模拟环境中评估了他们的框架。虽然他们预计即使在目标不明确的情况下,它也能让代理帮助人类用户,但他们并没有预料到他们在模拟中观察到的一些有趣行为。
“首先,我们发现代理人能够纠正他们的行为,以尽量减少对房屋的干扰,”普伊格解释道。“例如,如果他们选择了一个物体,后来发现该物体与任务无关,他们会将物体放回原来的位置以保持房屋整洁。其次,当不确定目标时,代理会选择行动这通常是有帮助的,无论人类的目标是什么,例如将盘子递给人类而不是承诺将其带到桌子或储物柜中。”
在模拟中,Puig、Shu和他们的同事创建的框架取得了非常有希望的结果。即使该团队最初调整了助手代理来协助代表人类用户的模型(以节省现实世界测试的时间和成本),但发现代理在与真人交互时可以实现类似的性能。
未来,NOPA框架可以帮助增强现有和新开发的家庭助理的能力。此外,它可能会激发类似方法的创造,以创造更直观、更适应社会的人工智能。
“到目前为止,我们只评估了具体模拟中的方法,”Shu补充道。“我们现在想将该方法应用到真实家庭中的真实机器人上。此外,我们希望将语言交流纳入框架,以便人工智能助手更好地帮助人类。”