“SSUP”模型可以学会像人类一样使用工具
3831
在《美国国家科学院院刊》上发表的一篇新论文中描述了在麻省理工学院在思维和机器中心进行的研究,研究人员Kelsey Allen,Kevin Smith和Joshua Tenenbaum讨论了这种即兴工具。
他们设计了一项新颖的任务,即“虚拟工具”游戏,该工具充分利用了工具的使用能力:人们必须从一组“工具”中选择一个对象,然后才能将其放置在二维计算机化场景中以实现目标,例如将球放入某个容器中。解决该游戏中的难题需要对许多物理原理进行推理,包括发射,阻挡或支撑物体。
该团队假设,人们需要依靠三种能力来解决这些难题:
一种将人们的行为引导到将在场景中产生变化的行为的先验信念;
能够想象其行为的效果的能力;
以及一种能够快速做出反应的机制更新他们对哪些行动可能提供解决方案的信念。
他们建立了一个实例化这些原理的模型,称为“采样,模拟,更新”或“ SSUP”模型,并使其与人玩同一游戏。他们发现SSUP可以像人们一样以相似的速度和方式解决每个难题。
另一方面,流行的深度学习模型可以很好地玩Atari游戏,但对象和实体结构不相同,因此无法将其知识推广到未经过直接训练的难题中。
这项研究为研究和规范化支持人工工具使用的认知提供了新的框架。该团队希望将这一框架扩展到不仅研究工具的使用,而且还研究人们如何创建用于解决新问题的创新性新工具,以及人类如何将这些信息从简单的物理工具传输到复杂的对象(例如计算机或飞机)中我们的日常生活。
麻省理工学院计算认知科学实验室的一名博士生Kelsey Allen,对虚拟工具游戏如何为其他对工具使用感兴趣的认知科学家,提供支持感到非常兴奋:“在这一领域还有很多事情要做。我们已经开始与多个不同机构的研究人员就项目进行合作,范围从研究游戏变得有趣意味着什么,到研究体现方式如何影响无形的身体推理。我希望认知科学界的其他人将使用该游戏作为工具,以更好地了解物理模型如何与决策和计划进行交互。”
麻省理工学院计算认知科学教授约书亚·特南鲍姆(Joshua Tenenbaum)认为,这项工作不仅是朝着理解人类认知和文化的重要方面迈出的一步,而且也是朝着如何在机器中构建更像人类的形式发展智能迈出的一步。
“人工智能研究人员对增强学习(RL)算法可以像人类一样,从试错经验中学习的潜力感到非常兴奋,但是人类受益于真正的试错学习却仅仅展示了少数Tenenbaum说:“这是一项试验,而不是像当今的RL系统那样拥有数百万或数十亿的经验。” “虚拟工具游戏使我们能够研究这种非常快速,自然得多的人类尝试错误学习形式。