“最好的人工智能系统的常识还不如老鼠,”Yann LeCun 去年一月宣布在访问巴黎期间。
对于Facebook人工智能研究负责人来说,机器距离与人类匹敌还很远。为了在这一领域取得进展,这家高科技巨头的 FAIR 实验室正在采取多种途径,大量借鉴人类学习模型,这些模型从出生起就基于交互和对环境的观察。
正是在这样的背景下,由 Douwe Kiela 和 Jason Weston 领导的一个小团队产生了启动该项目的非常规想法“边走边聊”由两名特工(人工智能)组成,一名扮演在纽约迷路的游客,另一名充当导游。最终目标是通过每个具有不同元素的方式到达精确的目的地:带有网格的 360 度城市视图,使游客可以轻松发现十字路口,以及带有“酒店”或“餐厅”等通用地标的简单 2D 地图”作为指南。每个人都无法向对方展示他所看到的。
结果比人类更好
第一个结果表明,通过训练它们在非常现实的情况下而不是在模拟的宇宙中进行对话、行动和感知,这些计算机程序最终会更容易地找到自己的方式。因为每个人都有义务向对方描述他所看到的东西,一个是其位置,另一个是为了到达最终目的地而经过的地方。
不过,请注意不要被误解。如果两个程序收集并理解用自然语言表达的大量元素,它们就可以用合成语言相互交流。所有结果均优于人类进行相同测试所获得的结果!
Facebook 研究人员为此开发了一种名为 MASC(空间卷积掩模注意力)的机制,该机制允许代理使用的语言模型快速分析响应中的关键词。它的使用将使实验的精度提高一倍。
请注意,每次体验在导游预测游客到达时结束。如果正确的话,这一集就被认为是成功的。对行动或通讯的次数没有限制。
Facebook 毫无疑问是在吹嘘,它更愿意将这一实验视为基础研究的一个阶段,提出的问题多于提供的答案。“我们的最终目标是通过自然语言交互实现高水平的综合性能,并邀请社区也这样做。”,我们可以在 FAIR 博文中阅读。
为了鼓励其他科学家加入该项目,Facebook 立即发布了其“Talk the Walk”数据集,这是第一个基于行动和感知的大规模对话数据集。我们不遗余力地希望有一天我们的智能助手能够真正理解人类告诉他们的内容。那时,也只有那时,他们才能真正帮助我们。
来源 :
Facebook