这是自 2016 年以来一直举办的有趣的虚拟竞赛。多所大学和 Google 或 IBM 等高科技公司定期相互竞争。斯坦福阅读测试(斯坦福问答数据集或 SQuAD)使得评估机器的理解能力成为可能。但两位竞争对手刚刚首次从人群中脱颖而出。第一个是阿里巴巴。 1 月初,他的系统得分为 82.44,以微弱优势击败了在同一轮问答中得分为 82.304 的人类对手。
第二个是微软,它通过其位于亚洲的研究实验室取得了同样的成就。顺便指出的是,三星在本次临时排名中仅排名第 14 位,Facebook 仅排名第 16 位,我们可以在下面的推文中看到:
https://twitter.com/withfries2/status/952951808283967488
科技巨头经常向调查问卷提交他们的人工智能,但 SQuAD 已成为最著名的之一。它包括 100,000 个问题,这些问题是从 500 多篇文章中生成的,主题极其多样,这些文章本身取自维基百科。所有这些都是为了测试机器处理大量信息并为查询提供精确答案的能力。
机器能解决一切问题吗?
机器阅读的这些进步意味着机器最终将有可能吸收大量文本来总结或提取特定信息。为什么不想象有一天,智能助理能够通过简单地从网络获取答案来为任何问题提供非常精确的答案?
在不久的将来,应用程序将是多种但更为温和:提供自动在线客户服务、总结设备使用说明,甚至为某些博物馆提供音频指南文本。就我们而言,我们正在考虑一种新型机器人记者,它能够处理比目前的简单统计数据更复杂的信息。我们甚至可以预期,未来学生将不必完整阅读某些教科书,就能让机器提取大量数据。或者你让你的智能扬声器每天早上整理一份新闻评论,而不必查看报纸。 “这可以前所未有地减少人为干预的需要”,在一份新闻稿中宣布中国日报骆斯,阿里巴巴自然语言处理研究负责人。
在他这边微软旨在简化律师和医生的任务,他们可以花更少的时间阅读大量文件,而将更多的时间用于治疗患者或研究客户的策略。 Bing 搜索引擎已经受益于自动阅读方面的众多进步。微软也仍在开发该系统系统网他的项目是让一台机器教另一台机器阅读。
如果阿里巴巴和微软的人工智能取得了前所未有的成果,那么人类的阅读能力总体上仍然优于机器,而机器在掌握语言的复杂性和细微差别方面仍然遇到困难。“自然语言处理仍然是一个充满挑战的领域。我们都必须继续进步”微软亚洲研究院副院长周明脾气暴躁。