微软的新人工智能能够发现好笑话
飞出个未来/二十世纪福克斯
尽管计算机能够在短短几秒钟内处理数百万个数字,但它们并不以具有深厚的情感或幽默感而闻名——直到现在。 一个新的微软开发的系统经过训练,可以发现正在进行的最有趣的提交内容纽约人卡通字幕比赛。 事实上,该软件的开发部分是出于需要,大量条目涌入,人类编辑无法应对。
“每周查看 5,000 个字幕条目的过程通常会在大约两年内摧毁[我的编辑助理]的思维,然后我会得到一个新的,”纽约人漫画编辑鲍勃·曼考夫向彭博社解释。 “这有点令人畏惧。这就像雪盲一样;你的幽默失明了。”
这就是曼考夫一直与微软研究人员 Dafna Shahaf 和 Eric Horvitz 合作开发新的幽默敏感人工智能软件的原因。 当然,该程序需要接受哪些有趣、哪些不好笑的训练,因为它没有天生的感知力来判断什么是有趣的:通过输入数千条之前提交的内容,人工智能获得了一个包含之前回复的大型数据库。工作。
然后还有一个问题,就是让软件准确地识别卡通所描绘的内容——如果它要为其挑选一个标题,这一点至关重要。 为了解决这个问题,研究人员选择了一系列关键字,分为两组——上下文和异常——这为人工智能引擎提供了足够的数据来处理。 在最终的计算中,计算机在选择最有趣的标题方面不如人类编辑那么好,但它足以过滤掉糟糕的笑话,使其变得有用。
标题的复杂性、可读性、其中的情感、专有名词和不定冠词的数量等因素都被用来衡量一个笑话是否真的有趣。 在研究结束时,该团队估计每周至少有 2,200 份提交作品可以从比赛中被淘汰,而不会面临丢弃潜在宝石的风险。 “我确实认为未来是人机陪伴”曼考夫说。“计算机可以提供很大的帮助。”
对于微软来说,长期目标是达到一个阶段,让软件能够想出自己的笑话(当然是基于以前的俏皮话的庞大数据库,而不是最初的想法)——这将使应用程序,例如科塔娜相处起来更愉快。 这是一种改变,不再需要担心机器人崛起并接管文明。 如果我们能够防止类似的事情再次发生,那么这一切都是完全值得的:
研究人员的努力正在 8 月 13 日悉尼 KDD 数据会议上进行展示,官方报告也已发布在线发布。