Microsoft得益于新系统，在对话性语音识别中实现了人类平价

2016-10-19

Microsoft人工智能和研究工程师已经开发了一种语音识别系统，该系统具有与人类翻译人员相当的能力。

据报道，该技术的单词率误差为5.9％，这是第一次低于6％。

根据研究人员的说法，这种结果类似于与软件所实现的对话的人相似的。

“我们已经达到了人类的平价。这是一个历史性的成就，”微软的首席演讲科学家Xuedong Huang，说。

该公司表示，研究人员使用的神经语言模型不仅能够学习单词的声音，还可以学习与他人的联系。例如，该软件可以理解“快速”和“快速”一词具有相似的含义。

至于这需要什么，微软计划使用这项技术来改善其虚拟助手提供科尔塔纳以及某些可访问性工具，例如语音到文本转录软件。

有趣的是，汤姆·布兰特（Tom Brant）PC杂志报道说，五年前的最佳语音识别系统通常产生转录，单词错误率在20％至25％之间。不用说，这一发展与当时的技术可以做到的一项巨大的加速。

Microsoft人工智能与研究小组执行副总裁Harry Shum说：“即使在五年前，我也不会以为我们可以实现这一目标。”

但是，该公司强调，这并不意味着系统可以完美地抄写和识别语音，并补充说，即使人类也不这样做。无论如何，这在神经网络的研究中仍然很重要。

还值得一提的是雷德蒙德公司管理在9月份达到6.3％的单词率误差。当时，毫无疑问，这是一项令人印象深刻的壮举。

对于那些感兴趣的人研究论文可在网上获得，信用Wayne Xiong，Jasha Droppo，Xuedong Huang，Frank Seide，Mike Seltzer，Andreas Stolcke，Dong Yu和Geoffrey Zweig。

简而言之，这或多或少只是在语音识别技术方面的开始，因为Microsoft还有很长的路要走，可以清楚地可以清楚地听到在许多不同环境中设置的各种声音。然而，这项成就是向前迈出的重要一步。

您如何看待微软达到什么？请随时通过下面的评论部分放弃，并告诉我们。