反垃圾邮件、Kinect 甚至自动翻译器有什么共同点?它们都是基于机器学习技术的!微软技术和安全总监 Bernard Ourghanlian 向我们讲述了人工智能的这一重大进步。
Bernard Ourghanlian 于 1999 年加入 Microsoft。他是 Microsoft France 的技术和安全总监。在 Windows 9 首次推出前几天,以及 Cortana 语音助手在法国推出前几个月,我们在出版商法国总部举行的新闻发布会上与他进行了交谈。他与我们讨论了人工智能的一个令人兴奋的子领域:机器学习。
01net:您能给我们定义一下机器学习吗?
伯纳德·奥根连:它是机器获取数据以学习和丰富自身的能力,这要归功于它的经验,也就是说它恢复其他数据和学习新数据的潜在能力。
有具体的应用例子吗?
事实上,我们在日常生活中以极其平庸的方式使用机器学习。对于搜索引擎,我们使用机器学习。当您的邮箱收到很少或根本没有垃圾邮件时,这是因为它具有过滤垃圾邮件的机器学习算法。
机器学习什么时候开始普及的?
我想说这种技术已经存在十多年了。
我们还谈论了很多关于深度学习的内容。有什么区别?
深度学习是机器学习,但其算法的实现基于所谓的深度神经网络。他们首先使微软研究院,然后是整个行业,在语音识别方面取得了长足的进步。在这一领域,第一项工作是由美国国防部资助的,作为冷战的一部分,将俄文翻译成美文。
然后,加拿大取得了进展,因为他们有义务将所有立法文本翻译成其两种官方语言:法语和英语。最后,最近,谷歌的方法包括:“我上网查看网络上翻译的文本,这样我就可以丰富我的数据库并学习”。现在,我们已经成功地将平均错误率降低到了 5% 以下,这是完全可以接受的。
我们在哪些 Microsoft 应用程序中发现了深度学习?
Cortana [微软的个人助理] 基于多个层面的深度学习。首先是关于对人所说内容的理解。然后因为它使用 Bing,而 Bing 本身就支持深度学习。最后,通过软件传感器,它可以了解您的环境,从而根据具体情况进行干预。那是针对普通大众的。我们还推出了 Azure ML,它的测试版有效期为几个月,它允许公司访问具有机器学习算法库的市场。
机器学习的未来是什么?
我们的直觉是,将会有越来越多的人拥有私人助理,为我们的日常生活提供帮助。甚至,在一定数量的情况下,谁可以代替我们行动。
它的优势在于能够处理大量数据吗?
不。当然,我们拥有的数据越多,我们的模型就越相关。但我们可以很好地在小数据量上创建模型。而这并不是导致机器学习出现的原因。相反,能够完成使用传统编程语言无法完成的事情。机器学习是计算机科学和统计学的融合。它允许您在真实情况下收集数据并将这些数据提取到模型中。这是它的根本性贡献。
接下来的问题是这些数据是否具有代表性,或者是否异常,也就是说超出了经典经验的范围。因此,我们可以在 IT 安全中非常有趣地使用机器学习。如今有许多 CAC 40 公司在几个月甚至几年前就遭受过攻击,但他们却没有意识到。然而,机器学习能够解释微弱的信号。无需尝试处理大量行为相同的数据,而是可以隔离少数表现出奇怪行为且需要处理的数据。
想到我们可以用它来建模和预测人们的行为,是不是很可怕?
是的,用户不能对所收集数据的处理负责。因为他不一定知道十年后我们要用它做什么。奥巴马总统的专家委员会还建议修改立法,让公司或国家承担责任。这也是微软的立场。