自动支票阅读、图像识别、语音识别、语音辅助、汽车自动驾驶、策略游戏、财务分析、欺诈检测、搜索引擎、医疗诊断辅助等。
人工智能现在几乎渗透到各个领域,让我们的生活变得更加轻松。目前最成功的技术是自动学习或“机器学习”(ML)技术。
当我们看到一辆自动驾驶汽车驶过时,当我们观察国际象棋软件或当我们聆听语音助手时,我们有理由留下深刻的印象。然而,这些系统并不是很智能。它们使它们能够完成非常专业的任务,在这些任务中它们将轻松击败人类。但他们将无法做任何其他事情,因为他们不具备一般智力。
事实上,这些系统并不了解它们在做什么,因为它们所做的一切主要是统计计算的结果。机器学习书籍充满了“概率”技术、“距离”评估、线性或多项式“回归”、“随机梯度”等。这就是机器学习也被称为统计学习的原因。
大数据和显卡点燃火药
机器学习有三种主要形式:监督式、无监督式和强化式。但它显然是第一个正在崛起的领域,这尤其要归功于它的一个子类别,即深度学习。监督机器学习的目标是创建一个能够识别事物的计算机系统。
为了实现这一目标,我们以“特征”的形式对这些元素进行建模,我们为自己配备了大量标记的事物和学习算法。然后,我们将“重量”与这些不同的特征联系起来,例如,这将使得区分椅子和苹果成为可能。为了找到正确的权重,我们要求算法识别已知的事物。如果他犯了错误,我们会稍微调整权重并重新开始,直到错误最小。如果一切顺利,系统将创建一个权重矩阵,一种视觉过滤器,使其能够很好地识别事物,即使它以前从未见过它们。
但事物的初始建模及其特征的定义是复杂的。这就是深度学习将提供解决方案。这项技术创建于 20 世纪 80 年代,它将学习细分为几个可训练的模块,并将它们排列在连续的层中。结果称为多层神经网络。
这种系统的优点是它会自动创建事物的分层表示并显示出特征。不再需要手工建模。在多层神经网络中,卷积网络脱颖而出。它们由 Yann Lecun 发明,受到哺乳动物视觉皮层功能的启发,特别适合图像识别。
但是深度学习没有立即起飞。直到 2011-2012 年,研究人员才可以一方面依赖大型数据库(ImageNet 数据库中分布在 1,000 个类别中的 120 万张图像),另一方面依赖经济实惠的图形处理器(Nvidia Cuda GPU)这项技术已经真正开始流行。
“错误率的降低使得一场真正的革命以令人难以置信的速度发生了。一夜之间,大多数语音和视觉研究团队放弃了他们喜欢的方法,转而转向卷积和其他神经网络。,Yann Lecun 解释道在法兰西学院,2016年。
如今,监督学习系统已经变得极其复杂。它们能够处理数千个类别和数亿个特征。一些神经网络现在超过 150 层。监督学习领域最负盛名的进展是 Tesla 和 MobileEye 的自动驾驶仪。
奖励学习
但其他形式的学习还没有结束。尤其是强化学习,也有它的辉煌时刻。该技术不依赖于标记数据的评估,而是根据经验奖励过程进行工作。对此进行评估并反馈到学习算法中,以改进决策规则并找到更好的问题解决方案。
这种技术在游戏中被广泛使用。 2017 年,谷歌子公司 DeepMind 公司成功创建了该程序阿尔法狗零式只知道围棋规则的他,在40天的时间里就在这门学科中所向披靡。他通过与自己对战来学习游戏,没有添加外部数据。同年,马卢巴微软子公司推出的强化学习系统不仅能够打破吃豆人女士的人类记录(266,330 分),而且还能够达到最高分(999,990 分)。
问题是强化学习需要很长时间。由于没有标记数据,误差评估比较困难。因此,您必须多次重复这些操作。环境的复杂性也放大了这种评估的难度。当许多因素都会影响实验结果时,我们如何解释实验结果?以吃豆人女士为例,研究人员通过部署 150 个不同的代理来解决这个问题,每个代理都专注于一个特定的问题:收集尽可能多的吃豆糖,避免来自右侧、来自右侧的鬼魂。左等每个代理都会对下一步要采取的行动发表意见。最终的决定是所有这些意见的结果。
控制环境复杂性的另一种方法是集成卷积网络。这条道路尤其被探索谷歌2016 年,该技术表明深度学习使得更好地纠正工业机器人手臂的运动成为可能。最终,他们能够比以前更加流畅地抓取物体。
在眼前,人类雄心勃勃的榜样
但圣杯仍然是无监督学习,这是人类和动物的自然学习模式。它不需要标记数据,并允许软件自行识别遇到的事物。例如,应用于简单的问题时,它可以评估 Spotify 用户的音乐品味或向亚马逊客户提供作品。
无监督学习依赖于不同的技术,包括神经网络和算法。聚类。在后一种情况下,想法通常是计算数据之间的统计距离并识别相似的元素组。
不幸的是,研究人员还不知道如何使用无监督学习来解决复杂问题。
这是一个尚未开发的广阔领域。“人工智能研究人员和物理学家处于同样尴尬的境地;宇宙质量的 95% 具有完全未知的性质:暗物质和暗能量。人工智能的暗物质是无监督学习””,法兰西学院的 Yann Lecun 解释道。简而言之,机器掌权还不是明天。