1955 年 8 月,一群科学家请求资助 13,500 美元,以便在新罕布什尔州达特茅斯学院举办夏季研讨会。他们提议探索的领域是人工智能(人工智能)。
尽管资金请求微乎其微,研究人员的猜想并不:“原则上,学习的每个方面或智能的任何其他特征都可以如此精确地描述,以至于可以制造机器来模拟它”。
自从这些卑微的开端以来,电影和媒体纷纷将人工智能浪漫化或将其塑造成恶棍。然而,对于大多数人来说,人工智能仍然是一个讨论点,而不是有意识的生活体验的一部分。
AI已经走进我们的生活
上个月末,AI以 ChatGPT 的形式,摆脱了科幻猜测和研究实验室,进入了普通大众的桌面和手机。
这就是所谓的“生成式人工智能”——突然间,措辞巧妙的提示可以生成一篇文章,或者整理一份食谱和购物清单,或者创作一首埃尔维斯·普雷斯利风格的诗。
虽然 ChatGPT 是生成式人工智能成功的一年中最引人注目的进入者,但类似的系统在创建新内容方面表现出了更广泛的潜力,通过文本到图像提示来创建充满活力的图像,甚至赢得了艺术比赛。
人工智能可能还没有谋生的机会意识或者是科幻电影和小说中流行的一种心理理论,但它至少正在接近颠覆我们认为人工智能系统可以做的事情。
与这些系统密切合作的研究人员已经被这些系统迷住了感知的前景,就像 Google 的大型语言模型 (LLM) LaMDA 的情况一样。法学硕士是一种经过训练可以处理和生成自然语言的模型。
生成式人工智能还引发了对剽窃、利用原始内容来创建模型的担忧,信息操纵的伦理和滥用信任,甚至“编程结束”。
所有这一切的核心是自达特茅斯夏季研讨会以来日益紧迫的问题:人工智能与人类智能有何不同?
“AI”到底意味着什么?
要成为人工智能,系统必须表现出一定程度的学习和适应能力。因此,决策系统、自动化和统计都不是人工智能。
人工智能大致分为两类:狭义人工智能(ANI)和通用人工智能(AGI)。迄今为止,AGI 还不存在。
创建通用人工智能的关键挑战是以一致且有用的方式利用所有知识对世界进行充分建模。至少可以说,这是一项艰巨的任务。
我们今天所知道的大多数人工智能都具有狭隘的智能——特定的系统解决特定的问题。与人类智能不同,这种狭隘的人工智能智能仅在其接受过训练的领域有效:例如欺诈检测、面部识别或社交推荐。
然而,通用人工智能将像人类一样发挥作用。目前,尝试实现这一目标的最著名的例子是使用神经网络和基于大量数据训练的“深度学习”。
神经网络的灵感来自于人类大脑的工作方式。与大多数人不同机器学习模型对训练数据进行计算,神经网络的工作原理是通过互连网络逐一馈送每个数据点,每次都调整参数。
随着越来越多的数据通过网络输入,参数趋于稳定;最终结果是“训练有素”的神经网络,然后它可以根据新数据产生所需的输出——例如,识别图像中是否包含猫或狗。
当今人工智能的重大飞跃是由训练大型神经网络方式的技术改进推动的,得益于大型云计算基础设施的功能,我们可以在每次运行中重新调整大量参数。例如,GPT-3(为 ChatGPT 提供支持的人工智能系统)是一个大型神经网络拥有 1750 亿个参数。
人工智能需要什么才能发挥作用?
人工智能要想成功需要三件事。
首先,它需要高质量、公正的数据,而且是大量的数据。构建神经网络的研究人员使用随着社会数字化而产生的大数据集。
Co-Pilot 旨在增强人类程序员的能力,从 GitHub 上共享的数十亿行代码中提取数据。 ChatGPT 和其他大型语言模型使用在线存储的数十亿个网站和文本文档。
文本到图像工具,例如 Stable Diffusion、DALLE-2 和 Midjourney,使用来自数据集的图像-文本对,例如莱昂5B。随着我们将更多的生活数字化并为它们提供替代数据源,例如模拟数据或来自游戏设置的数据,人工智能模型将继续发展其复杂性和影响力我的世界。
人工智能还需要计算基础设施来进行有效的训练。随着计算机变得越来越强大,现在需要大量工作和大规模计算的模型可能在不久的将来可以在本地处理。例如,Stable Diffusion 已经可以在本地计算机而不是云环境上运行。
人工智能的第三个需求是改进模型和算法。数据驱动系统在以下方面继续取得快速进展一个又一个的域名曾经被认为是人类认知的领域。
然而,随着我们周围的世界不断变化,人工智能系统需要不断使用新数据进行重新训练。如果没有这一关键步骤,人工智能系统将产生实际上不正确的答案,或者不考虑训练以来出现的新信息。
神经网络并不是人工智能的唯一方法。人工智能研究的另一个突出阵营是符号人工智能– 它不是消化巨大的数据集,而是依赖于类似于人类形成特定现象的内部符号表示的过程的规则和知识。
但在过去的十年里,随着现代深度学习的“创始人”,力量的平衡严重倾向于数据驱动的方法最近荣获图灵奖,相当于计算机科学领域的诺贝尔奖。
数据、计算和算法构成了人工智能未来的基础。各项指标都表明,在可预见的未来,这三个类别都将取得快速进展。