现在当孩子一定很艰难。出生太晚,无法真正享受互联网,还为时过早自封为神皇的沙漠荒地运行水资源短缺和古佐林? 如果您尝试用一些简单的数学知识来缓解疼痛,那么您很可能要忍受屈居于机器人之下。
“国际数学奥林匹克是当今世界上最聪明的高中数学家的舞台,”谷歌 DeepMind 的研究科学家 Trieu Trinh 和 Thang Luong 在一篇新博文关于他们的突破性人工智能(AI)系统AlphaGeometry。
他们宣称,“AlphaGeometry 是一个人工智能系统,它能够解决复杂的几何问题,其水平接近人类奥林匹克金牌得主,这是人工智能性能上的一次突破”。在对 30 道奥林匹克几何问题的基准测试中,AlphaGeometry 在标准奥林匹克时间限制内解决了 25 道问题。相比之下,人类金牌得主平均解决了 25.9 道问题。
令人印象深刻的不仅仅是该系统在竞赛中的得分。自计算机首次证明数学定理以来,已经过去了近 50 年——本质上是对四色定理从那时起,确实存在争议计算机辅助证明领域已经到来突飞猛进。
但最近,随着大数据和先进的机器学习技术的出现,我们开始看到一种转变——无论这种转变多么微小——不再将计算机用作简单的数字计算器,而是转向能够产生真正有创意的证明。
Trinh 和 Luong 认为,AlphaGeometry 能够解决奥林匹克数学选手面临的各种复杂数学问题,这可能标志着人工智能研究的一个重要里程碑。
到目前为止,这样的程序至少面临两个主要障碍。首先,计算机电脑;任何曾经写过 50 页代码却因为第 337 行的一个错误分号而导致整个过程失败的人都可以告诉你,他们不擅长推理或演绎。其次,数学是有点困难教授最尖端的机器学习系统。
DeepMind 的 David Saxton 表示:“像神经网络这样的学习系统在‘代数推理’方面表现得相当糟糕。”新科学家回到2019年。
他补充道:“人类擅长数学,但他们使用的一般推理技能是当前人工智能学习系统所不具备的。”
然而,AlphaGeometry 通过将神经语言模型(擅长快速预测,但实际意义不大)与符号推理引擎相结合,应对了这些挑战。Trinh 和 Luong 写道,后者的机器“基于形式逻辑,使用清晰的规则得出结论”,这使得它们更擅长理性推理,但也速度慢且不灵活——尤其是在独自处理大型复杂问题时。”
这两个系统一起以某种循环方式工作:符号推理引擎会不断解决问题,直到卡住为止,此时语言模型会建议对论证进行调整。这是一个很棒的理论 - 只有一个问题。他们将用什么来训练语言模型?
理想情况下,程序将接受数百万甚至数十亿的人造几何证明,然后程序可以消化这些证明,并以不同程度的官僚主义形式输出。但“人造”和“几何”与“计算机程序”配合得并不好?“[AlphaGeometry] 无法‘看到’它所解决的问题,”法兰西学院研究基础几何知识的认知神经科学家 Stanislas Dehaene 告诉纽约时报。“系统学习操纵的圆圈、线条和三角形根本就没有空间感知。”
因此,团队必须想出一个不同的解决方案。Trinh 和 Luong 解释说:“使用高度并行化的计算,系统首先生成十亿个几何对象的随机图,然后详尽地推导出每个图中点和线之间的所有关系。”
“AlphaGeometry 找到了每个图表中包含的所有证明,然后反向研究以找出需要哪些额外的构造(如果有的话)才能得出这些证明,”他们继续说道。他们将这个过程称为“符号演绎和回溯”。
显然,它取得了成功:该人工智能不仅表现得几乎与人类 IMO 金牌得主一样优秀,而且比之前挑战该挑战的最先进系统成功 2.5 倍。两人指出:“仅凭其几何能力,它就成为世界上第一个能够突破 2000 年和 2015 年 IMO 铜牌门槛的人工智能模型。”
虽然该系统目前仅限于几何问题,但 Trinh 和 Luong 希望将数学 AI 的能力扩展到更多学科。
Trinh 告诉《纽约时报》:“我们不是在渐进式地改进,而是在结果上取得了巨大的进步和突破。”
他补充道:“只是不要过度炒作。”