DeepMind数学模型登上Nature，能以人类金牌水平解决奥赛几何题

文丨Congerry

AI 解锁新成就！

Google DeepMind 最新研发的人工智能系统 AlphaGeometry，在解决复杂几何问题的能力已接近国际数学奥林匹克（针对顶尖高中数学学生的竞赛）金牌得主的平均水平。

研究人员根据 2000-2022 年奥林匹克竞赛，制作了一个包含 30 道奥林匹克几何题的基准测试集 (IMO-AG-30) 。在比赛时间限制内，AlphaGeometry 解决了其中的 25 道题。

相比之下，之前最先进的“吴氏方法”解决了 10 个问题，而人类金牌得主平均解决了 25.9 个问题。

研究论文以 “Solving olympiad geometry without human demonstrations” 为题发表在《Nature》上。

解决数学问题需要逻辑推理，而当前大多数人工智能模型并不擅长这一点。正因如此，数学问题一直被视为衡量人工智能进展的重要基准。

DeepMind 团队表示，解决奥林匹克级的几何问题是开发深度数学推理的一个重要里程碑，是迈向更先进、更通用的人工智能系统的必经之路。

AlphaGeometry 是如何工作的？

AlphaGeometry是一个神经符号系统，通过语言模型和符号推理引擎的协同工作来寻找复杂几何定理的证明。

这类似于心理学家Daniel Kahneman提出的“思考，快与慢”的理念，一个系统提供快速的“直觉”想法，另一个系统则提供更深思熟虑、理性的决策。

语言模型擅长从数据中识别一般模式和关系，可以快速预测出潜在有用的结构，但通常缺乏严格的推理或解释决策的能力。

另一方面，符号推理引擎基于形式逻辑并使用明确规则进行推断，更加理性且可解释，但可能“缓慢”且不够灵活，特别是在独立处理大规模复杂问题时。

在 AlphaGeometry 中，语言模型引导符号推导引擎探索几何问题的可能解决方案。奥林匹克几何题常需要添加新的几何结构如点、线或圆来求解。

语言模型可以从无数可能性中预测添加哪些新结构最有用，提供重要线索让符号引擎进一步推导逼近解决方案。

流程可以概括如下:

给定一个几何问题，及其相关前提和图形。AlphaGeometry 的符号推理引擎对给定图形进行逻辑推理，试图找到解决问题的方法。如果符号引擎无法通过推理得到解决方案，AlphaGeometry 的语言模型会提出添加一些新的几何结构(如点、线、圆等)到图形中。符号引擎然后基于这些新的结构继续逻辑推理，看是否可以推导出解决问题的方法。如果还不行，语言模型会再提出添加一些新的几何结构，循环往复。直到符号引擎通过语言模型提供的新结构，最终可以推导出解决问题的方法和证明。

在这个过程中，语言模型发挥快速提出新点子的作用，符号引擎发挥严谨推理的作用，二者相互协同，以解决复杂问题。

在解 2015 年国际数学奥林匹克竞赛的第三题(左图)时，AlphaGeometry 经过了长达 109 步的逻辑推理，才最终给出了解决这个题目的方法。

一些AI研究者认为，这种混合系统正是AI未来的发展方向。

AlphaGeometry 的训练是基于合成数据而不是现有的数据

人工智能系统常难以解决数学和几何领域的复杂问题，这不仅因为缺乏推理能力，也与训练数据不足有关，而AlphaGeometry 的训练是基于合成数据而不是现有的数据。

几何学依赖于对空间、距离、形状和相对位置的理解，是艺术、建筑、工程及许多其他领域的基础。人类可以使用笔和纸来学习几何，检查图表并利用现有知识发现新的、更复杂的几何特性和关系。

DeepMind 的合成数据生成方法大规模模拟了这种知识构建过程，能够从零开始训练AlphaGeometry，而无需任何人类演示。

该系统利用高度并行的计算，首先生成数十亿个随机的几何对象图，并详细地推导出每个图中点和线之间的所有关系。

AlphaGeometry找到每个图表中包含的所有证明，然后回溯以确定需要哪些额外的构造(如果有的话)来推导这些证明。DeepMind称这种技术为“符号演绎和回溯”（symbolic deduction and traceback）。

AlphaGeometry 生成的合成数据的视觉表示

这个巨大的数据集经过过滤以消除相似的例子，结果形成了包含1亿个不同难度的独特示例的最终训练集，其中900万个具有添加的构造。

有了如此多关于这些构造如何产生证明的例子，当遇到奥林匹克几何问题时，AlphaGeometry的语言模型能够为新的结构提出可靠的建议。

尽管 AlphaGeometry 的表现令人印象深刻，但它也遇到了一些无法解决的问题，例如越南数学家 Lê Bá Khánh Trình 在 1979 年奥运会上解决的相交圆难题。

虽然 AlphaGeometry 只能解决三分之一的奥运难题，但据 Deepmind 称，它是世界上第一个跨过 2000 年和 2015 年奥运会铜牌门槛的人工智能模型。

研究人员希望，AlphaGeometry 和其他合成数据生成和训练方法将为数学、科学和人工智能领域带来新的可能性。

如果您有什么想说的，欢迎屏幕前你们在评论区留言讨论！我们将为点赞、评论、关注的同学们送上红包不限量哟~

玩酷网

DeepMind数学模型登上Nature，能以人类金牌水平解决奥赛几何题

趣唠科技不打烊