张少学习分享网什么是 DeepMind AlphaGeometry？

什么是 AlphaGeometry？

AlphaGeometry 是专为解决复杂几何图形而构建的下一代人工智能系统。该系统采用新颖的逻辑推理设计方法，使其在几何相关任务中超越了最先进的结果。

因此，与 OpenAI 的 ChatGPT 和 Google 的 Gemini 等可被视为通用 AI 模型的 AI 工具不同，AlphaGeometry 是一种特定领域的 AI 模型。

代码和模型以及合成数据生成和训练中使用的方法（参见下一节）是在开源许可下发布的。

为了测试 AlphaGeometry 的性能，Google Deepmind 的研究人员准备了一组基准几何问题，这些问题是根据2000 年至 2022 年历届国际数学奥林匹克竞赛 (IMO) 编制的。

IMO 是一项年度锦标赛，聚集了来自世界各地的优秀高中生来解决数学问题，包括几何领域的问题。

AlphaGeometry 在比赛时间限制下解决了 30 个选定问题中的 25 个，超越了之前人工智能系统的最先进成绩，接近人类金牌得主的平均分，如下图所示。基准测试的设计和结果可以在《自然》杂志上发表的一篇专门论文中找到。

AlphaGeometry 成功的关键在于其解决（几何）问题的混合方法。虽然现代大型语言模型 (LLM)，如 OpenAI 的 ChatGPT 和 Google 的 Gemini，擅长检测模式，但它们通常无法精确推理。

Google DeepMind 试图通过将神经语言模型与专门用于代数和几何推理的符号演绎引擎相结合来克服这一限制。神经语言模型有助于提供快速、直观的想法和解决方案。相比之下，符号模型基于易于解释和验证的形式逻辑语句，可以根据第一个模型返回的初步想法提供更加深思熟虑、理性的决策。

为了更好地了解 AlphaGeometry 的工作原理，我们首先必须了解 IMO 几何问题的本质。这些问题基于图表，需要添加新的几何结构（例如点、线和圆）才能解决。

当 AlphaGeometry 遇到其中一个问题时，它首先使用其语言模型来预测从无限数量的可能性中添加哪些新结构最有用。这些线索有助于填补空白，并允许符号引擎对图表进行进一步推论并接近解决方案。

这种创新的双重方法使 AlphaGeometry 不仅可以预测有用的结构，还可以解释和验证其决策。

AlphaGeometry 开发过程中最重大的挑战之一是训练过程。将几何对象内的属性和关系（即空间、距离、形状、相对正数）转换为机器可读的格式是一项复杂的任务，因为特定于几何的编程语言定义很窄，很难捕获使用以下方法导出的人类证明：超出几何范围的工具，例如复数。

这种情况造成了数据瓶颈，阻碍了机器学习技术用于几何目的。

为了克服这一限制，Google DeepMind 研究人员开发了一种新颖的方法，利用并行计算技术生成大量合成训练数据，其中包含 1 亿个独特的几何对象图。请查看我们的单独文章，了解什么是合成数据。

然后模型使用此类训练数据来学习所有属性和关系，以及几何定理及其相关证明。一切都不需要人类演示。

合成数据的广泛可用性使得 AlphaGeometry 的语言模型能够在遇到新的几何问题时为新的构造提出很好的建议。

AlphaGeometry是专门为解决抽象几何问题而设计的研究模型。尽管 AlphaGeometry 具有前所未有的性能，但它仅接受了解决 IMO 问题的训练（而且只是其中的一部分，因为 IMO 测试还包括其他数学领域的问题，例如代数、数论和组合学）。

AlphaGeometry 的目标并不是在几何学发挥基础作用的学科（例如建筑、工程和艺术）中做出贡献。相反，它是一个很有前景的例子，展示了如何将神经语言和符号模型结合起来，以增强未来人工智能系统的推理能力。

正如 AlphaGeometry 训练期间所展示的那样，生成大规模合成数据的新方法的开发正在使我们接近人工智能研究的新前沿。

最终目标是构建能够超越当前大型语言模型的限制和缺点的新一代人工智能系统。这可以通过为新模型配备先进的推理和解决问题的技能来实现，这些技能可以帮助概括数学领域及其他领域的知识。