用人工智能引导人类直觉推进数学发展.

数学家已经尝试使用计算机协助发现数学模式和公式,本文作者提出可以使用机器学习技术帮助数学家发现新的猜想(conjecture)和定理(theorem)。

1. 使用AI引导数学直觉

“只有结合严格的形式主义和良好的直觉,才能解决复杂的数学问题。”(陶哲轩)

数学直觉对数学发展至关重要,作者提出了一种通用框架,使用机器学习工具指导数学家对复杂数学对象的数学直觉,并进一步验证数学对象是否存在关系的假设。值得一提的是,该方法并不是凭空生成数学直觉,而是对数学家的直觉进行引导和验证。

本文讨论的问题可以建模如下。假设两个复杂的数学对象$X(z)$和$Y(z)$,它们都和$z$相关。数学家猜想这两个数学对象之间存在某种联系,并试图构造一个函数$\hat{f}$,使得$\hat{f}(X(z))≈Y(z)$。

一个简单的例子是,假设$z$表示一个凸多面体,$X(z) \in \Bbb{Z}^{2}\times \Bbb{R}^{2}$表示该多面体的顶点数、边数、体积和表面积,$Y(z) \in \Bbb{Z}$表示该多面体的面数。由欧拉公式可知,凸多面体的面数等于边数减顶点数再加$2$,因此可以写出关系式:$X(z)\cdot (-1,1,0,0)+2=Y(z)$。

对于更复杂的数学对象和关系,很难从数据中猜想出具体的关系式,因为$\hat{f}$往往是非线性的。

本文作者提出了一个“直觉的测试平台”,能够快速验证两个数学对象之间是否存在关系,如果存在还可以对它们之间的关系提供指导。 该框架通过两种方式帮助指导数学家的直觉:通过使用监督机器学习技术验证数学对象中的模式是否存在;通过使用归因技术帮助理解这些模式。

数学家首先提出假设,即$X(z)$和$Y(z)$之间存在关系。在监督学习阶段,生成数据集$(X(z),Y(z))$,训练回归模型$Y(z)=\hat{f}(X(z))$。当数据量充足时,如果学习到的非线性函数$\hat{f}$比随机预测的准确率高,则表明两个对象之间可能存在关系。使用归因技术进一步理解$\hat{f}$对$X(z)$的哪些分量敏感,本工作使用梯度显著性(gradient saliency)计算$\hat{f}$相对于$X(z)$的导数,导数越大的分量对结果的影响也越大。通过上述过程引导数学家的直觉,使其能够识别问题中可能与关系相关的因素,并进一步作出假设,证明定理。

作者使用上述框架在两个不同的数学领域中帮助数学家获得有价值的数学结果。在拓扑学中,发展并证明了纽结理论中代数不变量和几何不变量的一个关系。在表示论中,提出了推测对称群的组合不变性猜想的解决方案。

2. 应用:拓扑学

在低维拓扑学中,扭结(knot)是三维空间中的简单闭合曲线。扭结可以根据不变量(invariant)进行分类,具有相同不变量的扭结是等效的。不变量主要包括几何、代数或一些数值量,本文主要关注双曲(hyperbolic)不变量(一种几何不变量)和代数(algebraic)不变量。下表给出了几种不同类型的扭结对应的不变量取值:

作者猜想扭结的几何不变量与代数不变量Signature(记作$\sigma$)之间存在关系。通过监督学习和归因技术,作者发现影响Signature的三个主要因素是经向平移(meridional translation) $\mu$ 和纵向平移(longitudinal translation) $\lambda$ 的实部和虚部。作者进一步绘制了Signature和$\lambda$ 的实部之间的关系图象,从中不难看出两者存在联系。

作者使用仅包含上述三个不变量的数据集重新训练了模型,获得了与之前非常接近的精度,这表明这三个不变量足以表示几何不变量的特征。通过引导数学家关注这些不变量,研究者提出了一种新的数量关系。

定义自然斜率(natural slope) $\text{slope}(K) = \text{Re} (\lambda / \mu)$,作者提出如下猜想:

\[|2\sigma(K) -\text{slope}(K)|<c_1\text{vol}(K)+c_2\]

遗憾的是,可以构造上式的反例。作者进一步建立了自然斜率$\text{slope}(K)$、Signature $\sigma(K)$、体积$\text{vol}(K)$和注入半径(injectivity,下一个显著的几何不变量) $\text{inj}(K)$之间的关系:

\[|2\sigma(K) -\text{slope}(K)|\leq c \text{vol}(K)\text{inj}(K)^{-3}\]

上式得到了数学家的证明。通过生成的数据集可以给出常数$c$的一个下界$0.23392$。

3. 应用:表示论

表示论是研究线性对称(linear symmetry)的理论。不可约(irreducible)表示的结构是由KL多项式控制的。组合不变性(combinatorial invariance)猜想提出,对称群$S_N$中的两个元素的KL多项式可以从其未标记的Bruhat区间(一种有向图)中计算得到。由于非平凡KL多项式的Bruhat区间通常是很大的图,数学家理解这些对象之间的关系时遇到障碍。下表给出了一些Bruhat区间及其KL多项式的例子:

作者通过监督学习模型以相当高的精度从Bruhat区间预测出KL多项式,特别地,Bruhat区间中的子图可能已经能够支撑KL多项式的计算。通过计算归因技术确定的显著性子图,作者引导数学家分析得到KL多项式可以从超立方体和$S_{N-1}$计算出来。

作者对$S_7$之前的约$3×10^6$个区间和从$S_8$和$S_9$中采样的超过$1.3×10^5$个非同构区间进行了验证,测试表明所有的超立方体分解都正确地确定了KL多项式。作者进一步提出猜想:

如果上述猜想成立,将解决对称群的组合不变性问题。