由曲率决定形状:Minkowski问题的解

近期来,最优传输理论在深度学习领域得到越来越多的关注。人们普遍认为深度学习的目的是学习嵌入在高维背景空间中的低维数据流形上的概率分布,因此主要任务分为流形结构学习和概率分布学习。而概率分布学习归结为在所有可能的分布构成的空间中进行优化,其变分法基于最优传输理论。生成模型中的模式坍塌可以用最优传输映射的正则性来解释。由Brenier定理,以欧氏距离平方为代价的最优传输映射由凸函数(Brenier 势能)的梯度映射给出,而Brenier势能函数满足经典的Monge-Ampere方程。而Monge-Ampere方程在微分几何中与经典的Minkowski-Alexandrov理论紧密联系。
在微分几何中,曲面的全系不变量是第一基本形式(黎曼度量)和第二基本形式,曲面的高斯曲率由度量来决定。对于凸曲面而言,仅黎曼度量就可以决定曲面的形状。由高斯曲率得到凸曲面形状被称为是闵可夫斯基(Minkowski)问题。丘成桐先生和郑绍远教授曾经将Minkowski定理推广到高维情形。求解Minkowski问题等价于求解球面Monge-Ampere方程,进一步等价于球面最优传输映射。
丘成桐先生在 1993 年提出了 100 个微分几何中的开放问题【1】,在过去的数十年间,指引着世界几何领域的发展,其中第 19 问题是寻找 Minkowski 问题的高效数值解法,以及如何将此问题推广到非凸曲面:
“The Minkowski problem is a problem of determining a closed convex surface in terms of the curvature function defined on the unit sphere via the Gauss map. It would be interesting to find an efficient algorithm to solve the problem numerically. It would be very interesting also to find a suitable generalization of the Minkowski problem to nonconvex surfaces. Presumably one needs to understand a multivalued support function and multivalued curvature functions. Can these functions determine the closed surface uniquely? If it is unique, will the result be stable under small perturbations of the data? How does one compute the lines of curvature, the asymptotic lines and the umbilical points in terms of Minkowski data? ”
在过去的二十年间,我们一直努力解答丘先生提出的第 19 问题。2016 年,在丘先生带领下我们用几何变分法求解欧氏几何中的最优传输映射,为这一问题的解答奠定了基础【2】,2019 年我们将这一方法从欧氏几何推广到球面几何,从而回答了丘先生第 19 问题的前面部分,即高效算法求 Minkowski 问题的数值解。未曾料到,Monge-Ampere方程理论居然在深度学习领域大放异彩。历史再一次证明丘先生的高瞻远瞩,几何分析方法对于工程应用的深远影响。
我们去年线上课程曾经详细讲解这一理论和算法,在这里我们回顾整理如下。
图1. 欧氏平面上的最优传输映射,由Brenier定理,归结为蒙日-安培方程。
闵可夫斯基问题
Minkowski问题是从Gauss曲率决定凸曲面形状,历史上有多种提法,这里我们只考虑第一类型,另外类型的Minkowski问题也有基于变分法的解答。我们先从局部考察这个问题,令是定义在平面区域上的函数,则其图是一张曲面,次曲面的Gauss曲率公式为
这是经典的Monge-Ampere方程。我们知道最优传输中的Brenier理论:给定测度之间的最优传输映射是Brenier势能函数的梯度映射,Brenier势能函数满足Monge-Ampere方程。因此由Brenier定理(或者等价的),我们可以由Gauss曲率得到凸曲面形状。如果我们考虑整体封闭曲面,则自然得到Minkowski问题。
图片
图2. Minkowski 问题。
假设是一张封闭凸曲面嵌入在三维欧氏空间之中,单位原点在曲面的内部。我们可以将曲面视为定义在单位球面上的径向函数的图:令表示三维空间中的单位球面,为球面上的任意一点,代表三维空间中的一个方向,是定义在球面上的正值函数,此函数的图(graph)记为
曲面是某个径向函数的图,我们也称是曲面的极坐标。假设曲面光滑,那么在曲面任意一点有唯一的切平面和法向量,映射将点映成其法向量被称为是法向量映射。如果曲面不光滑,那么我们将切平面推广为支撑平面,法向量推广为次法向量:对于任意点,过点的一张支撑平面将一分为二,原来曲面包含在支撑平面的下侧(负侧),支撑平面的法向量被称为是曲面在点处的一个次法向量,所有的次法向量集合为:
次法向量映射将点映射到其次法向量集合。这里次法向量映射是广义多值映射,一点的像是一个集合。由此我们定义高斯映射,,
给定球面上的一个 Borel 集合,是曲面上的一个区域,是 Gauss 球面上的一个区域,是的总 Gauss 曲率。由此定义球面的 Gauss 曲率测度:
这里是球面上的为 Hausdorff 测度。
Minkowski 问题:在球面上给定一个 Borel 测度,找到一个凸曲面,使得?
令球面子集,我们说是凸的,如果锥集
是凸的。的极集(polar set)定义为
经典的Minkowski定理给出了Minkowski问题解存在性和唯一性的充要条件:
Minkowski定理令是上的一个Borel测度,则存在一个凸曲面,使得,当且仅当并且对一切紧凸集, \mathcal^2(\Omega^*)" data-formula-type="inline-equation" style="">,此外若存在,则不同的解之间相差一个扩张(dilation)。
球面最优传输问题
给定单位球面上的两个Borel测度和,满足条件和定理中的条件。任意两点,其测地距离记为,即连接两点的大圆弧的长度为
我们定义传输代价为,
一个球面自同胚被称为是保测度的,如果对于任意Borel集合,都有
被记为。
球面最优传输问题在所有保测度的球面自同胚下,寻找总传输代价最小者:
由最优传输理论的对偶提法,问题(2)等价于下面的Kantorovich对偶问题,
这里是Gauss曲率测度.是的c-变换,或者广义Legendre变换,
对称地,我们有
由最优传输理论我们知道最优解的存在性和唯一性(在相差一个常数的意义下)。那么就是Minkowski问题的解。
经典的Minkowski问题解的存在性和唯一性可以用Alexandrov映射引理方法来证明,这个方法本质上是基于代数拓扑,无法直接给出构造性方法。丘成桐先生和郑绍远教授基于Monge-Ampere方程理论用连续性方法给出了任意维Minkowski问题解的存在性证明。这种方法将Monge-Ampere微分算子线性化,用迭代法求解,每一步等价于求解一个线性椭圆型偏微分方程。迄今为止,这种方法还没有用到球面蒙日-安培方程的数值求解。这里基于最优传输理论给出的理论给出了构造性证明,等价于丘先生带领我们发展的几何变分法【2】.
广义勒让德变换
从c-变换入手,比较容易理解Minkowski几何观点和最优传输观点的等价性。最优传输中的c-变换等价于凸几何中的广义勒让德变换,而后者非常自然直观。用通常语音来讲,所谓的广义勒让德变换就是:凸曲面是其所有支撑平面的内包络。给定一个凸曲面的极坐标表示,我们考察期支撑面(切面)。令是中一张平面的极坐标表示,不经过原点。假如原点到的距离为,的法向量为,那么的极坐标表示为
这里代表从原点到平面的距离,我们称之为法截距。考察的所有支撑平面,以为法向量的支撑平面的法截距为,如此得到球面函数。固定一个方向,从原点出发沿着方向的射线与所有支撑平面都相交,其距离原点最近的交点在曲面上,这意味着是的内包络:
两边同时取对数,得到
等式(5)等价于
几何上,这意味着我们取遍曲面上所有的点,向方向投影,取最大者为以为法向量的支撑平面的法截距。固定,假设极值在点处取得,那么在点处的法向量为,这意味着映射是曲面的Gauss映射。对比等式(4)和等式(6),我们有
这时,最优传输映射就是Gauss映射。
图片
图3. 球面上的广义勒让德变换。
由此,我们看到凸曲面的广义勒让德变换就是c-变换,最优传输映射就是Gauss映射,最优传输理论和凸微分几何理论自然地等同起来。
球面Power Diagram
从计算角度而言,Minkowski问题、球面最优传输与计算几何中的Voronoi Diagram/Delaunay Triangulation理论是协调一致的,但在这里是球面的Power Diagram和Weighted Delaunay 三角剖分。
图片
图4. 球面Power Diagram
给定一个球面测地三角形,三条边都是测地线,三个内角为,其对边的边长为,球面的余弦定律给出边角之间的关系
给定球面上的以为圆心、为半径的测地圆),为圆外一点,过做测地圆的切线,切点为,和之间的测地距离被称为是到测地圆的power距离,记为
在球面上给定一族测地圆,
对应的球面Power Diagram是球面的一个胞腔分解,,
Power Diagram的对偶三角剖分被称为是Weighted Delaunay Triangulation. 我们看到等价于
这意味着球面Power Diagram由平面内包络
的投影得到。比较公式(5)和公式(7),我们看到相似性。
在计算机上,我们将离散化为Dirac测度之和,
这里。对应的Kantorovich势能函数记为,Kantorovich对偶能量(3)可以改写成
Kantorovich能量的梯度等于每个Power胞腔的目标面积减去当前面积,
这里是的当前面积。假设是Weighted Delaunay三角剖分上的一条边,其对偶的Power Diagram边为,两条边的交点是,将分成两段,长度分别为和;将分成两段,有向长度为和。能量的Hessian矩阵每一项为
对角元素为
Hessian矩阵在线性子空间上是严格正定的,因此能量强凸,极值存在并且唯一。我们用牛顿法进行凸优化,从而得到的更新方向。
图片
图5. 大脑皮层共形映射到球面上,推前的曲面面元定义了球面上的目标测度。
这一算法的关键在于优化过程中每一步的临时解都在可容许解空间之内,一旦越界,必须退回可容许解空间之内,重新调整搜索方向。可容许解空间定义为这样的Kantorovich势能函数,使得所有的power胞腔非空,
我们证明列可容许解空间的凸性。算法开始的时候将初始化为,用牛顿法计算更新方向,更新势能函数, 计算的凸包,再计算凸包对偶的内包络, 支撑平面族为。凸包向单位球面的中心投影得到球面的Weighted Delaunay三角剖分,内包络向球面的中心投影得到球面的Power Diagram. 计算每个胞腔的球面面积,得到能量的梯度,计算三角剖分和power diagram所有的边长,得到能量的Hessian矩阵。如果有的胞腔消失,我们则退回到可容许解空间减小步长,再度尝试。如此迭代直至梯度接近零。初始的目标测度是高斯曲率测度,最后得到的凸包就是Minkowski问题的解,每个顶点的次法向量映射的像为对应的Power胞腔。
图片
图6. 球面Power Diagram(左帧)和 Weighted Delaunay 三角剖分 (右帧)。
图片
图7. 势能函数。
图片
图8. 闵可夫斯基问题的解,由高斯曲率复建的凸曲面。
图5至图8显示了一个算例:大脑皮层曲面共形映射到单位球面上,曲面的面元推前到球面上,定义了目标测度,则存在一个凸曲面,以此测度为高斯曲率测度。图6显示了最终算出的球面Power Diagram和对偶的Weighted Delaunay 三角剖分,图7是相应的势能函数,图8是势能函数的广义Legendre对偶,即闵可夫斯基问题的解。
图片
图9. 球面保面积的全局参数化。
作为直接应用,我们用这个算法可以求得零亏格曲面保面积参数化。假设曲面总面积等于球面面积,通过计算,最终曲面的每个顶点映射到球面Power Diagram的胞腔重心,如此得到的同胚映射是保持曲面面元的。即令是曲面上的任意一个区域,映射将映射到,则和面积相等。
小结
Minkowski问题是凸微分几何中的经典问题,丘成桐先生和郑绍远教授将Minkowski定理推广到高维,丘先生将Minkowski问题的数值求解算法作为一个开放问题在1993年提出,我们团队于2019年给出这个问题前半部分的解答。其后半部分依然开放。
Minkowski问题归结为球面的蒙日-安培问题,可以用最优传输理论来刻画。我们基于几何变分法将其归结为计算几何中的power diagram和weighted Delaunay triangulation算法,推广到球面几何用Newton法来迭代优化凸能量。
在深度学习领域,越来越多的学者认为最优传输理论是可解释AI的主要理论基础之一,越来越多的相关论文开始涌现,渐渐成为一个独立子领域。近期,越来越多的朋友认识到这一方法的重要性,很多同行和同学与老顾联系,将这种算法应用于医学图像、模式识别和集成电路芯片设计等领域。最近也和罗锋教授、汪徐家院士、刘克峰教授和陈士魁教授等讨论相关的理论算法细节。
暑期课程
球面最优传输、几何变分法和Minkowski问题的解答,我们在去年的课程中曾经讲过。我们准备今年在线上再度开设“计算共形几何”课程,专门讲解这些现代几何理论和计算,用双语教学。我们的线上课程计划从2022年7月份开始,每周4次,每次8:30-10:00pm. 具体课程链接将会很快发布,敬请期待。2022年的课程微信群可以通过扫描下面二维码加入。