邹谋炎
(中国科学院研究生院暑期讲座材料)
不少工科学生特别是工科研究生对数学基础不足感到压力。确实,缺乏数学的帮助会使得学生们的研究缺乏思路和工具,缺乏捕捉问题的敏感性,缺乏抽取问题本质的能力,缺乏处理问题的技巧和方法。我们许多硕士生、博士生的研究论文缺乏创新性,数学基础差是一个重要原因。这个讲座谈谈工科学生如何学习数学的问题,希望对有愿望提高数学能力的同学有所帮助。我本人是电子信息领域中的一个研究者,不是数学家,这里讲的希望能贴近工科学生的需要。作数学工作的同仁可以从这里了解到工科研究者对数学的一部分理解以及对数学家们的期望。
(一)让兴趣引导我们接近数学
有愿望学习数学,而数学内容常常不那么有趣。确实没有多少人能坚持做那些令人发困的劳作。然而,有人谈到过这样的经验:对数学的兴趣需要发掘、引导和培养。我对此很为认同。有多种方法可能增加你对数学的兴趣,当然没有一种办法可以减轻你需要付出的努力。
多做数学题是提高数学能力和兴趣的有效方法。不少成功的研究者都介绍过这个经验。如果你正在学习数学,如果你发现一道道看似困难的问题能逐渐被你解答,就表明你已经进入了良好状态。这是一个好的开端,会有克服者的喜悦,会不断发现你自己的数学才能,有继续进展的兴趣和劲头。如果你已经进入了研究工作,如果你不时抽出一点时间做一点数学趣题,对保持和提高你的数学思维活力一定有所帮助。
不少学生提出过这样的问题:是不是必须先准备了深入宽广的数学基础才适合于进入研究工作?确实,我不知道有哪个非数学专业的研究者是那样做的。而且认为那不是一个切合实际的方法。不过,准备在工科专业领域内做深入研究的学生们应当花一点时间读一点最基础的数学。除了工科大学已经教过的高等数学等课程外,可以读一点实分析和近世代数的入门知识。了解一点关于集合、测度、连续统、Lebesgue积分,以及初等数论、群这些基本概念。学习这些基本知识不需要太多的时间,而对进一步学习数学理论很有必要。对于更深入广泛的数学知识,不妨先采用“浏览学习法”:试着读一读,不太懂不要紧,但要求快一些,多一些。“浏览学习法”的目的是了解数学涉及的各个方面,为将来深入学习提供线索。不要小看那些似懂非懂的线索。如果你积累了较丰富的线索,它们会扩展你的思路,在需要的时候引导你较快地了解必须深入准备的基础。缺乏线索,脑子里要么一片空白,要么产生一些不切实际的空想,自然难以作研究工作。
结合专业研究的需要来学习深入的数学理论是一个许多研究者都很认可的方法。事实上,对专业研究题目深入思考可能激发起对数学的高度兴趣甚至产生出创新性成果。爱因斯坦的研究经历是人们知道的。在爱因斯坦研究广义相对论的早期,并非数学基础十分丰厚。在他的同学格罗斯曼的帮助下,了解了黎曼几何和张量分析。爱因斯坦在深入研究中感觉到,这种数学工具简直是为他发展广义相对论而准备的。他的工作不仅使广义相对论发展到成熟,而且推动了黎曼几何更加突飞猛进地进步。
绝非只是在物理等基础研究领域能够提出挑战性问题和发现数学的应用。在应用科学包括工程学科领域内,处处都有挑战性问题。当你试图解决某个实际问题的时候,你总会感到手头的数学不够用。尽管现代数学已经取得了十分丰富的成果,而物理世界太复杂太丰富了,当今数学能够描述和处理的问题还仅仅是一个很小的集合,而工科研究者手头的数学恐怕会更少。
从自己从事的工程学科研究中抽取数学问题是我对工科学生的一个建议。不必苦苦寻求那些被媒体追捧的“明珠”,除非你确实有准备和兴趣。你在工程学科中的已有基础是值得珍视的。这些基础有可能帮助你抽取出很有意义的理论和数学问题。而发现这些问题,除了灵感以外,最靠得住的恐怕是对专业工作的专注、勤奋而开放的思考和数学基础。
工科学生可以发挥自己在形象思维方面的长处去理解数学。如果这样,你或许会发现数学中的若干知识不仅有趣,而且有用。这里说一说几个常见的例子。
―― 正交性。这是布满了数学和物理书籍的基本知识。为什么正交函数会如此广泛地受到重视?从数学的角度看到的是基,用它来描述函数空间中任何一个元具有唯一性和可逆性;可以联系映射的定义域和值域,从而研究解乃至求得解。从应用的角度看到的是一种基本工具或方法,可以使得例如函数变换、函数逼近、数据压缩、数学物理问题的求解等问题变得容易处理和易于理解。与正交性相联系的自然是非正交性。非正交性也很有用。例如用非正交基(标架)表示信号可以灵活地具有某些特别的性质。这种表示带有一定冗余,但有一定抗损能力。
描述空间正交性最基本的数学原理是什么?合理的回答应该是Cauchy-Riemann方程。由此才有保角变换、Laplace方程、调和函数、Poisson方程等等。空间正交性对数学物理问题的研究者太有用了。有了这个直观概念,就容易理解和猜测例如流体力学、引力场、电磁场等等领域中边值问题的解的形式。例如波导中特别是在不规则波导中电磁波存在的模式、模式变化这些问题可以根据正交性来猜测和解释,因为电场分量必定垂直于波导壁,而磁场分量必须平行于波导壁。
―― 无源性。讨论无源性的数学家不多,但对于物理和工程,无源性非常重要。空间无源性隐含在解析函数的Cauchy积分定理中。事实上,例如用有限元方法处理大型力学计算问题时人们观察到,求解方程的矩阵一般是主对角优势的,这和求解一个无源电阻网络时观察到的现象相一致。其内因就是无源性,它保证了解的数值稳定性和迭代求解方法的快速收敛。在电路理论中证实,一类特别的解析函数称为正实函数作为驱动阻抗,是无源网络可综合的充分必要条件。进而,无源而且无损的网络在电子工程设计上非常有用。因为例如无源无损滤波器的特性随元件参数变化的敏感度底,适合于工业生产。现代数字滤波器包括通信滤波器组的理论和设计都要应用和发展这些概念。
―― 最大熵和最小熵。熵是热物理学中最先引入的概念,用它表示能量在系统中分布的均匀程度,同时也表示热和温度的关系。一个系统达到了热平衡,或达到了能量的均匀分布,则系统的熵达到最大。在通信领域中熵被用来作为信息的度量,表示平均信息量。如果熵最大,表明信源的不确定性最大,被传送的信号寄载的信息自然就最多。在信息处理、信号估计,包括图像处理应用中,熵的概念被借用来表示对解的先验限制:最大熵限制表示解在数值分布上应该有一定的均匀性或平滑性;而最小熵限制表示解应该很不平滑,如同若干孤立点那样。这两种情况在应用中都可能出现。例如在若干反演问题中(如信号重建、复原、去噪、估计等),为了抑制噪声,可以将最大熵作为对解的附加限制。在另外的情况下,例如希望的解是点状的星云,或者是如同若干孤立噪声那样的岩层反射序列,或者是只含一个非零元的理想信道,对这些情况就可以附加最小熵限制。注意我们这里使用的“概念被借用”说法。其实这是研究中的常用方法。如果你的视野广些,积累多些,就有可借用的机会。
―― 距离和相似性。距离这个概念在数学中太重要了,它是定义度量空间的第一要素。有了距离,才好讨论度量空间中元和元之间的相互关系,才好讨论按距离的收敛性。有多种距离的具体形式适合于研究不同的数学问题。典型的例子有用函数差值上界定义的距离(一致收敛距离)和按函数差值平方积分定义的距离(均方收敛距离)。典型地,许多问题需要通过最优化一个泛函指标来表达,这个指标就是距离。工科研究者十分关注距离的一个直观含义:函数的相似性度量。自然地,用距离描述的相似性是很窄的一类相似性。即使是这样, 它的应用已经遍及物理和工程的许多领域。与电子信息领域相关的应用例子有信号(图像)重建、恢复、估计等等。两个随机变量的在统计上是否相关或独立,或者它们的统计特性是否相似,为检验这些问题在统计学中引入了Kullback-Leibler型距离和Bhattacharyya距离(或称为差离度,divergence)。这些距离不满足三角不等式,称为广义距离。它们在统计模式分析、目标识别和分类、图像分割和配准等方面已经有重要应用。在工程研究中你可以利用手头掌握的数学不等式,定义新的距离或广义距离,它或许有某种特别的性质。
人感知物理世界,哪些事和物按什么方式和度量彼此相似,这可能是最富魅力的科学问题之一。相似这个概念既直观又抽象甚至神秘。例如绘画家可以将一个人的形象用写实画、印象画、线描画、甚至各种形态的漫画表现出来,我们可以认识他,并认为和照片上的他是同一个人。问题是如何从数学上定义这些图画中人的相似性?
如果你细心思考,数学中处处都可以发现很有趣的问题,这些问题可以在物理和工程中找到应用背景。
物理和工程学科中包含大量的数学。有的工科学习者对数学表达不经意,甚至厌烦,这种心态会妨碍知识的获得。如果你愿意花一点时间去读懂一些重要的数学表达,你会发现不仅在认识的深度上会大大不同,而且会引出乐趣甚至创新性的认识。这里不妨举一个大家熟悉的例子。卷积的表达式为y(t) =∫abx(t-τ)h(τ)dτ。我们的教科书中总是这样解说的:在每个时间点t,将x(τ)翻转为x(-τ),再平移为x(t-τ),与h(τ)乘积的结果,求面积,就得到卷积的结果。这个解说是没错的,并且因为x(τ)要被翻转,成为“卷积”这个称呼的来源。但问题是,这个解释符合物理事实吗?或者说在物理上的一个卷积过程,要求一个物理量在时间上(或空间上)必须被翻转吗?这显然不是事实!现在的问题出在哪里?问题出在刚才的解说仅仅是一个数学解说。另一种解说就没有这样的困难:将x(t)平移一个时间量τ成为x(t-τ),乘在τ处的函数值h(τ),取遍定义h(τ)的所有τ,将乘积累积起来,就得到卷积的结果。后一种解释其实是最老的解释:叠加原理。正是按照这种解释,可以构造出用物理硬件实施卷积计算的卷积器。“翻转”这个概念应该说造成了某些负面后果。例如,考虑两个外形不同的多边形(你不妨在纸上画一个任意的三角形和一个任意的四边形,假定图形内数值是1,图形外是0),这两个图形卷积后,结果是什么外形?你可以试图通过上面的两种解释从概念上得到结果。你会发现,从“翻转”解释出发会使你头痛,而从后一种解释得到结果就很直观和容易。不要小看了这里的问题,它联系着某些深入的数学:代数几何、多项式代数和分配函数理论。
另一个简单例子是矩阵的奇异值分解(SVD)。这种方法常常用于图像的特征描述、分类和识别。人们将图像离散化为数值数组,将数组作为矩阵,计算它的若干个显著的奇异值,作为描述图像特征的一组特征量。这样做合理吗?或者说,若干个显著奇异值能描述图像灰度分布特征吗?回答却是否定的。事实上,你需要仔细解读一下SVD的数学表达式。注意每对奇异向量的乘积uiviT是一个可分图像。SVD表达式表明,用若干个可分图像按奇异值进行强度加权后叠加在一起,可以逼近原图像。因此,除了几个显著奇异值外,如何描述几个显著的可分图像的特征是你可以发展的工作。
从物理和工程上解释数学是工科研究者的优势,不要忘记了这一点。我们还可以举一个抽象一点的例子。同伦是数学中的一个概念。一个拓扑流形或函数如果能够通过连续变形变成另一个拓扑流形或函数,我们就说这两个拓扑流形或函数彼此同伦。同伦论是数学中一个重要研究领域,并且与Riemann几何的研究密切关联。仅仅是同伦这个概念对工程就很有用。在大规模集成电路(VLSI)设计中需要通过电路仿真,检查设计出的电路是不是符合设计要求。一个基本的检查是要计算各个晶体管在加电后的工作点(电压和电流)。晶体管特性是非线性的,数量多,相互直流互连。直接处理这样的非线性电路问题很困难,并且可能是多解的。电路仿真程序SPICE的研究者提出了一种“源步法”,就是利用了同伦的思想。让电源电压从0开始,连续小步地逐步升到额定值,计算随之逐步迭代进行。这样在每一步,都是解一个线性化的电路问题,并且计算过程符合加电的实际物理过程。这种处理大型非线性计算问题的方法应该不限于电路计算的应用。
不同应用领域可以有关于数学概念和表达的不同解读,其实这正是数学的奥妙之处。解读数学需要耐性。如果你想把握它,就花一点时间去解读它。
(二)努力寻求数学概念的浅近解释
工科学生有形象思维的强势,但在抽象思维方面常常处于弱势。实际上,学生们进入学习多少都有这样的特点。好的教育工作者会注意这个特点。例如前苏联数学家柯尔莫哥罗夫建议讲解数学时要能用其他科学领域的例子来吸引学生,增进理解,培养理论联系实际的能力。并且要求以清楚的解释和广博的知识来吸引学生进行思维运动。柯尔莫哥罗夫的学生、数学家Arnold更是强烈地呼吁数学教育必须结合物理,充分利用几何直观,反对数学教育的非几何化和脱离物理。事实上,用物理和工程例子将数学概念形象化和具体化,达到浅近易懂,是数学家对学生(不只是工科学生)的最重要帮助。在50年代莫斯科大学组织了一批顶级的数学家写了数学普及名著“数学――它的内容、方法和意义”。直到现在,世界范围内的科学工作者中许多人都曾经或正在从该书获得入门知识。
许多学者都承认一个事实:高深理论的原始概念其实是简单的。只是不少“专著”直接从高深理论开始,忽略了对基础背景的介绍,学生接受起来就觉得抽象难懂。工科学生要想真正掌握数学理论,还不得不寻求一个具体化的或形象化理解,最好有一个物理的或工程的例子。如果得不到老师的指导,你就得准备多花一点功夫。有一些方法可以供参考。其一是尽量利用百科全书那样的工具,包括Wikipedia的网络百科,它常常可以帮助你尽可能浅近地理解基本知识。其二是多参阅几本讲述同一个理论的书或涉及该理论的文章,从中发现你可以理解的内容。如果一时难以找到很切合的参考,可以暂时放一放,不必钻牛角尖。常常,你在工程学科中的研究积累会帮助你开拓思路,甚至找到领悟的灵感。
工科学生有必要增强自信。某些数学概念内涵的神秘性其实只是我们自己的感觉而已。当然,抽象和严格是数学科学性的精髓。但这并不妨碍可以将数学概念和物理或几何直观联系起来。我们这里解说一两个例子,如有谬误请专家不吝赐教。
―― 紧集(Compact set),闭区间或有界闭集概念的拓广。“有限维闭区间”是一个易懂、易用的概念。它有一个很直观的性质,就是它在每个维上有下确界和上确界。此外,孤立点也很特别,不需要考虑它的任何“近邻”。引入“紧集”的主要动因是为了扩展有限维闭区间的概念,使得可以包含无穷维空间的点集,或者是由一类函数组成的集合。紧集的机巧定义就达到了这个目的。
紧集最有用的性质是它的有界性和可分性。这里,一个集合可分,是指存在着一个可数集合在该集中稠密。在有限维空间中,紧集的充分必要条件是有界和闭性。同时,在Hausdorff 空间中,紧集都是闭的。这含盖了分析中常用的空间,如所有的距离空间,拓扑群,和拓扑流形。在非Hausdorff空间可以构造出例子表明紧集的闭性不一定成立。
紧集的例子如:有限维闭区间;Rn中的有限个孤立点;含极限点在内的孤立有界点列集合;所有一致有界并等度连续的函数集合。在一维上的“紧支集”可以是指一个闭区间,也可以指实轴上一组有限个离散栅点。
Hausdorff空间是指符合分离公理的拓扑空间:如果集合中有两个元不相等,则它们必定有不同的邻域。细细思考一下你会发现,分离公理事实上是序列收敛性论证的基本依据:按邻域收敛,并且收敛有唯一性。
―― 拓扑(Topology),集合元素之间相互接触或连接的关系。
基本的拓扑学研究几何形体在连续变形下保持不变的性质,例如连通性。典型的问题有哥尼斯堡七桥问题,四色问题,布线平面化问题等等。
既然拓扑是指集合元素的接触或连接关系,它显然是更一般的几何性质,而不限于常规的Euclid几何性质。例如,电路拓扑图上两个节点之间有支路相连,这可以与物理连接关系一致,但与物理元件的实际空间位置不必一致。
当集合元素在某个连续域中取值时,就需要将问题放到“拓扑空间”中去研究。在拓扑空间中,常规的距离定义不一定有意义,而点列的收敛可以通过“充分小邻域”和“覆盖”这样的概念来定义和论证。一般拓扑学使用公理化方法研究连续性问题,概念变得更加抽象,并一直与微分几何、抽象代数等学科并行发展。
网络拓扑,是指网络的基本元素“顶点”和“边”的连接关系。例如用顶点来表示一个国家,两个顶点之间有边相连,表示两个国家接壤。关于网络拓扑的学科分支通常称为图论。用图论方法研究的典型数学问题有一大类组合优化问题,最优布线问题,流图分析,逻辑分析,交通流和数据流分析等等。
虽然拓扑是几何形体在连续变形下不变的性质,但在应用中发现限制形体(结构)的拓扑不变可能得不到最优解。于是希望,如果有必要,能够通过连续演化实现拓扑结构的改变。这一般地还是一个未解决问题,但也有解决得好的例子。例如希望将二维平面上的单连通区域连续地演化出多连通区域或多个单连通区域,直接在二维平面上不大好办。但如果扩充到三维,构造一个三维函数,并使用水平截集获得二维区域,就能容易地解决。这个方法已经成功地用于图像的活动围道分割等处理算法。
―― 流形(Manifold),受一定约束的某个(一维或多维)变量所有可能状态的集合。在数学文献中,流形有一个抽象的定义:流形是一类拓扑空间,其中每个点都有邻域,而这种邻域与 中的单位开球在拓扑上是同胚的。
流形的含义十分广泛,并且可以定义各种各样的流形。空间是流形。然而流形可以是某种“可弯曲”的空间(通常将Euclid空间视为“平直”的空间)。3维空间中的球面是流形的一个例子,而球面上任何一条经线或纬线是一个子流形。基于球面建立的几何学与Euclid几何学是不同的。
在物理上流形这个概念有一个重要应用,用它来表现某个受约束的物理量的全局行为。例如,机器臂可达的所有极限位置。在模式识别问题中(如人脸识别),描述单个个体不同形态的一系列N维特征量样本构成N维空间中的一个流形上。不同个体有不同的流形。这些流形构成了进行模式识别的基础。从这个例子可以看出,即使你关注的流形不一定能够被解析地表达出来,它也为你提供了一个处理问题的明晰概念。
微分流形或平滑流形是指可在其上实施微分运算的流形。
想象在曲面微分流形上有两个十分靠近的点,它们之间的坐标差为{dxi},其Euclid距离就是ds0=(∑i=1Ndxi2)1/2。然而,从一点只能沿流形的测地线到另一点,沿测地线的距离ds会大于Euclid距离。于是将ds定义为ds=(∑i,j=1Ngijdxidxj)1/2。其中(gij)是一个沿流形表面逐点定义的对称正定矩阵,称为Riemann度量,用来描述对距离元的校正。定义了Riemann度量的微分流形称为Riemann流形。
在信息处理技术中可以将概率分布模型p(y | x;θ)全体视为参数空间Θ中的一个Riemann流形。当参数θ变成θ+Δθ时,p(y | x;θ)和p(y | x;θ+Δθ)之间的Kullback -Leibler距离正好等于ΔθTGΔθ,这里G是Fisher信息矩阵。由此可见,G正好是这种Riemann流形的Riemann度量。发展这些概念可以建立起概率模型参数估计的新方法,用于例如盲源分离、盲辨识、神经网络学习算法等等。由于流形有直观的几何解释,这种数学概念和方法又称为信息几何。
以上所解说的几个数学概念仅仅希望起到抛砖引玉的作用。更多的入门知识显然不是这样的讲座适合介绍的,应该期望得到数学家门的帮助。我们希望工科学生消除数学的神秘感。柯尔莫哥罗夫说,应该把泛函分析方法当作日常工具来应用。虽然我们一下子作不到,只要不忘记有机会就用它,你会发现,你论文的学术水准会有所提高,得到的评价会有所不同。另一方面,数学研究者了解物理和工程需求是有益的。事实上,把数学概念讲得浅显易懂,这需要对物理和工程的了解,一定能够扩展数学研究者的思路。
(三)应用需求是数学产生的源泉和发展的源动力
我们需要更多地帮助工科学生增强学习数学的兴趣和进行深入研究的信心。在我国的媒体上对“数学明珠”有过度的宣传,对学生们的影响是复杂的,对工科学生造成的负面影响多于正面影响。许多工科学生和工科研究者觉得自己的工作和数学的距离愈来愈远,甚至认为自己的工作只是一些工程性的工作,难于和理论研究结合起来。一些研究生痛苦于定不下一个适当的研究题目,这种情况在我国的科研单位和大学不算少见。出现这种情况的原因是多方面的。从文化方面来看,重理轻工的观念和习俗,影响一部分工科学生,放松了对应用科学前景的追求。这种情况在我国相当严重,值得引起关注。
工程学科中是不是难于提出有创新性的研究题目呢?近代科技发展的历史已经明确回答了这个问题。虽然计算机断层成像技术有早先的理论铺垫,被承认和授予诺贝尔奖的还是它的实现技术。晶体管的发明更是物理和工艺实现技术结合的产物。当今的科技创新,其主要支撑点是技术创新――方法、工艺、条件和工具的创新。工科研究者不必自惭形秽。你所处的应用需求环境和工作条件是值得珍视的。只要注意了积累功底(理论的和实践的),你一定会不断提高捕捉问题的敏感性,增强抽取问题本质的能力,就很有可能发现值得探索的问题。
数学是从应用需求产生的。这句话讲的不只是历史,还是现实。
一个例子是泛函分析,它的出现得益于运动变分问题(J.阿达马)和力学积分方程(阿贝尔、Fredholm)的研究。推动这门数学全面进步的有J. von Neumann 的工作,是他首先将Hilbert谱理论和量子力学完美结合起来。Sobolev将泛函分析方法用于数学物理方程的研究和求解。在Sobolev空间中引入弱导数和广义解这些概念,为大型求解计算问题的分段近似处理提供了理论基础。与此密切关联的有限元方法可以说是数学和工程结合的典范。其应用领域包括结构力学、流体力学、空气动力学、计算电磁学、气象科学等各个学科。多领域的应用需求又反过来推动了计算数学理论和方法的完善和发展,这不仅仅限于有限元方法。
近20~30年间在信息技术领域中出现了几次重要的研究热潮。这些热潮活跃于信息技术领域,但吸引了大量的数学研究者共同参与。典型的有:关于人工神经网络的研究;关于小波理论的研究;关于高阶统计的研究;关于Markov随机场的研究;关于偏微分方程法用于图像处理的研究等等。当这些热潮出现的时候,不仅仅是信息技术类刊物,还包括数学刊物都大量报道研究进展。人们可以从美国应用数学协会(Society for Industrial and Applied Mathematics,SIAM)出版的十几种刊物了解到相关的动态。数学家们需要应用背景的支持,需要从应用需求中寻找灵感。而大量研究结果表明,他们这样作是成功的。从事应用包括工程的研究者应该意识到自己所处的有利环境,问题是你需要提高对科学问题的敏感度。
为了让工科学生了解如何提出和处理问题,这里不妨介绍几个例子。这虽然算不上重大成果,但或许有用,学生们或许可以从中找到某些可借鉴的思路。
例子1。 两个或多个多项式的最大公因子(GCD)问题。
这是一个很经典的问题,但一直解决得不好。数学家们建议了Euclid辗转除法、结式法等多种方法,似都不好用。例如MATLAB中有计算GCD的程序(m-文件),但一般不可用。严重的问题是,数学家提供的方法中,多项式的系数不容许有一点点误差。而在工程中我们需要这样的方法:如果两个多项式有数值上准确的GCD,方法应该给出准确的GCD;如果两个多项式的系数在数值上有误差,方法应该给出GCD的一个合理估计。由于一维信号反卷积问题的需要,迫使我们考虑这个经典问题。
因为多项式乘积等价于系数数组的卷积,而离散卷积可以表达为矩阵向量积。利用这些工程上熟悉的工具,将多项式代数转换为矩阵代数来处理,立即可以得到GCD阶次和矩阵秩的关系,从而估计GCD的阶。最后GCD的决定可以通过解一个确定性代数方程获得,也可以用最小二乘方法获得。这样的方法可以处理的多项式阶次相当高(例如达到500阶以上),并且结果不敏感于多项式系数的变化,因此新方法可以用于工程。
例子2。 二变量多项式的可分解性。
这是代数几何中关心的基本问题之一。德国数学家F.G.M. Eisenstein的一个重要成果是提出了关于多项式不可分解(或称不可约)的判别方法。其实质是指出了一种特别的二维支持域,称为Eisenstein支持域,定义其上的二变量多项式,无论系数取何值,都是不可约的。这是一个十九世纪的工作。直到上世纪80年代,由于反卷积和相位恢复问题的研究和应用需求,才重新唤起了人们的注意。我们注意到,Eisenstein支持域只是一种很特别的支持域,在实际物理问题中缺乏可用性。于是提出了判别一个任意的二维支持域是不是强制其上定义的二变量多项式不可约的问题。这个问题要求将Eisenstein的特例推广到一般。
我们不是沿数学家过去的思路。重新审视一下分配函数论中关于两个(非负)分配函数卷积造成的支持域关系。这个关系表达为C=A+B,其中A和B是两个卷积因子的支持域,C是结果的支持域,符号“+”表示集合加。这个看似简单的表达式解释起来并不简单,问题来源于关于卷积运算需要“翻转”一个因子的思维定式。我们抛弃了这个思维定式,按叠加原理解释卷积,得出了支持域可嵌入性的认识:A和B是C的两个互补可嵌入因子。这样,A和B外形的每个线元都完全并正好地保留在C的外形上。这样,C如果可分解为C=A+B,它的外形线元集合就必能够划分成两个集合,每个分别能构成一个封闭图形。否则,C就是不可分解的。演绎这个结果可以进一步得出若干判据,从几何直观上就能够判断一个支持域是不是强制不可约的,包括判断Eisenstein支持域。这样就大大扩充了关于多项式不可约判别的理论和方法,并且能够用于工程实践。
例子3。 多变量非线性函数全局最优化。
这是一个多学科关注的问题。简单表述如下:设f(x)是一个非负函数,找一个最小化子x0,使得f(x)在x0处达到全局最小值。关于这类全局优化问题典型地有以下几种方法。(1)基于梯度下降的方法。该类方法容易找到局部极小值,缺乏有效的机制逃出局部极值区。(2)采用模拟退火、演化规划一类随机搜索的方法。该类方法缺乏收敛机制,即使搜索到全局最小值附近,新的搜索可以跳开很远。(3)区间代数搜索方法。在搜索策略上有规律性,但仍然缺乏收敛机制。如果搜索正确,结果误差由最终的区间长度决定。
我们希望寻找一种方法,能将随机或规则搜索与梯度下降结合起来,达到这样的效果:从任何一个点出发,只用很少的搜索步就能够判断,往下的搜索是否值得继续,也就是判断当前的搜索是不是处在一个局部极小值的盆中。由此决定是不是要选择新的起始点。如果能够找到有效地提供这种判断的机制,函数全局优化的算法应该非常有效。这可能吗?
假定f(x)是优化目标函数,构造一个“辅助价格函数”g(x) = f(x)/(▽f T▽f + c),其中c > 0, 是一个可调整的常数。能证明函数g(x)具有以下性质:它与f(x)具有相同的全局极小值;对于给定的c,f(x)在c决定的一个电平以上的全部极小值点都变成g(x)的极大值点,而f(x)在该电平下的极小值处g(x)也是极小值。因此算法可以这样来构造:使用随机搜索法,从任何一点出发用梯度法往下搜索f(x)的极小值。在搜索中同时观察g(x)的变化。如果发现g(x)不减,立即改用新的搜索起始点。当重新起始搜索的次数达到一个指定次数N以后,根据迄今已搜索到的f(x)最小的极小值fmini(x),对c进行修正。当上述过程重新进行时,f(x)的电平高于fmini(x)的全部极小值点都映射成g(x)的极大值点。在将来的联合搜索中,就大大减轻了计算工作量。计算表明,如果搜索落到了f(x)的局部极小值附近的区域内,利用g(x),通常只要2到3步迭代就会跳出到新的起始。这样,新方法具有梯度方法快速、准确的优点,同时避免了停在局部极值点的困难。用这种方法试验了我们收集到的若干典型困难例子,认为是目前最有效的方法。
方法有潜在的应用前景。在许多情况下,我们不清楚f(x)的具体表达式。例如用几种材料组分合成新材料,使新材料达到某种品质。只要这种希望的品质能够定量地被测量,以上方法就可能应用。事实上,只要f(x)能够被测量获得,▽f就能够在数值上获得,于是方法就可以实施。
以上是我们在处理工程技术研究中获得的部分结果。我们体会到,物理和工程学科中的研究能够帮助我们从不同的角度和思路去思考问题,能够扩展数学问题的解决和应用。
(四)几句忠告
现代科技发展已经将科技、经济、国力联系在一起。任何一个专业门类都有成千上万的人参与。重大科技创新的背后都有许多前人的基础性工作。有志的青年科技工作者和研究生需要不断积累知识,拓宽知识领域,树立团队工作观念和合作精神,同时勤于独立思考。在科学研究中特别忌讳盲从,包括盲从“权威”、盲从大流。积累知识和勤于思考应该说是科技工作者的基本功,这需要坚持。特别是刚毕业的硕士生、博士生,能够在2、3年后成为世界知名科学家当然再好不过,只是这样的成功者太少。对每个研究者,只要坚持了积累知识和勤于思考的基本功,总会有回报的。
如何选择科研方向和研究题目是青年科技工作者常常感到困惑的问题。从手头的项目作深作精开始,或许你会发现,你现在正处于手头项目的优势环境中,而你获得的任何实际进步可能都包含着很有意义的创新。当然另一方面,聪明的研究者决不会在小问题上钻牛角尖,而会时时关注科技发展的全景,时时发现自己能够开拓的新路子。同时需注意,基础理论研究是重要的,而基础方法、条件和工具的研究同样重要。
如果你刚刚进入研究,不妨拟定一个自己的五年计划和目标,包括数学、理论的扩充和实际技能的学习两个方面。这个讲座只讲了如何学习数学的问题,希望不会造成误导。利用一切联系实际的机会学习和积累实际技能,是一个必须补充的建议。
(此文为中科院研究生院暑期讲座材料, 2008年6月。)
本文引用地址:http://blog.sciencenet.cn/blog-4909-243368.html