高数总结

漫谈高数

(一) 泰勒级数的物理意义

高等数学干吗要研究级数问题?

        是为了把简单的问题弄复杂来表明自己的高深? No,是为了把各种简单的问题/复杂的问题,他们的求解过程用一种通用的方法来表示。

        提一个问题,99*99等于多少? 相信我们不会傻到列式子去算,口算也太难了而是会做一个迂回的方法,99*(100-1),这样更好算。那么995*998呢? 问题更复杂了,(1000-5)*(1000-2),式子比直接计算要复杂,但是口算却成为了可能。归纳一下,x*y这样的乘法运算或者幂次运算,如何直接计算很麻烦的话,我们可以用因式分解的方法(中学生都能理解)来求解。但是因式分解仍然不够通用,因为我们总是需要通过观察"特定"的待求解式子,找到一种规律,然后才能因式分解,这是我们从小学到中学数学方法的全部: 特定问题特定的解答方法。那么,到了高等数学,怎么办? 研究一种方之四海皆准的,通用的方法。

        泰勒级数的物理意义是什么? 就是把方程g(x)=0的解,写成曲线方程的形式看看和x轴有什么交点。例如f(x)=x^2=5等价于g(x)=x^2-5=0和x轴的交点。而这个曲线交点可以用直线切线的逼近方法(牛顿迭代法)来实现,这就是泰勒级数的物理意义: 点+一次切线+2次切线+...+N次切线。每次切线公式的常数,就是泰勒级数第N项的常数。OK,从泰勒级数的式子可以看到,为了保证两边相等,且取N次导数以后仍然相等,常数系数需要除以n!,因为x^n取导数会产生n!的系数。泰勒级数,就是切线逼近法的非跌代的,展开式。泰勒公式怎么来的,其实根据牛顿逼近法就可以得到从1阶一直可以推导到N阶。假设f1(x)=f(x)-f(a),由牛顿逼近法有f1(x)=f'(a)(x-a)+o(x-a)^2,所以f(x)=f(a)+f'(a)(x-a)+o(x-a)^2

同理,假设f2(x)=f(x)-f(a)-f'(x)(x-a),

两边求导,f2'(x)=f'(x)-f'(x)-f''(x)(x-a)=-f''(a)(x-a)

再求不定积分f2(x)=-(1/2)f''(a)(x-a)^2+C,C就是那个高阶无穷小(需要证明)

所以f(x)=f(a)+f'(a)(x-a)+f''(a)(x-a)^2+o(x-a)^3依次类推,最后就有了泰勒公式。另一种证明过程干脆就是先写出来g(x)=a0+a1(x-a)+a2(x-a)^2+...+an(x-a)^n,然后从等式序列,g(a)=f(a),g'(a)=f'(a),...g'''''(a)=f'''''(a)... ...就得到所有的a0-an的泰勒展示系数了。

-------------------------------------------------------------------

        泰勒级数展开函数,能做什么?对于特定的x取值,可以求它附近的函数。y=x^100展开以后可以求x=1附近的0.9999的100次方等于多少,计算过程和结果不但更直观,而且可以通过舍弃一些高阶项的方法来避免不必要的精度计算,简化了计算,节省了计算时间(如果是计算机计算复杂数字的话)。在图像处理的计算机软件中,经常要用到开方和幂次计算,而Quake III的源代码中就对于此类的计算做了优化,采用泰勒技术展开和保留基本项的办法,比纯粹的此类运算快了4倍以上。

        还可以做什么呢? 对于曲线交点的问题,用方程求解的办法有时候找不到答案,方程太复杂解不出来,那么用泰勒级数的办法求这个交点,那么交点的精度要提高,相当于泰勒级数的保留项要增加,而这个过程对应于牛顿--莱布尼茨的迭代过程,曲线交点的解在精度要求确定的情况下,有了被求出的可能。

        看到了吧,泰勒技术用来求解高方程问题,是一种通用的方法,而不是像中学时代那样一种问题一种解决办法,高等数学之所以成为"高等",就是它足够抽象,抽象到外延无穷大。

        那么,更感兴趣的一个问题是,对于高阶的微分方程表达的问题,怎么求解呢? 泰勒级数不行了,就要到傅立叶级数-傅立叶变换-拉普拉斯变化。这几个工具广泛用于各个领域的数学分析,从信号与系统到数理方程的求解。

        中学数学和高等数学最大的区别是什么? 中学数学研究的是定解问题,例如根号4等于2。高等数学研究什么呢----它包含了不定解问题的求解,例如用一个有限小数位的实数来表示根号5的值。我们用泰勒级数展开求出的根号5的近似值,无论保留多少位小数,它都严格不等于根号5,但是实际应用已经足够了。不可解的问题,用高等数学的通解办法,可以求出一个有理数的近似解,它可以无限接近于上帝给出的那个无理数的定解。通解可行性的前提是,我们要证明这种接近的收敛性,所以我们会看到高等数学上册的课本里面,不厌其烦的,一章接一章,一遍又一遍的讲,一个函数,在某个开区间上,满足某个条件,就能被证明收敛于某种求和式子。初等数学求的是定解,那么如果没有定解呢? 高等数学可以求近似解。牛顿莱布尼茨就是切线逼近法的始祖。例如求解一般的3次方程的根,求解公式可以是定解形式。但是问题是根号内的无理数仍然无法表示出来。那么逼近法求一个数的N次方根就派上用场了。

  f{m}=m(k+1)=m(K)+{A/m^2.(k)-m(k)}1/n.

  n是方次,A被开方数。

  例如,A=5,5介于1的3次方至2的3次方之间。我们可以随意代入一个数m,例如2,那么:

  第一步,2+[5/(2×2)-2]×1/3=1.7;

  第二步,1.7+[5/(1.7×1.7)-1.7]×1/3=1.71;

  第三步,1.71+[5/(1.71×1.71)-1.71]×1/3=1.709;

  每次多取一位数。公式会自动反馈到正确的数值。

        具体的求解过程:先说说泰勒级数:一个方程,f(x)=0,求解x,它唯一对应x-f(x)二维图像上的一条曲线。那么x的求解过程可以用牛顿-莱布尼茨逼近法求得(迭代)。例如x^2=5可以看成f(x)=x^2-5=0的求曲线和X轴的交点。牛顿迭代法可以用来求解线性方程的近似解。那么如何求解非线性方程呢? f(x)用泰勒级数展开,取前N项(通常N=2),得到一个线性的方程,这个方程相当于是原来的曲线在求解点附近做了一条切线,其求解过程和牛顿迭代法等价。迭代次数越多,越接近非线性。用泰勒级数来分解sin(t),把一个光滑的函数变成一些列有楞有角的波形的叠加。用傅立叶级数来分解方波,把有楞有角的波形变成一些光滑曲线的集合。但是傅立叶级数舍弃项的时候,会产生高频的吉布斯毛刺(上升下降的边沿,迪利赫里条件不符合)。局部的收敛性不如泰勒级数展开----因为泰勒级数展开有逐项衰减的常数因子。

        举个例子,用泰勒级数求解欧拉公式。没有欧拉公式,就没有傅立叶变换,就没有拉普拉斯变化,就不能把高阶导数映射到e的倒数上面,也就无法把微分方程等价为一个限行方程。欧拉公式有什么用? 它把实数的三角运算变成了复数的旋转运算,把指数运算变成了乘积运算,把纯微分方程的求解过程变成了指数方程的求解过程,大大简化了运算。

-------------------------------------------------------------------

        推广一下。怎么分析一个函数?怎么分析一个几何的相交问题?怎么解决一个多维的问题? 初等的方法是根据函数或者图形的几何性质,去凑答案----当然大部分情况是凑不到答案的,因为能凑到答案是因为问题/题目给出了一些特殊的数学关系以使得我们恰好能凑到答案! 例如一个圆球在正方体里面,求通过某个顶点的切面方程或者距离什么的,我们可以通过做辅助面求得。但是这个求解太特殊了,对于普通的点,例如切面方程 13x+615y+72z-2=0这样的,初等方法就无能为力了。说白了初等方法就是牛顿在<<自然哲学的数学原理>>提到的几何方法,牛顿并没有把微积分上升到解析的思想。普通数学分析则提出了解析的代数运算思想,把具体的问题用通用的方式来求得,而问题的题设只是一种把函数的实际参数带入形式参数的过程,使得问题可以形式化了----如果数学问题不能形式化就不能通过状态机来求解,试想,计算机怎么会画辅助线呢? 几何图形是有意义的,但是形式求解本身没有意义,它必须把实际的"意义"问题变成代数运算,例如求最大值最小值变成导数=0。电路分析当中的模型是什么? 就是数学建模。因为电压和电流是可以测量的量,那么我们就要看什么量是不变量/变量,什么量是自变量/因变量。如果电压是不变量,我们认为是理想电压源;如果电流是不变量就是理想电流源,如果电压电流的比例不变就是恒定电阻;如果电压电流乘积不变就是理想功率源。把控制电路作为一个整体,那么电压/电流控制电压/电流,作为一个黑盒,对外的特性就是电压转移系数,电流转移系数,转移电阻和转移电抗。在物理学的电场分析当中电压/电势是一个矢量,但是到了集总电路分析的领域就退化成了一个标量。对于复杂问题的分析,好比物理学当中的动量/能量守恒,电路分析是以电流守恒为基础的,于是就有了节电电流法和环路电压法的概念。这些概念的建立都是为了分析的目的而存在的,是分析工具。我们首先得到一个工具,当直接分析很困难的时候,我们采用逼近的方法来解决----因为极限就是我们所求的。正是因为解析的思想是一种通用的求解方式,爱因斯坦在晚年才会追求4大场的统一理论,当然他忽略了这个"解析"的形式系统本身在量子的尺度上失效了,忽略了不确定性和概率的影响,令人惋惜。说的太远了,高数里面为什么有那么多种正交展开? 泰勒级数,傅立叶级数,罗朗级数----其实就是因为初等的方法无法精确分析出定解,那么就去寻找一种"不断逼近"的方法来求解。复变函数研究的就是如何用幂级数不断的逼近原函数这个基本命题。

-------------------------------------------------------------------

        泰勒是怎么想出来的?

        为什么泰勒级数,傅立叶级数,这些展开式都可以写成某个通项公式的和呢? 是不是真理都是简单的美的,就像毕达哥拉斯所设想的一样? 这个观点也许搞反了因果的方向。我们看一下泰勒级数是怎么得到的。泰勒假设f(x)=f(a)+f'(x)(x-a)+o(x-a)^2,这个是牛顿莱布尼茨公式可以推出来的,那么有了一次项以后,如何继续逼近? 方法类似,一次的求解是g1(x)=f(x)-f(a)=f'(x)(x-a),那么可以写出g2(x)=f(x)-f(a)-f'(x)(x-a)两边对x求导再求不定积分,就得到了2阶的泰勒级数。依次类推,可以得到N阶的泰勒级数。由于每一阶的推导过程是"相似"的,所以泰勒项数的子项肯定也就具有了某种形式意义上的相似性。说白了,不是因为客观存在某种规律使得函数可以展开成具有通项公式的幂级数,而是为了把函数展开成具有通项公式的幂级数再去看每个子项应该等于什么,然后为了保证严格再给出收敛以及一致收敛的条件。

        不是客观存在某种"简单而且美"的真理,而是主体把某种"简单而且美"的形式强加给客观,再看客观在"强加"语境下的特性如何。傅立叶级数的思想,频率分析的思想,和这个相似,是把我们心中的某个概念赋予外界的实在,按主管意识的想法来拆借外界----只有这样,思想才能被理解。当然,实数范围的泰勒级数和傅立叶级数展开的条件仍然比较严格,复变函数引入了对应的洛朗级数和傅立叶/拉普拉斯变换,通用性强多了。说白了,复变函数就是函数逼近论。为了解决初等思想没法解决的不可能想明白的问题而引入的高等方法。逼近思想的一个应用就是理解曲率的公式 A=|y''|/sqrt(1+y'^2)。画出逼近图形就可以理解了,用两个相似三角形就可以证明这个公式。

        复变函数说白了就是2维正交元素组成的数域。(1+i)^i=exp(iLn(1+i))=exp(i[Ln|1+i|+i(arg(1+i)+2kPi])=exp(-Pi) (1/4+2k)*(cos[ln2/2]+isin[ln2/2]),是一个正交的表达式,它保留了两个方向上的分量,使得2维分析变得可能。这样一来,高等数学当中的曲线积分,积分的变量不再是x和y而是只剩下了z,形式上简单多了。

        假设曲线积分S1=S(Pdx+Qdy)其中Q=x^2-2xy-y^2,P=x^2-y^2+2xy,显然满足格林公式。然后负数积分 S(z^2)dz=S(x^2+2xyi-y^2)d(x+yi)=S( (x^2-2xy)dx+(y^2-2xy)dy )。而S(x^2+2xyi-y^2)d(x+yi)实部=S(x^2-y^2)dx-2xy^2dy,虚部=S(2xydx+(x^2- y^2)dy),实部和虚部相加就是S1,也就是说,S是S1(曲线积分和路径无关)的复数形式。我们可以验证S(z^2)dz沿不同积分路线从起点到终点的积分结果。z^2=(x^2-y^2)+i2xy,显然满足柯西-黎曼条件。于是它和实数积分的格林公式统一了。

        实际的模型总是难以精确的解释的,所以我们创造一些理想模型去逼近现实。当然,两者不会相等,但是只要误差在容许的范围之内,我们认为数学的分析就成功了。这就是一切数学建模的思想。工科电子类的专业课,第一门数学建模的课程就是电路分析。这里传输线的问题被一个等效电路替代了。实际电源被一个理想的电压源加上一个电阻替代了,三级管放大电路的理论模型就是电流控制的电流源。一切都是为了分析的方便。只要结果足够近似,我们就认为自己的理论是有效的。出了这个边界,理论就需要修正。理论反映的不是客观实在,而是我们"如何去认识"的水平,理论是一种主观的存在,当实际情况可以影射到同一种理论的时候,我们说理论上有了一种主观的"普遍联系",就像电路分析和网络流量的拓扑分析有很多共同点。这种普遍联系不是客体的属性,只和主体的观点有关。

       

 

        说点题外话,对于工科电子类/计算机类的学生来说,我们学习了太多了经过精简压缩贯通的课程,以至于不知道了这些理论原有的面貌。有一种趋势就是把重要的思想性的原理性的东西去掉只留下工程实用性的内容下来。于是工科学生学到的都是"阉割"过的科学与技术----缺少灵魂的学问是无法用来做研究的。下面是课程的对应关系:

1. 高等数学(工科)2个学期 <-> 数学分析+解析几何+微分几何(5个学期)____数学系专业课

2. 线性代数(工科)1个学期 <-> 高等代数(2个学期)+矩阵论(1个学期)______数学系专业课

3. 数理方法(工科)1个学期 <-> 常微分方程+偏微分方程+算子理论(3个学期)_数学系专业课

4. 离散数学(工科)1-2学期 <-> 形式逻辑+数理逻辑+集合论+近世代数+组合数学+运筹学+拓扑学(N个学期)_数学系专业课

5. 信号与系统(工科)1个学期 <-> 复变分析+实变分析+泛函分析+控制理论+... ..._数学系专业课

        没有强大的数学基础,所谓的"科研",只能是某种一边发明数学一边凑答案的抓狂,只能是空谈。还是老老实实的做项目,搞软硬件研发,开发市场,做技术支持,写报告,等等。

 

(二) 方程和矩阵的物理含义

[一. 矩阵和空间的思想]

        我在这里,把线性代数归于高等数学的范畴,因为它的理论适用于很多高等数学求解的领域,例如多项微分方程组的求解,离不开它。

        方程组,有什么物理/几何的意义吗? 有,就是一种映射关系。下图中,左图代表了2维到2维的一一映射,注意,Ax=0只有0解代表对于满秩矩阵A,[0]只能被映射为[0]。右图代表A不满秩,就是2维映射到1维的情况,一个线段映射到一个点,也就是存在一个"解系"。

 

        换个角度,由于线性映射常常就是线性变换,也就是映射回本身的集合映射,所以AX=B也可以看成是某种交点的性质。根据向量之间相交的情况区分,定解(直线或面交于一点,1和2中的交点),无穷解(直线平行或面多面共线,这个线就构成解系。1种的红黄色重合线和3中的共线),或者无解(平行或面没有公共交点,1中的平行线和4中的平行交线)。如下图所示。

 

        符号系统还有什么作用?在线性代数和微分方程里面的算子理论就是符号系统的一种形式。如果ax=b有解,那么x=(a^-1)*b,其中|a|=0,我们可以推出对于矩阵方程组Ax=B有确定解,,那么这个解集是x=(A^-1)*b。这里-1表示逆矩阵,*表示矩阵相乘,其中|A|!=0。这样的表示是正确的科学的,要做的事情就是看看A^-1如何表示和得到。|A|不是绝对值而是行列式。A此时称为可逆矩阵----这个相当于实数运算里面要保证分母!=0。是不是很相似?

        可逆有什么性质:如果对一个矩阵做线性变换,使用一个满秩的矩阵,那么做变换的结果,秩不变。要注意,把矩阵当成算子的时候,乘法的交换律不一定成立。秩的加法律和乘法律r(AB)>=r(A)+r(B),r(A+B)<=r(A)+r(B)。秩的性质类似于开根号。两个性质, (1)A*B=I,那么A和B都可逆。(2)B可逆,A^2+AB+B^2=0,那么求证A和A+B可逆。证明:A(A+B)=-B^2。|-B^2|= (-1)^n*|B|^2!=0,所以A和A+B都可逆。什么又是N阶可逆矩阵呢?A*T(A)=I的矩阵就是了。推广的说,把分块矩阵的元素可以看作普通的矩阵元素,那么线性变换的结果相似,只是4则运算的单位从"1"变成了单位矩阵"I"。我们从一元方程得到类似的一元矩阵符号运算的性质。说白了,代数意义上就是双射。

-----------------------------------------------------------------------------------

[二. 矩阵运算的物理含义,举例]

        如果把矩阵看成一个2维坐标系离散值的几何,那么

1. 矩阵加法A+B就是A的各个点作平移,平移的度量是B当中对应的点。

2. 矩阵乘法A*B就是一种线性映射:如果A是x/y坐标系,B是y/z坐标系,那么结果就是x->z的映射。举个例子,有3个国家,A国有三个城市,B国有三个城市,C国有两个城市。他们之间的道路状况如下用矩阵表示

->B1,B2,B3

A1 1, 1, 0

A2 1, 0, 1

A3 1, 1, 0

->C1,C2

B1 1, 0

B2 1, 1

B3 0, 1

        那么从A国的每个城市出发经过B到达C的每个城市,各自有多少条线路? 答案就是A*B=[(2,1),(1,1),(2,1)]

3. 我们深入的讨论一下"映射"的概念。举实数为例,y=ax是一个乘法映射,每一个x对应一个y。那么如果知道y求x呢? x=a^(-1)*y。这里影射函数f(x)=ax和反函数g(x)=a^(-1)x互逆。那么我们推广到N维坐标系空间里面就看到,矩阵就是一个N*N 的坐标系映射。AX=B,把B看成Y,那么X=A^(-1)*Y。前提是A的范数!=0。我们构造的得到的A的1范数就是它的行列式。那么到底什么是映射? 莱布尼茨说映射就是一组2元关系。在1维的时候表现为函数的形式f(z)=z,在多维的时候表现为矩阵的形式。1维的多次映射表现为函数的嵌套(g o f),多维的情形可以写成矩阵的乘法。当然,限制条件是,矩阵能表示的是一个离散值的集合。当然,方阵才有逆----方阵是维数不变的N->N的一一映射,所以可能有且只有一个反映射,或者没有反映射。N->M的不同维数映射无法得到反映射。

4. 形式化的定义。我们如果把矩阵看成一个"算子"的话,矩阵的乘法就能看成一个状态机的推演,推算的过程就是一次算子入栈,反推的过程就是算子出栈。那么显然就能够理解(AB)T=B(T)*A(T)以及(AB)^-1=B^(-1)*A^(-1),(AB)* = (B*)*(A*)。我们从伴随矩阵的性质AA*=|A|E得到A^(-1)=A*/|A|。矩阵左乘是行变换,右乘是列变换。把矩阵看成算子,同时可以把子矩阵看成算子,分块矩阵的相成和行列式求解也就很简单了。可以把小的矩阵当成一个数来看待。三角阵通过初等变换可以变成分块阵。

5. 初等矩阵有3种,对应3种最基本的矩阵变换,也就是行列互换,行列数乘,一行/列数乘以后加到另一个行/列上面。初等矩阵都可逆。线性变换的结果是"相抵"的。一个矩阵总是能等于一个初等变换矩阵,并且逆矩阵的属性不变。对于可逆矩阵A,总有P1P2P3...PnAQ1Q2...Qn=E。或者说存在可逆矩阵P/Q使得PAQ=E。例如,如果A,B和A+B都可逆,那么A(-1)+B(-1)=B(-1)(B+A)A(-1)也是可逆的。

 

6. 于是有了线性空间的概念:线性空间V就是一个集合,它同时满足V上的元素加法和对于数域K上面的乘法满足8条线性运算的规则。

7. 为什么要讨论相似? 这里面包含了一种不变性,是研究变换的数学工具。实数变换可以拆分成复数变换,例如酉矩阵,在晶体学里,酉变换叫做幺正变换,也就是将空间(可以是任意维的)中一组基矢做一个旋转操作,不改变矢量的大小和内积。而在量子力学里面,这个用处就更大了,本质上就是量子力学所说的表象变换。是连接两个表象的桥梁。

你可能感兴趣的:(高数总结)