《变分法及其应用——物理、力学、工程中的经典建模》欧斐君 高等教育出版社
向量中有有限个元素,它们可以进行加法、数乘、定义范数、定义内积、定义夹角。比如,对于向量 a a a和 b b b,其夹角余弦值为
c o s < a , b > = ( a , b ) ∣ ∣ a ∣ ∣ ⋅ ∣ ∣ b ∣ ∣ cos<a,b> = \frac{(a,b)}{||a|| \cdot ||b||} cos<a,b>=∣∣a∣∣⋅∣∣b∣∣(a,b)
那么,如果把一个向量中的元素数量扩展到无穷,向量就变成了函数,我们尝试仿照向量,对函数定义范数、内积、夹角。首先是内积,它变成了
( f , g ) = ∫ f ( x ) g ( x ) d x (f,g) = \int f(x) g(x) dx (f,g)=∫f(x)g(x)dx
有了内积,很容易定义出范数。
∣ ∣ f ∣ ∣ = ( f , f ) = ∫ f 2 ( x ) d x ||f|| = \sqrt{(f,f)} = \sqrt{\int f^2(x) dx} ∣∣f∣∣=(f,f)=∫f2(x)dx
以及夹角。
c o s < f , g > = ( f , g ) ∣ ∣ f ∣ ∣ ⋅ ∣ ∣ g ∣ ∣ cos<f,g> = \frac{(f,g)}{||f|| \cdot ||g||} cos<f,g>=∣∣f∣∣⋅∣∣g∣∣(f,g)
有了夹角,我们就可以定义函数的正交,即如果 c o s < f , g > = 0 cos<f,g>=0 cos<f,g>=0,则函数 f f f与 g g g正交。正交函数族的例子有三角函数(傅里叶分解的基函数),切比雪夫多项式等等。函数在一组两两正交函数 ϕ i ( x ) \phi_i(x) ϕi(x)上的投影,被称为广义傅里叶级数。即
f = ∑ − ∞ ∞ c i ϕ i f = \sum_{-\infty}^{\infty} c_i \phi_i f=−∞∑∞ciϕi
其中,
c i = ( f i , ϕ i ) c_i = (f_i, \phi_i) ci=(fi,ϕi)
如果我们只取级数中的 N N N项和 f N f_N fN作为对 f f f的逼近,那么就有误差
e = ∣ ∣ f N − f ∣ ∣ e = || f_N - f || e=∣∣fN−f∣∣
对于这 N N N项的基函数,按 ( f i , ϕ i ) (f_i, \phi_i) (fi,ϕi)选取 c i c_i ci能让误差最小,因此 f N f_N fN是一个最佳逼近。
就像向量函数以向量为自变量,泛函以函数(无限维的向量)为自变量。其映射 J J J为 函 数 空 间 → R 函数空间 \rightarrow R 函数空间→R。
问题:从 ( 0 , 0 ) (0,0) (0,0)到 ( x 1 , y 1 ) (x_1,y_1) (x1,y1)构建一个光滑斜曲面,使得小球在重力中下降速度最快。
假设曲面的函数为 y = y ( x ) y=y(x) y=y(x),那么有两端的约束 y ( 0 ) = 0 , y ( x 1 ) = y 1 y(0)=0,y(x_1)=y_1 y(0)=0,y(x1)=y1;当小球下落到 ( x , y ) (x,y) (x,y)时,按照能量守恒,它的速度为 v = 2 g y v=\sqrt{2gy} v=2gy,取一个微元,斜面长度为 1 + y ′ 2 \sqrt{1+y'^2} 1+y′2,因此通过这个微元的时间为
t = 1 + y ′ 2 2 g y t = \frac{\sqrt{1+y'^2}}{\sqrt{2gy}} t=2gy1+y′2
因此通过整个斜面的总时间为
T = ∫ 0 x 1 t d x = ∫ 0 x 1 1 + y ′ 2 2 g y d x T = \int_0^{x_1} t dx = \int_0^{x_1} \frac{\sqrt{1+y'^2}}{\sqrt{2gy}} dx T=∫0x1tdx=∫0x12gy1+y′2dx
假设这个斜面是连续的,那么解一定存在于如下的函数空间( C 1 C^1 C1表示一阶连续):
A = { y ∣ y ( x ) ∈ C 1 ( x , y ) y ( 0 ) = 0 , y ( x 1 ) = y 1 } A=\left\{ y | \begin{matrix} y(x) \in C^1(x,y) \\ y(0)=0, y(x_1)=y_1 \end{matrix} \right\} A={y∣y(x)∈C1(x,y)y(0)=0,y(x1)=y1}
假设 y ∗ y^* y∗是最后的解,那么我们要求的问题就变成了一个优化问题
y ∗ = arg min y ∈ A T y^* = {\arg\min}_{y \in A} T y∗=argminy∈AT
一会儿再考虑如何求解这个方程。
问题:求一段通过 ( x 1 , y 1 ) (x_1,y_1) (x1,y1)和 ( x 2 , y 2 ) (x_2,y_2) (x2,y2)的曲线,绕着 x x x轴旋转后侧面表面积最小。
首先写出面积公式。按 x x x轴分成无数个微元,每个微元都是一个周长为 2 π y 2\pi y 2πy,高为 1 + y ′ 2 \sqrt{1+y'^2} 1+y′2的长方形,因此总面积为
S = ∫ x 1 x 2 2 π y 1 + y ′ 2 d x S = \int_{x_1}^{x_2} 2 \pi y \sqrt{1+y'^2} dx S=∫x1x22πy1+y′2dx
然后是解空间,假设曲线二阶连续,则有
A = { y ∣ y ( x ) ∈ C 2 ( x , y ) y ( x 1 ) = y 1 , y ( x 2 ) = y 2 } A=\left\{ y | \begin{matrix} y(x) \in C^2(x,y) \\ y(x_1)=y_1, y(x_2)=y_2 \end{matrix} \right\} A={y∣y(x)∈C2(x,y)y(x1)=y1,y(x2)=y2}
最后是求解的优化问题,令最优解为 y ∗ y^* y∗,则
y ∗ = arg min y ∈ A S y^* = {\arg\min}_{y \in A} S y∗=argminy∈AS
问题:在一个曲面上,求解两点间在曲面上的最短距离。
假设曲面方程为 g ( x , y , z ) = 0 g(x,y,z)=0 g(x,y,z)=0,直线方程为
l = { y = y ( x ) z = z ( x ) l = \left\{ \begin{matrix} y = y(x) \\ z = z(x) \end{matrix} \right. l={y=y(x)z=z(x)
首先是距离公式。
S = ∫ x 1 x 2 1 + y ′ 2 + z ′ 2 d x S = \int_{x_1}^{x_2} \sqrt{1+y'^2+z'^2} dx S=∫x1x21+y′2+z′2dx
然后是解空间。
A = { y ∣ g ( x , y ( x ) , z ( x ) ) = 0 , x ∈ ( x 1 , x 2 ) g ( x 1 , y 1 , z 1 ) = 0 , g ( x 2 , y 2 , z 2 ) = 0 } A=\left\{ y | \begin{matrix} g(x, y(x), z(x)) = 0, x \in (x_1,x_2) \\ g(x_1,y_1,z_1)=0, g(x_2,y_2,z_2)=0 \end{matrix} \right\} A={y∣g(x,y(x),z(x))=0,x∈(x1,x2)g(x1,y1,z1)=0,g(x2,y2,z2)=0}
最后是优化问题。
y ∗ = arg min y ∈ A S y^* = {\arg\min}_{y \in A} S y∗=argminy∈AS
一段长为 L L L的线段,如何围成更大的面积。
这是作业,还没完成。
欧拉公式帮助我们进行具体的求解。
设 f ( x ) ∈ C [ x 0 , x 1 ] , η ( x ) ∈ C 0 ∞ [ x 1 , x 2 ] f(x) \in C[x_0,x_1], \eta(x) \in C_0^{\infty}[x_1,x_2] f(x)∈C[x0,x1],η(x)∈C0∞[x1,x2],其中 C 0 ∞ C_0^{\infty} C0∞表示在边界上导数为0,中间无限次可导。如果有
∫ x 1 x 2 f ( x ) η ( x ) d x = 0 , ∀ η ∈ C 0 ∞ [ x 1 , x 2 ] \int_{x_1}^{x_2} f(x) \eta(x) dx = 0, \forall \eta \in C_0^{\infty}[x_1,x_2] ∫x1x2f(x)η(x)dx=0,∀η∈C0∞[x1,x2]
则 f ( x ) = 0 f(x)=0 f(x)=0。
证明:反证法。假设 f ( x 0 ) > 0 f(x_0)>0 f(x0)>0,则有 x ~ 1 < x 0 < x ~ 2 \tilde{x}_1<x_0<\tilde{x}_2 x~1<x0<x~2,在这个区间内, f ( x ) > 0 f(x)>0 f(x)>0。构造
η ( x ) = { K ( x − x ~ 1 ) 2 n ( x − x ~ 2 ) 2 n , x ∈ ( x ~ 1 , x ~ 2 ) 0 , x ∉ ( x ~ 1 , x ~ 2 ) \eta(x) = \left\{ \begin{matrix} K(x-\tilde{x}_1)^{2n}(x-\tilde{x}_2)^{2n},& x \in (\tilde{x}_1, \tilde{x}_2) \\ 0,& x \notin (\tilde{x}_1, \tilde{x}_2) \end{matrix} \right. η(x)={K(x−x~1)2n(x−x~2)2n,0,x∈(x~1,x~2)x∈/(x~1,x~2)
其中 K > 0 K>0 K>0, n n n为正整数,则
∫ x 1 x 2 f ( x ) η ( x ) d x = ∫ x ~ 1 x ~ 2 f ( x ) K ( x − x ~ 1 ) 2 n ( x − x ~ 2 ) 2 n d x > 0 \int_{x_1}^{x_2} f(x) \eta(x) dx = \int_{\tilde{x}_1}^{\tilde{x}_2} f(x) K(x-\tilde{x}_1)^{2n}(x-\tilde{x}_2)^{2n} dx > 0 ∫x1x2f(x)η(x)dx=∫x~1x~2f(x)K(x−x~1)2n(x−x~2)2ndx>0
矛盾。因此引理成立。
设泛函 J ( y ) = ∫ x 1 x 2 F ( x , y , y ′ ) d x J(y) = \int_{x_1}^{x_2} F(x,y,y') dx J(y)=∫x1x2F(x,y,y′)dx, F F F关于 x , y , y ′ x,y,y' x,y,y′连续,且有二阶连续偏导。假设解空间为
A = { y ∈ C 2 ( x 1 , x 2 ) , y ( x 1 ) = y 1 , y ( x 2 ) = y 2 } A = \left\{ \begin{matrix} y \in C^2(x_1,x_2), \\ y(x_1)=y_1, y(x_2)=y_2 \end{matrix} \right\} A={y∈C2(x1,x2),y(x1)=y1,y(x2)=y2}
则 y ∗ y^* y∗满足
F y − d d x F y ′ = 0 F_y - \frac{d}{dx} F_{y'} = 0 Fy−dxdFy′=0
此为欧拉方程。
证明: A A A中任意一个 y y y都可以写成 y ∗ + ϵ η y^* + \epsilon \eta y∗+ϵη的形式,因此
J ( y ) = ∫ x 1 x 2 F ( x , y , y ′ ) d x = ∫ x 1 x 2 F ( x , y ∗ + ϵ η , y ∗ ′ + ϵ η ′ ) d x = Φ ( ϵ ) J(y) = \int_{x_1}^{x_2} F(x,y,y') dx = \int_{x_1}^{x_2} F(x, y^* + \epsilon \eta, {y^*}' + \epsilon \eta') dx = \Phi(\epsilon) J(y)=∫x1x2F(x,y,y′)dx=∫x1x2F(x,y∗+ϵη,y∗′+ϵη′)dx=Φ(ϵ)
由于在 ϵ = 0 \epsilon=0 ϵ=0时取到最值,因此我们对上式关于 ϵ \epsilon ϵ求导结果应为 0 0 0,得到
Φ ′ ( ϵ ) = ∫ x 1 x 2 d F d ϵ d x = ∫ x 1 x 2 d F d x d x d ϵ + d F d y d y d ϵ + d F d y ′ d y ′ d ϵ d x = ∫ x 1 x 2 0 + d F d y η + d F d y ′ η ′ d x = ∫ x 1 x 2 d F d y η d x + ∫ x 1 x 2 d F d y ′ d η = ∫ x 1 x 2 d F d y η d x + d F d y ′ η ∣ x 1 x 2 − ∫ x 1 x 2 η d d x F y ′ d x = ∫ x 1 x 2 d F d y η d x − ∫ x 1 x 2 η d d x F y ′ d x = 0 → F y − d d x F y ′ = 0 \begin{aligned} \Phi'(\epsilon) &= \int_{x_1}^{x_2} \frac{dF}{d\epsilon} dx = \int_{x_1}^{x_2} \frac{dF}{dx}\frac{dx}{d\epsilon} + \frac{dF}{dy}\frac{dy}{d\epsilon} + \frac{dF}{dy'}\frac{dy'}{d\epsilon} dx \\ &= \int_{x_1}^{x_2} 0 + \frac{dF}{dy}\eta + \frac{dF}{dy'}\eta' dx \\ &= \int_{x_1}^{x_2} \frac{dF}{dy}\eta dx + \int_{x_1}^{x_2} \frac{dF}{dy'} d\eta \\ &= \int_{x_1}^{x_2} \frac{dF}{dy}\eta dx + \frac{dF}{dy'} \eta |_{x_1}^{x_2} - \int_{x_1}^{x_2} \eta \frac{d}{dx}F_{y'} dx \\ &= \int_{x_1}^{x_2} \frac{dF}{dy}\eta dx - \int_{x_1}^{x_2} \eta \frac{d}{dx}F_{y'} dx = 0 \\ & \rightarrow F_y - \frac{d}{dx} F_{y'} = 0 \end{aligned} Φ′(ϵ)=∫x1x2dϵdFdx=∫x1x2dxdFdϵdx+dydFdϵdy+dy′dFdϵdy′dx=∫x1x20+dydFη+dy′dFη′dx=∫x1x2dydFηdx+∫x1x2dy′dFdη=∫x1x2dydFηdx+dy′dFη∣x1x2−∫x1x2ηdxdFy′dx=∫x1x2dydFηdx−∫x1x2ηdxdFy′dx=0→Fy−dxdFy′=0
其中,第三行到第四行是分部积分,第四行到第五行是因为 η ( x 1 ) = η ( x 2 ) = 0 \eta(x_1)=\eta(x_2)=0 η(x1)=η(x2)=0,第五行到第六行是因为上述引理。
最速下降问题的表达式。
T = ∫ 0 x 1 1 + y ′ 2 2 g y d x = 1 2 g ∫ 0 x 1 F ( x , y , y ′ ) d x T = \int_0^{x_1} \frac{\sqrt{1+y'^2}}{\sqrt{2gy}} dx = \frac{1}{\sqrt{2g}} \int_0^{x_1} F(x,y,y') dx T=∫0x12gy1+y′2dx=2g1∫0x1F(x,y,y′)dx
求解 F y F_y Fy和 F y ′ F_{y'} Fy′。
F y = − 1 2 y − 3 2 1 + y ′ 2 F y ′ = y − 1 2 y ′ ( 1 + y ′ 2 ) − 1 2 \begin{aligned} F_y &= -\frac{1}{2} y^{-\frac{3}{2}} \sqrt{1+y'^2} \\ F_{y'} &= y^{-\frac{1}{2}} y' (1+y'^2)^{-\frac{1}{2}} \end{aligned} FyFy′=−21y−231+y′2=y−21y′(1+y′2)−21
带入欧拉方程,得到
− 1 2 y − 3 2 1 + y ′ 2 − d d x y − 1 2 y ′ ( 1 + y ′ 2 ) − 1 2 = 0 -\frac{1}{2} y^{-\frac{3}{2}} \sqrt{1+y'^2} - \frac{d}{dx} y^{-\frac{1}{2}} y' (1+y'^2)^{-\frac{1}{2}} = 0 −21y−231+y′2−dxdy−21y′(1+y′2)−21=0
化简(参考下一节的第一种退化情况),得到
1 + y ′ 2 + 2 y y ′ ′ = 0 1 + y'^2 + 2yy'' = 0 1+y′2+2yy′′=0
求解常微分方程,得到
{ x = c ( u − sin u ) y = c ( 1 − cos u ) \left\{ \begin{matrix} x = c(u - \sin u) \\ y = c(1 - \cos u) \end{matrix} \right. {x=c(u−sinu)y=c(1−cosu)
其中, c c c由 ( x 1 , y 1 ) (x_1,y_1) (x1,y1)确定。因此,最速降线为摆线。
(求解常微分方程,这里属于方程中只有 y y y的情况,因此令 p = y ′ p=y' p=y′,改造方程为 1 + p 2 + 2 y p ′ = 0 1+p^2+2yp'=0 1+p2+2yp′=0,先求 p p p,再求 x x x)。
第一种, F ( x , y , y ′ ) = v ( x , y ) 1 + y ′ 2 F(x,y,y')=v(x,y)\sqrt{1+y'^2} F(x,y,y′)=v(x,y)1+y′2。这种情况往往是由于需要乘上弦长 1 + y ′ 2 \sqrt{1+y'^2} 1+y′2而出现。
应用欧拉方程,得到
v y 1 + y ′ 2 − d d x v y ′ ( 1 + y ′ 2 ) − 1 2 = 0 → v y 1 + y ′ 2 − v x y ′ ( 1 + y ′ 2 ) − 1 2 − v y y ′ 2 ( 1 + y ′ 2 ) − 1 2 − v y ′ ′ ( 1 + y ′ 2 ) − 3 2 = 0 → v y − v x y ′ − v y ′ ′ 1 + y ′ 2 = 0 \begin{aligned} & v_y \sqrt{1+y'^2} - \frac{d}{dx} v y' (1+y'^2)^{-\frac{1}{2}} = 0 \\ \rightarrow & v_y \sqrt{1+y'^2} - v_x y' (1+y'^2)^{-\frac{1}{2}} - v_y y'^2 (1+y'^2)^{-\frac{1}{2}} - v y'' (1+y'^2)^{-\frac{3}{2}}= 0 \\ \rightarrow & v_y - v_xy' - v \frac{y''}{1+y'^2} = 0 \end{aligned} →→vy1+y′2−dxdvy′(1+y′2)−21=0vy1+y′2−vxy′(1+y′2)−21−vyy′2(1+y′2)−21−vy′′(1+y′2)−23=0vy−vxy′−v1+y′2y′′=0
其中,第一行到第二行中,第二项为全积分展开。
第二种, F ( x , y , y ′ ) = F ( x , y ′ ) F(x,y,y')=F(x,y') F(x,y,y′)=F(x,y′)。
应用欧拉方程,得到
d d x F y ′ = 0 → F y ′ = c \frac{d}{dx} F_{y'} = 0 \rightarrow F_{y'} = c dxdFy′=0→Fy′=c
第三种, F ( x , y , y ′ ) = F ( y , y ′ ) F(x,y,y')=F(y,y') F(x,y,y′)=F(y,y′)。
应用欧拉方程,得到
F y − d d x F y ′ = 0 → y ′ F y − y ′ d d x F y ′ = 0 → d d x ( F − y ′ F y ′ ) = 0 → F − y ′ F y ′ = c \begin{aligned} F_y - \frac{d}{dx} F_{y'} = 0 & \rightarrow y' F_y - y' \frac{d}{dx} F_{y'} = 0 \\ & \rightarrow \frac{d}{dx} \left( F - y' F_{y'} \right) = 0 \\ & \rightarrow F - y' F_{y'} = c \end{aligned} Fy−dxdFy′=0→y′Fy−y′dxdFy′=0→dxd(F−y′Fy′)=0→F−y′Fy′=c
第四种, F ( x , y , y ′ ) = F ( x , y ) F(x,y,y')=F(x,y) F(x,y,y′)=F(x,y)。
应用欧拉方程,得到
F y = 0 F_y = 0 Fy=0
第五种, F ( x , y , y ′ ) = P ( x , y ) + Q ( x , y ) y ′ F(x,y,y')=P(x,y)+Q(x,y)y' F(x,y,y′)=P(x,y)+Q(x,y)y′。
应用欧拉方程,得到
∂ P ∂ y + ∂ Q ∂ y y ′ − ( ∂ Q ∂ x + ∂ Q ∂ y y ′ ) = 0 → ∂ P ∂ y − ∂ Q ∂ x = 0 \begin{aligned} & \frac{\partial P}{\partial y} + \frac{\partial Q}{\partial y} y' - \left( \frac{\partial Q}{\partial x} + \frac{\partial Q}{\partial y} y' \right) = 0 \\ \rightarrow & \frac{\partial P}{\partial y} - \frac{\partial Q}{\partial x} = 0 \end{aligned} →∂y∂P+∂y∂Qy′−(∂x∂Q+∂y∂Qy′)=0∂y∂P−∂x∂Q=0
《变分法及其应用——物理、力学、工程中的经典建模》欧斐君 高等教育出版社