常微分方程(Ordinary Differential Equation I)
常微分方程(Ordinary Differential Equation II)
常微分方程(Ordinary Differential Equation III)
本章主要考虑的是如下形式的一阶线性微分方程组(First-order Linear Differential Equation System)
{ y 1 ′ ( x ) = a 11 ( x ) y 1 + a 12 ( x ) y 2 + ⋯ + a 1 n y n + f 1 ( x ) y 2 ′ ( x ) = a 21 ( x ) y 1 + a 22 ( x ) y 2 + ⋯ + a 2 n y n + f 2 ( x ) ⋯ ⋯ y n ′ ( x ) = a n 1 ( x ) y 1 + a n 2 ( x ) y 2 + ⋯ + a n n y n + f n ( x ) (1) \begin{cases} y'_1(x)=a_{11}(x)y_1+a_{12}(x)y_2+\cdots+a_{1n}y_n+f_1(x) \\ y'_2(x)=a_{21}(x)y_1+a_{22}(x)y_2+\cdots+a_{2n}y_n+f_2(x) \\ \cdots\quad\cdots \\ y'_n(x)=a_{n1}(x)y_1+a_{n2}(x)y_2+\cdots+a_{nn}y_n+f_n(x) \\ \end{cases}\tag{1} ⎩⎪⎪⎪⎨⎪⎪⎪⎧y1′(x)=a11(x)y1+a12(x)y2+⋯+a1nyn+f1(x)y2′(x)=a21(x)y1+a22(x)y2+⋯+a2nyn+f2(x)⋯⋯yn′(x)=an1(x)y1+an2(x)y2+⋯+annyn+fn(x)(1)
其中已知函数 a i j ( x ) a_{ij}(x) aij(x)和 f i ( x ) ( i , j = 1 , 2 , ⋯ , n ) f_i(x)(i,j=1,2,\cdots,n) fi(x)(i,j=1,2,⋯,n)在区间 [ a , b ] [a,b] [a,b] 上式连续的。
我们引入下面的函数矩阵和向量
A ( x ) = ( a 11 ( x ) a 12 ( x ) ⋯ a 1 n ( x ) a 21 ( x ) a 22 ( x ) ⋯ a 2 n ( x ) ⋮ ⋮ ⋱ ⋮ a n 1 ( x ) a n 2 ( x ) ⋯ a n n ( x ) ) \mathbf{A}(x)=\begin{pmatrix} a_{11}(x) & a_{12}(x) & \cdots & a_{1n}(x) \\ a_{21}(x) & a_{22}(x) & \cdots & a_{2n}(x) \\ \vdots &\vdots &\ddots &\vdots \\ a_{n1}(x) & a_{n2}(x) & \cdots & a_{nn}(x) \\ \end{pmatrix} A(x)=⎝⎜⎜⎜⎛a11(x)a21(x)⋮an1(x)a12(x)a22(x)⋮an2(x)⋯⋯⋱⋯a1n(x)a2n(x)⋮ann(x)⎠⎟⎟⎟⎞
A ( x ) \mathbf{A}(x) A(x)是 n × n n\times n n×n函数矩阵,它的每一个元素 a i j ( x ) ( i , j = 1 , 2 , ⋯ , n ) a_{ij}(x)(i,j=1,2,\cdots,n) aij(x)(i,j=1,2,⋯,n)是定义区间 [ a , b ] [a,b] [a,b]上的函数。
f ( x ) = ( f 1 ( x ) f 2 ( x ) ⋮ f n ( x ) ) , y = ( y 1 y 2 ⋮ y n ) \mathbf{f}(x)=\begin{pmatrix} f_1(x) \\ f_2(x) \\ \vdots \\ f_n(x) \end{pmatrix}, \mathbf{y}=\begin{pmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix} f(x)=⎝⎜⎜⎜⎛f1(x)f2(x)⋮fn(x)⎠⎟⎟⎟⎞,y=⎝⎜⎜⎜⎛y1y2⋮yn⎠⎟⎟⎟⎞
这里 f ( x ) , y \mathbf{f}(x),\mathbf{y} f(x),y是 n × 1 n\times 1 n×1矩阵或 n n n维列向量。
关于向量或矩阵的代数运算,如相加、相乘与纯量相乘等性质对于以函数作为元素的矩阵同样成立。
函数向量和函数矩阵的连续、微分和积分等概念的定义如下:如果函数向量 y \mathbf{y} y或矩阵 A ( x ) \mathbf{A}(x) A(x)的每一个元素都是区间 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上的连续函数,则称 y \mathbf{y} y或 A ( x ) \mathbf{A}(x) A(x)在 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上连续。
如果函数向量 y \mathbf{y} y或矩阵 A ( x ) \mathbf{A}(x) A(x)的每一个元素都是区间 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上的可微函数,则称 y \mathbf{y} y或 A ( x ) \mathbf{A}(x) A(x)在 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上可微,则定义它们的导数分别为
A ′ ( x ) = ( a 11 ′ ( x ) a 12 ′ ( x ) ⋯ a 1 n ′ ( x ) a 21 ′ ( x ) a 22 ′ ( x ) ⋯ a 2 n ′ ( x ) ⋮ ⋮ ⋱ ⋮ a n 1 ′ ( x ) a n 2 ′ ( x ) ⋯ a n n ′ ( x ) ) , y ′ = ( y 1 ′ y 2 ′ ⋮ y n ′ ) \mathbf{A}'(x)=\begin{pmatrix} a'_{11}(x) & a'_{12}(x) & \cdots & a'_{1n}(x) \\ a'_{21}(x) & a'_{22}(x) & \cdots & a'_{2n}(x) \\ \vdots &\vdots &\ddots &\vdots \\ a'_{n1}(x) & a'_{n2}(x) & \cdots & a'_{nn}(x) \\ \end{pmatrix} , \mathbf{y}'=\begin{pmatrix} y'_1 \\ y'_2 \\ \vdots \\ y'_n \end{pmatrix} A′(x)=⎝⎜⎜⎜⎛a11′(x)a21′(x)⋮an1′(x)a12′(x)a22′(x)⋮an2′(x)⋯⋯⋱⋯a1n′(x)a2n′(x)⋮ann′(x)⎠⎟⎟⎟⎞,y′=⎝⎜⎜⎜⎛y1′y2′⋮yn′⎠⎟⎟⎟⎞
不难证明 n × n n\times n n×n矩阵 A ( x ) , B ( x ) \mathbf{A}(x),\mathbf{B}(x) A(x),B(x)及 n n n维向量 u ( x ) , v ( x ) \mathbf{u}(x),\mathbf{v}(x) u(x),v(x) 是可微的,那么下式成立:
(1) ( A + B ) ′ = A ′ + B ′ (\mathbf{A}+\mathbf{B})'=\mathbf{A}'+\mathbf{B}' (A+B)′=A′+B′
( u + v ) ′ = u ′ + v ′ (\mathbf{u}+\mathbf{v})'=\mathbf{u}'+\mathbf{v}' (u+v)′=u′+v′
(2) ( A ⋅ B ) ′ = A ′ B + A B ′ (\mathbf{A}\cdot \mathbf{B})'=\mathbf{A}'\mathbf{B}+\mathbf{A}\mathbf{B}' (A⋅B)′=A′B+AB′
(3) ( A u ) ′ = A ′ u + A u ′ (\mathbf{A}\mathbf{u})'=\mathbf{A}'\mathbf{u}+\mathbf{A}\mathbf{u}' (Au)′=A′u+Au′
类似的,如果函数向量 y \mathbf{y} y或矩阵 A ( x ) \mathbf{A}(x) A(x)的每一个元素都是区间 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上的可积函数,则称 y \mathbf{y} y或 A ( x ) \mathbf{A}(x) A(x)在 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上可积,则定义它们的积分分别为
∫ a b A ′ ( x ) d x = ( ∫ a b a 11 ′ ( x ) d x ∫ a b a 12 ′ ( x ) d x ⋯ ∫ a b a 1 n ′ ( x ) d x ∫ a b a 21 ′ ( x ) d x ∫ a b a 22 ′ ( x ) d x ⋯ ∫ a b a 2 n ′ ( x ) d x ⋮ ⋮ ⋱ ⋮ ∫ a b a n 1 ′ ( x ) d x ∫ a b a n 2 ′ ( x ) d x ⋯ ∫ a b a n n ′ ( x ) d x ) \int_{a}^{b}\mathbf{A}'(x)dx=\begin{pmatrix} \int_{a}^{b}a'_{11}(x)dx & \int_{a}^{b}a'_{12}(x)dx & \cdots & \int_{a}^{b}a'_{1n}(x)dx \\ \int_{a}^{b}a'_{21}(x)dx & \int_{a}^{b}a'_{22}(x)dx & \cdots & \int_{a}^{b}a'_{2n}(x)dx \\ \vdots &\vdots &\ddots &\vdots \\ \int_{a}^{b}a'_{n1}(x)dx & \int_{a}^{b}a'_{n2}(x)dx & \cdots & \int_{a}^{b}a'_{nn}(x)dx \\ \end{pmatrix} ∫abA′(x)dx=⎝⎜⎜⎜⎜⎛∫aba11′(x)dx∫aba21′(x)dx⋮∫aban1′(x)dx∫aba12′(x)dx∫aba22′(x)dx⋮∫aban2′(x)dx⋯⋯⋱⋯∫aba1n′(x)dx∫aba2n′(x)dx⋮∫abann′(x)dx⎠⎟⎟⎟⎟⎞
∫ a b y ′ d x = ( ∫ a b y 1 ′ d x ∫ a b y 2 ′ d x ⋮ ∫ a b y n ′ d x ) \int_{a}^{b}\mathbf{y}'dx= \begin{pmatrix} \int_{a}^{b}y'_1dx \\ \int_{a}^{b}y'_2dx \\ \vdots \\ \int_{a}^{b} y'_ndx \end{pmatrix} ∫aby′dx=⎝⎜⎜⎜⎜⎛∫aby1′dx∫aby2′dx⋮∫abyn′dx⎠⎟⎟⎟⎟⎞
关于函数向量与函数矩阵的微分、积分运算法则和普通数值函数类似。
本章所讨论的一阶线性微分方程组可以写成以下的形式
y ′ = A ( x ) y + f ( x ) (2) \mathbf{y}'=\mathbf{A}(x)\mathbf{y}+\mathbf{f}(x)\tag{2} y′=A(x)y+f(x)(2)
若方程 (1) 的初始条件是
y 1 ( x 0 ) = η 1 , y 2 ( x 0 ) = η 2 , ⋯ , y n ( x 0 ) = η n y_1(x_0)=η_1,y_2(x_0)=η_2,\cdots,y_n(x_0)=η_n y1(x0)=η1,y2(x0)=η2,⋯,yn(x0)=ηn
则初始问题可以写成
{ y ′ = A ( x ) y + f ( x ) y ( x 0 ) = η \begin{cases} \mathbf{y}'=\mathbf{A}(x)\mathbf{y}+\mathbf{f}(x) \\ \mathbf{y}(x_0)=\mathbf{η} \end{cases} {y′=A(x)y+f(x)y(x0)=η
高阶线性微分方程和一阶线性微分方程组
对于 n阶线性微分方程初值问题
{ y ( n ) + a 1 ( x ) y ( n − 1 ) + ⋯ + a n − 1 ( x ) y ′ + a n ( x ) y = f ( x ) y ( x 0 ) = η 1 , y ′ ( x 0 ) = η 2 , ⋯ , y ( n − 1 ) ( x 0 ) = η n \begin{cases} y^{(n)}+a_1(x)y^{(n-1)}+\cdots+a_{n-1}(x)y'+a_n(x)y=f(x) \\ y(x_0)=η_1,y'(x_0)=η_2,\cdots,y^{(n-1)}(x_0)=η_n \end{cases} {y(n)+a1(x)y(n−1)+⋯+an−1(x)y′+an(x)y=f(x)y(x0)=η1,y′(x0)=η2,⋯,y(n−1)(x0)=ηn
引入变换
y 1 = y , y 2 = y ′ , ⋯ , y n = y ( n − 1 ) y_1=y,y_2=y',\cdots,y_n=y^{(n-1)} y1=y,y2=y′,⋯,yn=y(n−1)
可以得到下面的一阶线性微分方程组
{ y 1 ′ = y 2 y 2 ′ = y 3 ⋯ y n − 1 ′ = y n y n ′ = − a n ( x ) y 1 − ⋯ − a 2 ( x ) y n − 1 − a 1 ( x ) y n + f ( x ) \begin{cases} y'_1=y_2 \\ y'_2=y_3 \\ \cdots \\ y'_{n-1}=y_n \\ y'_n=-a_n(x)y_1-\cdots-a_2(x)y_{n-1}-a_1(x)y_n+f(x) \end{cases} ⎩⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎧y1′=y2y2′=y3⋯yn−1′=ynyn′=−an(x)y1−⋯−a2(x)yn−1−a1(x)yn+f(x)
初值问题可化为
{ y ′ = A ( x ) y + f ( x ) y ( x 0 ) = η \begin{cases} \mathbf{y}'=\mathbf{A}(x)\mathbf{y+f}(x) \\ \mathbf{y}(x_0)=\mathbf{η} \end{cases} {y′=A(x)y+f(x)y(x0)=η
其中 A ( x ) = ( 0 1 0 ⋯ 0 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 ⋯ 1 − a n ( x ) − a n − 1 ( x ) − a n − 2 ( x ) ⋯ − a 1 ( x ) ) y = ( y 1 y 2 ⋮ y n ) , f ( x ) = ( 0 0 ⋮ f ( x ) ) , η = ( η 1 η 2 ⋮ η n ) \mathbf{A}(x)=\begin{pmatrix} 0&1&0&\cdots&0 \\ 0&0&1&\cdots&0 \\ \vdots&\vdots&\vdots&\ddots&\vdots\\ 0&0&0&\cdots&1 \\ -a_n(x) & -a_{n-1}(x) & -a_{n-2}(x) &\cdots & -a_1(x) \end{pmatrix} \\ \mathbf{y}=\begin{pmatrix}y_1 \\ y_2 \\ \vdots \\ y_n \end{pmatrix}, \mathbf{f}(x)=\begin{pmatrix}0 \\0 \\ \vdots \\ f(x) \end{pmatrix}, \mathbf{η}=\begin{pmatrix}η_1 \\η_2 \\ \vdots \\ η_n \end{pmatrix} A(x)=⎝⎜⎜⎜⎜⎜⎛00⋮0−an(x)10⋮0−an−1(x)01⋮0−an−2(x)⋯⋯⋱⋯⋯00⋮1−a1(x)⎠⎟⎟⎟⎟⎟⎞y=⎝⎜⎜⎜⎛y1y2⋮yn⎠⎟⎟⎟⎞,f(x)=⎝⎜⎜⎜⎛00⋮f(x)⎠⎟⎟⎟⎞,η=⎝⎜⎜⎜⎛η1η2⋮ηn⎠⎟⎟⎟⎞
一阶线性微分方程组的定理可推广到相应的n阶线性微分方程。
n阶线性微分方程初值问题与对应一阶线性微分方程组初值问题在下列意义下是等价的:
若 y = φ ( x ) y=φ(x) y=φ(x) 是n阶线性微分方程在区间 [ a , b ] [a,b] [a,b] 上的解,则 y = ( φ ( x ) φ ′ ( x ) ⋮ φ ( n − 1 ) ( x ) ) \mathbf{y}=\begin{pmatrix}φ(x) \\ φ'(x) \\ \vdots \\ φ^{(n-1)}(x) \end{pmatrix} y=⎝⎜⎜⎜⎛φ(x)φ′(x)⋮φ(n−1)(x)⎠⎟⎟⎟⎞ 为相应一阶线性微分方程组在区间 [ a , b ] [a,b] [a,b] 上的解。
反之,若向量函数 y = ( y 1 ( x ) y 2 ( x ) ⋮ y n ( x ) ) \mathbf{y}=\begin{pmatrix}y_1(x) \\ y_2(x) \\ \vdots \\ y_n(x) \end{pmatrix} y=⎝⎜⎜⎜⎛y1(x)y2(x)⋮yn(x)⎠⎟⎟⎟⎞ 是相应一阶线性微分方程组在区间 [ a , b ] [a,b] [a,b] 上的解,则 y \mathbf{y} y 的第一个分量 y = y 1 ( x ) y=y_1(x) y=y1(x) 为n阶线性微分方程的解。
引入函数矩阵和向量的范数
∥ A ∥ = ∑ i , j = 1 n ∣ a i j ∣ , ∥ y ∥ = ∑ i = 1 n ∣ y i ∣ \|\mathbf{A}\|=\sum_{i,j=1}^{n}|a_{ij}|,\quad\|\mathbf{y}\|=\sum_{i=1}^{n}|y_i| ∥A∥=i,j=1∑n∣aij∣,∥y∥=i=1∑n∣yi∣
设 A , B \mathbf{A},\mathbf{B} A,B是 n × n n\times n n×n矩阵, u , v \mathbf{u},\mathbf{v} u,v 是 n n n维向量,则容易证明下面的性质:
(1) ∥ A B ∥ ⩽ ∥ A ∥ ⋅ ∥ B ∥ \|\mathbf{AB}\|⩽\|\mathbf{A}\|\cdot\|\mathbf{B}\| ∥AB∥⩽∥A∥⋅∥B∥
∥ A u ∥ ⩽ ∥ A ∥ ⋅ ∥ u ∥ \|\mathbf{Au}\|⩽\|\mathbf{A}\|\cdot\|\mathbf{u}\| ∥Au∥⩽∥A∥⋅∥u∥
(2) ∥ A + B ∥ ⩽ ∥ A ∥ + ∥ B ∥ \|\mathbf{A+B}\|⩽\|\mathbf{A}\|+\|\mathbf{B}\| ∥A+B∥⩽∥A∥+∥B∥
∥ u + v ∥ ⩽ ∥ u ∥ + ∥ v ∥ \|\mathbf{u+v}\|⩽\|\mathbf{u}\|+\|\mathbf{v}\| ∥u+v∥⩽∥u∥+∥v∥
有了函数向量和函数矩阵的范数,我们就定义了一种函数向量和函数矩阵空间的距离,从而可研究向量序列和矩阵序列的收敛性问题。
(1) 向量序列 { x k } , x k = ( x 1 k x 2 k ⋮ x n k ) \{\mathbf{x}_k\}, \mathbf{x}_k=\begin{pmatrix} x_{1k} \\ x_{2k} \\ \vdots \\ x_{nk} \end{pmatrix} {xk},xk=⎝⎜⎜⎜⎛x1kx2k⋮xnk⎠⎟⎟⎟⎞ 称为收敛的,如果对每一个 i ( i = 1 , 2 , ⋯ , n ) i(i=1,2,\cdots,n) i(i=1,2,⋯,n),数列 { x i k } \{\mathbf{x}_{ik}\} {xik}都是收敛的。
(2) 函数向量序列 { x k ( t ) } , x k ( t ) = ( x 1 k ( t ) x 2 k ( t ) ⋮ x n k ( t ) ) \{\mathbf{x}_k(t)\}, \mathbf{x}_k(t)=\begin{pmatrix} x_{1k}(t) \\ x_{2k}(t) \\ \vdots \\ x_{nk}(t) \end{pmatrix} {xk(t)},xk(t)=⎝⎜⎜⎜⎛x1k(t)x2k(t)⋮xnk(t)⎠⎟⎟⎟⎞ 称为区间 [ a , b ] [a,b] [a,b]上收敛的(一致收敛的),如果对每一个 i ( i = 1 , 2 , ⋯ , n ) i(i=1,2,\cdots,n) i(i=1,2,⋯,n),数列 { x i k ( x ) } \{\mathbf{x}_{ik}(x)\} {xik(x)}在区间 [ a , b ] [a,b] [a,b]上都是收敛的(一致收敛的)。
(3) 设 ∑ k = 1 ∞ x k \displaystyle\sum_{k=1}^{∞}\mathbf{x}_k k=1∑∞xk 是函数向量级数,如果其部分和所作成的函数向量序列在区间 [ a , b ] [a,b] [a,b]上收敛(一致收敛),则称 ∑ k = 1 ∞ x k \displaystyle\sum_{k=1}^{∞}\mathbf{x}_k k=1∑∞xk
在 [ a , b ] [a,b] [a,b]上是收敛的(一致收敛的)。
由上面的定义,对函数向量序列和函数向量级数可得到与数学分析中关于函数序列和函数级数相类似的结论。
例如,判别通常的函数级数的一致收敛性的维尔斯特拉斯判别法对于函数向量级数也是成立的,即如果
x k ⩽ M k , a ⩽ t ⩽ b \mathbf{x}_k⩽M_k,\quad a⩽t⩽b xk⩽Mk,a⩽t⩽b
而数值级数 ∑ k = 1 ∞ M k \displaystyle\sum_{k=1}^{∞}M_k k=1∑∞Mk是收敛的,则函数向量级数 ∑ k = 1 ∞ A k \displaystyle\sum_{k=1}^{∞}\mathbf{A}_k k=1∑∞Ak 在区间 [ a , b ] [a,b] [a,b]上一致收敛的。
积分号下取极限的定理对于函数向量也成立,这就是说,如果连续函数向量序列 { x k ( t ) } \{\mathbf{x}_k(t)\} {xk(t)} 在 [ a , b ] [a,b] [a,b] 上是一致收敛的,则
lim k → ∞ ∫ a b x k ( t ) d t = ∫ a b lim k → ∞ x k ( t ) d t \displaystyle\lim_{k\to\infty}\int_a^b\mathbf{x}_k(t)dt=\int_a^b\lim_{k\to\infty}\mathbf{x}_k(t)dt k→∞lim∫abxk(t)dt=∫abk→∞limxk(t)dt
以上谈到是向量序列的有关定义和结果,对于一般的举证序列类似。总之,上述一切都是数学分析有关概念的自然推广,证明类似。
定理 1 存在唯一性定理设 A ( x ) \mathbf{A}(x) A(x)和 f ( x ) \mathbf{f}(x) f(x)在区间 [ a , b ] [a,b] [a,b] 内连续,则初值问题
{ y ′ = A ( x ) y + f ( x ) y ( x 0 ) = η (3) \begin{cases} \mathbf{y}'=\mathbf{A}(x)\mathbf{y}+\mathbf{f}(x) \\ \mathbf{y}(x_0)=\mathbf{η} \end{cases}\tag{3} {y′=A(x)y+f(x)y(x0)=η(3)
在区间 [ a , b ] [a,b] [a,b]内存在唯一的解 φ ( x ) \mathbf{φ}(x) φ(x)。
和一阶微分方程一样,该定理的证明用到Picard 迭代法,共分五个小命题。
命题 1 设 y = φ ( x ) \mathbf{y}=\mathbf{φ}(x) y=φ(x)是初值问题(3)在 [ a , b ] [a,b] [a,b]的解,则 φ ( x ) \mathbf{φ}(x) φ(x)是
y = η + ∫ x 0 x [ A ( x ) y + f ( x ) ] d x \mathbf{y}=\mathbf{η}+\int_{x_0}^x[\mathbf{A}(x)\mathbf{y}+\mathbf{f}(x)]dx y=η+∫x0x[A(x)y+f(x)]dx
在 [ a , b ] [a,b] [a,b]上的连续解,反之亦然。
现在任取 φ 0 ( x ) = η \mathbf{φ}_0(x)=\mathbf{η} φ0(x)=η 构造皮卡逐步逼近向量函数序列
{ φ 0 ( x ) = η φ k ( x ) = η + ∫ x 0 x [ A ( x ) y + f ( x ) ] d x \begin{cases} \mathbf{φ}_0(x)=\mathbf{η} \\ \mathbf{φ}_k(x)=\mathbf{η}+\int_{x_0}^x[\mathbf{A}(x)\mathbf{y}+\mathbf{f}(x)]dx \end{cases} {φ0(x)=ηφk(x)=η+∫x0x[A(x)y+f(x)]dx
向量函数 φ k ( x ) \mathbf{φ}_k(x) φk(x) 成为第 k k k 次近似解。
命题 2 向量函数 φ k ( x ) \mathbf{φ}_k(x) φk(x) 在区间 [ a , b ] [a,b] [a,b] 上有定义且连续。
命题 3 向量函数序列 { φ k ( x ) } \{\mathbf{φ}_k(x)\} {φk(x)} 在 [ a , b ] [a,b] [a,b]上是一致收敛的。
现设
lim n → φ k ( x ) = φ ( x ) \lim\limits_{n\to}\mathbf{φ}_k(x)=\mathbf{φ}(x) n→limφk(x)=φ(x)
则 φ \mathbf{φ} φ也在 [ a , b ] [a,b] [a,b]上连续。
命题 4 φ \mathbf{φ} φ 是积分方程 (3) 在 [ a , b ] [a,b] [a,b]上是的连续解。
命题 5 若 ψ ( x ) \mathbf{ψ}(x) ψ(x) 也是积分方程 (3) 在 [ a , b ] [a,b] [a,b]上是的连续解,则 ψ ( x ) ≡ φ ( x ) ( x ∈ [ a , b ] ) \mathbf{ψ}(x)\equiv\mathbf{φ}(x)\quad(x\in[a,b]) ψ(x)≡φ(x)(x∈[a,b])。
当 f ( x ) ≡ 0 \mathbf{f}(x)\equiv0 f(x)≡0 时,(2) 式变为
y ′ = A ( x ) y (4) \mathbf{y}'=\mathbf{A}(x)\mathbf{y}\tag{4} y′=A(x)y(4)
称为齐次线性微分方组。 y ≡ 0 \mathbf y\equiv0 y≡0 是齐次方程组 (4) 的解,称为方程组的平凡解。
定理 2 叠加原理:若 y 1 ( x ) , y 2 ( x ) \mathbf{y}_1(x),\mathbf{y}_2(x) y1(x),y2(x)是方程组(4)的解,则他们的线性组合 α y 1 ( x ) + β y 2 ( x ) α\mathbf{y}_1(x)+β\mathbf{y}_2(x) αy1(x)+βy2(x) 也是方程组(4)的解,其中 α , β α,β α,β是任意常数。
令齐次线性方程组 (4) 在区间 [ a , b ] [a,b] [a,b] 上的所有解组成的集合为 S n S_n Sn ,由叠加原理知, S n S_n Sn 是一个线性空间。
线性相关和线性无关:定义在区间 [ a , b ] [a,b] [a,b] 上 k k k个向量函数 y 1 ( x ) = ( y 11 ( x ) y 21 ( x ) ⋮ y n 1 ( x ) ) , y 2 ( x ) = ( y 12 ( x ) y 22 ( x ) ⋮ y n 2 ( x ) ) , ⋯ , y k ( x ) = ( y 1 k ( x ) y 2 k ( x ) ⋮ y n k ( x ) ) \mathbf{y}_1(x)=\begin{pmatrix}y_{11}(x) \\ y_{21}(x) \\ \vdots \\ y_{n1}(x)\end{pmatrix}, \mathbf{y}_2(x)=\begin{pmatrix}y_{12}(x) \\ y_{22}(x) \\ \vdots \\ y_{n2}(x)\end{pmatrix}, \cdots, \mathbf{y}_k(x)=\begin{pmatrix}y_{1k}(x) \\ y_{2k}(x) \\ \vdots \\ y_{nk}(x)\end{pmatrix} y1(x)=⎝⎜⎜⎜⎛y11(x)y21(x)⋮yn1(x)⎠⎟⎟⎟⎞,y2(x)=⎝⎜⎜⎜⎛y12(x)y22(x)⋮yn2(x)⎠⎟⎟⎟⎞,⋯,yk(x)=⎝⎜⎜⎜⎛y1k(x)y2k(x)⋮ynk(x)⎠⎟⎟⎟⎞,如果存在不全为零的常数 c 1 , c 2 , ⋯ , c k c_1,c_2,\cdots,c_k c1,c2,⋯,ck ,使得恒等式
c 1 y 1 ( x ) + c 2 y 2 ( x ) + ⋯ + c k y k ( x ) ≡ 0 c_1\mathbf{y}_1(x)+c_2\mathbf{y}_2(x)+\cdots+c_k\mathbf{y}_k(x)\equiv0 c1y1(x)+c2y2(x)+⋯+ckyk(x)≡0
对所有的 x ∈ [ a , b ] x\in[a,b] x∈[a,b] 都成立,称这些向量函数在所给区间是线性相关的,否则称这些向量函数在所给区间是线性无关的。
定义:有定义在区间 [ a , b ] [a,b] [a,b]上的 n 个向量函数 y 1 ( x ) , y 2 ( x ) , ⋯ , y n ( x ) \mathbf{y}_1(x),\mathbf{y}_2(x),\cdots,\mathbf{y}_n(x) y1(x),y2(x),⋯,yn(x)所确定的行列式
W [ y 1 ( x ) , y 2 ( x ) , ⋯ , y n ( x ) ] = W ( x ) = ∣ y 11 ( x ) y 12 ( x ) ⋯ y 1 n ( x ) y 21 ( x ) y 22 ( x ) ⋯ y 2 n ( x ) ⋮ ⋮ ⋱ ⋮ y n 1 ( x ) y n 2 ( x ) ⋯ y n n ( x ) ∣ W[\mathbf{y}_1(x),\mathbf{y}_2(x),\cdots,\mathbf{y}_n(x)]=W(x) \\ =\begin{vmatrix} y_{11}(x) & y_{12}(x) & \cdots & y_{1n}(x) \\ y_{21}(x) & y_{22}(x) & \cdots & y_{2n}(x)\\ \vdots &\vdots &\ddots &\vdots \\ y_{n1}(x) & y_{n2}(x) & \cdots & y_{nn}(x) \\ \end{vmatrix} W[y1(x),y2(x),⋯,yn(x)]=W(x)=∣∣∣∣∣∣∣∣∣y11(x)y21(x)⋮yn1(x)y12(x)y22(x)⋮yn2(x)⋯⋯⋱⋯y1n(x)y2n(x)⋮ynn(x)∣∣∣∣∣∣∣∣∣
称为由这些函数所确定的伏朗斯基行列式(Wronskian)。
定理 3:若向量函数 y 1 ( x ) , y 2 ( x ) , ⋯ , y n ( x ) \mathbf{y}_1(x),\mathbf{y}_2(x),\cdots,\mathbf{y}_n(x) y1(x),y2(x),⋯,yn(x) 在区间 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上线性相关,则在区间 [ a , b ] [a,b] [a,b] 上它们的伏朗斯基行列式 W ( x ) ≡ 0 W(x)\equiv0 W(x)≡0 。
证明:由假设,即知存在一组不全为零的常数 c 1 , c 2 , ⋯ , c n c_1,c_2,\cdots,c_n c1,c2,⋯,cn 使得
c 1 y 1 ( x ) + c 2 y 2 ( x ) + ⋯ + c k y k ( x ) ≡ 0 ( a ⩽ x ⩽ b ) c_1\mathbf{y}_1(x)+c_2\mathbf{y}_2(x)+\cdots+c_k\mathbf{y}_k(x)\equiv0\quad(a⩽x⩽b) c1y1(x)+c2y2(x)+⋯+ckyk(x)≡0(a⩽x⩽b)
上式可看成关于 c 1 , c 2 , ⋯ , c n c_1,c_2,\cdots,c_n c1,c2,⋯,cn的齐次线性代数方程组,它的系数行列式就是伏朗斯基行列式 W ( x ) W(x) W(x) ,于是由线性代数理论知道,要此方程组存在非零解,则它的系数行列式必须为零,即 W ( x ) ≡ 0 W(x)\equiv0 W(x)≡0 。
注意,定理 3的逆定理不一定成立。也就是说,由某些向量函数组构成的伏朗斯基行列式为零,但它们也可能是线性无关的。
定理 4:齐次线性方程组(4)的解 y 1 ( x ) , y 2 ( x ) , ⋯ , y n ( x ) \mathbf{y}_1(x),\mathbf{y}_2(x),\cdots,\mathbf{y}_n(x) y1(x),y2(x),⋯,yn(x) 在区间 a ⩽ x ⩽ b a⩽x⩽b a⩽x⩽b上线性无关,等价于他们的伏朗斯基行列式 W ( x ) ≠ 0 ( a ⩽ x ⩽ b ) W(x)\neq0\quad(a⩽x⩽b) W(x)=0(a⩽x⩽b) 。
证明:用反证法即可。
定理 5:齐次线性方程组(4)一定存在n个线性无关的解。
根据解的存在唯一性定理,任取n组初始值 ( a ⩽ x 0 ⩽ b ) (a⩽x_0⩽b) (a⩽x0⩽b)
y 1 ( x 0 ) = ( 1 0 ⋮ 0 ) , y 2 ( x 0 ) = ( 0 1 ⋮ 0 ) , ⋯ , y n ( x 0 ) = ( 0 0 ⋮ 1 ) \mathbf{y}_1(x_0)=\begin{pmatrix} 1 \\ 0 \\\vdots\\0\end{pmatrix}, \mathbf{y}_2(x_0)=\begin{pmatrix} 0 \\ 1 \\\vdots\\0\end{pmatrix}, \cdots, \mathbf{y}_n(x_0)=\begin{pmatrix} 0 \\ 0 \\\vdots\\1\end{pmatrix} y1(x0)=⎝⎜⎜⎜⎛10⋮0⎠⎟⎟⎟⎞,y2(x0)=⎝⎜⎜⎜⎛01⋮0⎠⎟⎟⎟⎞,⋯,yn(x0)=⎝⎜⎜⎜⎛00⋮1⎠⎟⎟⎟⎞
存在n个唯一解 y 1 ( x ) , y 2 ( x ) , ⋯ , y n ( x ) \mathbf{y}_1(x),\mathbf{y}_2(x),\cdots,\mathbf{y}_n(x) y1(x),y2(x),⋯,yn(x)
又因为 W ( x 0 ) = 1 ≠ 0 W(x_0)=1\neq0 W(x0)=1=0
所以在区间 [ a , b ] [a,b] [a,b]上, y 1 ( x ) , y 2 ( x ) , ⋯ , y n ( x ) ( a ⩽ x 0 ⩽ b ) \mathbf{y}_1(x),\mathbf{y}_2(x),\cdots,\mathbf{y}_n(x)\quad(a⩽x_0⩽b) y1(x),y2(x),⋯,yn(x)(a⩽x0⩽b) 线性无关。
推论:齐次线性方程组 (4) 的线性无关解的最大个数等于n。
定理 6 通解结构定理 若 y 1 ( x ) , y 2 ( x ) , ⋯ , y n ( x ) \mathbf{y}_1(x),\mathbf{y}_2(x),\cdots,\mathbf{y}_n(x) y1(x),y2(x),⋯,yn(x)是齐次线性方程组(4)的n个线性无关的解,则方程组(4)的任一解可表示为
y ( x ) = c 1 y 1 ( x ) + c 2 y 2 ( x ) + ⋯ + c n y n ( x ) (5) \mathbf{y}(x)=c_1\mathbf{y}_1(x)+c_2\mathbf{y}_2(x)+\cdots+c_n\mathbf{y}_n(x)\tag{5} y(x)=c1y1(x)+c2y2(x)+⋯+cnyn(x)(5)
其中 c 1 , c 2 , ⋯ , c n c_1,c_2,\cdots,c_n c1,c2,⋯,cn 是任意常数。
证明:由叠加原理, y ( x ) \mathbf{y}(x) y(x) 是方程组(4)的解,接下来证明 y ( x ) \mathbf{y}(x) y(x) 包含了方程组 (4) 任一解。
由解的存在和唯一性定理,任取方程组 (4) 满足初始条件 y ( x 0 ) = η \mathbf{y}(x_0)=\mathbf{η} y(x0)=η 的一个解 y ( x ) \mathbf{y}(x) y(x) ,只需确定常数 c 1 , c 2 , ⋯ , c n c_1,c_2,\cdots,c_n c1,c2,⋯,cn的值,使其满足(5)式,作非齐次线性代数方程组
( y 11 ( x 0 ) y 12 ( x 0 ) ⋯ y 1 n ( x 0 ) y 21 ( x 0 ) y 22 ( x 0 ) ⋯ y 2 n ( x 0 ) ⋮ ⋮ ⋱ ⋮ y n 1 ( x 0 ) y n 2 ( x 0 ) ⋯ y n n ( x 0 ) ) ( c 1 c 2 ⋮ c n ) = ( η 1 η 2 ⋮ η n ) \begin{pmatrix} y_{11}(x_0) & y_{12}(x_0) & \cdots & y_{1n}(x_0) \\ y_{21}(x_0) & y_{22}(x_0) & \cdots & y_{2n}(x_0)\\ \vdots &\vdots &\ddots &\vdots \\ y_{n1}(x_0) & y_{n2}(x_0) & \cdots & y_{nn}(x_0) \\ \end{pmatrix} \begin{pmatrix} c_1 \\ c_2 \\ \vdots \\ c_n \end{pmatrix} =\begin{pmatrix} η_1 \\ η_2 \\ \vdots \\ η_n \end{pmatrix} ⎝⎜⎜⎜⎛y11(x0)y21(x0)⋮yn1(x0)y12(x0)y22(x0)⋮yn2(x0)⋯⋯⋱⋯y1n(x0)y2n(x0)⋮ynn(x0)⎠⎟⎟⎟⎞⎝⎜⎜⎜⎛c1c2⋮cn⎠⎟⎟⎟⎞=⎝⎜⎜⎜⎛η1η2⋮ηn⎠⎟⎟⎟⎞
它的系数行列式即为 W ( x 0 ) ≠ 0 W(x_0)\neq0 W(x0)=0 ,根据线性代数方程组的理论,上述方程组有唯一解 ,记为 c ˉ 1 , c ˉ 2 , ⋯ , c ˉ n \bar c_1,\bar c_2,\cdots,\bar c_n cˉ1,cˉ2,⋯,cˉn。
因此 y ( x ) = c ˉ 1 y 1 ( x ) + c ˉ 2 y 2 ( x ) + ⋯ + c ˉ n y n ( x ) \mathbf{y}(x)=\bar c_1\mathbf{y}_1(x)+\bar c_2\mathbf{y}_2(x)+\cdots+\bar c_n\mathbf{y}_n(x) y(x)=cˉ1y1(x)+cˉ2y2(x)+⋯+cˉnyn(x),并且满足初始条件。
定理证毕。
基解矩阵:我们称n个线性无关的解为一个基本解组(fundamental system of solutions)。显然,基本解组不是惟一的。由n个解构成的 n × n n\times n n×n 矩阵,称为解矩阵 。由基本解组构成的 n × n n\times n n×n 矩阵,称为基解矩阵 Φ ( x ) \mathbfΦ(x) Φ(x)。
(i) 基解矩阵的行列式就是这个解组的伏朗斯基行列式 det Φ ( x ) = W ( x ) ≠ 0 \det\mathbf{Φ}(x)=W(x)\neq0 detΦ(x)=W(x)=0。
(ii) 由定理 6的证明可知,其它的解均可由基解矩阵表示
y = Φ ( x ) c (6) \mathbf{y} =\mathbf{Φ}(x)\mathbf{c}\tag{6} y=Φ(x)c(6)
其中 c \mathbf{c} c 是确定的常数列向量。
(iii) 一个解矩阵 Φ ( x ) \mathbf{Φ}(x) Φ(x) 是基解矩阵的充要条件是 det Φ ( x ) ≠ 0 \det\mathbf{Φ}(x)\neq0 detΦ(x)=0
推论
(i) 设 Φ ( x ) \mathbf{Φ}(x) Φ(x) 是方程组 (4)的基解矩阵,则对任意非奇异(可逆)n 阶常数矩阵 C n × n \mathbf{C}_{n\times n} Cn×n ,矩阵 Ψ = Φ ( x ) C \mathbf{Ψ=Φ}(x)\mathbf{C} Ψ=Φ(x)C 也是方程组 (4)的基解矩阵。
(ii) 设 Φ ( x ) , Ψ ( x ) \mathbf{Φ}(x),\mathbf{Ψ}(x) Φ(x),Ψ(x) 都是方程组 (4)的基解矩阵,则比存在非奇异(可逆)n 阶常数矩阵 C n × n \mathbf{C}_{n\times n} Cn×n 使得 Ψ = Φ ( x ) C \mathbf{Ψ=Φ}(x)\mathbf{C} Ψ=Φ(x)C 成立。
本节讨论非齐次线性方程组
y ′ = A ( x ) y + f ( x ) (2) \mathbf{y}'=\mathbf{A}(x)\mathbf{y}+\mathbf{f}(x)\tag{2} y′=A(x)y+f(x)(2)
对应的齐次线性方程组为
y ′ = A ( x ) y (4) \mathbf{y}'=\mathbf{A}(x)\mathbf{y}\tag{4} y′=A(x)y(4)
解的性质
(1) 如果 y ( x ) \mathbf{y}(x) y(x) 是方程组 (2) 的解,而 y ˉ ( x ) \mathbf{\bar y}(x) yˉ(x) 是对应齐次线性方程组 (4) 的解,则 y ( x ) + y ˉ ( x ) \mathbf y(x)+\mathbf{\bar y}(x) y(x)+yˉ(x) 是方程组 (2) 的解。
(2) 如果 y ~ ( x ) , y ˉ ( x ) \mathbf{\tilde y}(x), \mathbf{\bar y}(x) y~(x),yˉ(x) 是方程组 (2) 的两个解,则 y ~ ( x ) − y ˉ ( x ) \mathbf{\tilde y}(x)-\mathbf{\bar y}(x) y~(x)−yˉ(x) 是对应齐次线性方程组 (4) 的解。
定理 7 通解结构定理:设 Φ ( x ) \mathbfΦ(x) Φ(x)是方程组 (4)的基解矩阵,而 φ ˉ ( x ) \mathbf{\bar φ}(x) φˉ(x) 是方程组 (2) 的某一解,则方程组 (2) 的任一解都可表示为
φ ( x ) = Φ ( x ) c + φ ˉ ( x ) (7) \mathbfφ(x) =\mathbfΦ(x)\mathbf c+\mathbf{\barφ}(x)\tag{7} φ(x)=Φ(x)c+φˉ(x)(7)
其中 c \mathbf c c 是确定的常数列向量。
证明:由解的性质知, φ ( x ) − φ ˉ ( x ) \mathbfφ(x)-\mathbf{\barφ}(x) φ(x)−φˉ(x) 是方程组(4)的解。
再由上节的结论得到 φ ( x ) − φ ˉ ( x ) = Φ ( x ) c \mathbfφ(x)-\mathbf{\barφ}(x)=\mathbfΦ(x)\mathbf c φ(x)−φˉ(x)=Φ(x)c
由此定理证毕。
常数变易法[^const]:定理 7告诉我们,要解非齐次线性方程组,只需知道它的一个特解和对应的齐次线性方程组的基解矩阵。其中,我们可以用常数变易法求得非齐次线性方程组的一个解。
设 Φ ( x ) \mathbfΦ(x) Φ(x)是方程组 (4)的基解矩阵,因而方程组 (4) 的任一解为 y = Φ ( x ) c \mathbf y=\mathbfΦ(x)\mathbf c y=Φ(x)c 。
用常数变易法,令
y = Φ ( x ) c ( x ) \mathbf y=\mathbfΦ(x)\mathbf c(x) y=Φ(x)c(x)
为非齐次方程组 (2) 的解。这里 c ( x ) \mathbf c(x) c(x) 是待定的向量函数。
将它带入方程组 (2) 就得到方程
Φ ′ ( x ) c ( x ) + Φ ( x ) c ′ ( x ) = A ( x ) Φ ( x ) c ( x ) + f ( x ) \mathbfΦ'(x)\mathbf c(x)+\mathbfΦ(x)\mathbf c'(x)=\mathbf{A}(x)\mathbfΦ(x)\mathbf c(x)+\mathbf{f}(x) Φ′(x)c(x)+Φ(x)c′(x)=A(x)Φ(x)c(x)+f(x)
因为 Φ ( x ) \mathbfΦ(x) Φ(x)是方程组 (4) 基解矩阵,所以 Φ ′ ( x ) = A ( x ) Φ ( x ) \mathbfΦ'(x)=\mathbf{A}(x)\mathbfΦ(x) Φ′(x)=A(x)Φ(x) ,由此,上式可化简为
Φ ( x ) c ′ ( x ) = f ( x ) \mathbfΦ(x)\mathbf c'(x)=\mathbf{f}(x) Φ(x)c′(x)=f(x)
又因为基解矩阵的行列式在区间 [ a , b ] [a,b] [a,b] 上恒不等于零,所以可逆,上式两边同左乘 Φ − 1 ( x ) \mathbfΦ^{-1}(x) Φ−1(x),然后积分,便得到
c ( x ) = ∫ x 0 x Φ − 1 ( s ) f ( s ) d s x 0 , x ∈ [ a , b ] \mathbf c(x)=\int_{x_0}^{x}\mathbfΦ^{-1}(s)\mathbf{f}(s)ds\quad x_0,x\in[a,b] c(x)=∫x0xΦ−1(s)f(s)dsx0,x∈[a,b]
其中 c ( x 0 ) = 0 \mathbf c(x_0)=0 c(x0)=0 。
定理 8:如果 Φ ( x ) \mathbfΦ(x) Φ(x)是方程组 (4) 的基解矩阵,则
y = Φ ( x ) ∫ x 0 x Φ − 1 ( s ) f ( s ) d s \mathbf y=\mathbfΦ(x)\int_{x_0}^{x}\mathbfΦ^{-1}(s)\mathbf{f}(s)ds y=Φ(x)∫x0xΦ−1(s)f(s)ds
是方程组 (2) 的解,且满足初始条件 y ( x 0 ) = 0 \mathbf y(x_0)=0 y(x0)=0 。
由定理 7和定理 8容易看出,方程组 (2) 满足初始条件 y ( x 0 ) = η \mathbf y(x_0)=\mathbfη y(x0)=η 的解由下面给出
y = Φ ( x ) Φ − 1 ( x 0 ) η + Φ ( x ) ∫ x 0 x Φ − 1 ( s ) f ( s ) d s (8) \mathbf y=\mathbfΦ(x)\mathbfΦ^{-1}(x_0)\mathbfη+\mathbfΦ(x)\int_{x_0}^{x}\mathbfΦ^{-1}(s)\mathbf{f}(s)ds \tag{8} y=Φ(x)Φ−1(x0)η+Φ(x)∫x0xΦ−1(s)f(s)ds(8)
上式称为非齐次方程组的常数变易公式。
本节讨论常系数线性微分方程组
y ′ = A y + f ( x ) (9) \mathbf{y'=Ay+f}(x)\tag{9} y′=Ay+f(x)(9)
对应的常系数齐次线性方程组为
y ′ = A y (10) \mathbf{y'=Ay}\tag{10} y′=Ay(10)
这里系数矩阵 A A A 为 n × n n\times n n×n 常数矩阵。根据常数变易公式,我们只需要求出方程组 (10) 的一个基解矩阵即可。
矩阵指数:引入矩阵指数的目的是为了求解方程组 (10) 基解矩阵。
设 A A A 是一个 n × n n\times n n×n 常数矩阵,我们定义矩阵指数(Matrix Exponential)(或写作 exp A \exp A expA)
e A = ∑ k = 0 ∞ A k k ! = E + A + A 2 2 ! + ⋯ A k k ! + ⋯ e^A=\sum_{k=0}^{\infty}\cfrac{A^k}{k!}=E+A+\cfrac{A^2}{2!}+\cdots\cfrac{A^k}{k!}+\cdots eA=k=0∑∞k!Ak=E+A+2!A2+⋯k!Ak+⋯
不难证明,级数 e A e^A eA 对于一切矩阵 A A A 都是绝对收敛的。
矩阵指数 e A e^A eA 的性质:
(1) 如果矩阵 A , B A,B A,B是可交换的,即 A B = B A AB=BA AB=BA,则 e A + B = e A e B e^{A+B}=e^Ae^B eA+B=eAeB
(2) 对于任何矩阵 A A A,矩阵指数都是可逆的 ( e A ) − 1 = e − A (e^A)^{-1}=e^{-A} (eA)−1=e−A
(3) 如果 P P P 是非奇异矩阵, e P − 1 A P = P − 1 e A P e^{P^{-1}AP}=P^{-1}e^AP eP−1AP=P−1eAP
定理 9:矩阵指数
Φ ( x ) = e A x (11) Φ(x)=e^{Ax}\tag{11} Φ(x)=eAx(11)
是方程组 (10) 的基解矩阵,且 Φ ( 0 ) = E Φ(0)=E Φ(0)=E
证明:级数 e A x = ∑ k = 0 ∞ A k x k k ! e^{Ax}=\displaystyle\sum_{k=0}^{\infty}\cfrac{A^kx^k}{k!} eAx=k=0∑∞k!Akxk 在 x x x 的任何有限区间上是一致收敛的。
事实上,对于一切正整数 k k k ,当 ∣ x ∣ ⩽ c |x|⩽ c ∣x∣⩽c(c为某一正数)时,有 ∥ A k x k k ! ∥ ⩽ ∥ A ∥ k ∣ x ∣ k k ! ⩽ ∥ A ∥ k c k k ! \|\cfrac{A^kx^k}{k!}\|⩽\cfrac{\|A\|^k|x|^k}{k!}⩽\cfrac{\|A\|^kc^k}{k!} ∥k!Akxk∥⩽k!∥A∥k∣x∣k⩽k!∥A∥kck ,而数值级数 ∑ k = 0 ∞ ( ∥ A ∥ c ) k k ! \displaystyle\sum_{k=0}^{\infty}\cfrac{(\|A\|c)^k}{k!} k=0∑∞k!(∥A∥c)k 是收敛的,所以 e A x e^{Ax} eAx 是一致收敛的。
而且用逐项微分法,可以得到 Φ ′ ( x ) = A e A x = A Φ ( x ) Φ'(x)=Ae^{Ax}=AΦ(x) Φ′(x)=AeAx=AΦ(x) ,这说明 Φ ( x ) Φ(x) Φ(x) 是方程组 (10) 的解矩阵。又因为 det [ Φ ( 0 ) ] = det E = 1 \det[Φ(0)]=\det E=1 det[Φ(0)]=detE=1,所以 Φ ( x ) Φ(x) Φ(x)为基解矩阵。
由定理 9我们可以得到方程组 (10) 的任一解可表示为
y = e A x c (12) \mathbf y=e^{\mathbf Ax}\mathbf c\tag{12} y=eAxc(12)
这里 c \mathbf c c 是一个常数向量。方程组 (9) 满足初始条件 y ( x 0 ) = η \mathbf y(x_0)=\mathbfη y(x0)=η 的解由下面给出
y = e A ( x − x 0 ) η + ∫ x 0 x e A ( x − s ) f ( s ) d s (13) \mathbf y=e^{\mathbf A(x-x_0)}\mathbfη+\int_{x_0}^{x}e^{\mathbf A(x-s)}\mathbf{f}(s)ds \tag{13} y=eA(x−x0)η+∫x0xeA(x−s)f(s)ds(13)
示例:如果 A A A 是一个对角阵 A = ( a 1 a 2 ⋱ a n ) A=\begin{pmatrix} a_1&& \\ &a_2&& \\ &&\ddots\\ &&&a_n \end{pmatrix} A=⎝⎜⎜⎛a1a2⋱an⎠⎟⎟⎞,求 y ′ = A y \mathbf{y'=Ay} y′=Ay 的基解矩阵。
e A x = E + A + A 2 2 ! + ⋯ A k k ! + ⋯ = ( e a 1 x e a 2 x ⋱ e a n x ) e^{Ax}=E+A+\cfrac{A^2}{2!}+\cdots\cfrac{A^k}{k!}+\cdots=\begin{pmatrix} e^{a_1x}&& \\ &e^{a_2x}&& \\ &&\ddots\\ &&&e^{a_nx} \end{pmatrix} eAx=E+A+2!A2+⋯k!Ak+⋯=⎝⎜⎜⎛ea1xea2x⋱eanx⎠⎟⎟⎞
基解矩阵的计算:由于矩阵指数的计算量比较大,我们引入几种解法。
特征值法
定理 10:设常数 λ λ λ 是矩阵 A \mathbf A A 的特征值, c \mathbf c c 是对应于特征值 λ λ λ 的特征向量( A c = λ c \mathbf{Ac}=λ\mathbf c Ac=λc),则 e λ x c e^{λx}\mathbf c eλxc 是齐次线性方程组 (10) 的解。
证明:直接代入方程组 λ e λ x c = A e λ x c λe^{λx}\mathbf c=\mathbf Ae^{λx}\mathbf c λeλxc=Aeλxc
因为 e λ x ≠ 0 e^{λx}\neq0 eλx=0,上式简化为齐次线性代数方程组
( λ E − A ) c = 0 (λ\mathbf{E-A)c}=0 (λE−A)c=0
根据线性代数理论,上述方程组获得非零解的充要条件是 λ λ λ 满足方程
det ( λ E − A ) = 0 (14) \det(λ\mathbf{E-A})=0 \tag{14} det(λE−A)=0(14)
n n n次多项式
p ( λ ) = det ( λ E − A ) (15) p(λ)=\det(λ\mathbf{E-A})\tag{15} p(λ)=det(λE−A)(15)
称为特征多项式, n n n次代数方程 p ( λ ) = 0 p(λ)=0 p(λ)=0 称为特征方程。
A \mathbf A A 的特征值就是特征方程的根,因为 n n n 次代数方程有 n n n 个根,所以 A \mathbf A A有 n n n 个特征值,当然不一定 n n n 个互不相同。
如果 λ = λ 0 λ=λ_0 λ=λ0 是特征方程的单根,则称 λ 0 λ_0 λ0 为简单特征根;如果 λ = λ 0 λ=λ_0 λ=λ0 是特征方程的 k k k 重根,则称 λ 0 λ_0 λ0 为 k k k重特征根 。
定理 11:如果矩阵 A \mathbf A A 具有 n n n 个线性无关的特征向量 c 1 , c 2 , ⋯ , c n \mathbf{c_1,c_2,\cdots,c_n} c1,c2,⋯,cn ,它们对应的特征值分别为 λ 1 , λ 2 , ⋯ , λ n λ_1,λ_2,\cdots,λ_n λ1,λ2,⋯,λn (不必各不相同),那么矩阵
Φ ( x ) = ( e λ 1 x c 1 , e λ 2 x c 2 , ⋯ , e λ n x c n ) \mathbfΦ(x)=(e^{λ_1x}\mathbf{c_1},e^{λ_2x}\mathbf{c_2},\cdots,e^{λ_nx}\mathbf{c_n}) Φ(x)=(eλ1xc1,eλ2xc2,⋯,eλnxcn)
是常系数线性微分方程组 (10) 的一个基解矩阵。
证明:由定理 10知道,每一对特征向量和特征值组成的向量函数 e λ i x c i ( i = 1 , 2 , ⋯ , n ) e^{λ_ix}\mathbf c_i\quad(i=1,2,\cdots,n) eλixci(i=1,2,⋯,n) 都是方程组 (10) 的解。
因此矩阵 Φ ( x ) = ( e λ 1 x c 1 , e λ 2 x c 2 , ⋯ , e λ n x c n ) \mathbfΦ(x)=(e^{λ_1x}\mathbf{c_1},e^{λ_2x}\mathbf{c_2},\cdots,e^{λ_nx}\mathbf{c_n}) Φ(x)=(eλ1xc1,eλ2xc2,⋯,eλnxcn) 是一个解矩阵
因为向量 c 1 , c 2 , ⋯ , c n \mathbf{c_1,c_2,\cdots,c_n} c1,c2,⋯,cn 线性无关
所以 W ( 0 ) = det Φ ( 0 ) = det ( c 1 , c 2 , ⋯ , c n ) ≠ 0 W(0)=\det\mathbfΦ(0)=\det(\mathbf{c_1,c_2,\cdots,c_n})\neq0 W(0)=detΦ(0)=det(c1,c2,⋯,cn)=0
从而矩阵 Φ ( x ) \mathbfΦ(x) Φ(x) 是一个基解矩阵。
一般来说,定理 11 中的 Φ ( x ) \mathbfΦ(x) Φ(x) 不一定等于矩阵指数 e A x e^{\mathbf Ax} eAx ,然而根据基解矩阵的性质,存在一个非奇异的常数矩阵 C \mathbf C C ,使得 e A x = Φ ( x ) C e^{\mathbf Ax}=\mathbfΦ(x)\mathbf C eAx=Φ(x)C
令 x = 0 x=0 x=0 ,我们得到 C = Φ − 1 ( 0 ) C=\mathbfΦ^{-1}(0) C=Φ−1(0),因此
e A x = Φ ( x ) Φ − 1 ( 0 ) (16) e^{\mathbf Ax}=\mathbfΦ(x)\mathbfΦ^{-1}(0)\tag{16} eAx=Φ(x)Φ−1(0)(16)
矩阵指数的计算问题变为方程组任意基解矩阵的计算问题。
结论:假设 λ 1 , λ 2 , ⋯ , λ k λ_1,λ_2,\cdots,λ_k λ1,λ2,⋯,λk 分别是矩阵 A \mathbf A A 的 n 1 , n 2 , ⋯ , n k n_1,n_2,\cdots,n_k n1,n2,⋯,nk 重不同的特征根,这里 n 1 + n 2 + ⋯ + n k = n n_1+n_2+\cdots+n_k=n n1+n2+⋯+nk=n , v 1 , v 2 , ⋯ , v n \mathbf{v_1,v_2,\cdots,v_n} v1,v2,⋯,vn 是 A \mathbf A A 的一组线性无关的特征向量。常系数线性微分方程组 (10) 满足条件 y ( 0 ) = η \mathbf y(0)=\mathbf η y(0)=η 的解可以写成(需要用到线性代数空间分解知识)
y = ∑ j = 1 k e λ j x [ ∑ i = 0 n i − 1 x i i ! ( A − λ j E ) i ] v j (17) \displaystyle\mathbf y=\sum^{k}_{j=1}e^{λ_jx}[\sum_{i=0}^{n_i-1}\cfrac{x^i}{i!}(\mathbf{A}-λ_j\mathbf{E})^i]\mathbf{v}_j\tag{17} y=j=1∑keλjx[i=0∑ni−1i!xi(A−λjE)i]vj(17)
作为公式 (16) 的应用,下面给出关于方程组的解的稳定性方面的重要定理。
定理 12:给定常系数线性微分方程组 (10)
(i) 如果系数矩阵 A \mathbf A A 的特征值的实部都是负数,则方程组 (10) 的任一解当 x → + ∞ x\to+\infty x→+∞ 时都趋于零。
(ii) 如果系数矩阵 A \mathbf A A 的特征值的实部都是非正数,且实部为零的特征值都是简单特征值,则方程组 (10) 的任一解当 x → + ∞ x\to+\infty x→+∞ 时都保持有界。
(iii) 如果系数矩阵 A \mathbf A A 的特征值至少有一个具有正实部,则方程组 (10) 至少有一解当 x → + ∞ x\to+\infty x→+∞ 时都趋于无穷。
利用约当(Jordan)标准型计算
由线性代数理论知道,对于矩阵 A \mathbf A A ,存在n阶非奇异矩阵 P \mathbf P P ,使得 P J P − 1 = A \mathbf{PJP^{-1}=A} PJP−1=A,其中 J = ( J 1 J 2 ⋱ J l ) \mathbf J=\begin{pmatrix} \mathbf J_1 \\ &\mathbf J_2 \\ &&\ddots \\ &&&\mathbf J_l \\ \end{pmatrix} J=⎝⎜⎜⎛J1J2⋱Jl⎠⎟⎟⎞ 为约当标准型,这里 J j = ( λ j 1 λ j 1 ⋱ ⋱ ⋱ 1 λ j ) ( j = 1 , 2 , ⋯ , l ) \mathbf J_j=\begin{pmatrix} λ_j & 1\\ &λ_j &1\\ &&\ddots &\ddots \\ &&&\ddots &1 \\ &&&&λ_j \\ \end{pmatrix}\quad(j=1,2,\cdots,l) Jj=⎝⎜⎜⎜⎜⎛λj1λj1⋱⋱⋱1λj⎠⎟⎟⎟⎟⎞(j=1,2,⋯,l) 为 n j n_j nj 阶矩阵,并且 n 1 + n 2 + ⋯ + n l = n n_1+n_2+\cdots+n_l=n n1+n2+⋯+nl=n ,而 l l l 为矩阵 A − λ E \mathbf{A}-λ\mathbf{E} A−λE 的初级因子的个数; λ 1 , λ 2 , ⋯ , λ k λ_1,λ_2,\cdots,λ_k λ1,λ2,⋯,λk 是特征方程 p ( λ ) = 0 p(λ)=0 p(λ)=0 的根,可能有相同的;矩阵中空白的元素均为零。
由于矩阵 J \mathbf J J 及 J j \mathbf J_j Jj 的特殊形式,利用矩阵指数的定义容易得到
e J x = ( e J 1 x e J 2 x ⋱ e J l x ) e^{\mathbf Jx}=\begin{pmatrix} e^{\mathbf J_1x} \\ &e^{\mathbf J_2x} \\ &&\ddots \\ &&&e^{\mathbf J_lx} \\ \end{pmatrix} eJx=⎝⎜⎜⎛eJ1xeJ2x⋱eJlx⎠⎟⎟⎞
其中
e J j x = e λ j x ( 1 x x 2 2 ! ⋯ x n j − 1 ( n j − 1 ) ! 1 x ⋯ x n j − 2 ( n j − 2 ) ! ⋱ ⋱ ⋮ ⋱ x 1 ) e^{\mathbf J_jx}=e^{λ_jx}\begin{pmatrix} 1 & x & \cfrac{x^2}{2!} &\cdots & \cfrac{x^{n_j-1}}{(n_j-1)!}\\ &1 &x &\cdots & \cfrac{x^{n_j-2}}{(n_j-2)!}\\ &&\ddots &\ddots & \vdots \\ &&&\ddots & x \\ &&&&1 \\ \end{pmatrix} eJjx=eλjx⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎛1x12!x2x⋱⋯⋯⋱⋱(nj−1)!xnj−1(nj−2)!xnj−2⋮x1⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎞
由矩阵指数的性质 (3) 知方程组 (10) 的 基解矩阵的计算公式:
e A x = e P J P − 1 = P e J x P − 1 (18) e^{\mathbf Ax}=e^{\mathbf{PJP^{-1}}}=\mathbf{P}e^{\mathbf{J}x}\mathbf{P}^{-1}\tag{18} eAx=ePJP−1=PeJxP−1(18)
当然,根据基解矩阵的性质知道,矩阵 Ψ ( x ) = P e J x \mathbf Ψ(x)=\mathbf{P}e^{\mathbf{J}x} Ψ(x)=PeJx 也是基解矩阵。
问题是非奇异矩阵 P \mathbf P P 的计算比较麻烦。
利用 Hamiton-Cayley 定理计算
用直接带入的方法应用Hamiton-Cayley 定理容易验证
e A x = ∑ j = 0 n − 1 r j + 1 ( x ) P j (19) \displaystyle e^{\mathbf Ax}=\sum_{j=0}^{n-1}r_{j+1}(x)\mathbf P_j \tag{19} eAx=j=0∑n−1rj+1(x)Pj(19)
其中 P 0 = E , P j = ∏ k = 1 j ( A − λ k E ) , ( j = 1 , 2 , ⋯ , n ) \displaystyle \mathbf{P_0=E},\mathbf{P_j}=\prod_{k=1}^{j}(\mathbf A-λ_k\mathbf E),(j=1,2,\cdots,n) P0=E,Pj=k=1∏j(A−λkE),(j=1,2,⋯,n),而 r 1 ( x ) , r 2 ( x ) , ⋯ , r n ( x ) r_1(x),r_2(x),\cdots,r_n(x) r1(x),r2(x),⋯,rn(x) 是初值问题
{ r 1 ′ = λ 1 r 1 r j ′ = r j − 1 + λ j r j r 1 ( 0 ) = 1 , r j ( 0 ) = 0 ( j = 2 , 3 , ⋯ , n ) \begin{cases} r'_1=λ_1r_1 \\ r'_j=r_{j-1}+λ_jr_j \\ r_1(0)=1,r_j(0)=0 \end{cases}\quad(j=2,3,\cdots,n) ⎩⎪⎨⎪⎧r1′=λ1r1rj′=rj−1+λjrjr1(0)=1,rj(0)=0(j=2,3,⋯,n)
的解。 λ 1 , λ 2 , ⋯ , λ k λ_1,λ_2,\cdots,λ_k λ1,λ2,⋯,λ