正定矩阵、正定二次型与正定函数

一、正定矩阵与正定函数

1.1 正定函数定义

[正定函数] 若实函数 V ( x ) V(x) V(x) 对任意 n 维非零向量 x x x 都有 V ( x ) > 0 V(x)>0 V(x)>0,当且仅当 x = 0 x=0 x=0 时, V ( x ) = 0 V(x)=0 V(x)=0,则称函数 V ( x ) V(x) V(x) 为正定函数。

[半正定函数] 如果 x ≠ 0 , V ( x ) ≥ 0 x \neq 0,V(x) \ge 0 x=0,V(x)0,则称 V ( x ) V(x) V(x) 为半正定函数。
[负定函数] 如果 x ≠ 0 , V ( x ) < 0 x \neq 0, V(x) < 0 x=0,V(x)<0,则称 V ( x ) V(x) V(x) 为负定函数。
[半负定函数] 如果 x ≠ 0 , V ( x ) ≤ 0 x \neq 0, V(x) \le 0 x=0,V(x)0,则称 V ( x ) V(x) V(x) 为半负定函数。

1.2 正定矩阵与正定二次型

若矩阵 A A A 是n 阶方阵,对于任意非零向量 x x x,都有 x T A x > 0 {x^T}Ax > 0 xTAx>0,则矩阵 A A A 是正定矩阵,函数 x T A x {x^T}Ax xTAx 称为矩阵 A A A 对应的正定二次型。

半正定、负定和半负定以此类推,不再赘述。

例如:

A = [ 1 0 0 1 ] A = \left [ \begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array} \right ] A=[1001]

V ( x ) = [ x 1 x 2 ] A [ x 1 x 2 ] = x 1 2 + x 2 2 (1.1) V(x) = \left [ \begin{array}{cc} x_1 & x_2 \end{array} \right ] A \left [ \begin{array}{cc} x_1 \\ x_2 \end{array} \right ] = x_1^2 + x_2^2 \tag{1.1} V(x)=[x1x2]A[x1x2]=x12+x22(1.1)

就是一个正定二次型。因为当且仅当 x = [ x 1 , x 2 ] T = [ 0 , 0 ] T x=[x_1, x_2]^T = [0, 0]^T x=[x1,x2]T=[0,0]T 时, V ( x ) = 0 V(x)=0 V(x)=0,否则 V ( x ) > 0 V(x)>0 V(x)>0,满足定义。

A = [ 1 − 1 − 1 1 ] A = \left [ \begin{array}{cc} 1 & -1 \\ -1 & 1 \end{array} \right ] A=[1111]

V ( x ) = ( x 1 − x 2 ) 2 (2.2) V(x) = (x_1 - x_2)^2 \tag{2.2} V(x)=(x1x2)2(2.2)

是一个半正定函数。因为 V ( x ) ≥ 0 V(x) \ge 0 V(x)0,当 x 1 = x 2 x_1 = x_2 x1=x2 时, V ( x ) = 0 V(x) = 0 V(x)=0

1.3 二次型图像

正定二次型有个很好的性质——有唯一的全局最小值。

以二阶矩阵为例,分别绘制正定 A 1 A_1 A1、半正定 A 2 A_2 A2、负定 A 3 A_3 A3、不定 A 4 A_4 A4二次型的图像,对应的矩阵分别取:

A 1 = [ 1 0 0 1 ] A 2 = [ 1 − 1 − 1 1 ] A 3 = [ − 1 0 0 − 1 ] A 4 = [ 1 0 0 − 1 ] A_1 = \left [ \begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array} \right ] \quad A_2 = \left [ \begin{array}{cc} 1 & -1 \\ -1 & 1 \end{array} \right ] \quad A_3 = \left [ \begin{array}{cc} -1 & 0 \\ 0 & -1 \end{array} \right ] \quad A_4 = \left [ \begin{array}{cc} 1 & 0\\ 0 & -1 \end{array} \right ] A1=[1001]A2=[1111]A3=[1001]A4=[1001]

[x1, x2] = meshgrid(-2:0.1:2);
subplot(221);mesh(x1, x2, x1.^2 + x2.^2);               % A1 = [1 0; 0 1];
subplot(222);mesh(x1, x2, x1.^2 + x2.^2 - 2*x1.*x2);    % A2 = [1 -1; -1 1];
subplot(223);mesh(x1, x2, -x1.^2 - x2.^2);              % A3 = [-1 0; 0 -1];
subplot(224);mesh(x1, x2, x1.^2 - x2.^2);               % A4 = [1 0; 0 -1];

正定矩阵、正定二次型与正定函数_第1张图片

可见,二阶正定矩阵对应的二次型图像是一个开口朝上旋转抛物面,在原点处有唯一最小值。有唯一最小值是一个很好的性质,因为最优化问题往往就是计算一个最小值。


二、正定函数的应用

正定函数的一个应用就是著名的Lyapunov函数,常常希望找到正定的 V ( x ) V(x) V(x) 和 负定的 V ˙ ( x ) \dot V(x) V˙(x),这样原系统就是稳定的。比如状态空间方程:

x ˙ = − x (2.3) \dot x = -x \tag{2.3} x˙=x(2.3)

其中, x x x 为系统的一个状态。选择
V ( x ) = 1 2 x 2 (2.4) V(x) = \frac{1}{2}x^2 \tag{2.4} V(x)=21x2(2.4)

则:

V ˙ ( x ) = x x ˙ = − x 2 (2.5) \dot V(x) = x\dot x = -x^2 \tag{2.5} V˙(x)=xx˙=x2(2.5)

V ( x ) V(x) V(x) 正定, V ˙ ( x ) \dot V(x) V˙(x) 负定,式(2.3) 表示的系统是稳定的。再看看式(2.1),当 x > 0 x>0 x>0 时, x ˙ < 0 \dot x<0 x˙<0 x x x 将朝着原点移动; x < 0 x<0 x<0 时, x ˙ > 0 \dot x>0 x˙>0 x x x 依旧朝着原点移动。因此,如果 x x x 代表着小球的位移,那么小球总会回到原点,说原点是稳定的理所当然。实际上,式子(2.4) 这个二次函数有着能量的含义,原点能量是最低的,小球总会滚到原点。再次看式(2.1),其解为 x = e − t x=e^{-t} x=et,随着时间推移, x x x 会不断趋近于 0,也可以看出 x x x 是稳定的。可见,Lyapunov函数、原方程、原方程的解都能用来分析稳定性。但实际情况中,往往原方程不直观,原方程解很复杂甚至没有解析解,而Lyapunov函数设计可能更为方便(有时也并不容易),因此得到广泛运用。

最后再感悟一下正定函数的美妙性。 V ( x ) > 0 V(x)>0 V(x)>0 V ˙ ( x ) < 0 \dot V(x)<0 V˙(x)<0 这个条件实在太强了,保证了某点领域内有唯一的最小值。如果对全部的 x x x 都成立,那么该点就是全局的最小值点,也就是全局稳定的。

— 完 —

你可能感兴趣的:(杂篇)