最小二乘法系统辨识小结

文章目录

  • 一.常用随机系统模型
    • 1.时间序列模型
    • 2.方程误差模型
    • 3.输出误差模型
  • 二.辨识模型
  • 三. 最小二乘基本原理
  • 四.最小二乘估计的统计特性
    • 1.无偏性定理
    • 2.估计误差协方差定理
    • 3.噪声方差估计定理
  • 五.常用的各类最小二乘辨识算法
    • 1.递推最小二乘辨识
      • 2.带遗忘因子最小二乘系统辨识
      • 3.新息与残差之间的关系
      • 4.有限数据窗最小二乘系统辨识
      • 5.带遗忘因子的有限数据窗最小二乘算法

吴爱国.系统辨识讲义
丁峰.系统辨识新论

最近看完了系统辨识课程的讲义,总结一下讲义上的内容:
系统辨识分为系统结构辨识和系统参数辨识。课程的内容是系统参数的辨识,即假设系统结构已知。
辨识的四要素:输入输出数据,模型集,准则函数,优化方法。
课程中模型的结构已知,实际的辨识中会存在多个可能的模型结构,构成待辨识的模型集。

A ( z ) = 1 + a 1 z − 1 + a 2 z − 2 + . . . . . + a n a z − n a A(z)=1+a_1z^{-1}+a_2z^{-2}+.....+a_{n_a}z^{-n_a} A(z)=1+a1z1+a2z2+.....+anazna B ( z ) = b 1 z − 1 + b 2 z − 2 + . . . . . + b n b z − n b B(z)=b_1z^{-1}+b_2z^{-2}+.....+b_{n_b}z^{-n_b} B(z)=b1z1+b2z2+.....+bnbznb C ( z ) = 1 + c 1 z − 1 + c 2 z − 2 + . . . . . + c n c z − n c C(z)=1+c_1z^{-1}+c_2z^{-2}+.....+c_{n_c}z^{-n_c} C(z)=1+c1z1+c2z2+.....+cncznc D ( z ) = 1 + d 1 z − 1 + d 2 z − 2 + . . . . . + d n d z − n d D(z)=1+d_1z^{-1}+d_2z^{-2}+.....+d_{n_d}z^{-n_d} D(z)=1+d1z1+d2z2+.....+dndznd F ( z ) = 1 + f 1 z − 1 + f 2 z − 2 + . . . . . + f n f z − n f F(z)=1+f_1z^{-1}+f_2z^{-2}+.....+f_{n_f}z^{-n_f} F(z)=1+f1z1+f2z2+.....+fnfznf
随机白噪声 v ( t ) v(t) v(t), E ( v ( t ) ) = 0 E(v(t))=0 E(v(t))=0, D ( v ( t ) ) = σ 2 D(v(t))=\sigma^2 D(v(t))=σ2

一.常用随机系统模型

常用的辨识模型有以下几类:

1.时间序列模型

(1)自回归模型(AR) A ( z ) y ( t ) = v ( t ) A(z)y(t)=v(t) A(z)y(t)=v(t)
该模型表示当前值是过去值的组合。
(2)滑动平均模型(MA) y ( t ) = D ( z ) v ( t ) y(t)=D(z)v(t) y(t)=D(z)v(t)
当前值是过去白噪声的组合。
(3)滑动平均自回归模型(ARMA) A ( z ) y ( t ) = D ( z ) v ( t ) A(z)y(t)=D(z)v(t) A(z)y(t)=D(z)v(t)
(4)确定性模型(ARMA) A ( z ) y ( t ) = B ( z ) u ( t ) A(z)y(t)=B(z)u(t) A(z)y(t)=B(z)u(t)

2.方程误差模型

误差是指描述输入和输出之间的差分方程的误差.
(1)受控自回归模型(ARX) A ( z ) y ( t ) = B ( z ) u ( t ) + v ( t ) A(z)y(t)=B(z)u(t)+v(t) A(z)y(t)=B(z)u(t)+v(t)
(2)受控自回归滑动平均模型(ARMAX) A ( z ) y ( t ) = B ( z ) u ( t ) + D ( z ) v ( t ) A(z)y(t)=B(z)u(t)+D(z)v(t) A(z)y(t)=B(z)u(t)+D(z)v(t)
(3)受控ARAR模型(ARARX) A ( z ) y ( t ) = B ( z ) u ( t ) + v ( t ) / C ( z ) A(z)y(t)=B(z)u(t)+v(t)/C(z) A(z)y(t)=B(z)u(t)+v(t)/C(z)
(4)受控ARARMA模型(ARARMAX) A ( z ) y ( t ) = B ( z ) u ( t ) + D ( z ) C ( z ) v ( t ) A(z)y(t)=B(z)u(t)+\frac{D(z)}{C(z)}v(t) A(z)y(t)=B(z)u(t)+C(z)D(z)v(t)

3.输出误差模型

(1)输出误差模型(OE) y ( t ) = B ( z ) A ( z ) u ( t ) + v ( t ) y(t)=\frac{B(z)}{A(z)}u(t)+v(t) y(t)=A(z)B(z)u(t)+v(t)
(2)输出误差滑动平均模型(OEMA) y ( t ) = B ( z ) A ( z ) u ( t ) + D ( z ) v ( t ) y(t)=\frac{B(z)}{A(z)}u(t)+D(z)v(t) y(t)=A(z)B(z)u(t)+D(z)v(t)
(3)输出误差自回归模型(OEAR) y ( t ) = B ( z ) A ( z ) u ( t ) + 1 C ( z ) v ( t ) y(t)=\frac{B(z)}{A(z)}u(t)+\frac{1}{C(z)}v(t) y(t)=A(z)B(z)u(t)+C(z)1v(t)
(4)输出误差自回归滑动平均模型(OEARMA) y ( t ) = B ( z ) A ( z ) u ( t ) + D ( z ) C ( z ) v ( t ) y(t)=\frac{B(z)}{A(z)}u(t)+\frac{D(z)}{C(z)}v(t) y(t)=A(z)B(z)u(t)+C(z)D(z)v(t)

二.辨识模型

为了辨识系统参数,一般把系统的参数写成一个参数向量形式,输入输出写成一个信息向量形式,就得到系统的辨识模型,也称为辨识表达式.一般单输入单输出线性参数系统的辨识模型可以表达为: y ( t ) = φ T ( t ) θ + v ( t ) y(t)=\varphi^T(t)\theta+v(t) y(t)=φT(t)θ+v(t)

三. 最小二乘基本原理

以一个典型的受控自回归模型为例:
设系统的模型为 y ( t ) + a 1 y ( t − 1 ) + a − 2 y ( t − 2 ) = b 1 u ( t ) + b 2 u ( t − 1 ) + v ( t ) y(t)+a_1y(t-1)+a-2y(t-2)=b_1u(t)+b_2u(t-1)+v(t) y(t)+a1y(t1)+a2y(t2)=b1u(t)+b2u(t1)+v(t)
将其写为如下的形式: y ( t ) = − a 1 y ( t − 1 ) − a 2 y ( t − 2 ) + b 1 u ( t ) + b 2 u ( t − 1 ) + v ( t ) y(t)=-a_1y(t-1)-a_2y(t-2)+b_1u(t)+b_2u(t-1)+v(t) y(t)=a1y(t1)a2y(t2)+b1u(t)+b2u(t1)+v(t)
设观测的数据长度为t,对这个模型有: y ( 3 ) = − a 1 y ( 2 ) − a 2 y ( 1 ) + b 1 u ( 3 ) + b 2 u ( 2 ) + v ( 3 ) y(3)=-a_1y(2)-a_2y(1)+b_1u(3)+b_2u(2)+v(3) y(3)=a1y(2)a2y(1)+b1u(3)+b2u(2)+v(3) y ( 4 ) = − a 1 y ( 3 ) − a 2 y ( 2 ) + b 1 u ( 4 ) + b 2 u ( 3 ) + v ( 4 ) y(4)=-a_1y(3)-a_2y(2)+b_1u(4)+b_2u(3)+v(4) y(4)=a1y(3)a2y(2)+b1u(4)+b2u(3)+v(4) . . . . . . . . . . . . . . . ............... ............... y ( t ) = − a 1 y ( t − 1 ) − a 2 y ( t − 2 ) + b 1 u ( t ) + b 2 u ( t − 1 ) + v ( t ) y(t)=-a_1y(t-1)-a_2y(t-2)+b_1u(t)+b_2u(t-1)+v(t) y(t)=a1y(t1)a2y(t2)+b1u(t)+b2u(t1)+v(t)
Y = [ y ( 3 ) , y ( 4 ) . . . . y ( t ) ] T Y=[y(3),y(4)....y(t)]^T Y=[y(3),y(4)....y(t)]T φ T ( i ) = [ − y ( i − 1 ) , − y ( i − 2 ) , u ( i ) , u ( i − 1 ) ] \varphi^T(i)=[-y(i-1),-y(i-2),u(i),u(i-1)] φT(i)=[y(i1),y(i2),u(i),u(i1)] θ = [ a 1 , a 2 , b 1 , b 2 ] \theta=[a_1,a_2,b_1,b_2] θ=[a1,a2,b1,b2] H = [ φ ( 3 ) , φ ( 4 ) , . . . . . φ ( t ) ] T H=[\varphi(3),\varphi(4),.....\varphi(t)]^T H=[φ(3),φ(4),.....φ(t)]T V = [ v ( 3 ) , v ( 4 ) . . . . v ( t ) ] T V=[v(3),v(4)....v(t)]^T V=[v(3),v(4)....v(t)]T

我们可以得到: Y = H θ + V Y=H\theta+V Y=Hθ+V
令准则函数为 J ( θ ) = ( Y − H θ ) T ( Y − H θ ) J(\theta)=(Y-H\theta)^T(Y-H\theta) J(θ)=(YHθ)T(YHθ)
J J J θ \theta θ求偏导,并令其偏导数为零.得到 θ \theta θ的估计值 θ L S = ( H T H ) − 1 H T Y \theta_{LS}=(H^TH)^{-1}H^TY θLS=(HTH)1HTY

四.最小二乘估计的统计特性

1.无偏性定理

已知 θ \theta θ的最小二乘估计 θ L S = ( H T H ) − 1 H T Y \theta_{LS}=(H^TH)^{-1}H^TY θLS=(HTH)1HTY,辨识模型可以写成: Y = H θ + W Y=H\theta+W Y=Hθ+W, W W W代表任意形式的噪声.在这里先不考虑 W W W中未知参数的辨识,只考虑与输入和输出(可测)有关的待估计参数.
θ L S \theta_{LS} θLS的数学期望 E ( θ L S ) = E [ ( H T H ) − 1 H T Y ] E(\theta_{LS})=E[(H^TH)^{-1}H^TY] E(θLS)=E[(HTH)1HTY] = E [ ( H T H ) − 1 H T ( H θ + W ) ] θ =E[(H^TH)^{-1}H^T(H\theta+W)]\theta =E[(HTH)1HT(Hθ+W)]θ = E [ θ + ( H T H ) − 1 H T W ] =E[\theta+(H^TH)^{-1}H^TW] =E[θ+(HTH)1HTW] = θ + E [ ( H T H ) − 1 H T W ] =\theta+E[(H^TH)^{-1}H^TW] =θ+E[(HTH)1HTW]其中 ( H T H ) − 1 H T 为 常 数 (H^TH)^{-1}H^T为常数 (HTH)1HT,所以 E ( θ L S ) = θ + ( H T H ) − 1 H T E [ W ] E(\theta_{LS})=\theta+(H^TH)^{-1}H^TE[W] E(θLS)=θ+(HTH)1HTE[W] W W W为白噪声,则 E ( θ L S ) = θ E(\theta_{LS})=\theta E(θLS)=θ. E ( θ L S ) E(\theta_{LS}) E(θLS) θ \theta θ的无偏估计.
或当噪声向量 W W W的均值为0,且与 H H H无关时, E ( θ L S ) E(\theta_{LS}) E(θLS) θ \theta θ的无偏估计.

2.估计误差协方差定理

对一个系统 Y = H θ + W Y=H\theta+W Y=Hθ+W,设噪声向量 W W W的均值为零,协方差矩阵 c o v [ W ] = R v cov[W]=R_v cov[W]=Rv,且 W W W H H H相互独立,则参数估计误差 θ L S ~ = θ L S − θ \tilde{\theta_{LS}}=\theta_{LS}-\theta θLS~=θLSθ的协方差矩阵为 c o v [ θ L S ~ ] = E [ ( H T H ) − 1 H T R v H ( H T H ) − 1 ] cov[\tilde{\theta_{LS}}]=E[(H^TH)^{-1}H^TR_vH(H^TH)^{-1}] cov[θLS~]=E[(HTH)1HTRvH(HTH)1]
c o v [ θ L S ~ ] = σ 2 E [ ( H T H ) − 1 ] cov[\tilde{\theta_{LS}}]=\sigma^2E[(H^TH)^{-1}] cov[θLS~]=σ2E[(HTH)1]
如果 W W W是一白噪声序列,且其方差为 σ 2 \sigma^2 σ2,则 c o v [ θ L S ~ ] = σ 2 E [ ( H T H ) − 1 ] cov[\tilde{\theta_{LS}}]=\sigma^2E[(H^TH)^{-1}] cov[θLS~]=σ2E[(HTH)1]

3.噪声方差估计定理

对一个系统 Y = H θ + W Y=H\theta+W Y=Hθ+W,设 W W W H H H是统计独立的零均值白噪声向量, W W W的分量为零均值白噪声向量 v ( t ) v(t) v(t),则v(t)的方差 σ 2 \sigma^2 σ2的估计为: σ 2 ^ = J [ θ L S ~ ] t − n , t 充 分 大 时 \hat{\sigma^2}=\frac{J[\tilde{\theta_{LS}}]}{t-n},t充分大时 σ2^=tnJ[θLS~],t其中 n : = d i m θ = θ 的 维 数 n:=dim\theta=\theta的维数 n:=dimθ=θ

五.常用的各类最小二乘辨识算法

1.递推最小二乘辨识

适用模型
受控自回归模型(ARX): A ( z ) y ( t ) = B ( z ) u ( t ) + v ( t ) A(z)y(t)=B(z)u(t)+v(t) A(z)y(t)=B(z)u(t)+v(t)
将上述模型写为辨识模型的形式: Y = H θ + W Y=H\theta+W Y=Hθ+W
递推最小二乘的算法如下: θ ^ ( t ) = θ ^ ( t − 1 ) + L ( t ) [ y ( t ) − φ T ( t ) θ ^ ( t − 1 ) ] \hat\theta(t)=\hat\theta(t-1)+L(t)[y(t)-\varphi^T(t)\hat\theta(t-1)] θ^(t)=θ^(t1)+L(t)[y(t)φT(t)θ^(t1)] L ( t ) = P ( t − 1 ) φ ( t ) 1 + φ T ( t ) P ( t − 1 ) φ ( t ) L(t)=\frac{P(t-1)\varphi(t)}{1+\varphi^T(t)P(t-1)\varphi(t)} L(t)=1+φT(t)P(t1)φ(t)P(t1)φ(t) P ( t ) = [ I − L ( t ) φ T ( t ) ] P ( t − 1 ) , P ( 0 ) = p 0 I P(t)=[I-L(t)\varphi^T(t)]P(t-1),P(0)=p_0I P(t)=[IL(t)φT(t)]P(t1),P(0)=p0I φ ( t ) = [ − y ( t − 1 ) , − y ( t − 2 ) . . . . , − y ( t − n a ) , u ( t − 1 ) , u ( t − 2 ) , . . . . . u ( t − n b ) ] \varphi(t)=[-y(t-1) ,-y(t-2)....,-y(t-n_a),u(t-1),u(t-2),.....u(t-n_b)] φ(t)=[y(t1),y(t2)....,y(tna),u(t1),u(t2),.....u(tnb)]
计算顺序如下:
P ( 0 ) − > L ( 1 ) − > θ ^ ( 1 ) − > P ( 1 ) − > L ( 1 ) − > θ ^ ( 2 ) − > . . . . . P(0)->L(1)->\hat\theta(1)->P(1)->L(1)->\hat\theta(2)->..... P(0)>L(1)>θ^(1)>P(1)>L(1)>θ^(2)>.....
其中P(0)一般取 1 0 6 10^6 106数量级.

2.带遗忘因子最小二乘系统辨识

适用模型
受控自回归模型(ARX): A ( z ) y ( t ) = B ( z ) u ( t ) + v ( t ) A(z)y(t)=B(z)u(t)+v(t) A(z)y(t)=B(z)u(t)+v(t)
将上述模型写为辨识模型的形式: Y = H θ + W Y=H\theta+W Y=Hθ+W.
算法如下:
θ ^ ( t ) = θ ^ ( t − 1 ) + L ( t ) [ y ( t ) − φ T ( t ) θ ^ ( t − 1 ) ] \hat\theta(t)=\hat\theta(t-1)+L(t)[y(t)-\varphi^T(t)\hat\theta(t-1)] θ^(t)=θ^(t1)+L(t)[y(t)φT(t)θ^(t1)] L ( t ) = P ( t − 1 ) φ ( t ) λ + φ T ( t ) P ( t − 1 ) φ ( t ) L(t)=\frac{P(t-1)\varphi(t)}{\lambda+\varphi^T(t)P(t-1)\varphi(t)} L(t)=λ+φT(t)P(t1)φ(t)P(t1)φ(t) P ( t ) = 1 λ [ I − L ( t ) φ T ( t ) ] P ( t − 1 ) , P ( 0 ) = p 0 I P(t)=\frac{1}{\lambda}[I-L(t)\varphi^T(t)]P(t-1),P(0)=p_0I P(t)=λ1[IL(t)φT(t)]P(t1),P(0)=p0I
λ \lambda λ一般取0.9~1,当 λ \lambda λ取1时即为标准最小二乘算法.

3.新息与残差之间的关系

新息: e ( t ) = y ( t ) − φ T ( t ) θ ^ ( t − 1 ) e(t)=y(t)-\varphi^T(t)\hat\theta(t-1) e(t)=y(t)φT(t)θ^(t1)
残差: ε ( t ) = y ( t ) − φ T ( t ) θ ^ ( t ) \varepsilon(t)=y(t)-\varphi^T(t)\hat\theta(t) ε(t)=y(t)φT(t)θ^(t)
e ( t ) = [ 1 + 1 λ φ T ( t ) θ ^ ( t ) ] ε ( t ) e(t)=[1+\frac{1}{\lambda}\varphi^T(t)\hat\theta(t)]\varepsilon(t) e(t)=[1+λ1φT(t)θ^(t)]ε(t)

4.有限数据窗最小二乘系统辨识

适用模型
受控自回归模型(ARX): A ( z ) y ( t ) = B ( z ) u ( t ) + v ( t ) A(z)y(t)=B(z)u(t)+v(t) A(z)y(t)=B(z)u(t)+v(t)
将上述模型写为辨识模型的形式: Y = H θ + W Y=H\theta+W Y=Hθ+W.
算法如下:
θ ^ ( t ) = θ ^ ( t − 1 ) + P ( t ) [ φ ( t ) , − φ ( t − p ) ] [ y ( t ) − φ T ( t ) θ ^ ( t − 1 ) , y ( t − p ) − φ T ( t − p ) θ ^ ( t − 1 ) ] T \hat\theta(t)=\hat\theta(t-1)+P(t)[\varphi(t),-\varphi(t-p)][y(t)-\varphi^T(t)\hat\theta(t-1),y(t-p)-\varphi^T(t-p)\hat\theta(t-1)]^T θ^(t)=θ^(t1)+P(t)[φ(t),φ(tp)][y(t)φT(t)θ^(t1),y(tp)φT(tp)θ^(t1)]T Q ( t ) = P ( t − 1 ) − P ( t − 1 ) φ ( t ) φ T ( t ) P ( t − 1 ) 1 + φ T ( t ) P ( t − 1 ) φ ( t ) Q(t)=P(t-1)-\frac{P(t-1)\varphi(t)\varphi^T(t)P(t-1)}{1+\varphi^T(t)P(t-1)\varphi(t)} Q(t)=P(t1)1+φT(t)P(t1)φ(t)P(t1)φ(t)φT(t)P(t1) P ( t ) = Q ( t ) + Q ( t ) φ ( t − p ) φ T ( t − p ) Q ( t ) 1 − φ T ( t − p ) Q ( t ) φ ( t − p ) P(t)=Q(t)+\frac{Q(t)\varphi(t-p)\varphi^T(t-p)Q(t)}{1-\varphi^T(t-p)Q(t)\varphi(t-p)} P(t)=Q(t)+1φT(tp)Q(t)φ(tp)Q(t)φ(tp)φT(tp)Q(t)

5.带遗忘因子的有限数据窗最小二乘算法

适用模型
受控自回归模型(ARX): A ( z ) y ( t ) = B ( z ) u ( t ) + v ( t ) A(z)y(t)=B(z)u(t)+v(t) A(z)y(t)=B(z)u(t)+v(t)
将上述模型写为辨识模型的形式: Y = H θ + W Y=H\theta+W Y=Hθ+W.
θ ^ ( t ) = α ( t − 1 ) + P ( t ) φ ( t ) [ y ( t ) − φ T ( t ) α ( t − 1 ) ] \hat\theta(t)=\alpha(t-1)+P(t)\varphi(t)[y(t)-\varphi^T(t)\alpha(t-1)] θ^(t)=α(t1)+P(t)φ(t)[y(t)φT(t)α(t1)] P ( t ) = 1 λ [ P α ( t − 1 ) − P α ( t − 1 ) φ ( t ) φ T ( t ) P α ( t − 1 ) λ + φ T ( t ) P α ( t − 1 ) φ ( t ) ] P(t)=\frac{1}{\lambda}[P_{\alpha}(t-1)-\frac{P_{\alpha}(t-1)\varphi(t)\varphi^T(t)P_\alpha(t-1)}{\lambda+\varphi^T(t)P_{\alpha}(t-1)\varphi(t)}] P(t)=λ1[Pα(t1)λ+φT(t)Pα(t1)φ(t)Pα(t1)φ(t)φT(t)Pα(t1)] α ( t − 1 ) = θ ^ ( t − 1 ) − λ p − 1 P α ( t − 1 ) φ ( t − p ) [ y ( t ) − φ T ( t − p ) θ ^ ( t − 1 ) ] \alpha(t-1)=\hat\theta(t-1)-\lambda^{p-1}P_{\alpha}(t-1)\varphi(t-p)[y(t)-\varphi^T(t-p)\hat\theta(t-1)] α(t1)=θ^(t1)λp1Pα(t1)φ(tp)[y(t)φT(tp)θ^(t1)] P α ( t − 1 ) = P ( t − 1 ) + P α ( t − 1 ) φ ( t − p ) φ T ( t − p ) P α ( t − 1 ) λ − 1 − φ T ( t − p ) P α ( t − 1 ) φ ( t − p ) P_{\alpha}(t-1)=P(t-1)+\frac{P_{\alpha}(t-1)\varphi(t-p)\varphi^T(t-p)P_\alpha(t-1)}{\lambda^{-1}-\varphi^T(t-p)P_{\alpha}(t-1)\varphi(t-p)} Pα(t1)=P(t1)+λ1φT(tp)Pα(t1)φ(tp)Pα(t1)φ(tp)φT(tp)Pα(t1)

最小二乘法系统辨识小结_第1张图片

你可能感兴趣的:(控制算法)