摘要——本文提供了一种基于线性矩阵不等式(LMI)的程序,用于估算多变量超扭曲算法(MSTA)的到达时间,该算法处理凸有界参数不确定性和外源干扰,后者具有范数有界的时间导数。对于一类Lyapunov函数,我们能够确定从一个出乎意料的简单数学规划问题中得到的最优到达时间估计。至于到达时间估计和验证,与考虑的Lyapunov函数类相关的最坏输入干扰已被完全表征。通过文献中的示例讨论了理论结果的影响。
关键词——MSTA,到达时间估计,鲁棒性,有限时间收敛。
超扭曲算法(STA)由Levant在开创性论文[1]中提出。迄今为止,STA的巨大兴趣体现在关于其理论和在不确定系统控制与观测中的实际应用的众多出版物中。STA基于更高阶滑模(HOSM)的概念,包含在有限时间后,不仅是滑模变量σ,还包括其导数到某个阶数n的零化。通常,HOSM控制器的实现需要可测滑模变量σ(t)的导数,直到阶数n。STA的例外在于,它能够在不使用这些导数的情况下产生SOSM[2]。
STA之所以吸引人,是因为类似于经典的一级滑模(FOSM)控制,它在存在一定类别的不确定干扰的情况下也能实现有限时间稳定。与FOSM产生的非连续切换控制相比,STA提供了一个连续的控制信号。这引发了使用STA消除抖动的期望[3]–[5]。然而,这种期望在理论和实践中都未得到证实,其相对于传统FOSM的优势或劣势仍然是讨论的主题[6]–[8]。尽管存在争议,对STA控制的持久兴趣是不容置疑的。
本文考虑了一个相关问题:如何估算到达时间,即确定Tr,一个从给定初始条件开始,收敛到零并在所有未来时间保持零的时间间隔的上界[9]。在[9]–[13]中为标量情况,和在[14]–[16]中为特定的多变量情况(标量已知增益)开发了一些估算STA这一重要特性的解决方案。
文献中普遍忽视了干扰的初始条件,其影响一般集中在其导数或Lipschitz常数上。实际上,干扰的初始条件可能导致完全不同的到达时间。这也表明,虽然步进干扰在不连续性处不会改变干扰导数,但可以导致植物输出的大幅波动。相比之下,传统的SMC能够拒绝这种干扰。这是使用STA中连续控制信号的代价。
我们提出的到达时间估算方法基于从“严格”Lyapunov函数类[17]中导出的线性矩阵不等式(LMI)的公式。LMI的解,已知在数值上具有吸引力,允许计算所考虑的Lyapunov函数类的最优Tr。验证表明,这一估计显著优于许多之前引用的方法,除了[12]中也给出了最优的标量STA到达时间估计外。
本文的主要贡献可以总结为以下几个互补的方面,基于通过凸优化问题表达的设计条件:
• 处理了一般MSTA,受到凸有界参数不确定性和外源有界干扰的影响。对于采用的Lyapunov函数类,确定了最优到达时间。
• 对“最坏”干扰进行了全面表征,以揭示未知干扰对STA控制策略导致的到达时间恶化的实际影响。
重要的是要强调,LMI方法允许考虑矩阵增益,而不仅仅是[15, 18]中的标量增益,以及输入矩阵中的多面体不确定性。
A. 符号说明
对于实对称矩阵,最小特征值用 ρ ( ⋅ ) \rho (·) ρ(⋅)表示。对于实方阵,第j个特征值用 ρ j ( ⋅ ) \rho_j(·) ρj(⋅)表示。采用Filippov对不连续微分方程解的定义[19]。见[20]以补充符号说明。
考虑一个不确定的MIMO系统,描述为
σ ˙ = B u + f ( t ) (1) \dot{\sigma} = Bu + f(t) \tag{1} σ˙=Bu+f(t)(1)
其中, σ ∈ R n \sigma \in \mathbb{R}^n σ∈Rn是状态向量, u ∈ R m u \in \mathbb{R}^m u∈Rm是系统输入, B ∈ R n × m B \in \mathbb{R}^n×m B∈Rn×m是不确定的输入矩阵, f ( t ) : R ∈ R + → ∈ R n f(t) : R\in \mathbb{R}^+ → \in \mathbb{R}^n f(t):R∈R+→∈Rn是不确定的干扰。在[20]中,最近开发了一种新的设计程序,能够处理形式为
u = K 1 σ ∥ σ ∥ + K 2 η , η ˙ = σ ∥ σ ∥ (2) u = K_1 \frac{\sigma}{\| \sigma \|} + K_2 \eta, \quad \dot{\eta} = \frac{\sigma}{\| \sigma \|} \tag{2} u=K1∥σ∥σ+K2η,η˙=∥σ∥σ(2)
的MIMO超扭曲控制,其中 η ∈ R n η \in \mathbb{R}^n η∈Rn, K = [ K 1 ; K 2 ] ∈ R m × 2 n K = [K_1 ; K_2] \in \mathbb{R}^{m×2n} K=[K1;K2]∈Rm×2n是控制增益。已经给出了存在性条件以及确定上述控制增益的条件,前提是:
其中 δ δ δ是一个正的常量。
因此,暂时假设控制增益已知。将 (2) 代入 (1) 得到闭环系统,描述为
σ ˙ = B K 1 σ ∥ σ ∥ + B K 2 η + f ( t ) , η ˙ = σ ∥ σ ∥ (4) \dot{\sigma} = BK_1 \frac{\sigma}{\| \sigma \|} + BK_2 \eta + f(t), \quad \dot{\eta} = \frac{\sigma}{\| \sigma \|} \tag{4} σ˙=BK1∥σ∥σ+BK2η+f(t),η˙=∥σ∥σ(4)
通常情况下,在控制合成中不直接处理。实际上,假设矩阵 B K 2 ∈ R n × n BK_2 \in \mathbb{R}^n×n BK2∈Rn×n是非奇异的[20],对不确定输入矩阵 B ∈ B B \in \mathcal{B} B∈B和外源干扰 f ( t ) f(t) f(t)进行一对一的变量变换
( σ z ) ⇔ ( σ η + ( B K 2 ) − 1 f ) (5) \begin{pmatrix} \sigma \\ z \end{pmatrix} \Leftrightarrow \begin{pmatrix} \sigma \\ \eta + (BK_2)^{-1} f \end{pmatrix} \tag{5} (σz)⇔(ση+(BK2)−1f)(5)
将会被应用。这个观察及其后果将在接下来的部分中深入探讨。采用变量变换 (5) 可以很快验证,闭环系统 (4) 变成
σ ˙ = B K 1 σ ∥ σ ∥ + B K 2 z (6) \dot{\sigma} = BK_1 \frac{\sigma}{\| \sigma \|} + BK_2 z \tag{6} σ˙=BK1∥σ∥σ+BK2z(6)
z ˙ = σ ∥ σ ∥ + w ∥ σ ∥ (7) \dot{z} = \frac{\sigma}{\| \sigma \|} + \frac{w}{\| \sigma \|} \tag{7} z˙=∥σ∥σ+∥σ∥w(7)
其中, w ( t ) = 1 ∣ σ ∣ ( B K 2 ) − 1 f ˙ ( t ) w(t) = \sqrt{\frac{1}{| \sigma |}} (BK_2)^{-1} \dot{f}(t) w(t)=∣σ∣1(BK2)−1f˙(t)。此外,对于给定的 γ > 0 γ > 0 γ>0,如果范数界限约束 (3) 满足 δ = ∣ ( B K 2 ) − 1 ∣ − 1 γ − 1 δ = | (BK_2)^{-1} |^{-1} γ^{-1} δ=∣(BK2)−1∣−1γ−1,则 w T w ≤ ∣ σ ∣ γ − 2 w^T w \leq | \sigma | γ^{-2} wTw≤∣σ∣γ−2。定义状态变量 x = [ σ T ; z T ] T ∈ R 2 n x = [\sigma^T ; z^T]^T \in \mathbb{R}^{2n} x=[σT;zT]T∈R2n,闭环系统被重新写为以下紧凑形式
x ˙ = L ( σ ) A K R ( σ ) x + L ( σ ) F 0 w (8) \dot{x} = L(\sigma) A_K R(\sigma) x + L(\sigma) F_0 w \tag{8} x˙=L(σ)AKR(σ)x+L(σ)F0w(8)
其中 F 0 = [ 0 ; I n ] T ∈ R 2 n × n F_0 = [0 ; I_n]^T \in \mathbb{R}^{2n×n} F0=[0;In]T∈R2n×n, L ( σ ) = diag ( I n , I n / ∣ σ ∣ ) L(\sigma) = \text{diag}(I_n, I_n / \sqrt{| \sigma |}) L(σ)=diag(In,In/∣σ∣), R ( σ ) = diag ( I n / ∣ σ ∣ , I n ) R(\sigma) = \text{diag}(I_n / \sqrt{| \sigma |}, I_n) R(σ)=diag(In/∣σ∣,In),以及
A K = ( B K 1 B K 2 I n 0 ) ∈ R 2 n × 2 n (9) A_K = \begin{pmatrix} BK_1 & BK_2 \\ I_n & 0 \end{pmatrix} ∈ R^{2n×2n} \tag{9} AK=(BK1InBK20)∈R2n×2n(9)
这突显了矩阵 B ∈ B B \in \mathcal{B} B∈B中的,不确定性在闭环矩阵 A K ∈ A K A_K \in \mathbb{A}_K AK∈AK中的反映,其中紧集 A K = c o { A K i } i ∈ K \mathbb{A}_K = co\{ A_{K_i} \}_{i \in K} AK=co{AKi}i∈K可以从 (9) 和 B 的极端矩阵中很容易确定。注意 L ( σ ) L(\sigma) L(σ)和 R ( σ ) R(\sigma) R(σ)对所有 σ ≠ 0 σ ≠ 0 σ=0是良定义的正定矩阵。
本文的目标有两个。首先,提供了与闭环系统 (8) 的任意初始条件 x ( 0 ) = x 0 ∈ R 2 n x(0) = x_0 \in \mathbb{R}^{2n} x(0)=x0∈R2n相关的最优到达时间估计 T r ( x 0 ) Tr(x_0) Tr(x0)。此外,评估和讨论了输入矩阵 B 和外源干扰 f(t) 中的不确定性对与未经变换的闭环系统 (4) 相关的到达时间估计值的影响。其次,为了评估所提出的到达时间估计的精度,特征化和确定最坏干扰 f ∗ ( t ) f^*(t) f∗(t)作为优化后的任务。
我们采用以下李雅普诺夫函数候选形式:
V ( x ) = ξ ( x ) T P ξ ( x ) (10) V(x) = \xi(x)^T P \xi(x) \tag{10} V(x)=ξ(x)TPξ(x)(10)
其中, P ∈ R 2 n × 2 n P \in \mathbb{R}^{2n \times 2n} P∈R2n×2n是待确定的对称正定矩阵, ξ ( x ) = R ( σ ) x \xi(x) = R(\sigma)x ξ(x)=R(σ)x。为了理论上得出关于有限时间稳定性的可靠结论,可以验证李雅普诺夫函数 V ( x ) V(x) V(x)在 x ≠ 0 x \neq 0 x=0时是连续的,并且设定 V ( 0 ) = 0 V(0) = 0 V(0)=0时,它是正定且处处连续的。此外,它是径向无界的,并且在集合 S = { x ∈ R 2 n ∣ σ = 0 } S = \{ x \in \mathbb{R}^{2n} \mid \sigma = 0 \} S={x∈R2n∣σ=0}上除外,其他地方都是可微的。以下引理对于获得在下一部分中报告的结果尤为重要。引理 1:设矩阵 G 0 = [ I n 0 ] ∈ R n × 2 n G_0 = [I_n \; 0] \in \mathbb{R}^{n \times 2n} G0=[In0]∈Rn×2n,以及对称矩阵 0 < W ∈ R 2 n × 2 n 0 < W \in \mathbb{R}^{2n \times 2n} 0<W∈R2n×2n, 0 < P ∈ R 2 n × 2 n 0 < P \in \mathbb{R}^{2n \times 2n} 0<P∈R2n×2n给定。函数 h ( ξ ) g ( ξ ) : R 2 n → R + h(\xi) g(\xi) : \mathbb{R}^{2n} \to \mathbb{R}^+ h(ξ)g(ξ):R2n→R+其中
h ( ξ ) = ξ T G 0 T G 0 ξ ξ T W ξ , g ( ξ ) = ξ T P ξ ξ T W ξ (11) h(\xi) = \frac{\xi^T G_0^T G_0 \xi}{\xi^T W \xi}, \quad g(\xi) = \frac{\xi^T P \xi}{\xi^T W \xi} \tag{11} h(ξ)=ξTWξξTG0TG0ξ,g(ξ)=ξTWξξTPξ(11)
对于所有 0 ≠ ξ ∈ R 2 n 0 \neq \xi \in \mathbb{R}^{2n} 0=ξ∈R2n都是良定义的。对于所有正标量 ω > 0 \omega > 0 ω>0和 ρ > 0 \rho > 0 ρ>0,如果 LMI
[ ω W − ρ P G 0 G 0 T ρ I n ] > 0 (12) \begin{bmatrix} \omega W - \rho P & \; G_0 \\ G_0^T & \; \rho I_n \end{bmatrix}> 0 \tag{12} [ωW−ρPG0TG0ρIn]>0(12)
成立,则有
2 h ( ξ ) g ( ξ ) < ω , ∀ 0 ≠ ξ ∈ R 2 n 2 \sqrt{h(\xi) g(\xi)} < \omega, \quad \forall 0 \neq \xi \in \mathbb{R}^{2n} 2h(ξ)g(ξ)<ω,∀0=ξ∈R2n
此外,等式
max 0 ≠ ξ 2 h ( ξ ) g ( ξ ) = inf ω { ω ∣ ( 12 ) } (13) \max_{0 \neq \xi} 2 \sqrt{h(\xi) g(\xi)} = \inf_{\omega} \{ \omega \mid (12) \} \tag{13} 0=ξmax2h(ξ)g(ξ)=ωinf{ω∣(12)}(13)
也成立。
证明:证明的第一部分可以从以下观察中得出:对于所有 ξ ≠ 0 \xi \neq 0 ξ=0, h ( ξ ) ≥ 0 h(\xi) \geq 0 h(ξ)≥0, g ( ξ ) > 0 g(\xi) > 0 g(ξ)>0和 ξ T W ξ > 0 \xi^T W \xi > 0 ξTWξ>0,这些条件共同表明所考虑的函数确实是良定义的。此外,对 ρ \rho ρ进行微分表明,等式
inf ρ > 0 ( ρ − 1 h ( ξ ) + ρ g ( ξ ) ) = 2 h ( ξ ) g ( ξ ) (14) \inf_{\rho > 0} \left( \rho^{-1} h(\xi) + \rho g(\xi) \right) \\ = 2 \sqrt{h(\xi) g(\xi)} \tag{14} ρ>0inf(ρ−1h(ξ)+ρg(ξ))=2h(ξ)g(ξ)(14)
成立,因此,结果是
2 h ( ξ ) g ( ξ ) ≤ ρ − 1 h ( ξ ) + ρ g ( ξ ) = ξ T ( ρ − 1 G 0 T G 0 + ρ P ) ξ ξ T W ξ < ω (15) 2 \sqrt{h(\xi) g(\xi)} \leq \rho^{-1} h(\xi) + \rho g(\xi) \\ = \frac{\xi^T \left( \rho^{-1} G_0^T G_0 + \rho P \right) \xi}{\xi^T W \xi} < \omega \tag{15} 2h(ξ)g(ξ)≤ρ−1h(ξ)+ρg(ξ)=ξTWξξT(ρ−1G0TG0+ρP)ξ<ω(15)
对于所有 0 ≠ ξ ∈ R 2 n 0 \neq \xi \in \mathbb{R}^{2n} 0=ξ∈R2n成立,因为 (15) 中的最后不等式源于 (12) 的第二主对角元素的舒尔补。基于这个上界,剩下的任务是证明如果 ξ ∗ ≠ 0 \xi^* \neq 0 ξ∗=0解决了 (13) 左侧的问题,并且 ( ω ∗ , ρ ∗ ) (\omega^*, \rho^*) (ω∗,ρ∗)解决了右侧的问题,则 ω ∗ > 0 \omega^* > 0 ω∗>0任意接近于 2 h ( ξ ∗ ) g ( ξ ∗ ) 2 \sqrt{h(\xi^*) g(\xi^*)} 2h(ξ∗)g(ξ∗)。为此,注意可以始终调整一个正标量 r > 0 r > 0 r>0使得 q ∗ = ξ ∗ / r q^* = \xi^* / \sqrt{r} q∗=ξ∗/r时有 q ∗ T W q ∗ = 1 q^{*T} W q^* = 1 q∗TWq∗=1,因此满足等式2 h ( ξ ∗ ) g ( ξ ∗ ) = 2 ( q ∗ T G 0 T G 0 q ∗ ) ( q ∗ T P q ∗ ) \sqrt{h(\xi^*) g(\xi^*)} = 2 \sqrt{(q^{*T} G_0^T G_0 q^*)(q^{*T} P q^*)} h(ξ∗)g(ξ∗)=2(q∗TG0TG0q∗)(q∗TPq∗)
舒尔补法对于不等式 (12) 的第二主对角元素有
inf ω { ω ∣ ( 12 ) } = inf ρ > 0 max q T W q = 1 q T ( ρ − 1 G 0 T G 0 + ρ P ) q = inf ρ > 0 φ ( ρ ) = ω ∗ (16) \inf_{\omega} \{ \omega \mid (12) \} = \inf_{\rho > 0} \max_{q^T W q = 1} q^T \left( \rho^{-1} G_0^T G_0 + \rho P \right) q \\ = \inf_{\rho > 0} \varphi(\rho) = \omega^* \tag{16} ωinf{ω∣(12)}=ρ>0infqTWq=1maxqT(ρ−1G0TG0+ρP)q=ρ>0infφ(ρ)=ω∗(16)
其中凸函数
φ ( ρ ) = max q T W q = 1 q T ( ρ − 1 G 0 T G 0 + ρ P ) q (17) \varphi(\rho) = \max_{q^T W q = 1} q^T \left( \rho^{-1} G_0^T G_0 + \rho P \right) q \tag{17} φ(ρ)=qTWq=1maxqT(ρ−1G0TG0+ρP)q(17)
定义域是 ρ > 0 \rho > 0 ρ>0。该函数满足 Danskin 定理的要求(见 [21]),以表征 (16) 的最优性,即 0 ∈ ∂ φ ( ρ ∗ ) 0 \in \partial \varphi(\rho^*) 0∈∂φ(ρ∗),其中 ∂ φ ( ρ ) \partial \varphi(\rho) ∂φ(ρ)是在点 ρ > 0 \rho > 0 ρ>0的次梯度集。记 Q ( ρ ) Q(\rho) Q(ρ)为 (17) 的所有最优解集,我们有
∂ φ ( ρ ) = co { − ρ − 2 q T G 0 T G 0 q + q T P q : q ∈ Q ( ρ ) } = − ρ − 2 tr ( Q G 0 T G 0 ) + tr ( Q P ) (18) \partial \varphi(\rho) = \text{co} \left\{ -\rho^{-2} q^T G_0^T G_0 q + q^T P q : q \in Q(\rho) \right\} \\ = -\rho^{-2} \text{tr}(Q G_0^T G_0) + \text{tr}(Q P) \tag{18} ∂φ(ρ)=co{−ρ−2qTG0TG0q+qTPq:q∈Q(ρ)}=−ρ−2tr(QG0TG0)+tr(QP)(18)
其中 Q ∈ co { q q T : q ∈ Q ( ρ ) } Q \in \text{co} \{ q q^T : q \in Q(\rho) \} Q∈co{qqT:q∈Q(ρ)}。另一方面,由于定义上 φ ( ρ ) \varphi(\rho) φ(ρ)对所有 q ∈ Q ( ρ ) q \in Q(\rho) q∈Q(ρ)是常数,因此我们可以看到
φ ( ρ ) = ρ − 1 tr ( Q G 0 T G 0 ) + ρ tr ( Q P ) (19) \varphi(\rho) = \rho^{-1} \text{tr}(Q G_0^T G_0) + \rho \text{tr}(Q P) \tag{19} φ(ρ)=ρ−1tr(QG0TG0)+ρtr(QP)(19)
对于所有满足 tr ( Q W ) = 1 \text{tr}(Q W) = 1 tr(QW)=1的可行 Q ≥ 0 Q \geq 0 Q≥0。从 (18) 可以得出最优性条件 0 ∈ ∂ φ ( ρ ∗ ) 0 \in \partial \varphi(\rho^*) 0∈∂φ(ρ∗)确定了最优解 ρ ∗ > 0 \rho^* > 0 ρ∗>0,结合 (19) 得到
φ ( ρ ∗ ) = 2 tr ( Q G 0 T G 0 ) tr ( Q P ) = 2 ( q ∗ T G 0 T G 0 q ∗ ) ( q ∗ T P q ∗ ) (20) \varphi(\rho^*) = 2 \sqrt{ \text{tr}(Q G_0^T G_0) \text{tr}(Q P) } \\ = 2 \sqrt{ (q^{*^T} G_0^T G_0 q^*) (q^{*T} P q^*) } \tag{20} φ(ρ∗)=2tr(QG0TG0)tr(QP)=2(q∗TG0TG0q∗)(q∗TPq∗)(20)
其中第二个等式是因为选择了 Q = q ∗ q ∗ T Q = q^* q^{*T} Q=q∗q∗T且 q ∗ ∈ Q ( ρ ∗ ) q^* \in Q(\rho^*) q∗∈Q(ρ∗),从而完成了证明。引理 1 的证明具有构造性,因为它提供了每个问题的最优解。实际上,通过线性搜索过程确定了最优的 ω ∗ \omega^* ω∗,因为对于每个 ρ > 0 \rho > 0 ρ>0,通过求解一个广义特征值问题来计算 φ ( ρ ) \varphi(\rho) φ(ρ)的值。一旦找到 ρ ∗ > 0 \rho^* > 0 ρ∗>0,最大广义特征值等于 ω ∗ \omega^* ω∗,相关的广义特征向量提供 q ∗ ∈ Q ( ρ ∗ ) q^* \in Q(\rho^*) q∗∈Q(ρ∗)。
引理 1 的结果不会在后续的计算中引入任何形式的保守性。在当前框架下,它提供了可以通过李雅普诺夫函数 (10) 确定的最佳到达时间估计。
引理 2:设标量 κ > 0 \kappa > 0 κ>0和矩阵 P > 0 P > 0 P>0给定。考虑 Δ x = [ 0 Δ z T ] T = F 0 Δ z \Delta x = [0 \; \Delta z^T]^T = F_0 \Delta z Δx=[0ΔzT]T=F0Δz和 LMI
[ θ − ζ κ 2 0 0 ζ I n ] > [ ξ ( x ) T F 0 T ] P [ ξ ( x ) T F 0 T ] T (21) \begin{bmatrix} \theta - \zeta \kappa^2 & 0 \\ 0 & \zeta I_n \end{bmatrix}> \begin{bmatrix} \xi(x)^T F_0^T \\ \end{bmatrix} P \begin{bmatrix} \xi(x)^T F_0^T \end{bmatrix}^T \tag{21} [θ−ζκ200ζIn]>[ξ(x)TF0T]P[ξ(x)TF0T]T(21)
对于所有 ∥ Δ z ∥ ≤ κ \|\Delta z\| \leq \kappa ∥Δz∥≤κ,有上界
V ( x + Δ x ) ≤ inf θ { θ ∣ ( 21 ) } (22) V(x + \Delta x) \leq \inf_{\theta} \{ \theta \mid (21) \} \tag{22} V(x+Δx)≤θinf{θ∣(21)}(22)
证明: 简单的代数运算表明
V ( x + Δ x ) = V ( x ) + 2 ξ ( x ) T P F 0 Δ z + Δ z T F 0 T P F 0 Δ z (23) V(x + \Delta x) = V(x) + 2 \xi(x)^T P F_0 \Delta z + \Delta z^T F_0^T P F_0 \Delta z \tag{23} V(x+Δx)=V(x)+2ξ(x)TPF0Δz+ΔzTF0TPF0Δz(23)
这表明可以通过二次规划问题的最优解确定一个紧的上界:
最小化标量 θ \theta θ,使得
V ( x ) + 2 ξ ( x ) T P F 0 Δ z + Δ z T F 0 T P F 0 Δ z < θ (24) V(x) + 2 \xi(x)^T P F_0 \Delta z + \Delta z^T F_0^T P F_0 \Delta z < \theta \tag{24} V(x)+2ξ(x)TPF0Δz+ΔzTF0TPF0Δz<θ(24)
对于所有 ∥ Δ z ∥ ≤ κ \|\Delta z\| \leq \kappa ∥Δz∥≤κ成立。著名的 S 程序(见 [22])是一种适合解决这类问题的技术。它说明当且仅当能够确定一个标量 ζ > 0 \zeta > 0 ζ>0使得
V ( x ) + 2 ξ ( x ) T P F 0 Δ z + Δ z T F 0 T P F 0 Δ z − θ < ζ ( ∥ Δ z ∥ 2 − κ 2 ) (25) V(x) + 2 \xi(x)^T P F_0 \Delta z + \Delta z^T F_0^T P F_0 \Delta z - \theta < \zeta \left( \|\Delta z\|^2 - \kappa^2 \right) \tag{25} V(x)+2ξ(x)TPF0Δz+ΔzTF0TPF0Δz−θ<ζ(∥Δz∥2−κ2)(25)
对于所有 Δ z ∈ R n \Delta z \in \mathbb{R}^n Δz∈Rn成立时,才存在解。通过将 (25) 左侧的所有项移到左边,可以明显地看出,我们必须施加条件 ζ I n > F 0 T P F 0 \zeta I_n > F_0^T P F_0 ζIn>F0TPF0以确保存在最大值,简单推导得到
Δ z = ( ζ I n − F 0 T P F 0 ) − 1 F 0 T P ξ ( x ) \Delta z = (\zeta I_n - F_0^T P F_0)^{-1} F_0^T P \xi(x) Δz=(ζIn−F0TPF0)−1F0TPξ(x)
因此,(25) 可以简化为
ξ ( x ) T P F 0 ( ζ I n − F 0 T P F 0 ) − 1 F 0 T P ξ ( x ) < θ − ζ κ 2 − ξ ( x ) T P ξ ( x ) (26) \xi(x)^T P F_0 (\zeta I_n - F_0^T P F_0)^{-1} F_0^T P \xi(x) < \theta - \zeta \kappa^2 - \xi(x)^T P \xi(x) \tag{26} ξ(x)TPF0(ζIn−F0TPF0)−1F0TPξ(x)<θ−ζκ2−ξ(x)TPξ(x)(26)
通过标准舒尔补法可以表达为 LMI (21),从而完成了证明。
如 [22] 中所述,S 程序是表征具有唯一约束的二次问题最优性的必要和充分条件,这正是引理 2 证明中处理的情况。因此,存在一个可行的 Δ z \Delta z Δz,使得 (22) 中的等式成立。此外,观察到如果 κ = 0 \kappa = 0 κ=0,最小上界等于 V ( x ) V(x) V(x),这确认了所提出的上界确实是紧的。另一方面,有趣的是,约束 (21) 对于正定矩阵 P > 0 P > 0 P>0是线性的。正如后续所见,这一属性在关注到达时间估计时非常有用。
我们现在可以通过确定合适的李雅普诺夫函数形式(10),并计算其沿着闭环系统(8)的任意解(假设存在)的时间导数来继续进行。这是通过直接应用 [20] 的结果,特别是定理 2,实现的,从而得出下述定理。
定理 1: 设控制增益 K ∈ R m × 2 n K \in \mathbb{R}^{m \times 2n} K∈Rm×2n给定。如果存在对称矩阵 0 < P ∈ R 2 n × 2 n 0 < P \in \mathbb{R}^{2n \times 2n} 0<P∈R2n×2n, 0 < W ∈ R 2 n × 2 n 0 < W \in \mathbb{R}^{2n \times 2n} 0<W∈R2n×2n和一个两块对角矩阵 0 < Z d ∈ R 2 n × 2 n 0 < Z_d \in \mathbb{R}^{2n \times 2n} 0<Zd∈R2n×2n,满足矩阵不等式
A T K P + P A K + P [ E 0 T F 0 T ] T Z d [ E 0 F 0 ] P + [ B K γ − 1 G 0 ] T Z d − 1 [ B K γ − 1 G 0 ] + W < 0 (27) A^T K P + P A K + P \begin{bmatrix} E^T_0 \\ F^T_0 \end{bmatrix}^T Z_d \begin{bmatrix} E_0 \\ F_0 \end{bmatrix} P + \\ \begin{bmatrix} B K \\ \gamma^{-1} G_0 \end{bmatrix}^T Z_d^{-1} \begin{bmatrix} B K \\ \gamma^{-1} G_0 \end{bmatrix} + W < 0 \tag{27} ATKP+PAK+P[E0TF0T]TZd[E0F0]P+[BKγ−1G0]TZd−1[BKγ−1G0]+W<0(27)
其中 E 0 = [ 1 2 I n 0 ] T ∈ R 2 n × n E_0 = \left[ \frac{1}{2} I_n \; 0 \right]^T \in \mathbb{R}^{2n \times n} E0=[21In0]T∈R2n×n,则闭环系统(8)是全局有限时间稳定的,且李雅普诺夫函数的时间导数满足
V ˙ ( x ) ≤ − 1 k σ ξ ( x ) T W ξ ( x ) (28) \dot{V}(x) \leq - \frac{1}{\sqrt{k_\sigma}} \xi(x)^T W \xi(x) \tag{28} V˙(x)≤−kσ1ξ(x)TWξ(x)(28)
对于任何外部干扰,前提是 ∥ w ∥ 2 ≤ k σ γ − 2 \|w\|_2 \leq k_\sigma \gamma^{-2} ∥w∥2≤kσγ−2。
证明: 见 [20]。证明省略。
我们可以揭示定理的两个重要后果。首先,适当的代数操作将不等式 (27) 转换为 LMI,可以通过数值方法轻松求解。第二个后果是,结合引理 1,可以对到达时间进行适当的估计。实际上,(28) 产生
V ˙ ≤ − ( ξ ( x ) T W ξ ( x ) ξ ( x ) T G 0 T G 0 ξ ( x ) ⋅ ξ ( x ) T W ξ ( x ) ξ ( x ) T P ξ ( x ) ) 1 / 2 V 1 / 2 = − 1 ω V 1 / 2 (29) \dot{V} \leq - \left( \frac{\xi(x)^T W \xi(x)}{\xi(x)^T G_0^T G_0 \xi(x)} \cdot \frac{\xi(x)^T W \xi(x)}{\xi(x)^T P \xi(x)} \right)^{1/2} V^{1/2} \\ = - \frac{1}{\sqrt{\omega}} V^{1/2} \tag{29} V˙≤−(ξ(x)TG0TG0ξ(x)ξ(x)TWξ(x)⋅ξ(x)TPξ(x)ξ(x)TWξ(x))1/2V1/2=−ω1V1/2(29)
这意味着到达时间满足
T r ( x 0 ) ≤ ω V ( x 0 ) = ξ ( x 0 ) T ( ω 2 P ) ξ ( x 0 ) (30) T_r(x_0) \leq \frac{\omega}{\sqrt{V(x_0)}} = \sqrt{\xi(x_0)^T (\omega^2 P) \xi(x_0)} \tag{30} Tr(x0)≤V(x0)ω=ξ(x0)T(ω2P)ξ(x0)(30)
因此,在当前背景下,最佳的到达时间估计来源于对 (30) 右侧的最小化,需满足适当的约束。为此,稍微滥用符号,我们考虑以下一一对应的变量变换:
{ ω 2 P , ω 2 Z d − 1 , ω 2 W , ω − 1 ρ } ⇔ { P , S d , W , ρ } (31) \left\{ \omega^2 P, \omega^2 Z_d^{-1}, \omega^2 W, \omega^{-1} \rho \right\} \Leftrightarrow \left\{ P, S_d, W, \rho \right\} \tag{31} {ω2P,ω2Zd−1,ω2W,ω−1ρ}⇔{P,Sd,W,ρ}(31)
将引理 1 的矩阵不等式 (12) 两边乘以 diag ( ω I n , I n / ω ) \text{diag}(\sqrt{\omega} I_n, I_n / \sqrt{\omega}) diag(ωIn,In/ω)转换为
[ W − ρ P ⋅ G 0 ρ I n ] > 0 (32) \begin{bmatrix} W - \rho P & \cdot G_0 \\ \rho I_n \end{bmatrix} > 0 \tag{32} [W−ρPρIn⋅G0]>0(32)
和将矩阵不等式 (27) 乘以 ω 2 \omega^2 ω2转换为一组 LMI,每个对应 B 的一个顶点,即
[ ( A K i P + P A K i + W ) + [ B i K γ − 1 G 0 ] T S d [ B i K γ − 1 G 0 ] ] [ E 0 T F 0 T ] P − S d < 0 (33) \begin{bmatrix} \left( A_{K_i} P + PA_{K_i} + W \right)+ \\ \begin{bmatrix} B_i K \\ \gamma^{-1} G_0 \end{bmatrix}^T S_d \begin{bmatrix} B_i K \\ \gamma^{-1} G_0 \end{bmatrix} \end{bmatrix} \begin{bmatrix} E_0^T \\ F_0^T \end{bmatrix} P - S_d < 0 \tag{33} (AKiP+PAKi+W)+[BiKγ−1G0]TSd[BiKγ−1G0] [E0TF0T]P−Sd<0(33)
对于所有 i ∈ K i \in K i∈K成立。因此,最佳的到达时间估计来自以下优化问题的最优解:
T r ( x 0 ) 2 ≤ inf P > 0 , W , S d , ρ { ξ ( x 0 ) T P ξ ( x 0 ) : (32) - (33) } (34) T_r(x_0)^2 \leq \inf_{P > 0, W, S_d, \rho} \left\{ \xi(x_0)^T P \xi(x_0) : \text{(32) - (33)} \right\} \tag{34} Tr(x0)2≤P>0,W,Sd,ρinf{ξ(x0)TPξ(x0):(32) - (33)}(34)
这考虑了 B 模型不确定性和外部干扰 f ( t ) f(t) f(t)。不幸的是,问题 (34) 由于约束 (32) 中变量的乘积不是联合凸的。尽管如此,全球解可以通过处理标量变量 ρ > 0 \rho > 0 ρ>0的线性搜索过程确定。这个策略将在下一节中详细讨论。
A. 标量情况
我们将注意力集中在以下简化的无干扰闭环系统(4)的标量版本,这些版本在许多参考文献中被考虑,包括 [9],[10] 和更近期的 [12] 和 [15]。
σ ˙ = − k 1 ( σ ∣ σ ∣ ) + η η ˙ = − k 2 ( σ ∣ σ ∣ ) (35) \dot{\sigma} = -k_1 \left( \frac{\sigma}{|\sigma|} \right) + \eta \quad \dot{\eta} = -k_2 \left( \frac{\sigma}{|\sigma|} \right) \tag{35} σ˙=−k1(∣σ∣σ)+ηη˙=−k2(∣σ∣σ)(35)
采用状态变量 x = [ σ η ] T ∈ R 2 x = [\sigma \; \eta]^T \in \mathbb{R}^2 x=[ση]T∈R2和 w = 0 w = 0 w=0,状态空间实现仍然由 (8) 给出,其中
A K = [ − k 1 1 − k 2 0 ] ∈ R 2 × 2 (36) A_K = \begin{bmatrix} -k_1 & 1 \\ -k_2 & 0 \end{bmatrix} \in \mathbb{R}^{2 \times 2} \tag{36} AK=[−k1−k210]∈R2×2(36)
是一个 Hurwitz 稳定矩阵,只要控制增益 k 1 k_1 k1和 k 2 k_2 k2是正标量。下一个引理总结了关于这个特定 STA 控制系统的到达时间估计的先前结果。
引理 3: 设 ξ ( x 0 ) ≠ 0 \xi(x_0) \neq 0 ξ(x0)=0和控制增益 k 1 > 0 k_1 > 0 k1>0, k 2 > 0 k_2 > 0 k2>0给定。到达时间估计为
T r ( x 0 ) 2 ≤ inf 0 < ρ < ρ ˉ ξ ( x 0 ) T P ξ ( x 0 ) (37) T_r(x_0)^2 \leq \inf_{0 < \rho < \bar{\rho}} \xi(x_0)^T P \xi(x_0) \tag{37} Tr(x0)2≤0<ρ<ρˉinfξ(x0)TPξ(x0)(37)
其中 0 < P ∈ R 2 × 2 0 < P \in \mathbb{R}^{2 \times 2} 0<P∈R2×2解决李雅普诺夫方程
A T P + P A + ρ P + ρ − 1 G 0 T G 0 = 0 (38) A^T P + PA + \rho P + \rho^{-1} G_0^T G_0 = 0 \tag{38} ATP+PA+ρP+ρ−1G0TG0=0(38)
其中
A = [ − k 1 / 2 1 / 2 − k 2 0 ] ∈ R 2 × 2 (39) A = \begin{bmatrix} -k_1/2 & 1/2 \\ -k_2 & 0 \end{bmatrix} \in \mathbb{R}^{2 \times 2} \tag{39} A=[−k1/2−k21/20]∈R2×2(39)
和 ρ ˉ / 2 = − max 1 ≤ j ≤ 2 Re { λ j ( A ) } \bar{\rho}/2 = -\max_{1 \leq j \leq 2} \text{Re}\{\lambda_j(A)\} ρˉ/2=−max1≤j≤2Re{λj(A)}。
证明: 通过时间微分验证,在这种特定情况下,定理 1 的结果简化为
V ˙ ( x ) ≤ − 1 ∣ σ ∣ ξ ( x ) T W ξ ( x ) (40) \dot{V}(x) \leq - \frac{1}{\sqrt{|\sigma|}} \xi(x)^T W \xi(x) \tag{40} V˙(x)≤−∣σ∣1ξ(x)TWξ(x)(40)
其中 W > 0 W > 0 W>0和 P > 0 P > 0 P>0满足李雅普诺夫不等式 A T P + P A + W < 0 A^T P + PA + W < 0 ATP+PA+W<0。
选择 W > 0 W > 0 W>0是 (32) 的一个可行解,接近于 ρ P + ρ − 1 G 0 T G 0 > 0 \rho P + \rho^{-1} G_0^T G_0 > 0 ρP+ρ−1G0TG0>0,问题 (34) 简化为 (37),因为对 ρ > 0 \rho > 0 ρ>0的上界保持 P > 0 P > 0 P>0可行,因此可以在不失一般性的情况下包括。证毕。
通过任何可用的线性搜索过程应用于区间 ρ ∈ ( 0 , ρ ˉ ) \rho \in (0, \bar{\rho}) ρ∈(0,ρˉ)可以解决问题 (37),这为 Lyapunov 函数 V ( x ) V(x) V(x)类提供了最佳的到达时间估计。此时,适当地比较引理 3 的结果与文献中的结果是合适的。
表 I 提供了五个示例的数据。前三个示例在 [10] 中提出,其中可以找到通过模拟计算的相应到达时间的真实值。参考文献 [9] 提出了最后两个示例,但没有进一步的信息关于真实的到达时间。表 II 给出了通过每个引用文献的程序和引理 3 计算的到达时间估计 T r ( x 0 ) T_r(x_0) Tr(x0)。比较第二列和最后一列,很明显,本论文中报告的值优于 [10] 计算的值,采用 W = I 2 W = I_2 W=I2,遵循这一选择会是最不保守的猜想。由于涉及控制增益的附加条件,仅在示例 4 中满足,因此无法在每种情况下应用 [15] 提出的到达时间计算方法,其到达时间估计大于引理 3 提供的值。最后,第三列显示了应用于示例 4 和 5 的 [9] 中给出的程序的结果。我们相信它们非常接近或甚至等于真实的到达时间值。我们认为,将这一过程推广到处理多变量超扭转控制系统是非常困难的。
对于相同类型的 Lyapunov 函数,[12] 是非常相关的。对于标量系统,它提供了通过条件证明的最佳到达时间,这些条件可以证明与引理 3 的条件相同。
每当(34)对于特定的初始条件 x 0 = [ σ 0 T , z 0 T ] T ∈ R 2 n x_0 = \begin{bmatrix} \sigma_0^T , z_0^T \end{bmatrix}^T \in \mathbb{R}^{2n} x0=[σ0T,z0T]T∈R2n被求解时,它提供了变换系统(8)的最佳到达时间估计。然而,如果要估计原始系统(变换前)的到达时间(4),我们需要对
x 0 = q 0 + [ 0 ( B K 2 ) − 1 f 0 ] (40) x_0 = q_0 + \begin{bmatrix} 0 \\ (BK_2)^{-1} f_0 \end{bmatrix} \tag{40} x0=q0+[0(BK2)−1f0](40)
进行评估,其中 q 0 = [ σ 0 T , η 0 T ] T ∈ R 2 n q_0 = \begin{bmatrix} \sigma_0^T , \eta_0^T \end{bmatrix}^T \in \mathbb{R}^{2n} q0=[σ0T,η0T]T∈R2n和 f 0 = f ( 0 ) f_0 = f(0) f0=f(0)。因此, x 0 ∈ R 2 n x_0 \in \mathbb{R}^{2n} x0∈R2n依赖于未知的干扰初始条件,由于时间导数约束(3)没有对 t = 0 t = 0 t=0时的干扰幅度施加任何限制,因此可能是无界的。在这种情况下,相应的到达时间估计变得任意大,因此不够明确。
在我们看来,文献中没有像应有的那样强调这一不适当的事实,除了少数例外 [23]。
现在让我们处理当前情况下的到达时间估计,这自然更为复杂,因为我们必须处理未知但有界的 f 0 ∈ R 2 n f_0 \in \mathbb{R}^{2n} f0∈R2n$。为此,如果我们假设
∥ f 0 ∥ ≤ ∥ ( B K 2 ) − 1 ∥ − 1 κ , (41) \|f_0\| \leq \| (BK_2)^{-1} \|^{-1} \kappa , \tag{41} ∥f0∥≤∥(BK2)−1∥−1κ,(41)
那么 ∥ z ~ ∥ ≤ κ \|\tilde{z}\| \leq \kappa ∥z~∥≤κ,其中 z ~ = ( B K 2 ) − 1 f 0 \tilde{z} = (BK_2)^{-1} f_0 z~=(BK2)−1f0,这使得可以应用引理 2 的结果。实际上,LMI
[ θ − ζ κ 2 0 0 ζ I n ] > [ ξ ( q 0 ) T F 0 T ] T P [ ξ ( q 0 ) F 0 ] (42) \begin{bmatrix} \theta - \zeta \kappa^2 & 0 \\ 0 & \zeta I_n \end{bmatrix} > \begin{bmatrix} \xi(q_0)^T \\ F_0^T \end{bmatrix}^T P \begin{bmatrix} \xi(q_0) \\ F_0 \end{bmatrix} \tag{42} [θ−ζκ200ζIn]>[ξ(q0)TF0T]TP[ξ(q0)F0](42)
结合之前的 LMI,提供了到达时间估计
T r ( x 0 ) 2 ≤ inf P > 0 , W , S d , z ~ , θ , ζ { θ : (32) - (33), (42) } (43) T_r(x_0)^2 \leq \inf_{P > 0, W, S_d, \tilde{z}, \theta, \zeta} \{ \theta : \text{(32) - (33), (42)} \} \tag{43} Tr(x0)2≤P>0,W,Sd,z~,θ,ζinf{θ:(32) - (33), (42)}(43)
它对应于原始不确定闭环系统从任何初始条件 [ σ ( 0 ) T η ( 0 ) T ] T = q 0 ∈ R 2 n [\sigma(0)^T \; \eta(0)^T]^T = q_0 \in \mathbb{R}^{2n} [σ(0)Tη(0)T]T=q0∈R2n到达原点 x = [ σ T z T ] T = 0 ∈ R n x = [\sigma^T \; z^T]^T = 0 \in \mathbb{R}^n x=[σTzT]T=0∈Rn的经过时间。仅在干扰的初始条件是有界的情况下,这才是可能的。作为附带结果,用户可以施加更大的界限,但通常这会以增加到达时间估计为代价。这个方面将在示例中进行说明。
读者肯定会注意到,参见 [20] 的详细信息,当输入矩阵不确定时,干扰信号的界限必须满足
∥ f 0 ∥ ≤ inf B ∈ B ∥ ( B K 2 ) − 1 ∥ − 1 κ (44) \|f_0\| \leq \inf_{B \in \mathcal{B}} \| (BK_2)^{-1} \|^{-1} \kappa \tag{44} ∥f0∥≤B∈Binf∥(BK2)−1∥−1κ(44)
∥ f ˙ ( t ) ∥ ≤ inf B ∈ B ∥ ( B K 2 ) − 1 ∥ − 1 γ − 1 , ∀ t ≥ 0 (45) \| \dot{f}(t) \| \leq \inf_{B \in \mathcal{B}} \| (BK_2)^{-1} \|^{-1} \gamma^{-1}, \quad \forall t \geq 0 \tag{45} ∥f˙(t)∥≤B∈Binf∥(BK2)−1∥−1γ−1,∀t≥0(45)
这两个条件取决于可能出现在集合 B \mathcal{B} B内部的非凸函数的最小值。其数值确定通常是一个非常困难的任务,应尽量避免。为此,我们现在提出了一种方法,通过处理仅涉及极端矩阵 B i , ∀ i ∈ K B_i, \forall i \in \mathcal{K} Bi,∀i∈K来计算这个最小值,虽然不是完全精确,但能得到一个稍微保守的值。这改善了 [20] 中报告的相关结果。对于任何矩阵 M ∈ R n × n M \in \mathbb{R}^{n \times n} M∈Rn×n,不等式
( B K 2 − M ) ( B K 2 − M ) T ≥ 0 (46) (BK_2 - M)(BK_2 - M)^T \geq 0 \tag{46} (BK2−M)(BK2−M)T≥0(46)
成立,这意味着
B K 2 K 2 T B T ≥ B K 2 M T + M K 2 T B T − M M T (47) BK_2 K_2^T B^T \geq BK_2 M^T + M K_2^T B^T - M M^T \tag{47} BK2K2TBT≥BK2MT+MK2TBT−MMT(47)
因此,我们有
inf B ∈ B ∥ ( B K 2 ) − 1 ∥ − 2 = inf B ∈ B ρ ( B K 2 K 2 T B T ) ≥ inf B ∈ B ρ ( B K 2 M T + M K 2 T B T − M M T ) = min i ∈ K ρ ( B i K 2 M T + M K 2 T B i T − M M T ) = sup α > 0 , M { α : B i K 2 M T + M K 2 T B i T − M M T > α I n } (48) \inf_{B \in \mathcal{B}} \| (BK_2)^{-1} \|^{-2} = \inf_{B \in \mathcal{B}} \rho(BK_2 K_2^T B^T) \\ \geq \inf_{B \in \mathcal{B}} \rho(BK_2 M^T + M K_2^T B^T - M M^T) \\ = \min_{i \in \mathcal{K}} \rho(B_i K_2 M^T + M K_2^T B_i^T - M M^T) \\ = \sup_{\alpha > 0, M} \{ \alpha : B_i K_2 M^T + M K_2^T B_i^T - M M^T > \alpha I_n \} \tag{48} B∈Binf∥(BK2)−1∥−2=B∈Binfρ(BK2K2TBT)≥B∈Binfρ(BK2MT+MK2TBT−MMT)=i∈Kminρ(BiK2MT+MK2TBiT−MMT)=α>0,Msup{α:BiK2MT+MK2TBiT−MMT>αIn}(48)
其中,我们使用了 ρ ( ⋅ ) \rho(\cdot) ρ(⋅)是一个凹函数的事实。作为直接后果,LMIs
[ B i K 2 M T + M K 2 T B i T − α I n ⋅ M T I n ] > 0 , ∀ i ∈ K (49) \begin{bmatrix} B_i K_2 M^T + M K_2^T B_i^T - \alpha I_n & \cdot \\ M^T & I_n \end{bmatrix} > 0, \quad \forall i \in \mathcal{K} \tag{49} [BiK2MT+MK2TBiT−αInMT⋅In]>0,∀i∈K(49)
产生了所需的结果,即
inf B ∈ B ∥ ( B K 2 ) − 1 ∥ − 2 ≥ sup α > 0 , M { α : (49) } (50) \inf_{B \in \mathcal{B}} \| (BK_2)^{-1} \|^{-2} \geq \sup_{\alpha > 0, M} \{ \alpha : \text{(49)} \} \tag{50} B∈Binf∥(BK2)−1∥−2≥α>0,Msup{α:(49)}(50)
这可以通过任何 LMI 解算器轻松实现,因为,如预期的那样,仅涉及极端矩阵 B i , ∀ i ∈ K B_i, \forall i \in \mathcal{K} Bi,∀i∈K的计算。数值实验表明,除了求解更简单外,下界(50)确实是紧的。
本节旨在验证我们对 MSTA 的到达时间估计的精度。主要思想是描述和计算最差的可行干扰 f ∗ ( t ) f^*(t) f∗(t),即,期望的最长期到达时间。接下来,通过仿真确定施加 f ∗ ( t ) f^*(t) f∗(t)的闭环系统的到达时间。请注意,原则上,最差干扰应该满足 t = 0 t = 0 t=0时的界限(44)和所有 t ≥ 0 t \geq 0 t≥0的界限(45)。然而,如后文所述,由于我们设计条件的充分性,这可能并不总是如此。
假设问题(43)已经解决,确定最差干扰的原理需要采用两个独立的步骤。
首先,确定最差干扰初始条件 f 0 ∗ f_0^* f0∗。为此,问题(43)可以视为一个嵌套优化问题,其中首先对标量变量对 ( θ , ζ ) (\theta, \zeta) (θ,ζ)进行优化。因此,结合引理 2 可以得到
min θ , ζ { θ : (42) } = max ∥ z ~ ∥ ≤ ζ V ( q 0 + F 0 z ~ ) (51) \min_{\theta, \zeta} \{ \theta : \text{(42)} \} = \max_{\| \tilde{z} \| \leq \zeta} V(q_0 + F_0 \tilde{z}) \tag{51} θ,ζmin{θ:(42)}=∥z~∥≤ζmaxV(q0+F0z~)(51)
其最优解
z ~ 0 ∗ = ( ζ I n − F 0 T P F 0 ) − 1 F 0 T P ξ ( x 0 ) (52) \tilde{z}_0^* = \left( \zeta I_n - F_0^T P F_0 \right)^{-1} F_0^T P \xi(x_0) \tag{52} z~0∗=(ζIn−F0TPF0)−1F0TPξ(x0)(52)
直接提供了最差干扰初始条件 f 0 ∗ = ( B K 2 ) z ~ 0 ∗ f_0^* = (BK_2) \tilde{z}_0^* f0∗=(BK2)z~0∗。第二步基于 Hamilton-Jacobi-Bellman 方程
max ∥ w ∥ ≤ k ξ ( x ) − 1 { ξ ( x ) T ( W p ∥ σ ∥ ) ξ ( x ) + ∇ V ( x ) T [ L ( σ ) A K R ( σ ) x + L ( σ ) F 0 w ] } = 0 (53) \max_{\| w \| \leq \sqrt{k \xi(x)^{-1}}} \left\{ \xi(x)^T \left ( \frac{W_p} { \sqrt{\| \sigma \|} } \right ) \xi(x) + \nabla V(x)^T \left[ L(\sigma) A_K R(\sigma)x + L(\sigma) F_0 w \right] \right\} \\ = 0 \tag{53} ∥w∥≤kξ(x)−1max{ξ(x)T(∥σ∥Wp)ξ(x)+∇V(x)T[L(σ)AKR(σ)x+L(σ)F0w]}=0(53)
其中,未知的是时间不变的成本函数 V ( x ) V(x) V(x)。由于在这个一般设置中,方程(53)实际上是不可解的,我们通过将 V ( x ) V(x) V(x)设为(10)中给出的 Lyapunov 函数候选来寻找次优解,其中 P > 0 P > 0 P>0来自问题(43)所提供的最小到达时间估计。这种选择源于定理 1 的结果,因为由于不等式(28),方程(53)对于所有可行的 w ∈ R n w \in \mathbb{R}^n w∈Rn都变为严格负的,从而确认了次优性。考虑到([20],定理 2 的证明)中已建立的部分,方程(53)中直接依赖于干扰 w w w的部分可以替代为
∇ V ( x ) T L ( σ ) F 0 w = 2 k σ ∥ F 0 T P ξ ( x ) ∥ ξ ( x ) T P F 0 w (54) \nabla V(x)^T L(\sigma) F_0 w = \frac{2 \sqrt{k \sigma}}{\| F_0^T P \xi(x) \|} \xi(x)^T P F_0 w \tag{54} ∇V(x)TL(σ)F0w=∥F0TPξ(x)∥2kσξ(x)TPF0w(54)
因此,在这个框架中,最差干扰是使(54)右侧最大化的可行干扰。这样,我们得到
f ∗ ( t ) = ( B K 2 ) z ~ ∗ ( t ) f^*(t) = (BK_2) \tilde{z}^*(t) f∗(t)=(BK2)z~∗(t),其中,
z ~ ˙ ∗ = w ∗ k σ = γ − 1 F 0 T P ξ ( x ) ∥ F 0 T P ξ ( x ) ∥ (55) \dot{\tilde{z}}^* = \frac{w^*}{\sqrt{k \sigma}} = \gamma^{-1} \frac{F_0^T P \xi(x)}{\| F_0^T P \xi(x) \|} \tag{55} z~˙∗=kσw∗=γ−1∥F0TPξ(x)∥F0TPξ(x)(55)
将这两个条件结合起来,我们可以通过以下积分反馈回路来实现最差干扰
z ~ ∗ ( t ) = z ~ 0 ∗ + ∫ 0 t z ~ ˙ ∗ ( τ ) d τ (56) \tilde{z}^*(t) = \tilde{z}_0^* + \int_{0}^{t} \dot{\tilde{z}}^*(\tau) d\tau \tag{56} z~∗(t)=z~0∗+∫0tz~˙∗(τ)dτ(56)
最后值得一提的是, (52) 和 (55) 表明 ∥ f 0 ∗ ∥ ≤ ∥ B K 2 ∥ κ \| f_0^* \| \leq \| BK_2 \| \kappa ∥f0∗∥≤∥BK2∥κ和 ∥ f ˙ ∗ ∥ ≤ ∥ B K 2 ∥ γ − 1 \| \dot{f}^* \| \leq \| BK_2 \| \gamma^{-1} ∥f˙∗∥≤∥BK2∥γ−1。这意味着(44)和(45)中给出的两个上界可能会被违反。尽管如此, z ~ ∗ \tilde{z}^* z~∗是可行的,即 ∥ z ~ 0 ∗ ∥ ≤ κ \| \tilde{z}_0^* \| \leq \kappa ∥z~0∗∥≤κ和 ∥ z ~ ˙ ∗ ∥ ≤ γ − 1 \| \dot{\tilde{z}}^* \| \leq \gamma^{-1} ∥z~˙∗∥≤γ−1,这意味着 f ∗ ( t ) f^*(t) f∗(t)是一个有效的干扰。
关于数值解,我们需要关注标量变量 ρ > 0 \rho > 0 ρ>0,因为问题(43)并不是联合凸的,但当 ρ > 0 \rho > 0 ρ>0固定时,它对剩余变量 P , W , S d , θ , ζ P, W, S_d, \theta, \zeta P,W,Sd,θ,ζ变得凸。这种情况适合通过线性搜索程序来处理,如果有一个上界 ρ ˉ > 0 \bar{\rho} > 0 ρˉ>0,该过程将大大简化。为此,请注意,不等式(32)与(33)一起表明
A K i T P + P A K i + ρ P < 0 , i ∈ K (57) A_{K_i}^T P + P A_{K_i} + \rho P < 0, \quad i \in K \tag{57} AKiTP+PAKi+ρP<0,i∈K(57)
对于某个矩阵 P > 0 P > 0 P>0。这个不等式表明,矩阵 A K i + ( ρ / 2 ) I 2 n , ∀ i ∈ K A_{K_i} + (\rho/2)I_{2n}, \forall i \in K AKi+(ρ/2)I2n,∀i∈K必须是 Hurwitz 稳定的,因此得出
ρ ˉ / 2 = − max 1 ≤ j ≤ 2 n , i ∈ K Re { ϱ j ( A K i ) } (58) \bar{\rho}/2 = - \max_{1 \leq j \leq 2n, i \in K} \text{Re}\{\varrho_j(A_{K_i})\} \tag{58} ρˉ/2=−1≤j≤2n,i∈KmaxRe{ϱj(AKi)}(58)
通过这些代数操作,最佳的到达时间估计为
T r ( x 0 ) 2 ≤ inf 0 < ρ < ρ ˉ τ ( q 0 , ρ ) (59) T_r(x_0)^2 \leq \inf_{0 < \rho < \bar{\rho}} \tau(q_0, \rho) \tag{59} Tr(x0)2≤0<ρ<ρˉinfτ(q0,ρ)(59)
其中,
τ ( q 0 , ρ ) = inf P > 0 , W , S d , θ , ζ { θ : ( 32 ) − ( 33 ) , ( 42 ) } (60) \tau(q_0, \rho) = \inf_{P>0,W,S_d,\theta,\zeta} \{\theta : (32) - (33), (42)\} \tag{60} τ(q0,ρ)=P>0,W,Sd,θ,ζinf{θ:(32)−(33),(42)}(60)
这个表达式清楚地表明,应用于(59)的线性搜索程序是通过一系列以线性目标函数和 LMI 约束表达的凸规划问题的解来实现的。它确保了始终可以获得提供最小到达时间估计的全局解。
我们采用了 [20] 中的程序来设计用于超冗余 ROV(水下遥控载具)模型的水平运动控制的鲁棒 MSTA,该模型灵感来源于实际的 ROV(LUMA)1。
状态变量为 σ = [ v x v y ω z ] T ∈ R 3 \sigma = [v_x \; v_y \; \omega_z]^T \in \mathbb{R}^3 σ=[vxvyωz]T∈R3,其中 v x v_x vx和 v y v_y vy是与机体框架相关的速度, ω z \omega_z ωz是与 z 轴相关的角速度。ROV 有四个推进器,通过控制变量 u ∈ R 4 u \in \mathbb{R}^4 u∈R4负责机体的位移。忽略科氏力、阻力和牵缆力 [24],简化的 ROV 模型可以通过(1)表示,其中 B ( g ) = M − 1 Φ ( g ) B(g) = M^{-1}\Phi(g) B(g)=M−1Φ(g),其中
M = diag ( m 0 , m 0 , I z ) M = \text{diag}(m_0, m_0, I_z) M=diag(m0,m0,Iz), ROV \text{ROV } ROV 的质量 m 0 = 290 [ kg ] m_0 = 290 [\text{kg}] m0=290[kg], 惯性矩 I z = 23 [ kg ⋅ m 2 ] I_z = 23 [\text{kg} \cdot \text{m}^2] Iz=23[kg⋅m2]且
Φ = [ ψ 1 ψ 1 ψ 1 ψ 1 ψ 1 − ψ 1 − ψ 1 ψ 1 − ψ 2 ψ 2 − ψ 2 ψ 2 ] (61) \Phi = \begin{bmatrix} \psi_1 & \psi_1 & \psi_1 & \psi_1 \\ \psi_1 & -\psi_1 & -\psi_1 & \psi_1 \\ -\psi_2 & \psi_2 & -\psi_2 & \psi_2 \end{bmatrix} \tag{61} Φ= ψ1ψ1−ψ2ψ1−ψ1ψ2ψ1−ψ1−ψ2ψ1ψ1ψ2 (61)
其中, ψ 1 = 2 / 2 \psi_1 = \sqrt{2}/2 ψ1=2/2且 ψ 2 = 0.35 [ m ] \psi_2 = 0.35 \; [\text{m}] ψ2=0.35[m]。矩阵 Φ ( g ) = diag ( g 1 , 1 , g 3 , 1 ) \Phi(g) = \text{diag}(g_1, 1, g_3, 1) Φ(g)=diag(g1,1,g3,1)定义了执行器增益。假设 g 1 , g 3 ∈ [ 1 / 2 , 1 ] g_1, g_3 \in [1/2, 1] g1,g3∈[1/2,1]是第一个和第三个控制通道的不确定增益,而其他通道正常工作。可以简单地确定 N = 4 N = 4 N=4个极端矩阵 B i ∈ R 3 × 4 B_i \in \mathbb{R}^{3 \times 4} Bi∈R3×4,使得 B ( g ) ∈ B = co { B i } i ∈ K B(g) \in \mathcal{B} = \text{co}\{B_i\}_{i \in K} B(g)∈B=co{Bi}i∈K,对于所有可行的 ( g 1 , g 3 ) (g_1, g_3) (g1,g3)对。
此外,我们假设初始条件 σ ( 0 ) = [ 1 1 π / 4 ] T \sigma(0) = [1 \; 1 \; \pi/4]^T σ(0)=[11π/4]T和 η ( 0 ) = [ 0 0 0 ] T \eta(0) = [0 \; 0 \; 0]^T η(0)=[000]T,得出 q 0 = [ 1 1 π / 4 0 0 0 ] T q_0 = [1 \; 1 \; \pi/4 \; 0 \; 0 \; 0]^T q0=[11π/4000]T,成本矩阵为 C = [ I 6 0 ] T ∈ R 10 × 6 C = [I_6 \; 0]^T \in \mathbb{R}^{10 \times 6} C=[I60]T∈R10×6和 D = [ 0 I 4 ] T ∈ R 10 × 4 D = [0 \; I_4]^T \in \mathbb{R}^{10 \times 4} D=[0I4]T∈R10×4。设置 γ = 1.01 \gamma = 1.01 γ=1.01,得到鲁棒控制增益
K 1 = [ − 135.0033 − 54.9292 25.3903 − 88.9191 199.3576 − 33.7332 − 135.0033 54.9292 25.3905 − 88.9191 − 199.3576 − 33.7332 ] K_1 = \begin{bmatrix} -135.0033 & -54.9292 & 25.3903 \\ -88.9191 & 199.3576 & -33.7332 \\ -135.0033 & 54.9292 & 25.3905 \\ -88.9191 & -199.3576 & -33.7332 \end{bmatrix} K1= −135.0033−88.9191−135.0033−88.9191−54.9292199.357654.9292−199.357625.3903−33.733225.3905−33.7332
K 2 = [ − 6.2719 − 4.3601 1.5738 − 4.4258 15.8243 − 3.6586 − 6.2719 4.3601 1.5738 − 4.4258 − 15.8243 − 3.6586 ] K_2 = \begin{bmatrix} -6.2719 & -4.3601 & 1.5738 \\ -4.4258 & 15.8243 & -3.6586 \\ -6.2719 & 4.3601 & 1.5738 \\ -4.4258 & -15.8243 & -3.6586 \end{bmatrix} K2= −6.2719−4.4258−6.2719−4.4258−4.360115.82434.3601−15.82431.5738−3.65861.5738−3.6586
问题(59)-(60)在四种不同的设置下求解:
当 γ = + ∞ \gamma = +\infty γ=+∞且 κ = 0 \kappa = 0 κ=0时,闭环系统假定无外部干扰。我们得到的估计是 T r ( x 0 ) ≤ 8.58 T_r(x_0) \leq 8.58 Tr(x0)≤8.58,对于 ρ ∗ ≈ 0.054 \rho^* \approx 0.054 ρ∗≈0.054。图1显示了闭环系统的轨迹,指示了 T r ( x 0 ) ≈ 4.9 T_r(x_0) \approx 4.9 Tr(x0)≈4.9(以 • 标记)。
当 γ = + ∞ \gamma = +\infty γ=+∞且 κ = 7.0 \kappa = 7.0 κ=7.0时,外部干扰允许为 $f(t) = f_0 $且 ∥ f 0 ∥ ≤ 0.2174 \|f_0\| \leq 0.2174 ∥f0∥≤0.2174。我们得到的估计是 T r ( x 0 ) ≤ 14.58 T_r(x_0) \leq 14.58 Tr(x0)≤14.58,对于 ρ ∗ ≈ 0.049 \rho^* \approx 0.049 ρ∗≈0.049。初始干扰的不确定性并不会显著影响到达时间。事实上,遭受最差干扰的闭环系统表现出的到达时间为 T r ( x 0 ) ≈ 9.45 T_r(x_0) \approx 9.45 Tr(x0)≈9.45。
当 γ = 1.01 \gamma = 1.01 γ=1.01且 κ = 7.0 \kappa = 7.0 κ=7.0时,干扰必须满足 ∥ f ˙ ( t ) ∥ ≤ 0.0307 \| \dot{f}(t) \| \leq 0.0307 ∥f˙(t)∥≤0.0307,$|f_0| \leq 0.2174 $,我们确定 T r ( x 0 ) ≤ 1.53 × 1 0 3 T_r(x_0) \leq 1.53 \times 10^3 Tr(x0)≤1.53×103,对于 ρ ∗ ≈ 4.87 × 1 0 − 4 \rho^* \approx 4.87 \times 10^{-4} ρ∗≈4.87×10−4。应用最差干扰 f ∗ ( t ) f^*(t) f∗(t)(由(56)给出),闭环系统的时间仿真如图2所示,允许我们确定到达时间为 T r ( x 0 ) ≈ 1.15 × 1 0 3 T_r(x_0) \approx 1.15 \times 10^3 Tr(x0)≈1.15×103,(以 • 标记),接近估计值。最差干扰施加的到达时间的显著增加表明,在这种情况下,MSTA 在稳定性域的边界附近运行。
案例 iii)中呈现的最差干扰迫使系统在其稳定性极限附近危险地运行。因此,到达时间显著增加。在实际操作中,这样的情况是不可取的。因此,我们考虑减小 ∥ f ˙ ( t ) ∥ \|\dot{f}(t)\| ∥f˙(t)∥的上界,这可以通过设置 γ = 2.00 \gamma = 2.00 γ=2.00来实现。对于 κ = 7.0 \kappa = 7.0 κ=7.0,我们得到 ∥ f ˙ ( t ) ∥ ≤ 0.0155 \|\dot{f}(t)\| \leq 0.0155 ∥f˙(t)∥≤0.0155, ∥ f 0 ∥ ≤ 0.2174 \|f_0\| \leq 0.2174 ∥f0∥≤0.2174和 T r ( x 0 ) ≤ 29.00 T_r(x_0) \leq 29.00 Tr(x0)≤29.00,对于 ρ ∗ ≈ 0.25 \rho^* \approx 0.25 ρ∗≈0.25。在仿真中获得的实际到达时间,采用最差干扰时为 T r ( x 0 ) ≈ 19.23 T_r(x_0) \approx 19.23 Tr(x0)≈19.23。再次,估计值是合适的,并且控制器性能大大提高。
请注意,如前所述,干扰 w w w始终遵循所需的限制 ∥ w ∥ 2 ≤ ∥ σ ∥ γ − 2 \|w\|_2 \leq \| \sigma \| \gamma^{-2} ∥w∥2≤∥σ∥γ−2对于所有 B ∈ B B \in \mathcal{B} B∈B。然而,最差干扰导数 f ˙ ∗ ( t ) \dot{f}^*(t) f˙∗(t)可能会违反计算的界限(45)。事实上,虽然 w ∗ ( t ) w^*(t) w∗(t)始终满足其范数界限,但对于 f ˙ ∗ ( t ) \dot{f}^*(t) f˙∗(t)可能并不适用。避免到达时间恶化的一种方法可能是增加 γ \gamma γ以提高稳定性裕度。
本文提出了一种在存在植物不确定性和外部干扰情况下,估计多变量超扭曲算法到达时间的方法。植物不确定性在一个多面体凸集内,且干扰在 t = 0 t = 0 t=0处具有范数界限,其导数也有范数界限。基于 LMI 解,辅以有限区间上的一维搜索,解决了关于一类著名的李雅普诺夫函数的最佳到达时间估计。本文考虑了两种重要情况,即:a) 无干扰且初始条件非零;b) 初始条件有界且干扰导数有界。对于情况 a),进行了与处理标量 STA 的几篇前期论文的详细比较。相比通过数值仿真得出的确切到达时间,所提出的最佳估计显著地提供了更为精确的估计。
对于多变量系统的情况 a),本文所给出的估计似乎相当准确。然而,对于情况 b),在存在其他论文中使用的特定正弦类干扰的情况下,估计显得过于悲观。事实上,这种表面上的保守估计通过综合一个所谓的“最差干扰”得到解释,该干扰将导致与真实到达时间相同数量级的到达时间估计。因此,所提出的估计正确地包含了最差干扰,似乎并不过于悲观。本文再次强调了原始(未变换)干扰 f 0 f_0 f0的初始值在到达时间估计中的重要影响。
作者感谢国家科学与技术发展委员会(CNPq/巴西)和高等教育人员改进协调委员会(CAPES/巴西)提供的部分财务支持。
[1] A. Levant, “滑模控制中的滑模阶数和滑模精度,”《国际控制杂志》,第58卷,第6期,页1247–1263,1993年。
[2] Y. B. Shtessel, C. Edwards, L. Fridman, 和 A. Levant, 《滑模控制与观测》。纽约,NY,美国:Springer-Verlag,2014年。
[3] G. Bartolini, A. Ferrara, 和 E. U. Utkin, “通过二阶滑模控制避免抖振,”《IEEE自动控制汇刊》,第43卷,页241–246,1998年2月。
[4] G. Bartolini, A. Ferrara, E. Usai, 和 V. I. Utkin, “关于多输入无抖振的二阶滑模控制,”《IEEE自动控制汇刊》,第45卷,页1711–1717,2000年9月。
[5] L. Dorel 和 A. Levant, “关于无抖振滑模控制,”在第47届IEEE决策与控制会议论文集,(坎昆,墨西哥),页2196–2201,2008年12月。
[6] I. Boiko 和 L. Fridman, “连续滑模控制器中抖振的分析,”《IEEE自动控制汇刊》,第50卷,第9期,页1442–1446,2005年。
[7] V. Utkin, “高阶滑模控制的讨论方面,”《IEEE自动控制汇刊》,第61卷,第3期,页829–833,2016年。
[8] U. Pérez-Ventura 和 L. Fridman, “何时合理实施不连续滑模控制器而非连续滑模控制器?频域标准,”《国际鲁棒与非线性控制杂志》,第29卷,第3期,页810–828,2019年。
[9] R. Seeber, M. Horn, 和 L. Fridman, “估计超扭曲算法到达时间的新方法,”《IEEE自动控制汇刊》,第63卷,第12期,页4301–4308,2018年。
[10] A. Dávila, J. A. Moreno, 和 L. Fridman, “超扭曲算法的最佳李雅普诺夫函数选择以估计到达时间,”在第48届IEEE决策与控制会议暨第28届中国控制会议,CDC-CCC 2009,2009年。
[11] V. Utkin, “关于超扭曲控制的收敛时间和干扰抑制,”《IEEE自动控制汇刊》,第58卷,第8期,页2013–2017,2013年。
[12] R. Seeber 和 M. Horn, “基于李雅普诺夫的超扭曲算法的最佳到达时间界限,”《IEEE控制系统快报》,第3卷,第4期,页924–929,2019年。
[13] J. C. Geromel 和 C. E. Celeste, “带有收敛时间评估的轨迹跟踪控制,”《国际控制杂志》,第96卷,第8期,页2394–2402,2023年。
[14] I. Nagesh 和 C. Edwards, “多变量超扭曲滑模方法,”《自动化学报》,第50卷,第3期,页984–988,2014年。
[15] M. Basin, P. Rodriguez-Ramirez, 和 A. Garza-Alonso, “多变量连续固定时间二阶滑模控制:设计与收敛时间估计,”《亚洲控制杂志》,第21卷,第1期,页323–338,2019年。
[16] M. Basin, “有限时间与固定时间收敛算法:设计与收敛时间估计,”《控制年鉴》,第48卷,页209–221,2019年。
[17] J. A. Moreno 和 M. Osorio, “超扭曲算法的严格李雅普诺夫函数,”《IEEE自动控制汇刊》,第57卷,第4期,页1035–1040,2012年。
[18] M. Basin, C. Bharath Panathula, 和 Y. Shtessel, “多变量连续固定时间二阶滑模控制:设计与收敛时间估计,”《IET控制理论与应用》,第11卷,第8期,页1104–1111,2016年。
[19] A. F. Filippov, 《具有不连续右侧的微分方程》。多德雷赫特:Kluwer学术出版商,1988年。
[20] J. C. Geromel, E. V. L. Nunes, 和 L. Hsu, “基于LMI的鲁棒多变量超扭曲算法设计,”《IEEE自动控制汇刊》,DOI: 10.1109/TAC.2024.3358235,2024年。
[21] L. S. Lasdon, 《大型系统的优化理论》。纽约,NY,美国:Macmillan公司,1970年。
[22] S. Boyd, L.