Event-Triggering Sampling Based Leader-FollowingConsensus in Second-Order Multi-Agent Systems
本文研究了一种新颖的分布式事件触发采样方案,在该序列中二阶领导者遵循共识的问题,在该方案中,代理通过有限的通信介质交换信息。 设计了基于事件的分布式采样规则,其中每个代理决定何时测量自己的状态值,并在本地计算的测量误差超过依赖状态的阈值时请求其邻居代理在网络上广播其状态值。对于固定拓扑的情况,建立了充要条件。 对于切换拓扑的情况,在时变有向图是一致连通的假设下,获得了充分的条件。 结果表明,inter-event事件间隔有一个严格的正常数下界,这就排除了在达成共识之前的Zeno-behavior。 数值算例说明了理论结果的正确性。
文中考虑了具有领导者的二阶多智能体系统的一致性问题,智能体基于分布式的事件触发的采样控制的非线性动力学模型,控制器通过固定拓扑(fixed topology)或切换拓扑(switching topologies)的有限通信介质交换信息。 提出了基于事件的采样方案,其中每个智能体决定何时测量自己的状态值,并在本地计算的测量误差信号超过依赖状态的阈值时,请求其邻居智能体通过网络广播其状态值。 特别是,当控制增益设置为零时,在连续时间交互框架内的多智能体系统的二阶共识可以看作是我们结果的特例。 这项工作提出了一种用于二阶线性和非线性多智能体系统的分布式协作控制的新方法。
文中使用的控制输入如下:
u i ( t ) = ∑ j ∈ N i a i j ( x j ( t k i ) − x i ( t k i ) + v j ( t k i ) − v i ( t k i ) ) + b i ( x 0 ( t k i ) − x i ( t k i ) + v 0 ( t k i ) − v i ( t k i ) ) {{u}_{i}}(t)=\sum\limits_{j\in {{N}_{i}}}{{{a}_{ij}}\left( {{x}_{j}}(t_{k}^{i})-{{x}_{i}}(t_{k}^{i})+{{v}_{j}}(t_{k}^{i})-{{v}_{i}}(t_{k}^{i}) \right)+{{b}_{i}}\left( {{x}_{0}}(t_{k}^{i})-{{x}_{i}}(t_{k}^{i})+{{v}_{0}}(t_{k}^{i})-{{v}_{i}}(t_{k}^{i}) \right)} ui(t)=j∈Ni∑aij(xj(tki)−xi(tki)+vj(tki)−vi(tki))+bi(x0(tki)−xi(tki)+v0(tki)−vi(tki))
其中 t ∈ [ t k i , t k + 1 i ) t \in [t_k^i,t_{k+1}^i) t∈[tki,tk+1i), B = d i a g { b 1 , b 2 , ⋯ , b N } B=diag\{b_1,b_2,\cdots,b_N\} B=diag{b1,b2,⋯,bN}是领导者与智能体共同形成的有向拓扑图的邻接矩阵, A = ( a i j ) A=(a_ij) A=(aij)是智能体群体同形成的有向拓扑图的邻接矩阵。
智能体 i i i只在其单独的事件时间序列 { t k i } k = 0 ∞ \{t_{k}^{i}\}_{k=0}^{\infty } {tki}k=0∞上被触发。且智能体 i i i使用最新的测量量 x i ( t k i ) x_i(t_k^i) xi(tki)和 x j ( t k i ) , j ∈ N i x_j(t_k^i), j\in N_i xj(tki),j∈Ni,并不是直接使用 x i ( t ) x_i(t) xi(t)和 x j ( t ) , j ∈ N i x_j(t), j\in N_i xj(t),j∈Ni。正常来说,每当智能体 i i i在时间 t k i t_k^i tki更新了其状态信息,便会需要获取其邻居智能体 j j j此时的状态信息。但是实际上这是行不通的,因为智能体 j j j仅在时间序列 { t k j } k = 0 ∞ \{t_{k}^{j}\}_{k=0}^{\infty } {tkj}k=0∞时获取自身状态信息并发送给邻居智能体。
Remark 1: 在此使用
u i ( t ) = β ∑ j ∈ N i a i j ( x j ( t k i ) − x i ( t k i ) ) {{u}_{i}}(t)=\beta \sum\nolimits_{j\in {{N}_{i}}}{{{a}_{ij}}\left( {{x}_{j}}(t_{k}^{i})-{{x}_{i}}(t_{k}^{i}) \right)} ui(t)=β∑j∈Niaij(xj(tki)−xi(tki)) 作为输入,而不是用
u i ( t ) = β ∑ j ∈ N i a i j ( x j ( t k ′ ( t ) i ) − x i ( t k i ) ) {{u}_{i}}(t)=\beta \sum\nolimits_{j\in {{N}_{i}}}{{{a}_{ij}}\left( {{x}_{j}}(t_{{k}'(t)}^{i})-{{x}_{i}}(t_{k}^{i}) \right)} ui(t)=β∑j∈Niaij(xj(tk′(t)i)−xi(tki))
k ′ ( t ) ≜ a r g m i n l ∈ Z 0 + : t ≥ t l j { t − t l j } {k}'(t)\triangleq argmi{{n}_{l\in Z_{0}^{+}:t\ge t_{l}^{j}}}\{t-t_{l}^{j}\} k′(t)≜argminl∈Z0+:t≥tlj{t−tlj}作为输入。
这是因为智能体 i i i对自身状态进行采样或者接收到任意邻居智能体的状态信息时,第一种控制输入可以不用立即更新邻居智能体的状态信息,即便其邻居智能体已经完成了采样过程。第二种则需要时刻更新智能体的信息。
Note:智能体 i i i更新其控制输入以其自身 t k i t_k^i tki为参考时间,而不是 t k ′ ( t ) j t_{k'(t)}^j tk′(t)j。同时允许智能体之间采样和更新信息有时延,或者可以跳过多个周期。即智能体 i i i更新控制输入时可以使用智能体 j j j多个周期 n T s j nT_s^j nTsj之前的状态数据,以确保系统稳定性。可以由此确定采样周期 T s j T_s^j Tsj的取值范围。
智能体 i i i分布式事件触发规则:该规则仅根据其本地信息来分析确定,何时智能体 i i i必须对自身状态进行采样,同时从请求其邻居发送最新的状态测量值,以便确保群体可以与领导者之间的一致性。 同时,假设在达成一致性之前,系统具有控制输入,如果已经达成一致,则将它们的控制输入量为零。 因此,在智能群体达成一致性之前,对于 t n ∈ [ t k i , t k + 1 i ) , i = 1 , 2 , ⋯ , N t_n\in [t^i_k,t^i_{k+1}),i=1,2,\cdots,N tn∈[tki,tk+1i),i=1,2,⋯,N,定义测量误差 e x i ( t ) e_{xi}(t) exi(t), e v i ( t ) e_{vi}(t) evi(t), e x i j ( t ) e_{xij}(t) exij(t)和 e v i j ( t ) e_{vij}(t) evij(t),其分别定义为 e x i ( t ) = x i ( t k i ) − x i ( t ) e_{xi}(t)=x_{i}(t^i_k)-x_{i}(t) exi(t)=xi(tki)−xi(t), e v i ( t ) = v i ( t k i ) − v i ( t ) e_{vi}(t)=v_{i}(t^i_k)-v_{i}(t) evi(t)=vi(tki)−vi(t), e x i j ( t ) = x j ( t k i ) − x j ( t ) e_{xij}(t)=x_{j}(t^i_k)-x_{j}(t) exij(t)=xj(tki)−xj(t),且当 j ∈ N i j\in N_i j∈Ni时 e x i j ( t ) = 0 e_{xij}(t)=0 exij(t)=0。同理 e v i j ( t ) = v j ( t k i ) − v j ( t ) e_{vij}(t)=v_{j}(t^i_k)-v_{j}(t) evij(t)=vj(tki)−vj(t),当 j ∈ N i j\in N_i j∈Ni时 e v i j ( t ) = 0 e_{vij}(t)=0 evij(t)=0。
分布式事件触发的采样规则可以定义为:
E i ( t ) = ( b i + d i ) ∥ e x i ( t ) + e v i ( t ) ∥ + ∥ A i ∥ ∥ e ~ x i ( t ) + e ~ v i ( t ) ∥ + b i ∥ e x i 0 ( t ) + e v i 0 ( t ) ∥ − β i H i ( t ) = ( b i + d i ) ∥ x i ( t k i ) − x i ( t ) + v i ( t k i ) − v i ( t ) ∥ E_i(t)=(b_i+d_i)\left\|e_{xi}(t)+e_{vi}(t)\right\|+\left\|A_i\right\| \left\|\tilde{e}_{xi}(t)+\tilde{e}_{vi}(t)\right\|+b_i \left\|e_{xi0}(t)+e_{vi0}(t)\right\| -\beta_iH_i(t)\\ =(b_i+d_i)\left\|x_i(t^i_k) -x_i(t) + v_i(t^i_k) -v_i(t)\right\| Ei(t)=(bi+di)∥exi(t)+evi(t)∥+∥Ai∥∥e~xi(t)+e~vi(t)∥+bi∥exi0(t)+evi0(t)∥−βiHi(t)=(bi+di)∥∥xi(tki)−xi(t)+vi(tki)−vi(t)∥∥
其中 b i b_i bi是领导者的伴随矩阵 B B B中的元素,当领导者与智能体 i i i之间建立连接时, b i > 0 b_i>0 bi>0,否则 b i = 0 b_i=0 bi=0。 D D D为度矩阵。