作者简介:邱 丽(1981—), 女(汉族),河南省信阳市人,深圳大学讲师、博士. E-mail: qiuli@szu.edu.cn
中文责编:方 圆; 英文责编:木 南
1)深圳大学机电与控制工程学院, 深圳 518060; 2)安徽工业大学电气信息学院, 安徽马鞍山 243000
Qiu Li1, Yao Fengqi2, Zhong Xiaopin1, and Xu Gang11)College of Mechatronics and Control Engineering, Shenzhen University, Shenzhen 518060, P.R.China2)School of Electrical Engineering and Information, Anhui University of Technology, Maanshan 243000, Anhui Province, P.R.China
networked control systems; unified modeling; dynamic output feedback control; random packet dropout and time delay; Markov chains; augmenting matrix technique; Lyapunov method
DOI: 10.3724/SP.J.1249.2015.01040
针对传感器与控制器、控制器与执行器之间具有随机丢包和时延的网络控制系统, 研究统一建模及动态输出反馈控制问题. 采用多个马尔可夫链分别描述前向通道和反馈通道的随机丢包与时延过程,将闭环网络控制系统建模成具有多个模态的马尔可夫随机跳变系统. 利用增广矩阵技术和李雅普诺夫方法得到闭环系统随机稳定的充分条件,给出动态输出反馈控制器的设计方法. 通过倒立摆系统验证动态反馈控制的有效性.
Unified modeling and dynamic output feedback control are considered for a class of networked control systems(NCSs)with random sensor-to-controller(S-C)and controller-to-actuator(C-A)packet dropouts and time delays. The packet dropouts and time delays in forward channels and feedback channels are modeled as multiple Markov chains and the closed-loop NCS is modeled as a Markovian jump linear system with multiple Markov chains. Based on the augmenting matrix technique and Lyapunov method, a sufficient condition is derived for the stochastic stability of the closed-loop NCS, and a design procedure is presented for the dynamic output feedback controller. The inverted pendulum system illustrates the effectiveness of the proposed method.
网络控制系统(networked control systems,NCS)是通过网络进行闭环反馈控制的系统,其主要特征是系统各部件(如传感器、控制器、执行器等)之间信息(如参考输入、被控对象输出、控制器输入等)交换都是由网络来实现的[1]. 与传统的点对点控制系统相比,网络控制系统减少了系统布线, 便于系统诊断和维护,提高了系统的灵活性和柔性. 但是,网络在给控制系统带来众多优势的同时, 其通信缺陷及制约也会使得控制系统的性能下降, 甚至失稳.
通常网络通信缺陷和制约可归纳为5种情况[1]: ① 量化问题; ② 数据包丢失; ③ 变采样; ④ 时延; ⑤ 传输受限. 网络中的这些问题使得闭环控制系统的性能下降甚至失稳. 因此,研究这些问题对系统性能的影响是很重要的.
近年来,针对网络的丢包、时延、量化、时变传输时延等问题的研究已取得很多成果.例如:文献[2- 4]研究了网络丢包问题; 文献[5- 6]研究了网络诱导时延问题; 文献[7]研究了量化问题; 文献[8-9]和文献[10-11] 分别研究了时变传输间隔及网络资源受限问题; 文献[12]同时考虑了量化和网络时延问题; 文献[13-16]同时考虑了数据包丢失和网络时延; 文献[13]还研究了具有随机丢包时延的不确定非线性NCS的鲁棒H∞滤波问题; 文献[15]采用滚动优化原理,研究具有时延及数据包失序的NCS滚动时域H∞控制问题; 文献[16]采用Lyapunov稳定性定理及线性矩阵不等式方法研究具有随机丢包和时延的NCS的状态反馈控制问题.文献[17]同时考虑了数据丢包和传输受限; 文献[18]同时考虑了时变的采样间隔和网络时延; 文献[19]同时考虑了时变的采样间隔和传输受限.另外,文献[20]研究量化、变采样及传输受限等问题; 文献[21]考虑丢包、变采样及传输受限等问题. 文献[1]研究时延、变采样及传输受限等问题.
然而,上述几种典型的网络制约往往同时存在于网络中.为了研究网络控制统一建模,本研究基于马尔可夫跳变理论,研究前向通道和反馈通道中同时具有随机丢包和时延的NCS动态输出反馈控制问题, 主要包括:①采用多马尔可夫链统一建模前向通道和反馈通道间的随机丢包和时延; ②采用增广矩阵技术处理网络诱导的随机时延,只需构造相对简单的李雅普诺夫函数就能使得闭环系统随机稳定; ③采用动态输出反馈控制器镇定闭环控制系统; ④数值仿真验证结果的有效性.
考虑图1所示的网络控制系统.被控对象、传感器、控制器及执行器通过网络分开分布. 网络诱导的随机时延及丢包同时存在于传感器与控制器及控制器与执行器之间. 假设传感器、控制器、执行器是时间驱动; 控制器总是使用最新的数据(如果旧的数据包和新的数据包同时到达,控制器使用新的数据,旧的数据舍弃)[22].
图1 随机丢包与时延的NCS结构图[22]
Fig.1 Block diagram of a NCS with packet dropouts and time delays
离散时间线性被控对象模型为
{xp(k+1)=Axp(k)+B(~overu)(k)
y(k)=Cxp(k)(1)
其中,xp(k)∈Rn 是系统状态;(~overu)(k)∈Rm和y(k)∈Rp分别表示控制输入和测量输出; A、 B和C是具有适当维数的实常矩阵.
采用一个具有以下状态空间实现的动态输出反馈控制器
{xc(k+1)=Acxc(k)+Bc(~overy)(k)
u(k)=Ccxc(k)+Dc(~overy)(k)(2)
其中,xc(k)∈Rn 是控制器的状态; Ac、 Bc、 Cc和Dc是待定的适当维数实矩阵.
如图1所示,随机有界时延分别存在于传感器与控制器以及控制器与执行器之间. d(k)≥0和τ(k)≥0分别表示传感器与控制器之间及控制器与执行器之间的随机时延.假设d(k)和τ(k)是有界的,取值范围为0≤d(k)≤d及0≤τ(k)≤τ, 其中, d和τ分别表示前向通道和反馈通道随机时延的最大步长.描述时延d(k)和τ(k)的一种方法是用两个相互独立的有限状态的齐次马尔可夫链进行建模[23-24].采用马尔可夫链来描述随机时延的优点是,在实际网络中,当前时刻的时延通常和前一时刻的时延有关[23]. 本研究采用两个独立的齐次马尔可夫链d(k)和τ(k)建模前向通道和反馈通道之间的随机时延,给出相应的状态转移概率λmn和τij.
在图1中, S1和S2分别表示传感器与控制器之间以及控制器与执行器之间的网络随机切换开关. α(k)和 β(k)(α(k)=0, 1; β(k)=0, 1)分别表示切换开关S1和S2的状态.当S1(S2)处于闭合状态时, α(k)=0(β(k)=0), 数据包成功接收,且有(~overy)(k)=y(k-d(k))((~overu)=u(k-τ(k))). 然而,当切换开关S1(S2)处于断开状态时, α(k)=1(β(k)=1), 数据包丢失, 切换输出(控制输入)处于前一时刻的状态,且有(~overy)(k)=(~overy)(k-1)((~overu)=(~overu)(k-1)). 随机切换开关S1及S2的动态特性可以建模为
{(~overy)(k)=(1-α(k))y(k-d(k))+
α(k)(~overy)(k-1)
(~overu)(k)=(1-β(k))u(k-τ(k))+
β(k)(~overu)(k-1)(3)
其中,
α(k)={0, 开关S1闭合, 数据包成功接收
1, 开关S1断开, 数据包丢失
β(k)={0, 开关S2闭合, 数据包成功接收
1, 开关S2断开, 数据包丢失
在式(3)中,用一个具有4个模态的齐次马尔可夫链{μ(k), k∈Z}建模α(k)和β(k)的随机切换过程, μ(k)在有限集(-overS)1 = {1, 2, 3, 4}中取值. 当式(3)中的α(k)和β(k)分别取值为(α(k)=0, β(k)=0)、(α(k)=0, β(k)=1)、(α(k)=1, β(k)=0)和(α(k)=1, β(k)=1)时, 对应马尔可夫链μ(k)的4个模态i=1, 2, 3, 4, 其中, i表示k时刻马尔可夫链μ(k)的状态.
在式(3)中,将{d(k), k∈Z}及{τ(k), k∈Z} 建模为两个独立的齐次马尔可夫链,分别在有限集(-overS)2={0, 1, …, d}和(-overS)3={0, 1, …, τ }中取值. 3个相互独立的齐次马尔可夫链μ(k)、 d(k)和τ(k)分别具有状态转移概率矩阵:
{Pr{μ(k+1)=j|μ(k)=i}=πij
Pr{d(k+1)=n|d(k)=m}=λmn
Pr{τ(k+1)=q|τ(k)=p}=γpq(4)
其中, πij≥0、 λmn≥0及γpq≥0对所有的(i, j∈(-overS)1)、(m, n∈(-overS)2)和(p, q∈(-overS)3)有
∑4j=1πij=1, ∑dn=0λmn=1, ∑τq=0γpq=1(5)
令
(~overx)(k)=
[xp(k)T(~overy)(k-1)T y(k-1)T … y(k-d)T]T
由此得到
{(~overx)(k+1)=A~(~overx)(k)+B~(~overu)(k)
(~overy)(k)=C~(~overx)(k)(6)
其中(I表示单位矩阵),
A~={[A 0 0 … 0 0
(1-α(k))C α(k)I 0 … 0 0
C 0 0 … 0 0
0 0 I … 0 0
0 0 0 … I 0],
当d=0时
[A 0 0 … 0 … 0
0 α(k)I 0 …(1-α(k))I_}第(2+d)项 … 0
C 0 0 … … 0 0
0 0 I … … 0 0
0
0
0 0 0 … … I 0],
当d>0时
B~=[BT 0 0 … 0 0]T
C~={[1-α(k)C α(k)I 0 … 0 0 0 … 0],
当d=0时
[0 α(k)I 0 … 0(1-α(k))I_}第(2+τ)项 0 … 0]
当d>0时
同理,令
(~overx)c(k)=
[xc(k)T(~overu)(k-1)T u(k-1)T…u(k-τ)T]T
则
{(~overx)c(k+1)=A~c(~overx)c(k)+B~c(~overy)(k)
(~overu)(k)=C~c(~overx)c(k)+D~c(~overy)(k)(7)
其中,
A~c={[Ac 0 0 … 0 0
(1-β(k))Cc β(k)I 0 … 0 0
Cc 0 0 … 0 0
0 0 I … 0 0
0 0 0 … I 0],
当τ=0时
[Ac 0 0 … 0 … 0
0 β(k)I 0 …(1-β(k))I_}第(2+τ)项 … 0
Cc 0 0 … … 0 0
0 0 I … … 0 0
0
0
0 0 0 … … I 0],
当τ>0时
B~c={[BTc(1-β(k))DTc DTc … 0]T,
当τ=0时
[BTc 0 DTc … 0]T, 当τ>0时
C~c={[1-β(k)Cc β(k)I 0 … 0 0 0 … 0],
当τ=0时
[0 β(k)I 0 … 0(1-β(k))I_}第(2+d)项 0 … 0]
当τ>0时
D~c={(1-β(k))Dc, 当τ=0时
0, 当τ>0时
结合式(6)和式(7),令x(k)=[(~overx)(k)T(~overx)c(k)T]T, 得闭环系统的状态方程为
x(k+1)=[A-+B-KC-]x(k)(8)
式中:
A-=[A~ 0
0 0],B-=[0 B~
I 0],
C-=[0 I
C~ 0],K=[A~c B~c
C~c D~c].
定义1.对任意有限初始条件x0=x(0), μ0=μ(0)∈S-1, d(0)=d0∈S-2, τ(0)=τ0∈S-3, 若存在有界矩阵W>0使
E{∑∞k=0=x(k)=2|x0,μ0,d0,τ0}≤xT0Wx0
成立,则闭环系统(8)称为随机稳定的.
首先给出使闭环系统(8)随机稳定的充分条件.
定理1.对闭环系统(8),若存在矩阵Pi, m, p>0, i∈S-1, m∈S-2, p∈S-3, 则以下不等式成立
L(i, m, p)=
[A-+B-KC-]TP-i, m, p[A-+B-KC-]-Pi, m, p<0(9)
说明闭环系统(8)是随机稳定的,其中, Pi, m, p=∑4j=1∑dn=0∑τq=0πijλmnγpqPj, n, q.
【证】 选取如下Lyapunov函数
V(k)=x(k)TPμ(k), d(k), τ(k)x(k)(10)
记μ(k)=i, d(k)=m, τ(k)=p, 沿着闭环系统(8)求解得
E[ΔV(k)]=E[V(k+1)]-V(k)=
E[x(k+1)TPμ(k+1), d(k+1), τ(k+1)x(k+1)]-
x(k)TPμ(k), d(k), τ(k)x(k)=
x(k)T([A-+B-KC-]TP-i, m, p[A-+B-KC-]-
Pi, m, p)x(k)=x(k)TL(i, m, p)x(k)(11)
结合式(9),由式(11)可得
E[ΔV ]≤-λmin(-L(i, m, p))x(k)Tx(k)≤
-βx(k)Tx(k)(12)
其中, β=inf{λmin(-L(i, m, p))}, λmin(-L(i, m, p))表示-L(i, m, p)的最小特征根.由式(12)可得, 对任意整数T≥1, 有
E[V(k+1)]-E[V(0)]≤
-β∑Tk=0E[x(k)T x(k)](13)
可得,
∑Tk=0E[x(k)T x(k)]≤1/(β)E[V(x0, Pμ0, d0, τ0)]
令T → ∞,得
∑Tk=0E[x(k)T x(k)]≤1/(β)E[V(x0, Pμ0, d0, τ0)]=
1/(β)xT0P(μ0, d0, τ0)x0(14)
因此,由式(14)和定义1可知闭环系统(8)是随机稳定的.
证毕.
本研究采用增广矩阵技术处理网络带来的随机时延d(k)和τ(k), 将具有随机丢包时延的NCS建模为不包含时滞项的闭环系统(8). 增广矩阵技术避免了构造复杂的Lyapunov函数,只需构造相对简单的Lyapunov函数,就能得到闭环系统(8)随机稳定的充分条件,避免了复杂的公式推导和运算.
定理1给出了在动态输出反馈控制率K作用下,闭环系统(8)随机稳定的一个充分条件. 基于该条件,可以导出系统(1)的动态输出反馈控制器设计方法.
由Schur补引理可知,式(9)等价于以下的矩阵不等式
[-Pi, m, p Γ
ΓT -Θ]<0,(15)
其中,
{i, j}∈S-1,{m, n}∈S-2, {p, q}∈S-3,
Γ=[(πi1λm0γp0)1/2Φ(πi1λm0γp1)1/2Φ…
(πijλmnγpq)1/2Φ…(πi4λmdγpτ)1/2Φ],
Θ=diag{P-11,0,0, P-11,0,1, …, P-1j,n,q, …, P-14,d,τ},_}4(1+d)(1+τ)项
Φ=A-+B-KC-
为了有效处理非线性矩阵不等式(15), 记不等式(15)左边的矩阵为 Ωi,m,p, 用Xj,n,q代替 Ωi,m,p中的P-1j,n,q, 得到式(17). 其中, Xj,n,q为正定矩阵. 采用锥补线性化(cone complementarity linearization, CCL)算法可将动态输出反馈控制器的求解问题转化为定理2中求解具有线性矩阵不等式约束的最小化问题.
定理2 对闭环系统(8)及动态输出反馈控制器(2),若存在适当维数的矩阵Ac、 Bc、 Cc、 Dc及对称正定矩阵Xj,n,q>0、 Pi,m,p>0, {i, j}∈S-1、 {m, n}∈S-2、 {p, q}∈S-3,使得以下的优化问题
minTr(∑4i=1∑dm=0∑τp=0Pi,m,pXi,m,p)(16)
s.t.(i)[-Pi,m,p Γ
ΓT -Xi,m,p]<0(17)
(ii)[-Pi,m,p I
I -Xi,m,p]>0(18)
其中,
Xj,n,q=diag{X1,0,0, X1,0,1, …, Xj,n,q, …, X4,d,τ},_}4(1+d)(1+τ)项.
(X~i,m,p, P~i,m,p, K~)有解, 则动态输出反馈控制器(2)使得闭环系统(8)是随机稳定的, 控制率K可通过下列最小化问题迭代求解算法得到.
步骤1:采用feasp求解器寻找满足式(17)和(18)的一组可行解(P0i,m,p, X0i,m,p, K0), 令k=0.
步骤2:采用mincx求解器求解以下有关(Pi,m,p, Xi,m,p, K)的LMI优化问题
{minTr∑4i=1∑dm=0∑τp=0(Pki,m,pXi,m,p+Pi,m,pXki,m,p)
s.t. ( i )[-Pi,m,p Γ
ΓT -Xi,m,p]<0
(ii)[-Pi,m,p I
I -Xi,m,p]>0
得
Pi,m,p, Xi,m,p, K, 令Pk+1i,m,p=Pi,m,p, Xk+1i,m,p=Xi,m,p, Kk+1=K.
步骤3: 如果 Pi,m,p满足式(15), 则退出, 得到的解即为此最小化问题的一个解; 否则, 令k=k+1, 然后返回到步骤2.
为了证明本研究方法的有效性,采用文献[24] 中的复杂四阶不稳定的倒立摆系统(该系统是在忽略空气阻力和各种摩擦之后,采用牛顿力学方法将直线一级倒立摆系统建模成小车和匀质杆组成的系统,文中简称倒立摆系统),如图2所示. 系统变量为[xd x·d θ θ ·]T. 其中, xd和θ分别表示小车的位置和倒立摆的角位置, 输出为y=[xd θ]T. 假设无摩擦,系统其他参数分别为: 小车质量m1=0.1 kg; 摆杆质量m2=0.5 kg; 摆杆转动轴心到杆质心的长度L=1 m.
图2 倒立摆控制系统[24]
Fig.2 Inverted pendulum system
设采样周期为Ts=0.1 s, 给如下的线性离散时间模型设计输出反馈控制器,被控对象相应参数为
A=[1.000 0 0.100 0 -0.016 6 -0.000 5
0 1.000 0 -0.337 4 -0.016 6
0 0 1.099 6 0.103 3
0 0 2.024 7 1.099 6],
B=[0.004 5
0.089 6
-0.006 8
-0.137 7], C=[1 0 0 0
0 1 0 0]
系统矩阵 A的4个特征根分别为1.000、1.000、1.556 9和0.462 3,因此该离散系统是开环不稳定系统.
闭环系统(8)中的随机跳变参数μ(k)∈ {1, 2, 3, 4}及随机时延d(k)∈{0, 1, 2}和τ(k)∈{0, 1}, 假设它们的状态转移概率矩阵分别为
π=[0.4 0.3 0.2 0.1
0.2 0.5 0.2 0.1
0.3 0.2 0.4 0.1
0.1 0.2 0.2 0.5],
λ=[0.6 0.4 0
0.5 0.4 0.1
0.5 0.4 0.1], γ=[0.4 0.6
0.5 0.5].
设在初始输出 y=[-0.1 0.1]T下,由定理2得动态输出反馈控制器的增益矩阵为
Ac=[0.872 1 0.065 4 0.337 2 -0.143 6
-0.335 1 1.204 1 -1.012 6 0.597 4
-0.045 7 0.045 6 0.098 1 0.241 5
0.521 3 -0.264 1 -0.584 1 0.254 1],
Bc=[0.131 5 0.672 4
0.403 8 3.102
0.051 7 1.325 2
-0.551 3 -0.947 6],
Cc=[-3.251 3 1.902 2 -9.623 5 8.045 4],
Dc=[3.852 1 40.603 5].
从图6可知, 系统在动态输出反馈控制器作用下是稳定的.
图6中两条状态相应曲线分别表示小车的位置xd和倒立摆的角位置θ, 数值仿真结果表明系统是随机稳定的. 仿真结果验证了本研究提出的控制方法的有效性.
采用马尔可夫跳变系统方法,研究了一类带有网络诱导丢包和时延的NCS动态输出反馈控制问题, 建立了新的闭环控制系统模型.采用增广矩阵方法避免了构造复杂李雅普诺夫函数, 设计了具有闭环系统随机稳定的动态输出反馈镇定控制器.
深圳大学学报理工版
JOURNAL OF SHENZHEN UNIVERSITY SCIENCE AND ENGINEERING
(1984年创刊 双月刊)
主 管 深圳大学
主 办 深圳大学
编辑出版 深圳大学学报理工版编辑部
主 编 阮双琛
国内发行 深圳市邮电局
国外发行 中国国际图书贸易集团有限公司(北京399信箱)
地 址 北京东黄城根北街16号
邮 编 100717
电 话 0755-26732266
0755-26538306
Email journal@szu.edu.cn
标准刊号 ISSN 1000-2618
CN 44-1401/N