作者简介:黄 磊(1975—),深圳大学教授,国家杰出青年基金获得者.研究方向:谱估计、阵列信号处理、统计信号处理以及在雷达、导航和无线通信中的应用.E-mail:lhuang@szu.edu.cn
中文责编:英 子; 英文责编:木 柯
1)深圳大学电子与信息工程学院,广东深圳 518060; 2)广东省(深圳大学-达实智能)位置感知与探测工程技术研究中心,广东深圳 518060
1)College of Electronics and Information Engineering, Shenzhen University, Shenzhen 518060, Guangdong Province, P.R.China2)Guangdong Provincial(SZU-DAS)Positioning & Sensing Engineering Technology Research Center, Shenzhen University, Shenzhen 518060, Guangdong Province, P.R.China
unmanned aerial vehicle(UAV); compressed sampling; limited bandwidth; data backhaul; image processing; one-bit compressed sampling; matrix completion
DOI: 10.3724/SP.J.1249.2019.05473
随着无人机(unmanned aerial vehicle, UAV)的广泛应用,其与地面接收站实时共享机载传感器数据成为工业界的迫切需求.然而,目前为无人机开放使用的频谱资源稀缺,通信信道带宽非常有限,这就促使人们研究如何在带宽受限条件下实现无人机数据的实时无损回传.作为突破经典奈奎斯特(Nyquist)采样理论的新技术,压缩采样将是解决这类问题的最佳方案.本文通过对比当前无人机通信技术核心参数,揭示现有通信技术标准无法满足无人机数据通信对信道带宽日益迫切的需求,评述无人机数据回传压缩技术,对压缩感知、1-bit压缩采样、相位恢复和矩阵补全技术原理进行回顾.采用压缩感知和矩阵补全技术对实测数据进行验证,结果表明,压缩感知和矩阵补全技术可在带宽不变的情况下,显著降低数据的传输时间.最后提出无人机数据压缩和恢复领域的4个研究发展方向.
With the widespread application of unmanned aerial vehicle(UAV), the real-time sharing of data between UAV and base station has become an urgent demand in industry. However, the spectrum resources available for UAV data transmission are extremely precious, resulting in rather limited channel bandwidth. This, in turn, motives ones to explore efficient technologies for real-time non-destructive backhaul of drone data under bandwidth-constrained conditions. As a new technology breaking through the classical Nyquist sampling theorem, the compressive sampling(CS)turns out to be a promising solution to the aforementioned problem. By comparing the core parameters of current UAV communication technologies, this paper reveals that the existing standards of communications cannot meet the increasing requirements of UAV data transmission. Subsequently, four representative CS techniques, including compressed sensing, one-bit compressed sampling, phase retrieval and matrix completion, are briefly reviewed. Then, the simulations of compressed sensing and matrix completion technologies with real-world data are carried out to demonstrate the effectiveness which reveals that compressed sensing and matrix completion methods are able to significantly reduce the transmission time of data backhaul without changing the bandwidth. Ultimately, this paper also describes four research and development directions in the field of UAV data compression and recovery.
无人机(unmanned aerial vehicle, UAV)在情报侦察、低空突防、航拍摄影、农业植保、现代物流、监控疾病、国土测绘、电力巡检以及抢险救灾等领域有着广泛的应用背景[1].近年来,无人机产业得到快速发展,发达国家都在积极发展无人机的先进技术,大力拓展无人机的行业应用.无论在哪个领域,无人机的监测数据都需要进行科学分析和应用才能发挥其实际作用.这就涉及到数据的实时共享问题——无人机的数据通信技术或无人机数据链技术.
无人机数据链属于窄带远距离传输技术,其数据传输率一般在115 200 bit/s以下[2].实际上,这种数据率很难满足目前的应用需求.譬如,美国地理情报局在2005年发布的MISP/STANG4609标准,定义了高清图像标准为1 280×720像素,要实现彩色或热图像的实时共享,数据链传输率需要达到1.48 Gbit/s[3].美国和北大西洋公约组织又制定了更高清晰度的图像标准,像素高达1 920×1 080,这时要求传输率达到3 Gbit/s以上[3].但是,目前大多数的无人机数据传输系统没有足够大的信道带宽提供如此高的信息传输速率,面临着极大挑战.
另一方面,随着无人机的广泛应用,人们已经不满足于高清图像的实时共享.高清无人机视频监测信息的实时回传逐渐成为主要需求.无人机通信链路主要包括控制信息的交互和无人机监测数据的回传.远程控制系统信息的交互主要是用于无人机起飞、降落和姿态调整等控制信息的传输,具有单位时间内数据量少、可靠性高且安全性强的特点.由于其在现实生活中已得到普遍应用,且相关技术趋于成熟,恕不赘述.但是,无人机监测(视频图像、雷达成像及地理测绘等)数据的回传,要求信息数据可以在无人机高速移动环境下,以较高的传输速率,实时可靠地回传到地面的控制中心.
为此,本文总结分析了现有的通信标准,发现现有的通信标准已无法满足无人机通信日益增长的需求,指出压缩采样(compressive sampling, CS)理论和技术可用于无人机数据的压缩和恢复.通过总结4种具有代表性的压缩采样技术及原理,从待处理数据结构的角度出发,将CS技术分为基于一维向量的压缩采样技术和基于二维矩阵的压缩采样技术.基于实测数据分析部分代表性的压缩采样技术的理论性能.最后,指出了未来的研究方向.
为探讨无人机监测数据的实时回传无线通信机制,本文对现有的无线通信技术进行了系统分析.如图1,根据传播距离的不同,现有无线通信网络可分为无线个人网(wireless personal area network, WPAN)、无线局域网(wireless local area network, WLAN)、无线邻域网(wireless neighborhood area network, WNAN),以及无线广域网(wireless wide area network, WWAN).它们的覆盖的范围分别是短距离通信(10~100 m)、中短距离通信(100~1 000 m)、中距离通信(5~10 km)以及长距离通信(10~100 km).
无人机具有高速移动性,表1为对常用的移动通信技术的核心参数(吞吐量、距离、频段、带宽及时延等)的总结和对比.由表1可见,采用正交频分复用(orthogonal frequency division multiplexing, OFDM)调制的长期演进(long term evolution, LTE)、长期演进+(long term evolution-advanced, LTE-A)、全球互通微波访问(worldwide interoperability for microwave access, WiMAX)、无线宽带(wireless fidelity, WiFi)和无线访问车载环境(wireless access vehicular environment, WAVE)可提供比较高的通信速率(≥11 Mbit/s); 宽带码分多址(wideband code division multiple access, WCDMA)和蓝牙次之(≥1 Mbit/s); Zigbee和LoRa最低(≤250 kbit/s).但是,从功耗角度来看,其排序为(Zigbee、LoRa)>WCDMA>(LTE、 LTE-A、 WiMAX、 WIFI、 WAVE).
由表1还可发现,现有的通信网络无法满足MISP/STANG 4609标准中高清图像的实时传输,因此也无法进行高清视频数据的实时传输.另一方面,考虑到无人机具有高速移动性,各种通信协议在不同移动速率下的信息传输速率会有不同程度的下滑,这就促使人们不断寻求有效的先进信号处理技术,利用有限的信道带宽进行高速率的无人机监测数据实时回传.由于机载传感器数据在空域、频域和码域具有稀疏结构的特性,这就激发研究人员通过压缩采样技术来求解无人机数据的实时回传.这里的压缩采样技术是指利用信号的稀疏特征,以低于(或远低于)奈奎斯特(Nyguist)采样率对信号进行采样.
基于信号稀疏结构的压缩采样技术可突破现有通信体制带宽受限的瓶颈,进而实现无人机数据与地面接收站的实时共享.关于压缩采样理论,业界已有大量的研究结果.本文主要介绍4种有潜力的无人机数据回传的压缩感知技术,包括压缩感知、1-bit压缩采样、相位恢复和矩阵补全(matrix completron, MC)技术.
图2描述了无人机数据回传的全过程,相对于传统的数据回传过程,该过程增加了利用压缩采样技术对数据进行压缩和恢复.压缩过程目的是设计量测矩阵进行随机采样; 数据恢复过程则是利用相应的恢复技术处理压缩数据,从而获得原始数据.
图2 四种压缩采样技术在UAV数据传输中的作用
Fig.2 (Color online)The role of four compression sampling techniques in UAV data transmission
压缩感知技术的主要目的是对接收的压缩采样信号 y=Φx∈RM×1, 通过稀疏恢复算法得到原始的具有稀疏特性的信号 x∈RN×1. 其中, N>M; Φ是量测矩阵[14-15], Φ∈RM×N; 压缩率 p1=M/N. 目前,人们已提出了多种基于稀疏恢复的方法,例如匹配追踪[16]、阈值法[17]和压缩采样匹配搜索法[18]等迭代方法,以及总体变异稀疏度[19]、非局部稀疏度[20]、小波树稀疏度[21]等基于原始数据的先验信息的优化方法.这些方法往往采用迭代优化的方法对问题进行求解,能取得较好的稀疏恢复性能,但也存在计算量过大的问题.同时,当实际数据不满足其特定的稀疏假设时,这些方法的恢复性能会大幅下降.
近年来,有学者提出基于深度学习的压缩感知方法,如叠加去噪自编码器[22]、卷积神经网络[23]和迭代收缩阈值网络[24]等.这些方法通过构建一个深度神经网络 f()并进行求解,最终得到(^overx)=f(W;(^overx)init). 其中, W是网络参数;(^overx)init是对原始数据 x的初始估计.在对 f()进行训练时,由于假设已有充分的训练数据集{X, Y}, 故有X=ΨinitY∈RN×K. 其中, K是用于求解Ψinit∈RN×M的估计Ψ ^init的样本数量, 且KN.因此,有Ψ ^init=XYT(YYT)-1,以及(^overx)init=Ψ ^inity. 实验表明,基于深度神经网络的压缩感知方法具有较低的计算复杂度,其复杂度低于传统数据恢复方法约3个数量级[23],因此非常适用于无人机数据回传应用.
为保证能够准确获取信息,通常需对原始数据进行高精度的量化采样.随着数据量的增大,高精度的量化采样将导致高昂的数据采集、存储和处理成本,难以满足无人机平台的应用需求[25-26].在信号稀疏特性的假设下,1-bit压缩采样技术为无人机的数据回传提供了新的解决方案.
在稀疏假设条件下,通常获得的是待重构信号 x在系统量测矩阵 Φ下的量测向量 y. 在1-bit压缩采样理论下,仅保留量测向量的符号信息,由此得到的信号量测模型[27-29]为
y=sgn(Φx)(1)
其中, sgn()为符号函数.在该模型下,对量测向量的采样仅需保留1 bit的符号信息,从而避免了高精度的量化采样过程,大幅简化了系统的硬件架构.此时,对信号 x的重构可表述[30]为
(^overx)=argminx=x=1, s.t.YΦx≥0, =x=2=1(2)
其中, Y=diag(y), diag()为构是对角矩阵函数.
式(2)中第1个约束保证了重构信号符号的正确性,第2个约束避免了重构的多解性.在这两个约束下,通过最小化重构信号的l1范数可得到满足稀疏特性假设的信号估计结果.
1-bit压缩采样理论能够有效降低数据采集的量化精度.假设传统的信号处理需要对信号进行8 bit的采样量化,而利用1-bit压缩采样理论,在采样率不变的情况下,可将数据量降至原来的1/8,从源头上解决无人机回传数据量大的问题.
仅依据原始复数信号的线性量测强度或幅值信息,来恢复该完整复数信号的技术通常被称为相位恢复.该技术被广泛用于天文学、晶体学和光学成像等领域[31-33].在这些领域中,由于设备采集信号时只记录了信号的强度或幅值,所以存储数据所占空间较少.在未采集复数信号相位信息的情况下,完整恢复原始信号其实是一项很有挑战的课题.
从数学角度来讲,相位恢复即是从M次线性量测的强度中,恢复出原始N维复数信号x, 数学模型[34]为
y=|Φx|2+n(3)
其中, Φ∈RM×N为已知的M×N量测矩阵; n为量测噪声.
相位恢复是一个非线性非凸的优化问题,通常需使量测次数M大于信号的维度N, 才能够准确地恢复出原始信号[36].
在无人机监测(视频图像、雷达成像和地理测绘等)数据的回传中,为满足高清图像和视频的连续快速传输,可采用相位恢复技术对所传输复数数据进行压缩传输.根据所要传输数据 x的特点,结合相位恢复数学模型,考虑将相位恢复模型中的量测矩阵 Φ设计为编码矩阵,然后对复数数据 x按一定规律编码后,取其强度或幅值,从而将复数数据的传输转化为实数数据的传输,加快数据传输速率.
通常,在设计编码矩阵 Φ时,其行向量维度应远大于列向量维度.如果所传输数据 x具有时域、空域、频域或码域等稀疏结构特性,编码矩阵 Φ的行向量维度则可大幅减少,此时,可以采用欠采样相位恢复算法对数据进行恢复[35].
区别于前面3种压缩采样技术,矩阵补全技术处理的数据是二维矩阵格式. 它可从欠采样信号 XΩ中恢复出原始信号 X. 欠采样信号的数学模型[36]为
XΩ=HΩ⊙X+N(4)
其中,所有变量都属于 RM×N; ⊙是元素乘法算子; X和 N分别是原始信号和噪声信号; HΩ是由{0}和{1}组成的量测矩阵, {0}和{1}均服从随机均匀分布,但是必须确保由采样信号组成的矩阵不含全零行和全零列[37].压缩率为
p2==HΩ=1/(M×N)(5)
其中, =HΩ=1是矩阵HΩ的l1范数.此外,由原始信号 X构成的矩阵必须满足低秩或近似抵秩性质.本文讨论的无人机数据为图像数据,而图像数据可由二维矩阵表示,同时图像的主要信息可由少部分较大的奇异值所刻画,则其余较小的奇异值可被忽略.所以,由图像数据构成的矩阵满足近似低秩的性质,进而矩阵补全技术也可以很好的用于无人机数据回传领域.
为恢复原始信号 X, CANDÈS等[38]提出通过求解秩最小化问题来恢复 X, 表示为
minX ^ rank(X ^), s.t.=X ^Ω-XΩ=F≤σ(6)
其中, X ^∈RM×N, σ>0是限制拟合误差的参数.然而,秩最小化问题是一个NP-hard问题.FAZEL[39]证明了核范数是排名函数rank()的凸包络.随后,CANDÈS等[37]提出通过求解核范数最小化问题代替求解秩最小化问题,将标准的矩阵补全问题凸松弛为最小核范数问题:
minX ^=X ^=*, s.t.=X ^Ω-XΩ=F≤σ(7)
其中, =X ^=*是矩阵的核范数.最小核范数问题是一个凸优化问题,可用多种算法求解[40- 43].
合成孔径雷达(synthetic aperture radar, SAR)具有全天候工作、分辨率高、抗干扰能力强等优点[44].因此,SAR挂载于无人机进行探测,在情报侦察、低空突防、农业植保、抢险救灾等领域均具有明显优势.但是,对高分辨率采样图像的需求增加了数据储存与传输的难度.经过随机均匀采样后的数据可以节省储存空间,或降低对下传信道带宽的要求,更可减少无人机发射信号的功耗.在成像过程中,则可先利用压缩感知或矩阵补全恢复原始数据,然后利用恢复的数据进行恢复成像.
该实验运行环境为:i7- 6700 CPU,3.40 GHz主频,16 Gbyte内存,Matlab2018a.
图3描述了实验的流程.其中,SAR数据由原始图片生成,源自Sandia National Laboratories,采用16 bit进行数据量化,编码方式为Huffman编码,无线通信机制为LoRa.
图4(a)展示了基于深度神经网路的数据压缩和恢复的流程,整个过程中压缩和恢复分别对应图3中的采样压缩和恢复操作.压缩过程数学表达为:y=Φx∈RM×1. 恢复阶段需要先训练该神经网络的参数,然后才可用于数据恢复.在网络训练阶段,先对 y进行初始化,
on deep neural network得到(^overx)ini=Qinity. 其中, Qinit=XYT(YYT)-1, X=[x1, x2, …, xNb]是与训练集相对应的标签, Y=[y1, y2, …, yNb]为训练集,Nb为训练集内图片的数量. 然后,将图片批量输入卷积神经网络当中,得到 r=x-ΦT(Φx-y). 最后,将 r依次经过非线性函数F(·)、软阈值函数Soft(·; θ)和非线性函数 G(·). 其中,卷积核的数量Nf=32, 卷积核维度为3×3; θ为阈值.在恢复数据过程中,压缩数据 y被输入神经网络,经过计算后可获得恢复后的数据(^overx).
图5展示了压缩感知技术在SAR数据压缩与恢复中的效果.图5(a)为原始数据成像效果; 图5(b)为在无噪情况下经过LoRa信道传输后基于压缩感知恢复的成像效果.其中,由SAR数据构成的矩阵维度是C1 000×800; 原始数据经过LoRa信道传输耗时为2 845 s; 采用压缩感知技术处理后的数据回传耗时为1 356 s; 压缩率 p1=50%; 数据传输时间节省了45.43%.由图5(b)可见,基于压缩感知恢复的SAR图像与原图几乎一致,无肉眼可见的损失.
图6描绘了矩阵补全技术在SAR数据压缩与恢复中的效果.图6(a)为原始数据成像结果,图6(b)为在无噪情况下,经过LoRa信道传输后基于矩阵补全的成像结果,图6(c)为在高斯白噪声情况下,经过LoRa信道传输后基于矩阵补全的成像结果.其中,倍噪比(signal to noise ratio, SNR)为10 dB; 由SAR数据构成的矩阵维度是C800×600,原始数据回传耗时1 029.34 s; 在采样率p2=40%情况下,压缩后的数据回传耗时缩短为669.42 s,数据传输时间节省了34.97%.由图6(a)和(b)可见,经过LoRa系统信道传输,并采用矩阵补全技术进行数据恢复,图像质量几乎没有降低.由图6(c)可见,矩阵补全技术可以抑制由传输信道带来的高斯噪声.
针对无人机应用的特点,免费、高速且能够远距离传输是当前的迫切需求.在众多通信网络中,LoRa网络因具有低成本、远距离传输的优势,有望能够解决无人机在雷达成像、地理测绘、农业植保等领域的数据回传问题.但是,LoRa网络的信道带宽非常有限,如何实现无人机视频或图像数据的实时回传是一项颇具挑战的研究.
本文指出压缩采样技术可运用于无人机数据回传领域来降低数据回传的延时,并通过实测数据验证了压缩感知和矩阵补全技术可在带宽不变的情况下,显著降低数据的传输时间,进而证明压缩采样技术将是突破该技术瓶颈的有效手段之一.
在无人机数据压缩和恢复的领域,下面几个方向值得关注:
① 现有的压缩采样技术仍然难以满足高清晰视频或图像传输的要求.研究具有更低压缩采样率或更低量化率的先进信号处理方法是未来研究方向之一.
② 本文的实验算法只能抑制高斯白噪声的干扰,而数据在实际传输过程中也可能收到脉冲噪声的干扰,因此研究具有抑制混合噪声的算法将是另一研究方向.
③ 超高清图像会引发大规模数据问题,数据恢复会带来更大的耗时,设计可分布或并行式计算的压缩采样算法将会是另一个值得研究的方向.
④ 压缩采样技术已从处理一维向量扩展到二维矩阵.针对视频的传输,高阶张量可利用数据间更多的相关信息,因此可达到更好的效果以及更高的压缩性能,即张量的压缩和恢复技术的研究将会引起广泛的关注.
深圳大学学报理工版
JOURNAL OF SHENZHEN UNIVERSITY SCIENCE AND ENGINEERING
(1984年创刊 双月刊)
主 管 深圳大学
主 办 深圳大学
编辑出版 深圳大学学报理工版编辑部
主 编 李清泉
国内发行 深圳市邮电局
国外发行 中国国际图书贸易集团有限公司(北京399信箱)
地 址 北京东黄城根北街16号
邮 编 100717
电 话 0755-26732266
0755-26538306
Email journal@szu.edu.cn
标准刊号 ISSN 1000-2618
CN 44-1401/N