基于信号特征知识图谱与宽度学习架构的特定辐射源识别*
时间:2023-04-12 11:56:56
基于信号特征知识图谱与宽度学习架构的特定辐射源识别*一文创作于:2023-04-12 11:56:56,全文字数:15330。
华敏妤,张逸彬,孙金龙,桂冠
(南京邮电大学通信与信息工程学院,江苏 南京 210023)
0 引言
在工业物联网环境下,工业数据流呈现数据量大、实时性强、信息传输多样化等特点[1-3],难以进行识别和分类,从而会影响后序应用如故障检测,且进一步会对无线通信的安全造成威胁。由此可见,在工业物联网环境下特定辐射源识别(SEI,Specific Emitter Identification)[4]意义重大。
近年来,包括机器学习(ML,Machine Learning)和深度学习(DL,Deep Learning)在内的人工智能方法在信号处理领域取得了巨大成就。如自动调制识别[5-6]、信道状态信息预测与反馈[7-8]、恶意软件流量分类[9]、航班延误预测[10]等应用。然而,这些基于ML或DL的技术都需要强大算力的支持。因此,本文着重关注C Chen等人提出的新型宽度学习方法[11-14]。该方法利用一个单层前向传播网络完成信号处理,不需要反向传播来调整网络权重,以此实现快速高效的训练。基于其特殊的架构,宽度学习能够快速高效地进行网络训练,为大数据驱动任务的在线学习提供了一种新的解决方案。
在SEI领域,目前还没有建立有关射频信号特征的体系库,而构建这样一种射频信号特征知识体系库有助于为射频信号识别提供切实的、有价值的信息参考,使特征信号结果具有更强的可迁移性。因此,本文考虑将知识图谱(KG,Knowledge Graph)[15-19]技术引入SEI领域,并验证该方案的可行性。KG本质上是语义网络的知识库,具有将复杂的、零散的知识形式化表示的能力。该技术通过数据挖掘、信息处理、知识计量和图形绘制,对现实世界的事物及其之间的相互关系进行表征,实现了可视化信息,能够更加清晰地调用获取信息,提高了信息的利用效率与可解释性。
综上所述,在工业物联网复杂的环境下,对数据量大、实时性强的多源信号,本文旨在提出一种基于信号特征知识图谱与宽度学习架构的SEI方法,该方法能够实现信号特征可视化表征存储,同时,在识别性能和计算开销方面相较于传统的ML方法能够有一定的提升。
1 系统模型
本文旨在提出一种快速有效的SEI方法实现工业物联网环境下射频信号的识别。如图1所示,特定辐射源识别系统由数据采集、KG、BLS架构以及设备识别四个部分组成。首先,利用辐射源信号采集设备采集数据,并进行数据预处理,生成可视化KG。然后,将接收到的PA信号作为KG-BLS架构的输入,KG-BLS架构包括外部和内部信号处理节点。最后,利用KG-BLS识别不同的辐射源设备,发现未经授权的非法设备。
图1 特定辐射源识别系统模型示意图
基于上述系统模型,本文利用所采集的6个PA数据作为模拟信号数据集。接收到的射频信号可以表示为:
由于SEI技术本质上是为了解决接收到的射频信号与对应的PA标签之间的匹配问题。本文假设数据集定义为,其中是对应不同辐射源设备的标签,则需要解决的问题可以定义为:
式中,fSEI(·)表示用于识别接收信号的映射函数,代表xi的预测标签类别,代表最优权重系数。此外,本文定义一组信号被正确识别的概率为准确率,可以表示为:
则对应的错误率可以表示为:ξ=1-α。因此,可以得到需要优化的目标函数为:
通过调整最有权重系数与fSEI(·)框架实现特定辐射源识别最大准确率与最小错误率。
2 基于KG-BLS架构SEI算法
由于目前大多数SEI算法都是基于ML算法框架实现的,而主流的SVM算法针对大规模训练样本会消耗大量的机器内存和运算时间。为此,本文提出可以采用宽度学习架构代替ML进行辐射源设备识别。在本节中,将详细介绍所提出的KG-BLS架构SEI算法,包括输入KG-BLS架构的信号特征、特征映射节点、增强节点以及KG-BLS输出识别结果。
2.1 构建信号知识图谱的特征表示
本文选取了均值、方差、标准差、峰度、偏度、四阶累积量、六阶累积量、最大值、最小值、中位数、峰峰值、整流平均值、均方根、方根幅值、波形因子、峰值因子、脉冲因子、裕度因子等作为时域提取的信号特征;选取了重心频率、均方频率、均方根频率、频率方差、频率标准差、谱峭度的均值、谱峭度的标准差、谱峭度的峰度、谱峭度的偏度等作为频域提取的信号特征,以此构建电磁信号知识图谱。经人工特征遴选,所提取的上述特征针对于SEI问题均为有效特征。
(1)高阶累积量
特征函数是研究随机变量分布规律的一个重要工具。设随机变量x的概率密度函数为f(x),则x的特征函数定义为:
将特征函数φ(v)对v求k阶导数:
则x的k阶矩定义为:
即x的k阶矩为其特征函数φ(v)的k阶导数在v=0的值。将特征函数取对数定义为累量生成函数,即累量生成函数为:
将累量生成函数ψ(v)的k阶导数在v=0的值称为x的k阶累积量,表示为Ck,即:
高阶累积量[20-21]不仅可以提取由于高斯性偏离引起的各种信息,而且能够自动抑制高斯噪声和对称分布噪声的影响,可以有效地对信号进行检验和表征。
(2)峰度与偏度
峰度[22]可以用来度量随机变量概率分布的陡峭程度。公式如下:
式中:μ为均值,σ为信标准差。峰度的取值范围为[1,+∞),峰度值越大,概率分布图越高尖,峰度值越小,概率分布图越矮胖。
偏度[22]可以用来度量随机变量概率分布的不对称性。公式如下:
式中:μ为均值;σ为信标准差。偏度的取值范围为(-∞,+∞),当S<0时,概率分布图左偏;当S=0时,表示数据相对均匀地分布在平均值两侧;当S>0时,概率分布图右偏。
(3)重心频率
重心频率[23]可以用来描述信号在频谱中分量较大的信号成分的频率,反映了信号功率谱的分布情况。公式如下:
其中,P(k)为对应的功率谱值,fk为对应点的频率幅值大小。低频幅值较大时,重心距离原点较近。
(4)均方频率与均方根频率
均方频率是信号频率平方的加权平均值,可以用来描述功率谱主频带分布。公式如下:
均方根频率是均方频率的算术平方根,公式如下:
2.2 基于KG-BLS架构的SEI系统
在2.1节针对所采集的原始射频信号的实部和虚部分别进行信号特征提取后,本文进一步提出可以采用宽度学习架构代替深度学习进行辐射源设备识别。近年来,几乎所有提出的数据驱动AI模型都可以描述为图2所示的问题:
图2 宽度学习系统模型示意图
对于SEI问题,射频信号是一维I/Q样本,因此,数据矩阵{X|X∈Rn×l}可以被定义为:
其中,n和l分别为数据样本的个数和每个样本的长度。对应辐射源设备{Y|Y∈Rn×c}的真实标签则可以被定义为:
<提醒您:因为《基于信号特征知识图谱与宽度学习架构的特定辐射源识别*》一文较长还有下一页,点击下面数字可以进行阅读!基于信号特征知识图谱与宽度学习架构的特定辐射源识别*
《基于信号特征知识图谱与宽度学习架构的特定辐射源识别*》在线阅读地址:基于信号特征知识图谱与宽度学习架构的特定辐射源识别*