1. 引言
无线电频谱是连接陆、海、空、天和网络空间的媒介,是国家重要的战略性稀缺资源。由于无线电波传播的开放性,无线电业务容易受到干扰,因此世界各国都对无线电使用有着严格的规定,并指定由专门的职能部门进行监测和管理。伴随数字经济、新基建和工业互联网等国家战略的深入实施,以5G、物联网等为代表的新一代信息通信技术与实体经济深度融合的步伐不断加快,无线电新技术、新业务、新应用大量涌现,成为各行业各领域加速数字化转型的重要引擎。与此同时,干扰事件逐年增多,电磁环境越来越复杂,无线电安全问题也受到越来越多的关注 [1]。
众所周知,由于泛在、传输速率高和免费等特点,WiFi是最受人们欢迎的上网方式,也是物联网中传感器信息传输的基础。由于公共WiFi环境缺少甚至毫无安全防护措施,WiFi安全问题十分突出,主要的包括:WiFi路由器DNS遭恶意篡改导致上网时广告弹窗或在购物时进入钓鱼网站;在公共场所使用免费WiFi时进入黑客设置的陷阱或被黑客监听,从而使上网记录、账号密码等关键信息被窃取;用户设置WiFi密码过于简单,黑客可瞬间暴力破解,并进行蹭网或盗取信息等 [2]。WiFi无线网络在给企业的生产和工作都带来了极大便利的同时,也引发了许多安全方面的问题,为此文中提出了可能采取的措施 [3],例如,对WiFi无线网络的访问进行严格的控制;通过与MAC地址进行绑定,对接入WiFi网络中的非法者进行防范;提高无线设备的加密与校验技术;避免受到DOS的攻击对站点定期加以审查;对核心网络进行隔离;强化对链路的监测与保护,从而提高其安全性,确保用户的信息数据和通信传输安全。同时,由于WiFi无线网络无所不在,利用WiFi信道状态信息CSI (Channel State Information)的幅度和相位特征可进行人数统计,在室内环境下进行下我们实验室采用支持向量机SVM (Support Vector Machine)、神经网络NN (Neural Networks)和卷积神经网络CNN (ConvolutionalNeural Networks)进行室内人数的统计分类,结果表明三种机器学习算法分别达到了94%、96%和88%的准确率 [4]。WiFi无线网络的大量使用,在方便人们的同时也可能暴露用户的隐私 [5]。因此,本文以WiFi信号传播和无线AP (Wireless Access Point)定位为研究对象,不仅有理论意义,而且对无线电监管工作有应用价值。论文的主要工作包括仿真模型、WiFi信号传播特性仿真和数据预处理、基于AI (Artificial Intelligence)的发射源定位研究,在发射源定位研究部分,论文采用卷积神经网络CNN、K邻近算法KNN (K-Nearest Neighbor)和支持向量机SVM对WiFi信号发射源进行定位,并讨论了监测接收点数量对定位准确率的影响。
2. 仿真模型
本文假设在一栋单层别墅的各个房间中分别放置无线AP (WiFi信号发射源,发射功率为10W,天线为偶极子),研究了无线AP的发射特性和定位方法。图1为单层别墅房外观示意图,图中房子外围白色柱子为放置的监测接收点,高度为1.5 m,接收天线为偶极子。图2为房间布局平面示意,图中房间内Site1、Site2、Site3表示三个房间内放置的无线AP的典型位置,外围红点为监测接收点,与图1中的白色柱子对应。

Figure 1. Schematic graph of the appearance of a one-story villa
图1. 单层别墅的外观示意图

Figure 2. Floor plan of wireless AP and receiving point
图2. 无线AP及接收点位置平面图
3. WiFi信号传播特性仿真和数据预处理
WiFi信号传播特性仿真采用WinProp软件 [6],仿真时假设无线AP在室内房间内按照从左到右,从上到下的路径共移动5001次,每次移动时进行场分布计算,并在监测接收点接收和记录WiFi信号场强,针对每个房间的仿真将获得8 × 5001组场强数据,为进行发射源定位准备数据。图3(a)-(c)分别是在3个房间发射WiFi信号时得到的仿真区域电场强度分布,仿真时截取的平面高度为1.5 m;图3(d)是在截取高度为1.5 m、2 m和2.5 m的平面上得到的场强分布仿真结果。可以看出,信号最强区域位于无线AP所属房间,靠近该房间的监测接收点测量到的场强次之;当无线AP在房间1时,位于左上角的监测接收点接收到的场强较强,而距离其较远的右下角的监测接收点较弱;同理,当无线AP在房间2和3发射时,位于右上侧和下方的监测接收点接收到的场强较强;当无线AP在各个房间内移动时,随着位置的变化各个监测接收点收到的信号将发生变化。因此,基于接收场强对非视通环境下的无线AP进行定位是可能的。假设每个房间内的无线AP在5001个不同的位置处进行发射,房子外围设置8个监测接收点进行接收时获得的接收功率数据矩阵为:

Figure 3. The power distribution inside and outside the villa and at different heights when WiFi signals are transmitted in 3 rooms respectively. (a) Wireless AP is located in room 1; (b) Wireless AP is located in room 2; (c) Wireless AP is located in room 3; (d) The distribution of received power inside and outside the villa under different receiving antenna heights
图3. 分别在3个房间发射WiFi信号时别墅内外及其不同高度下的功率分布。(a) 无线AP位于房间1;(b) 无线AP位于房间2;(c) 无线AP位于房间3;(d) 不同接收天线高度下别墅内外的接收功率分布
(1)
上式中,
对应模型中的三个房间;该矩阵的每个元素
表示在第i个位置处发射WiFi信号时,第j个监测点收到的功率值,
,
。每个房间采集5001条数据,三个房间将获得15,003条数据。在采用人工智能算法进行定位研究时,必须先对数据进行预处理,本文采用的方法是先取出WiFi信号接收功率原始数据集,求出数据的最大值和最小值后,采用
将原始数据归一化到区间[0, 1]。
4. 基于AI的发射源定位研究
1) 人工智能AI
人工智能AI是计算机科学的一个分支,主要研究开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统,研究内容包括机器学习和深度学习。机器学习算法包括支持向量机、K邻近算法、随机森林、梯度提升和k均值等 [7];深度学习算法包括卷积神经网络、循环神经网络、自编码、集成学习、多任务学习、迁移学习、终身学习、玻尔兹曼机、深度信念网络、深度生成模型、深度强化学习和序列生成模型等 [8] [9]。下面结合发射源定位介绍支持向量机SVM、K邻近算法KNN和卷积神经网络CNN。
SVM是一种监督机器学习算法,本文采用成对分类方法将非线性多分类问题转为binary SVM进行处理。设给定含N个样本的训练数据集
,对于第i类和第j类数据,训练一个SVM分类模型即等效为求解二次规划问题:
(2)
其中,上标表示是i类和j类之间的binary SVM的参数;下标t表示i类和j类的并集中样本的索引;
表示输入空间到特征空间的非线性映射,核函数为:
(3)
索引
,一共需训练
个binary SVMs。平均每个类包含N/M个样本,所以平均每个对偶问题包含2N/M个变量。第i类和第j类之间binary SVM的决策函数为:
(4)
(4)式用于判断数据是属于i类还是j类。
KNN是数据挖掘分类技术中最简单的机器学习算法之一,其指导思想是“近朱者赤,近墨者黑”,即由你的邻居来推断出你的类别。KNN算法的核心思想是:为了判断未知样本的类别,以所有已知类别的样本作为参照,计算未知样本与所有已知样本之间的欧式距离,从中选取与未知样本距离最近的K个已知样本,根据少数服从多数的投票法则,将未知样本与K个最邻近样本中所属类别占比较多的归为一类。假设给定两个样本
和
,其中n表示特征数,X和Y两个向量间的欧氏距离表示为:
(5)
KNN算法的分类原理如图4所示,图中当选择的K值取3时,待测样本的预测标签为类别1;当K取5时,待测样本预测标签为类别2。因此K值的选取十分重要,K越小越容易过拟合,当K = 1时只根据单个近邻进行预测,如果离目标点最近的一个点是噪声就会出错,此时模型复杂度高,稳健性低;但是如果K取的过大,这时与目标点较远的样本点也会对预测起作用,就会导致欠拟合,此时模型变得简单;如果K = N的时候,那么就是取全部的样本点,这样预测新点时最终结果都是取所有样本点中某分类下最多的点,分类模型就完全失效了。
图4. KNN分类原理示意图
CNN是一种前馈型的神经网络,相比于其他神经网络结构,卷积神经网络需要的参数相对较少,应用广泛。其核心思想是用卷积核
分别对输入特征映射
进行卷积,然后将卷积结果相加,并加上一个标量偏置b得到卷积层的净输入
,再经过非线性激活函数后得到输出特征映射
,最后通过汇聚层、全连接层和激活函数完成输入特征分类。
(6)
(7)
其中,
为三维卷积核,
为非线性激活函数。本文设计的CNN结构和参数如图5所示,采用8个卷积层对特征进行提取,通过一层Flatten将卷积层的多维输出一维化,最后通过全连接层和带有3个神经元和softmax的激活函数实现对3个房间内WiFi发射源位置的识别。

Figure 5. Structure CNN model and parameters
图5. CNN深度学习模型结构和参数
2) 实验结果
首先,在房子外围监测接收点的数量为8的情况下,用采集到是数据对CNN模型进行训练,训练次数为50次,每次训练的样本数为1024。图6为监测接收点位置编号示意图和通过模型训练和测试得到的混淆矩阵。结果表明采用8个监测接收点时,识别准确率达到98.5%,此时采用KNN和SVM的准确率分别为98.8%和97.7。
其次,将监测接收点的数量从8个分别减少至7个、6个、5个、……和2个,采用CNN,KNN和SVM对定位研究并对精度进行分析和比较。图7所示为混淆矩阵计算结果,表1为采用不同算法进行位置识别得到的精度比较。结果表明,当监测接收点数量仅为2个时,三种算法定位准确率均较低;当监测接收点数量为3个时,三种算法的定位准确率均达到70%;当监测接收点数量为4个时,KNN的定位准确率提高最明显,达到81.7%;当监测接收点的数量为5个时,KNN的定位准确率达到91.4%,CNN和SVM分别为83.6%和87.9%。因此要达到较高的定位精度,监测接收点的数量至少要有5个。

Figure 6. Antenna numbering diagram and confusion matrix (8 monitoring nodes)
图6. 天线编号示意图和混淆矩阵(8个监测节点)

Figure 7. The confusion matrix for different number of receiving points. (a) N = 7; (b) N = 6; (c) N = 5; (d) N = 4; (e) N = 3; (f) N = 2
图7. 监测接收点数量N变化时的混淆矩阵。(a) N = 7; (b) N = 6; (c) N = 5; (d) N = 4; (e) N = 3; (f) N = 2

Table 1. Comparison of location recognition accuracy of CNN, KNN and SVM
表1. CNN, KNN和SVM位置识别精度比较
图8为三种算法准确率比较曲线,可以看出,在监测节点数量多(N ≥ 4)和少(N < 4)的情况下KNN均具有较高的准确率;在监测节点数量较多的情况下,SVM的准确率高于CNN,而监测接收节点较少的情况下,CNN和KNN的准确率优于SVM。

Figure 8. Comparison of location recognition accuracy of three algorithms
图8. 三种算法准确率比较曲线
5. 结论
本文基于电磁场仿真软件WinProp建立了WiFi发射和接收功率仿真模型。通过模拟在一栋单层别墅内不同房间进行WiFi发射,在别墅外围设置监测接收点进行接收,研究了WiFi信号的传输特性;建立了WiFi信号接收功率数据集,分别采用CNN、KNN和SVM三种算法对房间内无线AP进行定位,并比较了监测接收节点数量变化时的定位精度。结果表明,在相同的节点数量下,KNN具有较高的定位精度;当监测接收节点数量为5个时,CNN、KNN和SVM算法的定位精度分别为83.6%、91.4%和87.9%;当监测接收节点的数量大于等于7个时,三种算法均可以达到90%以上的准确率。本文的研究工作对解决非视通环境下的无线电监测定位问题有重要意义。
致谢
本文得到了云南大学无线创新实验室的支持,对王晓燕博士和付英贤同学的支持表示衷心感谢。
基金项目
国家自然科学基金(61863035, 41461052, 11564044)。
参考文献