1. 引言
随着传感器和通信技术的发展,汽车无钥匙进入与启动系统(Passive Entry and Passive Start,简称PEPS)逐渐成为汽车的重要组成部分[1]。由于传统钥匙或遥控钥匙的便利性不足,基于消费者智能手机的蓝牙peps技术应运而生,用户把手机当成虚拟钥匙,实现车辆自动解锁和启动。该系统不仅提高了用户的便利性,还增强了车辆的安全性。低功耗蓝牙的优势在于其经济性、能耗低、延迟短以及可靠性高[2]。
目前,主流的无线定位技术主要可分为基于测距(三边测量、三角测量、到达时间差法等)和基于非测距的方法[3]。基于测距的方法受到使用场景、成本及定位精度的限制,不适合应用于蓝牙PEPS系统。该方法也采用非测距技术,通过事先收集大量场景数据来达到精确定位,也被称作位置指纹识别方法,对环境适应性较强,是汽车蓝牙PEPS研究中的主流技术。
指纹定位算法选取接受信号强度指示值(Received Signal Strength Indication,简称RSSI)作为位置指纹的特征参数[4],传统的RSSI定位算法主要依赖于单一终端采集信标的RSSI值。然而,在汽车环境中,RSSI信号容易受到车体、行人以及电磁干扰等多种环境因素的影响[5]。此外,由于车窗玻璃对RSSI信号衰减的影响不显著,因此识别靠近车窗的终端的内外部状态变得相对复杂。为了减少靠近车窗时的定位误差,并提高智能终端的内外部状态识别准确性,本文提出了一种基于WKNN算法的双终端差分加权K近邻(Differential Weighted K Nearest Neighbors, DWKNN)方法。该方法通过分析两个终端之间的RSSI信号差异,旨在减小车载电磁环境的干扰。原始终端收集到的RSSI信息可以利用经典的机器学习识别方法进行内外部状态判断。该算法结合了三种经典算法:加权K近邻[6]、朴素贝叶斯(Naïve Bayes Classifier,简称NBC)和分类回归树(Classification And Regression Tree, CART)。各类策略均会产生辨识成果,通过运用Dempster-Shafer (DS)证据理论,对潜在的矛盾结果进行整合,进而获得最终的辨识结论[7]。通过结合多种方法,旨在减少环境因素对RSSI信号的影响,从而提高定位精度和鲁棒性。
2. 蓝牙位置指纹定位技术
蓝牙位置指纹定位技术是一种基于无线信号特征进行定位的方法,广泛应用于室内定位系统。其基本原理是通过测量设备接收到的蓝牙信号强度(RSSI)等特征,建立与特定位置相关的“指纹”,从而实现对设备位置的识别和定位。原理图如图1所示,该系统大致包括二个部分:离线部分与在线部分。
不妨把需要规划位置匹配的区域划分成
个网格,计第
个网格为
,称每个网格的中心位置为参考点,在特定几何空间的各个参考点,数据采集人员获取蓝牙信标的RSSI值,从而构建位置指纹。针对于
个信标采集
次的情况,RSSI的样本中的一个离线的参考位置,存在以下形式:
(1)
上式中
表示在第
个离线区域上采集第
次采集第
个信标时的RSSI。
为对应的RSSI指纹信息。
Figure 1. Principle diagram of position fingerprinting
图1. 位置指纹法原理示意图
2.1. 离线阶段
离线阶段是蓝牙位置指纹系统进行定位的关键,主要涉及指纹数据库的构建。在这一阶段,系统需要在目标区域内进行广泛的信号采集。具体流程如下:
1) 区域划分:首先,把待定位位置分割成若干个小位置或网格,各个位置一般称为一个指纹位置。
2) 信号采集:在每个指纹位置,使用蓝牙设备(如蓝牙信标或接收器)收集来自该位置周围的蓝牙信号数据。
3) 指纹特征提取:对收集到的数据进行处理,提取出每个位置的特征向量,这些特征向量代表该位置的信号指纹。信号强度可能会受到环境因数的影响,因此通常会进行多次测量并计算平均值,以提高数据的可靠性。
4) 数据库建立:将每个位置的信号特征向量和对应的坐标信息存储在指纹数据库中。这个数据库将在后续的在线定位阶段中被用于匹配。
2.2. 在线阶段
在线阶段是指在实际应用过程中,通过实时的信号测量来进行定位。其过程如下:
1) 实时信号测量:用户的移动设备在待定位区域内,通过蓝牙模块持续扫描接收到的信号。与离线阶段类似,设备将记录每个可接收到的蓝牙信号强度和其他特征信息。
2) 指纹匹配:系统将实时测得的信号特征向量与离线阶段建立的指纹数据库进行比对。经典的传统匹配算法包括最近邻、朴素贝叶斯、分类回归树等算法。这些算法通过计算实时信号与数据库中各个指纹的相似度,找出最接近的指纹参考点。
3) 位置估计:通过匹配结果,系统能够估计出用户的当前位置。通常情况下,定位结果会以坐标形式输出,并可进一步用于导航或其他应用。
3. 匹配算法模型
经典的传统型方法包括K近邻算法,而常见的基于概率分布方法则有朴素贝叶斯法与分类回归树。前面一种算法往往仅基于信号接收强度的指示值来计算信号之间的物理位置,未能深入参考和分析原始数据中的信息相关性。相较之下,概率分布方法在进行定位时需依赖极为精确的概率分布,这要求大量的RSSI数据被记录,从而作为位置指纹进行匹配训练,这在实际应用中往往难以显著提升定位精度。
在车辆应用场景中,匹配定位算法的低识别准确率主要集中在汽车的车窗周围。这是由于构成汽车车窗的玻璃物质对RSSI信号的屏蔽作用几乎没有,使得在此区域内的信号识别变得颇为困难。为降低车窗附近的误差并提升对用户手机处于车内车外状态的识别精度,设计了一种基于两智能终端的差分匹配方法。假设原有的用户手机作为虚拟钥匙,被当做终端a,新增加的放置在车内位置不变的信号接收设备为终端b。在双终端指纹库的离线阶段中,a、b接收到的RSSI差分信息被存储。一方面终端a接收到的RSSI数据在传统的匹配算法上进行分析处理,比如选择加权K近邻算法、朴素贝叶斯法和分类回归树法三种传统算法。另一方面采取这三种方法与双终端算法各自处理匹配算法定位,再通过DS数据融合框架对这四种定位算法的结果进行决策判别。经DS证据理论决策得到的数据最终通过滤波器输出定位识别结果。位置指纹在线阶段的车内外识别算法匹配原理图如图2所示:
Figure 2. Schematic diagram of online phase matching algorithm
图2. 在线阶段匹配算法示意图
3.1. 双终端差分加权K近邻
在汽车环境中,车内外定位过程中蓝牙设备获取的RSSI信号容易受到车辆本身框架、人体介质及电磁环境等因素的干扰,导致终端收集到的RSSI信号存在较大波动,从而使得诸如加权K近邻这样的定位方法的错误识别率显著增加。关注到经典K近邻匹配法仅通过RSSI的平均指示值来计算无线蓝牙信号之间的物理参数距离,未能充分挖掘原始数据信息,因此提出了一种双终端方案。该方案将一个终端蓝牙信号接收控制器b放置在车辆内部,通过实时对比固定终端收集的RSSI与移动终端a收集的RSSI,从而减轻由于车辆的电磁干扰所造成的影响。
K近邻算法基于欧几里得距离,计算离线指纹数据库的RSSI向量组和在线测得的RSSI向量组之间的相似程度,并将所得结果以升序形式存储于集合之中。欧几里得相似量方法的表达式
如下:
(2)
式中:
代表在线阶段获取的实时RSSI信息,而
则为离线指纹信息库中第
行的RSSI位置数据。
位置的识别定位通过与在线测得的向量信号最靠近的前
个数据信息所对应位置进行推理。对计算所得的欧几里得距离较小的蓝牙信号给出更高权重值,从而提高了最终定位结果的正确率。
(3)
(4)
式中:排序最前面
个近邻所对应的空间物理坐标是
,
为这些位置的权重。为预防权重
出现极端值的情况,在计算距离的倒数时通常会在之后添加一个固定常数
,实际应用中
可选取固定值0.00001。
在双终端应用下,两个终端同步采集蓝牙信标的RSSI值,
、
表示两个蓝牙终端设备获取到的指纹离线数据库。在测试环境中采用轴对称的物理分布,假设计划布置
个信标蓝牙发射设备,每个信标都有一个与其相对应的对称信标,这些信标可以被划分为不同的
组。
(5)
式中:
表示在其中一次采样蓝牙信号时智能手机终端a获取到信标蓝牙
的RSSI值。
利用公式5,双终端收集同组RSSI的差方并累加,即可得到RSSI的强度参数
,并可将
、
预处理为离线的指纹库
:
(6)
式中:
为指纹位置信息库中蓝牙信标
所对应的全部RSSI组成的向量组。
如图3所示,展示了汽车内部与外部蓝牙信号指示值的差异程度。图中横轴为指纹库RSSI向量组的数量,前117组向量来自车外,后108组向量则来自车内,纵轴表示序列对应的差分强度
值。可以看出在车内与车外状态下,双终端同组信标的RSSI值差分效果显著。
3.2. 改进的Dempster-Shafer证据理论
Dempster-Shafer (DS)证据理论是贝叶斯概率理论的发展[8]。它的优越性在于通过将概率分配到多个事件假设中,而不是单个事件,来指示“不确定性”。通过优化的证据理论从事多源信息的数据决策融合,可以有效提高事件决策的有效性和算法识别的准确度。
假设
为一个有限非空集合,其中包含
个相互排斥的事件,
即为DS证据理论的识别框架。
(7)
Figure 3. Differential effect of RSSI on two terminals
图3. 双终端RSSI的差分效果
的幂集具有
个假设,表达形式如下:
(8)
质量函数
是一个将
映射到区间
的映射,定义如公式(9)所示:
(9)
上式满足以下限制:
(10)
也被称为基本概率分配(BPA),
的值越大,对事件
的支持度就越高。
假设
和
是对应于的不同证据源的两个基本概率赋值,融合后的基本概率赋值如下:
(11)
式中:
,
为冲突度量的系数,
。
Hellinger提出了一个新的距离度量参数,并称之为Hellinger距离。对于两个概率分布
和
,它们之间的距离度量如式12所示:
(12)
为了更好地衡量证据体的信息量和不确定性,受到香农的启发,Deng开发了一种新颖的信念熵[9],即邓熵。具体细节如式13所示:
(13)
式中:
是的
的质量函数。
尽管Hellinger距离在量化两个概率分布之间的差异方面效果较好,但它不能直接应用于DS证据理论,因为它的表达形式不是概率。因此,设计了一种新的信念Hellinger距离来测量两个证据之间的距离。
假设
和
为
上的两个质量函数。
和
之间的信念海林距离(BH)定义为:
(14)
式中:
。
然后基于提出的信念海林距离和信念熵,本文对传统的DS证据理论进行改进,提出一种新设计的多源数据信息融合方法,过程如下:
首先,我们使用公式14来计算证据源之间的距离,并将其记为
。之后建立一个距离的度量矩阵
如下:
(15)
然后根据度量矩阵
计算距离平均值,表示为
。公式如下:
(16)
计算证据的支持度(
):
(17)
计算每个证据源的信念熵:
(18)
然后生成构建证据源
的信息量:
(19)
获取证据源
的可信度:
(20)
对可信度进行归一化,获得最终的权重因子,记作
:
(21)
获得证据来源的最终加权平均质量函数,定义为:
(22)
最后利用Dempster决策规则将加权平均证据融合
次:
(23)
即为将DS证据理论改进后的最终数据融合结果,这一过程确保了每个证据源的贡献度与其可信度和信息量成正比,提高了多源数据融合决策后的可靠性和精确度。
4. 实验测试分析
为了评估决策融合算法与传统算法的效果差异,进行了一项车内、车外识别实验。发现在接近汽车车窗的较近距离时,定位方法的错误识别率会显著提高,因此在出现明显误判的情况下,记录下与车窗的距离,该距离被称为溢出距离。例如,若汽车车窗外延20 cm则表示外溢20 cm,若车窗内凹20 cm则称为内溢20 cm。定位识别方法在车窗周围附近的表现可以通过溢出距离进行评估。实验中将测试各种定位识别方法在位于车辆不同区域的识别正确率及其在汽车车窗周围的溢出距离。
测试中选用NRF52832控制板作为蓝牙接收设备。信标的布局需尽量减少遮挡,并采取轴对称的方式,以便于测量及内外识别的准确性。利用车辆的金属框架材质对蓝牙RSSI信号的衰减效果,布置造就车内蓝牙设备RSSI信号较强、车外蓝牙设备RSSI信号较弱的情形,从而整理出具有明显变化性的位置信息数据库。
当蓝牙设备数量达到某个阈值后,继续增加蓝牙设备数目对定位精度的提升效果并不显著。实验中信标蓝牙设备的布局如图4所示,包括总计2个车外蓝牙信标和6个车内蓝牙信标,终端b固定安装在车内的扶手箱位置处。
Figure 4. Bluetooth beacon layout
图4. 蓝牙信标布局
离线阶段:在信息收集流程中,必须尽量以多样化的方式收集信息,从而提高在线阶段的识别精度。离线位置库总计由26个子数据库构建,涵盖12个固定的车外采集区域、2个环绕车辆的动态采集区域、4个车内固定采集区域(对应于车内四个座位),以及靠近四个车窗的8个溢出区域采集位置。固定采集区域为半径0.5 m的圆形。在采集数据信息阶段,每个外部范围获取120组信息样本,而每个内部范围则收集360组信息样本。溢出区域采集范围指的是距离汽车车窗内外各20 cm的平面几何位置,车窗周围共计测得360组样本数据。
在线阶段:测试人员利用终端设备,在预设的车内外采集区域进行内外部识别所需的数据集采集,特别是在距离四个车窗20 cm的汽车内外区域,获取用于验证定位方法溢出距离的测试集数据。
在进行定位识别时,首先把离线阶段所获取的蓝牙信息经过滤波之类的预处理后形成离线数据指纹库。随后通过四种子算法独立进行识别,并根据DS证据理论将这四种方法的决策识别进行融合统一。
最终,通过滤波器输出对决策数据进行综合,推断出最终的识别结果。本测试规划了总共12个车内车外的识别测试范围,累计收集了1386组测试数据,其中车内数据为692组,车外数据为694组。
表1展示了基于差分加权K近邻法(DWKNN)和基于差分进化K近邻法(Differential Evolution K-Nearest Neighbor, DEKNN)在不同测试区域的定位准确性比较的结果。可以观察到,DWKNN算法在固定采集区域和动态采集区域进行识别时,定位平均准确度相较于DEKNN分别提高了1.31%和2.26%。特别是在动态区域中,DWKNN的性能提升效果更为显著,表明该算法在具有噪声和明显信号差异的场景下具有更好的鲁棒性。
Table 1. Comparison of the localization accuracy of DWKNN and DEKNN algorithms in different regions
表1. DWKNN和DEKNN算法在不同区域的定位准确性比较
K值 |
固定采集区域 |
动态采集区域 |
DEKNN |
DWKNN |
差异 |
DEKNN |
DWKNN |
差异 |
3 |
93.48% |
95.08% |
1.6% |
91.52% |
94.2% |
2.68% |
4 |
96.5% |
97.92% |
1.42% |
96.15% |
98.06% |
1.91% |
5 |
96.72% |
98% |
1.28% |
95.72% |
97.95% |
2.23% |
6 |
96.96% |
97.92% |
0.96% |
95.76% |
98% |
2.24% |
平均准确度 |
95.92% |
97.23% |
1.31% |
94.79% |
97.05% |
2.26% |
表2展示了各个基本识别算法及其融合识别算法在汽车内外识别测试集中的效果表现,记录了分析处理车内和车外的识别准确率。尽管各个子算法能够实现一定的识别精度,但仍存在少量误判。采用DS综合技术把四种子算法加以集成,显著增强了定位方法的辨识能力,综合方法的表现基本能够达到或超过表现最佳的单一方法。
Table 2. Accuracy of different algorithms in recognizing both the interior and exterior of car
表2. 不同算法在车内外识别的准确率
识别算法 |
车外识别率/% |
车内识别率/% |
WKNN |
100 |
93.9 |
NBC |
89.6 |
96.9 |
CART |
100 |
92.8 |
DWKNN |
99.2 |
95.2 |
DS |
99.6 |
97.8 |
在测试溢出距离时,我们设定了24个测试区域,分别位于距离4个汽车车窗内外20 cm、15 cm和10 cm的几何范围,每个区域收集120至240组样本以组建测试集。
如表3所示,表明DS融合定位识别算法在分析处理4个车窗周围获取的车内溢出、车外溢出数据集时的效果表现。从表格数据可以看出,算法在四个车窗附近的溢出识别率基本能够达到100%,表明DS算法在这些位置和距离上的识别效果非常好,仅在右侧后车窗外侧15 cm处识别率略有下降,降至92.7%。
5. 结论
本文聚焦于蓝牙PEPS系统中的车内外识别场景,提出了一种基于两个接收信号终端的差分加权K近邻匹配定位法。通过改良的DS证据理论,把差分加权定位法与传统的K近邻法的识别结果进行有效
Table 3. Recognition rate of the DS fusion algorithm near the car window
表3. DS融合算法在车窗附近的识别率
|
车外溢出识别率/% |
车内溢出识别率/% |
10 cm |
15 cm |
20 cm |
10 cm |
15 cm |
20 cm |
左侧主驾车窗 |
100 |
94.8 |
100.0 |
97.5 |
100 |
100 |
右侧副驾车窗 |
100 |
100 |
100.0 |
100 |
100 |
100 |
左侧后车窗 |
99.3 |
100 |
100.0 |
100 |
100 |
100 |
右侧后车窗 |
95.8 |
92.7 |
96.3 |
98.1 |
95.6 |
100 |
融合。在比较不同差分算法的定位性能测试中,本文的DWKNN算法对噪声和不平衡数据有更好的鲁棒性,固定区域和动态区域的平均定位精度分别达到了97.23%和97.05%。在车内外的识别测试中,各个子算法的识别准确率大致可达95%以上,而融合算法的准确率则超过了97%。实验结果表明,DS融合算法在不同车窗位置和不同距离的识别率表现优异,尤其在车窗附近的溢出识别率接近100%。本文通过DS理论的融合决策算法实现车内外状态的高精度识别,从而增强汽车内外部识别的准确度与可靠性。同时也降低了车辆附近环境不稳定因素对无线信号的干扰,针对车窗附近RSSI差异微小所引发的定位难题,本研究提出了一种创新性解决方案。