1. 引言
一元Askey-Wilson多项式
是n阶的x多项式,包含五个参数a、b、c、d和q。参考标准的基本超几何表示法 [1] 和该多项式的三项递推表达式关系,可以推断Askey-Wilson多项式为正交多项式。正交多项式形成的正交函数系是分析数学中的一个重要组成部分,正交多项式在实际应用中有着良好的鲁棒性,现已被广泛应用于机器学习及数理统计等各方面。从分析组合角度出发,Askey-Wilson多项式可以给出一个明确的绝对连续测度的n阶矩函数
,该函数是包含参数a、b、c、d和q并混合二项式和q-二项式的有理函数。Jang Soo Kim [2] 通过组合模型的n阶矩函数,给出了新的n阶Askey-Wilson多项式组合形式,所包含的参数在多项式中权重有所不同,当参数
时,得到的Askey-Wilson多项式表达式为对称的多项式,同样特殊情况
,
也是如此。Askey-Wilson多项式在正交多项式邻域中是最新的研究成果,构造支持向量机的核函数也是十分有效的。Luís Daniel Abreu [3] 等人基于Askey-Wilson多项式构造出多项式再生核函数,Michael R. Hoare [4] 等人研究了其转移矩阵。Askey-Wilson多项式选取不同参数的值,可以获取不同的Askey-Wilson多项式核函数形式,但由于参数比较多,所以必须要有一种高效的寻参机制和核选择机制,利用自适应优化策略来控制参数。正交多项式核函数以往采用的是Rbf核函数与泛化正交多项式乘积的组合核。三角核函数有着与Rbf核函数相当的性能,本文提出了Askey-Wilson多项式两类形式分别与Rbf核函数和三角核函数组合形成混合核函数,并考察每一种混合核函数在支持向量机上的分类能力。
2. Askey-Wilson核函数
2.1. Askey-Wilson多项式
Askey-Wilson多项式表达式 [5] 为:
,
其中
,且
。
Askey-Wilson多项式的递推公式 [2]:
,
其中
Askey-Wilson多项式的正交关系 [6] 为:
其中
,
。
2.2. 三角核函数
三角核函数是根据Laplace核函数
改进而来。利用泰勒展开式,当
时,
近似等于
。当
为1或者2且
,固定x范围,
核函数关于
是一个对称的三角图形,故可称为三角核函数 [7]。
2.3. 两类AW核函数
第一类Askey-Wilson多项式,
,
时,根据递推公式
、
、
,1到3阶AW广义多项式为
x为行向量,
为
转置。
第二类Askey-Wilson多项式,
,
,
时,根据递推公
、
1到3阶的AW广义多项式为
基于上述的两类Askey-Wilson多项式,建立n阶Askey-Wilson高斯核函数和Askey-Wilson三角核函数第一类AW高斯核函数
,第一类AW三角核函数
。同理可以构建第二类AW高斯核函数
和第二类AW三角核函数
。
根据Mercer条件 [6],若
,则
是核函数。由于
是Rbf核函数的一种形式,所以核函数成立。三角函数
,基于其单调性,利用Mercer定理,证明也是一个核函数 [6]。再根据核函数的性质,核函数的乘积组合依旧是核函数,所以第一类AW多项式混合函数和第二类AW多项式混合函数都可以作为支持向量机的核函数。
3. 实验结果
3.1. 在双螺旋分类对比
本文实验选择了238个样本点的双螺旋线数据集,通过第一类AW高斯核函数、第一类AW三角核函数、第二类AW高斯核函数、第二类AW三角核函数以及Rbf核函数来进行对比。表1列出了这5种核函数在双螺旋集上训练精度为100%时的分类间隔及支持向量的个数。如下是各类AW核函数在训练集上的分类界面图。


Table 1. Training results of kernel function on double helix
表1. 核函数在双螺旋线上训练结果
实验结果表明,AW核函数都能将双螺旋数据集准确的分类,且间隔都要优于Rbf核函数,尤其是第二类AW三角核函数最大间隔最好,其次是第二类AW高斯核函数。
3.2. 标准UCI数据集上的分类对比
选取的标准UCI数据集属性如表2所示。在这里只考虑1到3阶的AW核函数,核参数q取不同值时,1到3阶AW核函数对数据预测会产生不同准确率。选取最高的准确率,标明对应阶数,则得到实验结果如表3。根据表3的实验结果,挑选出AW核函数在每个数据集上最好的分类效果,然后和Rbf核函数、Poly核函数分类效果做出对比,得到表4。

Table 2. Attributes of experimental UCI data sets
表2. 实验种UCI数据集的属性

Table 3. Precision of four kinds of AW kernel function results: %
表3. 四类AW核函数结果精度:%

Table 4. Attributes of experimental UCI data sets
表4. 实验种UCI数据集的属性
从表4可以看出,第一类AW高斯核函数和第二类AW高斯核函数在sonar数据集上具有很好的表现,在vechicle和svmguide2表现比第一类AW三角核函数,第二类AW三角核函数要差一些。第一类AW三角核函数和第二类AW三角核函数可以通过调整核参数q的值从而获取最高的精度,比高斯核函数和多项式核函数而言有明显优势,因此有着非常好的鲁棒性的泛化能力。
NOTES
*通讯作者。