1. 引言
回归分析是用来评估一个响应变量和一组解释变量之间函数关系的一种数据分析工具,它被广泛的应用于通过对解释变量的观测来描述、控制和预测响应变量的值。在实际应用中,信息往往是不能被精确的测量,比如:性格稳定,波动平稳等具有模糊性的语言,经典的回归方法就有一定的局限性。
Zadeh [1] 于1965年提出了模糊集的概念,建立了模糊集理论,是用来处理不确定性问题的重要工具,它是把取值为0或1的特征函数扩展到可在单位闭区间[0,1]中任意取值的隶属函数来表示对某一模糊概念的模糊性的描述,显然它是对经典集合的扩展,经典集合只能描述“非此即彼”的状态,而模糊集可以描述“亦此亦彼”的状态,但它并不能描述“非此非彼”性。为此,1986年Atanassov [2] 提出模糊集的推广概念——直觉模糊集,给出了论域中一点的隶属度和非隶属度。
最早的模糊环境下的回归分析研究是Tanaka等 [3] 在1982年提出的,引入了模糊回归的可能性方法,通过转化使其目标函数为模糊回归系数展形和最小的带约束条件的线性规划模型问题。目前,模糊回归分析的主要方法大致可以分为三类。第一类是基于可能性概念的线性和非线性规划方法、目标规划和区间回归分析。第二类是最小二乘法和最小一乘法,通过定义两个模糊数之间的距离,使得距离和达到最小,从而确定回归模型的参数。第三类是基于机器学习的模糊回归分析,指的是在模糊回归中加入进化算法、神经网络等机器学习技术。此外还有基于鲁棒、概率、逻辑、二型、聚类和时间序列等模糊回归方法框架下的研究分析。
根据输入、输出数据及系数的类型,模糊回归模型主要可分为以下几类,一是具有清晰输入、清晰输出和模糊系数(CICOFC)的模型,二是具有清晰输入、模糊输出和模糊系数(CIFOFC)的模型,三是具有模糊输入、模糊输出和清晰系数(FIFOCC)的模型,四是具有模糊输入、模糊输出和模糊系数(FIFOFC)的模型。Mogilenko等 [4] 考虑CICOFC和CIFOFC的类型,将基于遗传算法和基于规划方法的模糊回归分析进行对比研究。Tanaka等 [5] 以模糊输出展形估计值和最小为目标,基于规划方法对具有CIFOFC类型的模糊回归模型的系数展开估计。Hassanpour等 [6] 利用L1范数量化模糊数之间的距离,用规划方法估计具有FIFOCC类型的模糊回归模型的系数。对于FIFOFC类型的模型,在模糊数乘法计算中常会出现形状改变的情况,Hassanpour等 [7] 利用三角模糊数乘积的近似计算,对FIFOFC类型的回归模型通过目标规划法估计模型的未知系数。Hong等 [8] 对于FIFOFC类型的模型,在LL-型模糊数间的运算中引入极端积算子(最弱算子),替代了Zadeh的取小取大算子,对模糊线性回归模型展开估计。Kelkinnama [9] 在模糊回归中提出用带有形状保持运算的最小一乘方法。
直觉模糊集的特点为回归分析提供了比传统模糊回归更丰富的工具来把握模糊性。Parvathi等 [10] 建立输入、输出为清晰数、系数为直觉模糊数的直觉模糊回归模型,并通过数学规划方法来估计模型的未知系数。Arefifi等 [11] 提出用最小二乘法来确定直觉模糊回归模型的未知系数。Hesamian等 [12] 针对具有清晰输入、直觉模糊输出和直觉模糊系数的半参偏logistic回归模型展开系数估计。Hesamian等 [13] 在文献 [12] 建立的模型中引入岭估计方法,对存在多重共线性的数据展开半参偏logistic回归模型系数的估计。Chen等 [14] 针对具有直觉模糊输入、直觉模糊输出、直觉模糊系数的直觉模糊回归模型,考虑系数可能为负的情形结合最小一乘法确定模型的回归系数。文献 [11] 和文献 [14] 中直觉模糊数相乘都是利用近似计算的结果。Kumar等 [15] 在直觉模糊数乘法中引入极端积算子,保证LL-型直觉模糊数的乘法运算还是LL-型直觉模糊数。Chen等 [16] 在直觉模糊回归中引入极端积算子,对模型的可行性和有效性展开分析。
通过以上的回顾可知关于基于极端积算子的直觉模糊回归模型还较少,本文首先为了更准确的将基于极端积算子推导的直觉模糊数之间的运算运用到直觉模糊回归模型中,给出LL-型直觉模糊数间除法的结果。其次提出两个基于水平截集的直觉模糊数之间的距离函数来表示对象之间的差异,并对其性质进行讨论。根据提出的新的距离建立了基于极端积算子,输入、输出、系数都是直觉模糊数的直觉模糊回归模型。并讨论了LL-型直觉模糊数退化成对称直觉模糊数,LL-型模糊数的情况。最后,利用三个拟合优度准则,与一些算例进行比较,验证了该方法具有较好的适用性和有效性。
本文其余的部分组织如下:第2节介绍了直觉模糊数的相关知识及给出了基于极端积算子的LL-型直觉模糊数间除法运算的算例;第3节根据直觉模糊集的距离给出了三个直觉模糊数间的距离公式并对其性质进行讨论;第4节根据提出的新距离建立了基于极端积算子的直觉模糊回归模型及其估计过程;第5节介绍了三种性能评价指标;第6节将提出的模型应用到直觉模糊数据集和模糊数据集上,并与其他模型进行比较;第7节是结论。
2. 预备知识
定义1 [2] 设X是论域,X上的直觉模糊集A可以表示为
其中
为A的隶属函数,
为A的非隶属函数,且对
,
。X上的直觉模糊集的全体记为
。
定义2 [17] 设
,对于
,
,A的
-截集和
-截集定义如下
定义3 [18] 映射
,如果
满足条件:
1)
,
2)
,
3)
,
4)
。
则称T为
上的T-模。
定义4 [19] LR-型直觉模糊数的隶属函数和非隶属函数的形式如下
其中
,
,a是A的中心,
和
是隶属函数的左右展形,
和
是非隶属函数的左右展形。记为
。记所有直觉模糊数的全体构成的集合为IFN,所有LL-型直觉模糊数的集合记为
,所有正的LL-型直觉模糊数的集合记为
,所有负的LL-型直觉模糊数的集合记为
。所有非负的LL-型直觉模糊数的集合记为
,所有非正的LL-型直觉模糊数的集合记为
。
注1 当
,
,
时,A退化成对称直觉模糊数,即
。当
时,直觉模糊数变成三角直觉模糊数记为
。
定义5 [17] 设
,
,
,则
为具有以下形式的Z的直觉模糊集
其中T为三角模。分别称
为A与B基于T-模的扩张加法、扩张减法、扩张乘法、扩张除法。
为A与B基于
的扩张加法、扩张减法、扩张乘法、扩张除法。
为A与B基于
的扩张加法、扩张减法、扩张乘法、
扩张除法。
接下来我们给出基于极端积算子的LL-型直觉模糊数间的加法、减法、乘法、数乘相关运算如下所示
设
,
,
,则 [15]
1)
2)
,
3)
关于直觉模糊数间的除法运算,在文献 [20] 中给出了直觉模糊数间基于极端积算子除法运算的近似结果,本文结合极端积算子和扩张原理,推导了LL-型直觉模糊数间的除法精确的运算并将结果放在附录中,这里举例说明基于极端积算子的直觉模糊数间的除法并不能保持形状不变性,设
,
,基于极端积算子和扩张原理推导的直觉模糊数除法结果见图1(a),其隶属函数和非隶属函数如下
除法结果近似为三角直觉模糊数
,见图1(b)。

Figure 1. Comparison of result. (a) Exact result of division
; (b) Approximate result of division
图1. 结果对比。(a)
的精确结果;(b)
的近似结果
3. 直觉模糊数间的距离及性质
在应用中,为了衡量两个直觉模糊数间的差异程度,我们通过水平集将其转化成区间与区间之间的差异,下面由直觉模糊集之间的距离度量 [22] [23] [24] 来构造了一些直觉模糊数之间的距离度量。
定义6 [21] 映射
为论域X上的直觉模糊集之间的距离,若对任意的
,映射满足
1)
,
2)
,
3)
。
假如A是直觉模糊数,
和
可以被两个区间表示:
和
。
对于
,
,
,
,r是A的截集个数,直觉模糊数之间的距离用截集表示如下
由距离的定义可知,提出的距离满足以下性质
1)
,
,
是度量空间。
2)
,
,
满足若
,则
。
我们用提出的基于两个截集水平
的距离应用到三种不同的情形中来说明这些距离可以合理地描述直觉模糊数之间的差异并且不涉及复杂的计算,结果见表1。情形1中,
的距离比
的更小。在情形2中,
,因为
和B更接近,所以
的距离比
的距离更小。在情形3中,直觉模糊数之间只有中心值的差异,用这三个距离求出的距离值也较好地说明了这种情况。
4. 基于极端积算子的直觉模糊回归模型
用LL-型直觉模糊数建立的直觉模糊回归模型一般形式如下
其中,
是输出的预测值,
是第j个自变量,n是数据量,p是自变量的个数,
是LL-型直觉模糊系数。
为了估计模型的系数,通过使得估计的因变量和观测的因变量之间的距离最小,也就是
首先令
和
,于是得到直觉模糊输出估计
为
· 对称直觉模糊数
具有以下的形式
。于是得到估计的对称直觉模糊输出
为
· LL-型模糊数
具有以下的形式
与
,则获得的估计的模糊输出
如下
我们最小化
和
之间的距离之和,即
,结合距离的定义等价于下列式子
为了简化上述优化问题,我们将其转化成标准的数学规划问题,对于绝对值表达
,引入非负变量
,于是可转化成
这里
,
。类似地,引入
这些非负变量。于是模型转化为以下式子
在约束条件下
同样的,以
为距离的模型被转化成如下规划问题
在约束条件下
其中
为非负变量。
5. 拟合优度指标
拟合结果的效果是回归分析中最关心的问题之一。在本节中,采用以下三种指标来评价直觉模糊模型的拟合效果。
1) 平均Kim & Bishu 测度(MKB)
2) 平均贴近测度(S)
设Y和
分别为直觉模糊输出的实际值和拟合值,则S测度定义如下:
3) 平均贴近测度(SM)
6. 模型对比
在这里我们将提出的基于
,
的模型应用到直觉模糊数据和模糊数据中来验证模型的可行性与有效性。
6.1. 直觉模糊数据集
在这个算例中考虑文献 [11] 中的直觉模糊输入-直觉模糊输出数据集,砂粒含量百分比
和有机质含量
为自变量,阳离子交换容量
为因变量,其中
且数据集均为对称三角直觉模糊数。将该方法与Arefifi等 [11],Chen等 [14] [16] 的模型作对比,这里将直觉模糊数的水平集的个数设为2,取
为0,
为1。模型相应的评价指标结果见表2。图2描述了观测输出的中心值,隶属函数在0水平集的上下界,非隶属函数在1水平集的上下界,以及基于
建立的模型得到的估计输出的中心值,隶属函数在0水平集的上下界,非隶属函数在1水平集的上下界。
由表2可知,Arefifi等 [11] 和Chen等 [14] 这两个模型的拟合效果不如其他模型,可能是因为两个模型在处理直觉模糊数乘法运算时采用的是基于
算子的扩张原理,计算结果是近似值。Chen等 [16] 及本文模型均是基于极端积算子建立的模型,从模型估计来看,由表2可知基于近似运算建立的模型没有使用基于极端积算子的模型好。Chen等 [16] 和我们使用
的模型具有比较接近的拟合效果,在形状保持算子的帮助下,MKB相对较低,同时具有较高的MS和MSM。使用
的模型与前面所提出的模型对比,也是相对占优的。

Table 2. Different model fitting effect of intuitionistic fuzzy data set
表2. 不同模型对直觉模糊数据集的拟合效果
注:括号内为各个评价指标的优劣次序。

Figure 2. Fitting effect of regression model on intuitionistic fuzzy data set
图2. 直觉模糊数据集上回归模型的拟合效果
6.2. 模糊数据集
该数据集由Sakawa等 [25] 提出,包含八个数据,由一个模糊响应变量和一个模糊解释变量组成,许多作者都使用这组数据来验证模型的可行性,其相应的优化模型及其三个评价指标见表3。
这里将所有对比模型分为两类,一类是模型系数是精确的,另一类是模型系数是模糊的。对于模型系数是精确系数的情况,Diamond [26] 采用的是最小二乘法来建立模型,其中回归系数要求是精确系数。Kao等 [28],Chen等 [30] [31],Choi等 [32] 的模型均带有模糊调整项且系数为精确系数,Chachi等 [33] 对模糊数据的
水平集得到的区间值数据,采用最小二乘法,建立清晰系数的模型。从三个评价准则可以看出,Chen等 [30] 的模型在这些模型中表现最好。
对于模型系数为模糊数的情况,在Sakawa等 [25] 方法中,利用三个模糊数相等的指标,提出了三种获得模糊线性回归的方法。为了解决模糊数相乘的问题,Yang等 [27] 引入了基于
的模糊运算,并采用最小二乘法构造模型。Nasrabadi等 [34] 在对称模糊数上定义了新的算术运算,并将这些运算用于模糊回归分析。Kelkinnama等 [9] 采用了基于
的算术运算的最小一乘法来构建模型。Chen等 [35] 提出了一种新的运算,并将其应用于数学规划中。
本文提出的模型以
,
作为目标函数,当直觉模糊数退化成模糊数时,
,
是相等的,由表3可以看出,本文提出的模型MKB值较低,对于MS和MSM分别处于第四,第五。从MSM指标来看,Sakawa等 [25] 较好,但其MKB较高。从MS指标来看,Chen等 [35] 较好,Chen等 [35] 与本文的MS差值为0.0104,总体来看本文提出的模型与Chen等 [35] 具有一定的等效性。

Table 3. Different model fitting effect of fuzzy data set
表3. 不同模型对模糊数据集的拟合效果
7. 结语
本文讨论了直觉模糊多元回归方法,提出利用最小绝对偏差估计直觉模糊系数。在模型中,输入和输出以及系数都是LL-型直觉模糊数。基于极端积算子结合扩张原理推导了直觉模糊数间的除法,并通过举例说明基于极端积算子的除法并不能保持形状不变性。为了得到直觉模糊回归模型,提出了基于直觉模糊数的水平集的距离度量并应用到规划问题中,与其他模型进行对比说明本文模型的可行性与有效性。
很明显,我们不能断言所提出的模型总是优于其他模型。因此我们需要根据数据的特性和问题的具体要求,决定在提出的模型中应该使用什么距离度量。直觉模糊回归分析还需要进一步的后续研究,有必要建立具有更好解释能力的模型。此外,我们可以研究如何建立一个与人工智能相结合的直觉模糊回归系统,以处理非线性函数关系、随机不确定性或多重共线性的数据。我们希望这种直觉模糊回归模型能够成为分析带有随机性或模糊性的非线性依赖关系的有效工具。
附录
基于
的两个直觉模糊数之间的除法
当
,
,有
当
,
,有
当
,
,有
当
,
,有
当
,
,有
当
,
,有