1. 引言
自1965年Zadeh [1]开创性地提出模糊集理论,模糊优化迅速在运筹学、控制理论和人工智能等多学科领域生根发芽。尽管模糊数学在不确定性优化方面取得了显著进展,但模糊函数的可微性及其在优化问题中的应用,依旧存在诸多亟待解决的难题。在模糊运算层面,其扩展性不足限制了对复杂模糊信息的处理能力;从可微性条件来看,现有的条件普适性欠佳,难以广泛应用于各种实际场景。
近年来,众多研究者针对这些问题展开了深入探索[2]-[4],相继提出了多种模糊函数的可微性定义,如Hukuhara可微(H可微)、广义Hukuhara可微(gH可微)等。同时,对模糊凸函数性质的研究也不断深入,其在优化中的作用逐渐明晰。然而,目前的研究仍存在一些关键缺陷:不同可微性定义之间的逻辑脉络尚未梳理清晰,缺乏系统性的关联分析,这使得研究者在选择合适的可微性定义时缺乏明确的指导;模糊优化问题的KKT条件尚未形成统一框架[5],导致在实际应用中难以灵活运用这些理论解决多样化的模糊优化问题;在实际应用中,像截集法[6]等模糊数运算方法,在运算效率和准确性方面还有很大的提升空间,无法满足日益增长的实际需求。此外,模糊优化中的序关系(如可能性序、必然性序)尚未与KKT条件系统结合,导致约束可行性判断缺乏理论支撑。
为了攻克上述难题,本文紧紧围绕模糊数的截集运算和Zadeh扩张原理[6],对模糊函数的可微性及其优化理论展开了系统而深入的研究。具体而言,本文的核心贡献主要体现在以下几个方面:
(1) 提出基于截集置信水平的分层可微性框架,统一H可微、gH可微与G可微的适用条件;
(2) 构建模糊序关系下的KKT条件,明确互补松弛条件在可能性测度下的数学表达。
2. 模糊函数的相关知识
1) 模糊数的截集
模糊数的截集是一个经典集合(清晰集合),表示在某个置信水平
下,模糊数中隶属度大于或等于
的所有元素组成的集合。
数学形式:对于一个模糊数
,其
-截集的定义为:
直观理解:截集将模糊数“切割”为明确区间,反映了“在至少
的可信度下,模糊数的可能取值范围”。
模糊数具有单调性:
越大,截集范围越小(例如,
的截集比
的截集更窄)截集是闭区间:如果模糊数的隶属函数是凸的(如三角形,梯形),其截集通常是一个闭区间
。
2) 模糊数的运算法则所依据的原理
(a) Zadeh扩张原理[7] [8]
定义:设
是一个经典函数,
分别为论域
上的模糊集合。
是论域
上的模糊集合,其隶属函数[9]定义为:
(b)
-截集法[10] (Interval Arithmetic)
对任意
,若
和
的
-截集分别为
和
,则运算结果
的
-截集为:
3) 广义Hukuhara减法:对于
,其广义Hukuhara减法定义为,如果存在模糊数
使得
4) 对于
,其
减法[11]定义为,
3.
-凸函数
1) 模糊凸函数定义:设
是凸集,如果对于任意
,下面式子成立,则称
是模糊凸函数。
注:关于模糊凸函数的定义虽然在表述上存在不同,但是实质内容基本相同。本文所选定义在凸函数的模糊化研究领域内被大量使用,例如[12]-[14]。
2)
是模糊凸函数当且仅当对任意
,
和
是凸函数,即
.
3) 基于隶属函数的等价表示
4) 基本性质
(a) 若
和
是模糊凸函数,则
和
也是模糊凸函数,但非线性运算(如乘法)可能不保持凸性。
(b) 模糊凸函数的局部极小值(若存在)也是全局极小值。
(c) 每个
截集对应的函数
和
均为经典凸函数。
4.
模糊函数的可微性相关介绍
1) H可微[12]:
(a) 点可微条件:若存在
,使得
这里的
以及
都是
中的元素,其运算和极限基于
中元素的度量
以及序关系
等来定义和衡量。
(b) 集合上可微条件:若
在
上可微,则对于任意
,对于
中各分量对应的函数(基于
元素的结构),设为
和
都可微,且
2) S可微[15]
定义:设
为
-凸函数。假设对任意
,有
在
都可微,分别记做
。
令
,如果
为一个模糊数的
截集,则称
是S-可微的,记做
。
3) G可微
设函数
(
为非空凸集,
是基于前3张图片中定义的相关模糊数集合),对于
模仿上述定义给出其G可微条件如下:
情况(i):存在
(这里的减法基于
中元素的加法逆运算和加法运算定义),使得
。其中极限运算基于
中元素的度量
来定义,
。
情况(ii):存在
,使得
情况(iii):存在
,使得
情况(iv):存在
,使得
当函数
在点
满足上述四种情况中的任意一种时,就称函数
在点
是G可微的。
4) 弱可微[16]:设
为
-凸函数。假设对任意
,
在
都可微,分别记做
,则称
是弱可微的。
5) gH可微:设函数
(
为非空凸集,
是模糊数集合),对于
:若存在
,使得对于任意足够小的
,基于
中元素的gH差运算
(为广义Hukuhara差),有
成立(这里的极限运算基于
中元素的度量
来定义),则称函数
在点
是gH可微的。
6) G可微
构建
-凸函数的G可微条件:设函数
(
为非空凸集,
是模糊数集合),对于
:若存在
,使得对于任意足够小的
,由
中元素定义的
差运算
成立(极限基于度量
来定义),称函数
在点
是G可微的。
7) 梯度[17]
设
为
-凸函数。如果
关于变量
是G可微的,记做
,则
。
称
在点
处的梯度。
例:假设我们有一个
-凸函数
,定义在二维模糊数空间上。函数
的表达式为:
其中
和
是模糊数。
(a) 计算
-导数:假设
关于
和
的
-导数分别为:
(b) 构造梯度:由梯度的定义,
在点
处的梯度为
8) 各个可微之间的关系
(a) 从H可微到gH可微
动机:H可微对模糊数的对称性限制过强,gH可微通过广义差运算支持非对称模糊数(如梯形模糊数)。
示例:
H可微:
(对称)
导数存在。
gH可微:
(非对称)
导数仍存在。
(b) 从gH可微到G可微
动机:gH可微要求差运算存在,而G可微通过截集运算彻底解除限制。
示例:
gH可微:
导数存在。
G可微:
“大约
”(语言变量)
通过截集求导。
5.
函数的KKT条件[18]
1) 问题设定
考虑一个
-凸函数相关的约束优化问题:
,其中
(
为非空凸集,
是基于之前图片中定义的相关模糊数集合),约束条件为:
等式约束:
,其中
。
不等式约束:
,其中
,
是
上的序关系。
2) 拉格朗日函数构建
构造拉格朗日函数
,在这其中
,
是等式约束对应的拉格朗日乘子;
,
是不等式约束对应的拉格朗日乘子。
3) KKT条件
(a) 原始可行性条件
等式约束满足:
,对于
。
不等式约束满足:
,对于
。
(b) 对偶可行性条件:对于不等式约束的拉格朗日乘子
有
(c) 梯度条件(稳定性条件):
拉格朗日函数
关于
的梯度为零向量。由于
都是到
的函数,这里的梯度定义基于之前模仿的
-凸函数梯度定义,即
是相应函数的梯度(向量形式,元素为
中的元素)。
(d) 互补松驰条件
对于等式约束:
(这里的“0”是指
中零元素对应的梯度形式),
。
对于不等式约束:
(同样是
中的相关零形式),
。这意味着要么不等式约束
是松弛的(
,此时
),要么约束起作用(
,此时
)。
例:设目标函数
,它是一个从
到
的函数(这里可看作
的特殊情况),并且是一个凸函数(也满足
-凸函数相关性质)。约束条件为:
等式约束:
,不等式约束:
。
我们的优化问题是在满足上述约束条件下,求
的最小值。
构造拉格朗日函数
,其中
是等式约束的拉格朗日乘子,
是不等式约束的拉格朗日乘子。
4) 模糊环境对KKT条件的影响
(a) 原始可行性条件的修正
经典KKT要求
,而模糊环境下需选择序关系:
- 弱可行性(基于可能性序):
- 强可行性(基于必然性序):
(b) 互补松弛条件的模糊化
经典互补松驰条件
需扩展为:
其中
为Zadeh扩张乘法,
表示模糊相等(隶属度
)。
5) 应用KKT条件[18] [19]
(a) 原始可行性条件:
等式约束:
,不等式约束:
。
(b) 对偶可行性条件:
。
(c) 梯度条件:对
分别求关于
的偏导数,并令其为0
,即
,即
(d) 互补松弛条件:
。
情况一:
此时不等式约束不起作用,由
可得
,将其代入
,并结合
(即
),有:
,
,
,解得
,满足不等式约束。
情况二:
,即
由
可得
。将
代入
和
,由
可得
,再代入
,解得
,满足
。
确定最优解
计算两种情况下目标函数的值:
当
时,
,
当
时,
。
比较可得,
的最小值为
,此时
,这些值满足KKT条件,是该优化问题的最优解。
例:某工厂生产一种产品,其生产成本
和市场需求
均为模糊数。工厂希望制定生产量
以最小化成本,同时满足模糊需求约束。
1) 模楜参数定义
- 生产成本:
,其中
-
(三角模糊数,单位成本波动)
-
(固定成本模糊性)
- 市场需求约束:
,其中
(最低需求模糊区间)
2) 模糊可微性的应用
目标函数梯度计算:
使用广义Hukuhara可微(gH可微)计算
的导数:
。
优化问题形式化:。
KKT条件:
1) 原始可行性:
(可能性测度
)。
2) 对偶可行性:模糊乘子
。
3) 互补松驰条件:
(Zadeh扩张乘法)。
4) 梯度条件:
。
步骤1:选择置信水平
,计算
的截集
。
步骤2:求解KKT条件:
- 若
,约束松他(
),最优解为
- 若
,约束活跃(
),取
(保守策略)。
最终解:
- 经典优化:假设
(清晰数),得
,无法反映需求波动风险。
- 模糊优化:解为区间
,决策者可选择:
-
(低成本,低风险),
-
(高成本,确保需求满足)。
文从
函数出发,定义相关的可微含义,并且推出KKT条件,本文呢的研究成果不仅推动了模糊函数可微性理论的发展,也为模糊优化问题的实际应用提供了理论基础和方法指导,具有重要的理论意义和应用价值。但是,对于应用于实际情况方面仍有不足,希望在后续可以进一步探索。