1. 引言
自1965年Zadeh [1] 定义了模糊集及运算法则,开辟出了信息不确定的模糊数据处理的方法,先后出现直觉模糊数 [2]、三角模糊数、梯形模糊数 [3] 型等不同的模糊信息量化的形式,并得到广泛研究。为避免隶属函数线性突变点本文选取正态模糊数 [4],利用正态模糊数的期望与方差刻画模糊决策值。方欢 [5],麻兴斌 [6] 分别对因果聚类分析进行研究,本文采用模糊聚类与模糊模式识别的方法对静态模糊预测中模糊特征集的提取进行改进,利用因素变量去推测预测值空间。
2. 备用知识
2.1. 正态模糊数
定义1 [4]:
为正态模糊数,其中,
,
。其隶属函数
.
正态模糊数运算法则:
设
,
,则
1)
;2)
,
;3)
,其中
。
2.2. 数据均值规格
特性指标矩阵U的第j列数据均值规格化 [7],计算
,
,
作变换
,
;
.
3. 静态模糊预测模型
模糊因果聚类
设有T期数据
,
,其
。X为因素状态空间,V为预测空间。
数据矩阵为
利用夹角余弦法
,
,求得模糊相似矩阵
,利用多目标综合决策法求出最优的模糊相似矩阵
,根据置信区间选出最佳聚类
。
4. 新模糊特征提取
将
向因素轴X投影,得
,
。对应
构造原因特征模糊集
。
,计算
的几何均值:
,
, (1)
,
,
. (2)
根据
和
构造
的模糊原因特征集
。
, (3)
其中
为一组给定的权重。
将
向预测轴V投影,得
,
。对应
建立模糊数
。
,计算
的几何均值:
, (4)
. (5)
(构造以
为参数的正态模糊数
)。
综上得对应分类
的特征模型为
进行预测若已知第T期的因素状态,对
和
应用
选出相应特征数对应正态模糊数作为v的预测值。
5. 实例分析
污水处理厂处理黑臭水,选取以下五个因素预测污水净化程度
,其中
:产量——每天污水处理量(千吨/天),
:质量——每天生化需氧量
去除率(%),
:质量——悬浮物SS去除率,
:气水比——处理每吨污水消耗的氧气量(米3/千克),
:单耗——去除每千克
的耗电量(千瓦时/千克)。数据参见表1。

Table 1. Information of the contamination of sewage purification
表1. 污水净化处理数据信息
上述表中数据为
,
,其
是污水净化程度。
对初始数据进行规格化 [7] 得矩阵
,
利用多元分析方法来确定各对象间的相似度,夹角余弦法
,
,求得模糊相似矩阵
;
根据置信区间
,
选出最佳聚类
的分类。
,
,
,
求分类
中各属性状态特征值的平均值,得
;
;
并求这4个分类的属性状态特征值的均值方差,得
,
,
,
,
;
,
,
,
,
;
,
,
,
,
;
,
,
,
,
.
带入实测污水净化程度接近4个分类中污水净化程度的平均值的
,取权重
,带入(3)式求得各分类的特征模糊集为:
,
,
,
.
根据(4~5)式取
求污水净化程度的平均值,得
,
,
,
;
,则
,
,
,
。
构造正态模糊数为
,
,
,
。
取
实测数据获得4个模糊特征集为
,
,
,
由最大隶属度原则,应选择
作为模糊预测,与实测值规范化处理后8.52较接近。类似比较其他3个编号预测值与实际值其误差范围在0.19~1.16,误差范围满足要求,此预测模型可行。
6. 结论
基于因果聚类模糊预测采用夹角余弦法对数据进行回归分析,改进模糊特征集的提取方式获得模糊特征集规避了直接映射强线性;污水净化处理中选取的因素具有可控性,通过对预测目标影响因素的选择可对预测目标空间值进行控制,本文通过实例验证了静态模糊预测模型具有可行性,预测得目标值与实际值误差在允许范围内。
基金项目
安徽省高校自然科学重点研究项目(KJ2020A0731),安徽省自然科学重大教学改革研究项目(2020zdxsjg390),安徽省自然科学研究项目(2020szsfkc0998)。