1. 引言
准确的短期负荷预测有利于电网安全、优质运行。为了提高电力短期负荷预测的准确性[1] ,专家和学者们提出了基于人工的神经网络预测模型和模糊系统预测[2] -[7] 等模型。但由于人工神经网络和模糊系统预测模型的预测精度,不能满足目前负荷预测的要求,因此一种新的学习机理论支持向量机(Support vector machine, SVM)模型被提出[8] ,该模型与传统的预测模型不同,对目标函数实现了结构风险最小化原理(Structural risk minimization, SRM),经验风险最小化原理和VC维的界,其拓扑结构由支持向量决定,克服了ANN结构依赖于经验的缺点,较好地解决了高维数、局部极小、小样本等ANN先天问题,对新样本有较好的泛化能力[9] [10] 。
最小二乘支持向量机(Least squares SVM, LSSVM)是标准SVM的一种扩展,采用的损失函与SVM不同,用等式约束代替了不等式约束,同时最小化误差的平方项,由于LSSVM所求解的是线性方程组,因此非线性问题得到了简化,提高了运行效率。
LSSVM的提出以后,一般应用于模式识别法方面,但在负荷预测方面也有应用,如文献[11] 结合混沌特性的相空间重构理论和支持向量机的回归理论建立了基于负荷混沌特性和最小二乘支持向量机的短期负荷预测模型。文献[12] 提出了基于粗糙集理论和遗传算法的最小二乘支持向量机短期负荷预测模型。文献[13] 采用小波变换和最小二乘支持向量机混合模型进行电力系统短期负荷预测。文献[14] 提出一种联合灰色模型和最小二乘支持向量机回归算法的电力短期负荷智能组合预测模型。
在实际应用过程中,在建立最小二乘支持向量机预测模型时,该模型的参数和对模型性能有很大影响。若正规化参数取值小,则对样本数据的惩罚就小,使训练误差变大,算法的泛化能力加强;取值大,相应地的权重就小,算法的泛化能力变差。采用高斯核函数时,的值太小会对样本数据造成过学习现象,太大会对样本数据造成欠学习现象。虽然文献[15] [16] 已经讨论了这些参数的确定方法,但是这些方法基本上都是通过基于交叉检验的试探法或凭经验给出,具有一定的盲目性。本文采用改进的粒子群优化算法选取和。
本文提出通过改进粒子群优化算法搜索过程,对最小二乘支持向量机的参数进行寻优,以测试集误差作为判决依据,实现模型参数的优化选择。实际算例表明,提出的预测方法与标准粒子群优化算法相比,收敛效果和预测精度更优,并具有更快的训练速度。
2. 粒子群优化算法的改进
2.1. 粒子群优化算法
粒子群优化(Panicle Swarm Optimization, PSO)算法是一种基于迭代优化的群体智能进化计算技术,算法初始化为一群随机粒子,然后通过迭代搜索到最优解[17] [18] 。在每一次迭代中,粒子通过跟踪两个极值来更新粒子自身的速度和在下一轮迭代中的位置。一个是粒子本身所找到的最优解,称为个体极值,另一个是当前整个种群找到的最优解,称为全局极值。找到这两个极值后,每个粒子根据它们决定自己的飞行速度和距离。在标准PSO中,粒子的速度和位置进行更新方程为:
(1)
(2)
其中,为惯性权重系数,和是加速常数,和是[0,1]之间的随机数。为迭代次数,即粒子的飞行步数。为粒子第次迭代的飞行速度,为粒子第次迭代的当前位置。
标准PSO算法,在对于有多个局部极值点的函数,容易陷入到局部极值点中,得不到正确的结果,造成早熟收敛。
2.2. PSO算法的改进
针对标准PSO算法早熟收敛问题,以标准PSO算法为基础,通过多样性度量指标控制种群特征的改进粒子群优化算法。
1) 平均粒距选取初始种群
初始粒子群的选取是随机的,理想状况下其位置应遍布整个解空间以增加搜索到全局最优解的概率。但是粒子的个数是有限的,解空间又相对较大,为了保证有限个粒子均匀分布在整个解空间,避免陷于局部最优的可能。为此,引入平均粒距的概念,定义如下:
(3)
其中,为搜索空间对角最大长度,为解空间维数,为种群粒子数目,表示第个粒子位置的第维坐标值,表示所有粒子位置的第维坐标值的均值。
平均粒距表示种群中各个粒子彼此间分布的离散程度,越小,表示种群越集中;越大,表示种群越分散。
2) 自适应调整判断早熟收敛
当全局子群中的粒子趋于收敛时,将全局子群中的部分粒子加到局部子群,以增加局部子群的规模,这样就能改善局部子群的全局搜索能力,避免出现局部最优的情况;若全局自群众的离去分布较散时,将局部子群的力气加到全局子群中,改善全局子群的局部搜索能力,提高这跟个种群的收敛速度和性能[19] 。
若设为群体的规模,和分别为全局和局部子群的规模,且,在迭代过程中,按下式更新:
其中,为全局子群的适应度方差,由下式计算:
(4)
(5)
其中,全局子群第个粒子当前的适应度值为,群当前的平均适应度值为,为归一化因子,用来限制的大小。若接近0时,全局子群中粒子的趋于收敛,为群体规模的一般,则群体搜索能力加强,若趋于无穷大时接近0,群体的收敛速度加快。
在迭代过程中,局部子群可能出现早熟收敛的问题,一旦出现早熟收敛,则整个种群会随着全局迭代快速收敛。为了防止这种情况出现,若出现,则重新初始化局部子群。
3. 最小二乘支持向量机
最小二乘支持向量机通过用等式约束代替不等式约束,最小化误差的平方项,将二次规划问题转化为求解线性方程组的问题,使其待选参数减少,降低了计算复杂性,加快了求解速度[20] 。
基本原理如下,对非线性负荷预测模型
(6)
给定一组数据点集,是与预测量密切相关的影响因素,如历史负荷数据、气象因素等,为所选输入变量的维数,是预测量的期望值,是已知数据点的总数。是从输入空间到高维特征空间的非线性映射。
按结构最小化原理,LS-SVM优化目标可表示为:
(7)
,
其中,为权向量,为误差,为误差向量,为正则化参数,控制对误差的惩罚程度。
引入Lagrange乘子,,式(2)可转化为:
(8)
由卡罗需–库恩–塔克(KKT)条件,得
(9)
消去和,则式(4)的解为:
(10)
其中,,为维列向量,为单位矩阵,,,,根据Mercer条件可以确定如下核函数。用原空间的核函数取代高维特征空间中的点积运算,使计算得以简化。因此非线性预测模型的表达式为:
(11)
其中,可由解式(6)的线性方程求出,表示从输入空间到高维特征空间的非线性映射。
在实际应用中,核函数一般选取为RBF核函数,其中为核宽度。
4. 改进PSO的LS-SVM预测模型
4.1. 改进PSO的LS-SVM参数设定
设定粒子群优化算法的搜索范围为:,。粒子数取20,粒子数目越多,分布就越广,搜索的空间范围就越大,因而更容易发现全局最优解。最大迭代次数取100。惯性权重系数:取值范围选作[0.4,0.9]。即随着迭代的进行,惯性权重可以在搜索过程中线性变化。加速常数和代表将每个粒子推向和位置加速项的权重。加速常数较大时,会使粒子过多的在局部范围徘徊,而较大时会促使粒子过早收敛到局部最小值,为了平衡随机因素的作用,取和均为2。平均粒距阈值,采用平均粒距来描述种群分布的多样性,指导初始种群的选取,以提高整体预测质量,对于随机产生的粒子,其平均粒距应不小于,从而尽可能使粒子的轨迹遍历搜索区间。适应度方差阈值。
4.2. 改进PSO的LSSVM的预测过程
改进的粒子群优化算法的具体过程是:在保证初始种群分布均匀的前提下,首先运行标准粒子群优化算法的基本操作,直到判断粒子陷入早熟状态,然后再对粒子解空间重新分配,从而引导粒子快速跳出局部最优加快收敛。具体的算法如下:
1) 按照前文所述方法初始化粒子群,设定种群规模,惯性权重初值,惯性权重终值,加速常数和,最大进化迭代次数或迭代终止阈值。
2) 根据当前位置计算各个粒子的适应值并作比较,将第个粒子当前点设为最优位置,所有粒子中最优者设为种群最优位置。
3) 计算种群的平均粒距和适应度方差,调整两个子群的规模和。如果且(和为预先给定的阈值),若出现早熟收敛,转4);否则,转5)。
4) 重新初始化粒子群。
5) 按照式(1)和式(2)更新各个粒子的速度和位置,产生新种群。
6) 计算各个粒子新位置的适应值,并分别与其历史最优位置和种群的历史最优位置作比较,若更优,则替换,否则,保持不变。
7) 检查是否满足寻优结束条件(达到或小于),若满足则结束寻优,得到最优解,转8),否则,令,转2)。
8) 将寻优的结果和赋给LS-SVM,进行短期负荷预测。
5. 算例分析
下面结合实际数据讨论改进粒子群算法最小二乘支持向量机预测模型的过程和分析。本文选取某地区电网2009年日负荷数据和气象数据建模,为减少偶然性因素影响,针对不同的样本集分别进行预测,然后对预测结果取平均值。
在日负荷预测时,本文按如下标准选取历史负荷数据作为待选输入变量:每个输入样本均含有12个特性指标:前一天同一预测点负荷;前一天的湿度、日类型值、最高温度、最低温度、平均温度;前两天同一预测点负荷;预测日的湿度、日类型值、最高温度、最低温度、平均温度。输出为预测点的负荷值。
本文对样本数据采用标准粒子群算法最小二乘支持向量机和改进粒子群优化的最小二乘向量机两种模型进行了建模计算和模型测试。经过迭代计算,两种模型的参数优化和负荷预测误差结果分别如表1、表2所示。
由上两表对比可知,改进的粒子群优化算法具有更强的寻优能力和较高的搜索精度。在四个预测日内,预测模型的平均绝对误差的总平均值为1.305%,最大误差在1.63%以内。因此,该算法用于短期负荷预测是有效可行的。
2009-3-27负荷预测结果的两种方法的拟合曲线如图1所示。
6. 结论
改进粒子群优化算法是基于种群多样性信息来指导初始种群的选取和判断粒子的早熟收敛,实质上是在原有算法粒子间位置更新的相互吸引聚集过程之后引入了一个排斥的过程,从而实现了粒子间吸引和互斥的平衡,以避免粒子早熟收敛,即当搜索后期粒子陷入局部最优时通过更新粒子的位置,引导粒子跳出局部最优,进一步提高了计算精度及全局寻优能力,由此得到的预测模型具有更好的学习和泛化
Table 1. Standard PSO LS-SVM parameters optimization and load forecasting error
表1. 标准PSO的LS-SVM参数优化和负荷预测误差
Table 2. Improved PSO LS-SVM parameters optimization and load forecasting error
表2. 改进PSO的LS-SVM参数优化和负荷预测误差
Figure 1. Fitting curves of two methods
图1. 两种方法的拟合曲线
能力。
参考文献