1. 引言
将电力负荷正确分类,可以从中看出负荷结构情况,指导电力系统的运行控制,有利于电力系统的安全稳定运行,意义重大。与其它地区相比,新疆地区电力负荷有其特殊性,比如,高耗能产业占比大,冬季电采暖负荷非常普遍。此外,需要特别注意的是,新疆地区和其它地区有两个多小时的时差,很多研究人员很容易忽略这一点。因此,开展新疆地区的负荷分类更具重要性。
目前,在工程实践中,电力系统负荷分类大多采用统计学的方法,通过大量的调研得到结果,调研过程中需要大量的人力、物力,而且得到的结果只是一个时间或者一段时间的负荷情况,不具备时变性 [1] [2] [3]。上述这种比较传统的方法,虽然思路清晰,但是随着电网结构的扩大,调研的工作量太大,很难实际操作。除了上述传统方法外,比较新颖的就是基于日负荷曲线的电力负荷分类,这种方法的原理是根据负荷特性的差异会体现在日负荷曲线上,所以先对日负荷曲线进行预处理,选取合适的聚类指标,之后进行聚类分析,完成对电力负荷的分类。关于电力负荷聚类的算法非常多,比如近邻传播算法、主成分分析法、K-means算法、模糊C均值算法、自组织映射神经网络算法(SOM)等等 [4] [5] [6]。
本文将新疆地区典型区域变电站的日负荷曲线进行了分离,借助分离的结果求出了相应的聚类指标,之后运用K-means聚类算法将新疆地区典型区域变电站进行了聚类,最后实现了新疆地区电力负荷的分类。
2. 新疆地区负荷曲线的分离
2.1. 新疆负荷特点
受地理位置、资源结构、人们生活方式的影响,新疆地区负荷特点和中东部地区有着很大差异。①负荷构成,新疆地区高耗能产业所占比重大,导致大部分日负荷曲线都比较平缓,负荷特性比较稳定。② 高耗能产业的发展与国家政策的指向密切相关,一旦发生经济危机,新疆地区月平均负荷率会大幅度下降。③ 新疆地区与中东部地区的气候差异很大,这种差异体现在日负荷曲线上,就是高峰的差异。和中东部地区相比,新疆地区冬季高峰高于夏季高峰,这是因为新疆地区冬季普遍采用电采暖。④ 虽然新疆地区负荷特性有其独特性,但是毕竟地处西北,可以并入西北主网。⑤ 受中央新疆工作座谈会的影响,新疆地区负荷将快速发展,第三产业和居民用电将占取很大比重,高耗能产业所占比重会有所下降。此外,新疆地区和一般的地区存在两个小时左右的时差,在进行日负荷曲线分时段处理的时候一定要注意 [7] [8]。
2.2. 新疆负荷聚类指标的确定
目前,电力系统都装有用于数据采集与监视控制的SCADA系统,系统每隔5分钟或者1分钟采集一个数据点,形成日负荷曲线。经过观察对比不同站点的日负荷数据发现,有的站点的日负荷曲线是5分钟采集一个点,而有的站点则是1分钟采集一个点,为了研究方便,必须进行统一化处理。统一化处理后,日负荷曲线呈现为5分钟采集一个点的数据文件,每条日负荷曲线有288组数据,如果直接进行聚类分析,数据维数巨大,不仅聚类速度慢,而且操作困难。因此,有必要进行降维处理。降维处理就意味着要选取合适的聚类指标,要求选取的聚类指标能够可靠地反映不同类型的负荷。考虑到上述因素,
选用
这六个指标,这六个指标的定义如表1所示:

Table 1. The connotation of clustering indicators
表1. 聚类指标的定义
2.3. 新疆地区日负荷曲线分离
日负荷曲线是各行业负荷的叠加,需要对日负荷曲线进行分离,得到
这四个聚类指标。
日负荷曲线的分离步骤:① 确定典型日负荷曲线的四个时间区间;② 求解各特征时刻的负荷功率平均值;③ 构造分行业负荷构成方程式;④ 求解各分行业负荷在各特征时刻的负荷比例;⑤ 日负荷曲线的分离;⑥ 求解各分行业的用电负荷比例。
根据不同类型负荷的用电特点,可以进行分时分段处理。不论从统计资料还是运行经验,可以得出:工业负荷全天几乎没有波动,农业负荷在夜间比较突出,商业负荷主要集中在白天,市政居民负荷则和人们的生活习惯息息相关。考虑到新疆地区的时差,新疆地区日负荷曲线分时分段如下:
低谷时段:2:00~9:00,低谷特征时刻:5:00~7:00;
早高峰时段:9:00~14:00,早高峰特征时刻:12:00~13:00;
平缓时段:14:00~19:00;
晚高峰时段:19:00~2:00,晚高峰特征时刻22:00~0:00。
选取了新疆地区典型变电站对日负荷曲线进行了分离,日负荷曲线分离结果如表2所示。

Table 2. Daily load curve separation results
表2. 日负荷曲线分离结果
3. 基于K-Means的新疆负荷聚类
3.1. K-Means聚类算法
K-means聚类算法,也被称为K-均值聚类算法,与其它聚类算法相比,该算法聚类效果良好。K-means聚类算法的过程如图1所示。
3.2. 基于K-Means聚类算法的新疆地区典型区域负荷分类的实现
从上述K-means聚类算法过程可以看出,聚类数和初始聚类中心对聚类结果的影响比较大,若是出现初始聚类中心的两个点本来就处于同一类,极有可能陷入局部最优解。
K-means聚类算法聚类数的确定有手肘法和轮廓系数法。手肘法主要借助SSE指标,SSE计算的是所有样本点的聚类误差,通过SSE可以从某种程度上反应聚类效果。SSE的计算如式(1)所示。
(1)
式中,
表示聚类结果的第i类,p是
中的样本点,
是
的中心点。
随着聚类数的增大,SSE的值会变小。当聚类数小于真实聚类数时,SSE值的下降幅度比较大;当聚类数大于真实聚类数时,SSE值的下降幅度明显变小。根据手肘法,下降幅度转折点就是真实聚类数。SSE值计算结果如图2所示。

Figure 1. K-means clustering algorithm flow chart
图1. K-means聚类算法流程图
根据手肘法,可以确定聚类数为7。结合新疆电网负荷构成特点,确定初始聚类中心。
表3为部分站点夏季最大运行方式下的聚类指标结果。变电站聚类结果如表4所示,行业聚类结果如图3所示。考虑到气候差异,同一变电站在冬季和夏季的供电类型可能不同,将冬季最大运行方式下的日负荷曲线进行聚类,变电站聚类结果如表5所示,行业聚类结果如图4所示。

Table 3. Partial site clustering indicator (Xia Da)
表3. 部分站点聚类指标(夏大)

Table 4. Clustering results (summer)
表4. 聚类结果(夏季)

Table 5. Clustering results (winter)
表5. 聚类结果(冬季)
图3是夏季最大运行方式下日负荷曲线的聚类情况,从图中可以看出:第一类负荷低谷集中在凌晨,白天负荷相对较高,晚间达到最高,但变化幅度偏小,与人们的生活作息有一定关系;第二类负荷低谷也出现在凌晨,晚间负荷相对较高,峰值出现在白天,与商业用电特点类似;第三类负荷低谷出现在白天,凌晨负荷相对较高,晚间达到最高,说明农业用电的比例较高;第四类与第一类趋势类似,但明显变化幅度比第一类大很多,说明与人们的生活作息关系密切;与第四类负荷相对比,第五类负荷在晚间向凌晨过渡期间,有一个明显的下降趋势;第六类负荷整体比较平稳,可见工业用电占比非常大,可将其归为工业负荷,此外这一类的变电站数目也是最多的,与新疆地区高耗能产业较高的事实也是吻合的,说明了聚类结果的正确性;与其它六类负荷相比,第七类负荷波动比较频繁,呈现三峰三谷的特点,说明这类变电站供电类型多样,可称之为混合负荷供电。
对比表4和表5,图3和图4,可以看出,某些变电站的供电结构会随气候的变化而发生变化。需要注意的是,冬季第5类变电站和第7类变电站的日负荷曲线的峰值出现在夜间,而且夜间普遍比白天高,在夏季中找不到类似的,结合实际,这主要是由于在这些地区冬季电采暖比较普遍。新疆地区的这种差异,也印证了在进行新疆地区电力负荷分类时,考虑气候差异的必要性。
3.3. 聚类效果评价
MIA、CDI、SMI、DBI、SI这5个指标在聚类效果评价中较为常用,本文取MIA和CDI这两个指标进行分析。Mean Index Adeqquacy (MIA)表示的是分配给聚类的每个输入向量与其中心之间的平均距离,MIA指标越小,聚类结果内部越紧凑,其值与聚类效果成负相关。Clustering Dispersion Indicator (CDI),表示的是同一集群中输入向量之间的平均基础距离与类代表负荷曲线之间的基础距离的比率,其值与聚类效果也成负相关。MIA和CDI的计算结果如表6所示。

Table 6. MIA and CDI calculation results
表6. MIA和CDI的计算结果
与FCM、Ward、SOM算法相比,K-means算法的平均 和 的值相对更小,聚类效果更好。此外,本文聚类分析的结果已在新疆电网典型区域负荷建模及参数辨识中得到应用。对新疆电网负荷模型进行了细化,结果表明,本文提出的聚类方法是有效的。
4. 结论
本文提出了一种基于日负荷曲线和K-means聚类算法的新疆地区电力负荷分类方法,成功将新疆地
区的气候差异、时差差异、负荷特点考虑在内,以
这六个指标为切入点,对典型区域
变电站的日负荷曲线进行分离,得到聚类指标结果,按照K-means聚类算法的流程进行聚类。实际应用表明,该方法是有效的。