1. 引言
我国对特高压的规定是指交流电压等级在1000 kV及以上,直流电压等级±800 kV及以上。特高压工程目前还处于发展和建设的初期,其造价具有投资高、规模大等特点。为大力提高特高压输变电工程建设的安全水平和经济效益,有必要对待建工程进行合理的造价预测。先进的特高压工程造价预测方案将为工程造价控制目标的合理确定和优化提供重要依据,为各施工单位投资成本控制和造价优化提供坚实的支撑。研究特高压工程造价预测的主要意义体现在以下几个方面:第一,有助于提升特高压工程造价的预测技术水平;第二,有助于特高压造价控制目标的确定及优化,提高科学化决策能力;第三,有助于全面提升各利益方的特高压工程造价管控精益化水平、提高投资的经济效益和社会效益。
目前,电力系统工程造价预测已经有较多研究,如文献 [1] 以输电线路工程的造价影响因素为输入,以输电线路工程造价为输出,利用BP神经网络预测方法进行输电线路工程造价预测,并将预测结果与实际工程对比以验证所提方案的合理性。文献 [2] 根据支持向量机(Support Vector Machine, SVM)理论,构建常规换流站工程的造价预测模型,通过输入已有实际工程数据训练预测模型,然后输入预测工程的各项影响造价因素的显性指标,得出新建工程的造价。文献 [3] 对220 kV换流站工程结算阶段的造价进行预测研究,首先根据国网公司工程造价结算标准建立预测指标体系,然后对各指标费用识别关键影响因素,最后运用支持向量机方法对各类费用的预测。文献 [4] 用输变电工程的历史数据构建基于人工神经网络(Artificial Neural Networks, ANN)的机器学习模型并将其应用到电力工程造价中。文献 [5] 提出一种与模糊聚类算法和粒子群算法结合的支持向量机预测模型,首先通过聚类将样本分类,然后利用粒子群支持向量机(Particle Swarm Optimization SVM, PSOSVM)进行工程造价预测。
尽管对造价预测研究较多,但都是基于常规变电工程进行的,目前对特高压工程造价预测,还未见相关研究。特高压工程有其特有的造价特点,已有常规工程造价预测方案并不适用特高压工程,在特高压输变电技术日益成熟、特高压工程建设蓬勃发展的背景下,亟需构建一套对其适用的预测方案指导待建工程的造价评估水平。一方面,特高压工程发展初期其造价具有投资高、历史样本少、造价组成复杂等特点,这与已发展成熟的输变电工程造价特点不同,需结合特高压工程造价特点构建预测模型;另一方面常规输变电工程应用的单一预测方法不具有普适性,即使对某工程适用,也不一定适用于其他工程。鉴于此,本文结合特高压工程造价特点,提出一种组合预测模型,即用多种预测模型对特高压工程的子模块造价分别进行预测,再根据模型权重评价体系结果确定各预测方法的预测权重,最后对不同预测模型所得预测结果加权求和即得造价组合预测值。
2. 特高压工程造价预测思路
2.1. 特高压工程造价特点
特高压工程还处于发展初期,与常规输变电工程造价相比,有其独特的工程造价特点。主要表现在以下几个方面。第一,工程造价投资高:因为电压等级高,所以特高压工程的建筑水平要求高、安装材料昂贵、设备成本高,导致其总的造价达数十亿人民币,远高于常规变电工程;第二,造价成分复杂:特高压工程建设处于初期阶段,尚未形成系统的完善的造价指标体系,导致造价数据不规范不统一,部分造价分类不一致,从而对造价分析带来一定困难;第三,工程造价历史样本少。由于已建成特高压交流变电工程和直流换流站工程较少,所以造价历史数据较少,造价分析较困难。显然,常规输变电工程大样本数据分析预测的方法并不适用。
2.2. 特高压工程造价预测层级
从工程特性上分,特高压工程可分为交流变电工程、直流换流站工程、交流线路工程、直流线路工程。不同工程又可按照费用继续划分到子工程层级甚至子模块层级。以换流站工程为例,换流站工程可按费用类别划分为建筑工程费、安装工程费和设备购置费三个个子工程层级的费用(需要指出的是,由于其他费用变化较大,且其中部分费用有具体的规程参照,本文的预测方法主要是基于本体工程费用(除去其他费用的工程造价),是否适用其他费用还有待验证,因此在本文的讨论暂不涉及其他费用)。子工程可继续按功能不同划分子模块层级,如图1所示为特高压直流换流站工程层级分解图,其他工程的划分和此类似,即先按费用划分,再按功能划分。图1中,换流站工程设备购置费可按模块功能划分四个子模块,分别是:阀厅设备费、换流变压器系统设备费、配电装置设备费、其他主要生产工程设备费。此外,根据子模块还可识别各子模块造价的影响因素,进而确定对子模块造价影响较大的关键影响因素。关键影响因素是构建造价预测模型的基石,但由于篇幅所限关键影响因素的确定不在本文的研究范围内,具体方法可查阅文献 [6] 和 [7] 。
2.3. 特高压工程造价预测样本处理
针对特高压工程造价的预测研究,首先应进行样本数据采集,形成原始数据。但原始数据具有杂乱性、不完整性,会严重影响模型算法的构建和执行效率,甚至导致计算错误结果,为此,在预测运算之前需对原始数据进行预处理,以改善数据的质量,提高数据挖掘过程的精度、效率和性能。
数据预处理完成后,将数据分为训练样本和验证样本两类,训练样本用于计算和拟合预测模型,验证样本用来校验所得模型的优劣,并用于组合预测模型的权重计算。
2.4. 特高压工程造价预测思路
本文提出的组合预测模型预测层级可深入到各子工程、子模块的造价,并且具有较好的适用性,能够应用到不同特性的特高压工程造价预测中。预测思路及流程见图2。如图2所示,首先,将历史样本分成训练样本与验证样本;其次,输入训练样本关键影响因素与子模块造价值,根据各种预测方法构建单一特高压工程造价预测模型,并用熵权法计算各模型的权重;然后,检验造价预测值是否满足要求,

Figure 1. Decomposition level of converter station project
图1. 换流站工程分解层级

Figure 2. Cost forecasting process of UHV project
图2. 特高压工程造价预测流程
不满足要求的方法权重应置零,例如结果是负数显然不满足要求,应将对应预测方法权重置零;最后,输出各组合预测模型权重,计算并集成工程造价目标。
3. 工程造价预测方法选取
由于特高压工程的样本较少,是一个基于小样本的预测问题,常规预测方法处理小样本数据并不精确甚至不适用。在选取和构建预测模型的过程中,本文根据以下两个原则进行。原则一,小样本适用原则。由于特高压输变电工程样本较少,因此须结合特高压工程的小样本特点采取合适的特高压工程造价预测方法。原则二,多种预测模型组合预测原则。由于特高压工程造价数额大,成分复杂,同一模块的造价可能相差很大,采用多种预测模型组合预测可以有效避免和消除单一预测方法和模型的局限性,提高预测精度。因此,在小样本适用原则基础上选取多种预测模型分别预测,再将造价预测结果加权求和以降低预测误差,提高预测精度。因此本文选取如下所述的预测方法并进一步构建组合预测模型。
3.1. 多元回归预测模型
多元回归分析(Multiple Linear Regression, MLR)的主要思想是用回归方程定量地刻画多个自变量与一个因变量之间的线性函数关系。多元回归分析广泛应用在心理学和金融学等学科。特高压工程造价样本最少一般在十个左右,多元回归分析对处理小样本数据有较好的表现。在特高压工程造价分析中,各子模块造价与关键影响因素的数学关系可能是线性的,也可能是非线性的。线性关系可通过构建关键影响因素与子模块之间的回归方程进行分析。通过拟合子模块造价函数
构建预测模型,当给定一组关键影响因素值
时,就可确定输出预测造价Y。
3.2. 人工神经网络预测模型
ANN是基于生物学中神经网络的基本原理所抽象出来的模拟人脑的神经系统对复杂信息处理机制的一种数学模型。ANN按功能可分为三层:输入层、隐层和输出层。ANN具有自适应、自组织等机器学习的特点,对于小样本数据具有一定的学习能力。特高压工程子模块造价与其关键影响因素可能呈现出非线性特性,神经网络通过小样本训练和学习来逼近此非线性系统。ANN的具体理论分析和数学特征已有较多文献进行论证,此处将其应用到特高压工程造价预测中,相关理论不再赘述。
3.3. 支持向量机预测模型
SVM是由Vapnik基于统计理论建立的一种小样本分类和预测方法 [8] 。SVM在解决非线性、小样本的分类和预测中表现出很多特有的优点,其目标是得到现有数据下的最优解。特高压工程具有工程样本少,工程造价高,造价数据不规范等特点,各关键影响因素与子模块造价可能呈现出高度非线性的复杂关系,用传统的建模方法较难处理,SVM方法很好地处理子模块造价与关键影响因素的关系;因此可用SVM对特高压工程造价预测进行研究。SVM的应用核心在于选取适当的参数,如不敏感损失函数
,复杂度和样本拟合精度的折衷系数
,核函数参数
。支持向量机的理论和应用步骤详见文献 [2] 。
3.4. 遗传算法改进的支持向量机预测模型
SVM模型对于参数的选择比较敏感,参数
、
、
的选择对精度影响很大,不合适的参数将会导致结果出现很大偏差。目前对SVM参数优化的方法和研究较少,还没有严格的数学计算标准,这三个参数的确定本质上是一种复杂的组合优化问题。遗传算法(Genetic Algorithm, GA)具有隐含的并行性和强大全局搜索能力,通过代表可行解的染色体之间的交叉、变异可以在很短的时间内搜索到该优化问题的全局最优点,确定合适的
、
、
。因此本文将遗传算法与SVM结合,即将GASVM预测模型应用于参数
、
、
的优化中,以改善SVM的性能,降低特高压工程造价预测的误差和不确定性。
3.5. 粒子群算法改进的支持向量机预测模型
粒子群算法(Particle Swarm Optimization, PSO)也是一种智能算法,其通过粒子个体之间的竞争和协作,实现在复杂的空间中搜索最优解。PSO也是一种智能算法,也具有并行性和全局搜索能力。和GA相比,PSO没有交叉变异等过程,其搜索过程总是跟随当前最优解,具有一定优势。因此本文亦将PSO算法用于SVM参数
、
、
的优化中,构建PSOSVM预测模型,改善SVM的小样本特高压工程造价预测的精度。
4. 组合预测模型构建
如上所述,用训练样本得到各预测模型后,输入验证样本和待预测工程关键影响因素值,可得到验证样本和待预测工程的上述各预测模型造价预测值,最后通过权重确定方法得到各方法权重并将各模型预测结果加权求和即得到组合造价预测值。
4.1. 预测模型权重确定准则
由于不同方法的局限性,部分预测结果可能有失偏颇。因此本文制定如下预测模型权重确定准则。
(1) 误差分析准则。误差是反映预测结果好坏、预测模型精度的重要指标。上述五种预测模型所得的验证样本结果各不相同,因而可基于验证样本的误差分析、构建多种误差指标,再依据熵权法构建组合预测模型权重体系。本文选用验证样本的预测值与真实值得均方误差(Mean Squared Error, MSE)、平均绝对误差(Mean Absolute Error, MAE)和平均绝对百分比误差(Mean Absolute Percent Error, MAPE)进行预测模型权重确定。各误差指标的计算分别如下,设有n个验证样本,yi为造价真实值,Δi (
)为验证样本的预测值与真实值的绝对误差。
(1)
(2)
(3)
(2) 非负准则。实际工程造价总是大于0,若某预测模型所得验证样本预测结果或待预测工程预测结果为负时,则可认为该模型不适用于此组数据,如让其参与组合预测,会降低预测精度。因此将其预测模型权重赋以0值。
(3)
准则。整理历史样本数据发现,靠近子模块造价众数的样本较多,达历史样本的一半之多;并且,所有子模块历史样本造价的最大值与众数之比不超过五倍,最小值与众数相比不低于1/5。据此本文认为特高压工程子模块的造价值波动一般在均值的
倍范围内。当有部分预测值与众数之比超过此范围则认为该预测方法所得预测值不准确。具体地,若某预测方法所得验证样本预测结果或待预测工程造价预测结果与其他预测方法相应结果相差较多(大于5倍或小于1/5倍)时,则可认为该模型不适用于此组数据,如让其参与组合预测,会降低预测精度。因此将该种预测模型权重赋以0值,即不考虑该模型。
4.2. 预测方法权重确定
多种预测模型的组合预测方法的重点是确定各预测模型的权重,以便最后得到加权造价组合预测值。熵权法是一种指标评价和方案决策的方法,具有广泛的应用。熵权法基本思想是把各待评价单元的信息进行量化与综合;采用熵权法对各因子赋权,可以简化评价过程。
熵权法的基本原理见文献 [9] 。熵权法是多目标综合评价决策的重要工具。应用熵权法过程中,若某个指标的熵越小,代表其变化程度越大,提供的信息量越多,在综合评价中的作用也越大,其权重也就越大,反之,某个指标的熵越大,表明指标值的变化程度较小,提供的信息量越少,在综合评价中的作用也越小,其权重也就越小。因此,本文基于准则(1)中的三种误差用熵权法来确定各模型权重确定。
预测模型权重确定的基本步骤如下:
(1) 对每个子模块构建预测误差矩阵M(i×j),(
)。元素mij表示第i种预测方法得到的验证样本预测值与真实值的第j类误差。其中j = 1, 2, 3分别表示误差类别为MSE,MAE,MAPE。若验证样本有多个值,则mij为多个预测值与真实值误差的平均值。
(2) 数据标准化处理,消去误差量纲。计算标准化误差
(4)
(3) 计算第j类误差的不同预测模型的占比
(5)
(4) 计算各预测模型的熵值
(6)
(5) 计算第j类误差指标的权重,亦即差异系数
(7)
(6) 计算各预测模型的初步权重。定义各预测模型权重
(8)
(7) 根据3.1的预测模型权重确定准则(2)和(3)修正初步权重,确定最终的组合预测模型权重。
(8) 计算组合预测子模块造价值,并集成得到工程造价预测值。
5. 算例分析
5.1. 换流站工程算例
本文梳理已建特高压工程历史数据。以换流站待建工程的造价组合预测为例说明该方案的有效性。
根据历史样本数据筛选得有效数据8组,取其中1组作为验证样本,其中7组作训练样本用来构建预测模型。得预测模型后根据以上五种预测方法,给定子模块关键影响因素,进行造价预测,得造价预测数据如下表1。表1中真实值表示验证样本对应子模块的真实造价值;R表示验证样本的造价预测值,P表示待预测工程的造价预测值。
由以上预测结果可见此五种方法各有其优势,尽管任意一种模型都不能普适所有的子模块,但各模型对大多数子模块都有较好的表现。MLR对换流变系统建筑费、阀厅设备安装费、配电装置建筑费和设备费等验证样本都有较好的表现,但对于配电装置安装费和设备费,依其构建的模型预测出待预测工程对应子模块的造价值为负值,因此尽管该预测方法对验证样本预测精确,按照准则(2),其对这两个子模块的预测模型权重应为0。由于以上预测数据中,无论验证样本子模块造价预测值还是待预测工程子模块造价预测值都未超过众数的5倍或小于众数额1/5。继续考查ANN、SVM、GASVM、PSOSVM,其对大部分子模块的预测结果都较好,对部分子模块的预测结果较差,但也未违反准则(2)和准则(3)的约束,具有较好的表现,可直接将熵权法所得初步权重结果作为最终权重。根据表1由式(1)到(8)可计算各方法的模型权重如表2。

Table 1. Forecast cost of converter station project (unit: RMB)
表1. 换流站工程造价预测数据(单位:元)

Table 2. Weight of each forecasting model of converter station project
表2. 换流站工程各预测模型权重
根据以上权重结果,计算验证样本的造价组合预测值为4,223,471,264元,与验证样本造价真实值的绝对误差百分比为0.773。MLR、ANN、SVM、GASVM、PSOSVM五种预测模型的造价预测绝对误差分别1.300、2.167、4.555、6.394、4.067。可见本文提出的多种方法组合预测模型具有比任一单一模型更高的精度,可以作为一种特高压工程造价的通用预测方法。由以上权重结合待预测工程造价预测值得待预测工程的造价为4,527,736,511元,可用该数据指导实际的待建工程投资决策。
5.2. 直流线路工程算例
为进一步说明本文组合预测模型的有效性,选取特高压工程的直流线路工程进行验证。由于线路工程的特殊性,按费用划分层级后已无法细分,可将费用划分结果作为子模块。具体地,直流线路工程本体工程按费用划分的子模块为土石方工程、基础工程、杆塔工程、架线工程、附件工程。直流线路工程样本按包段选取和整理,大大扩充了历史样本数据。整理和筛选历史样本,得有价值数据44组,取其中4组作为验证样本。用以上五种方法构建预测模型,得预测结果如下表3。
表中R1、R2、R3和R4分别表示四个验证样本的造价预测值;P表示待预测工程的造价预测值;W表示各预测方法权重。为说明本文方法的准确性,计算各预测模型的绝对误差百分比如表4。

Table 3. Forecast cost of DC transmission line project and weight of each forecasting model (unit: RMB/km)
表3. 直流线路工程造价预测结果与各预测模型权重(单位:元/千米)

Table 4. Forecast errors of DC transmission line project
表4. 直流线路工程预测误差
由表4对比组合预测模型与单一预测模型的验证样本直流线路工程总造价的误差,可见组合预测模型几乎比所有单一预测模型的预测误差更小,更逼近真实造价。最后得到待预测工程的造价预测值为2,788,821,可用此预测造价值指导实际的工程造价决策、管理与优化。
6. 结语
工程造价预测具有广泛的实际意义,能为工程造价控制目标的合理确定和优化提供重要依据,也能为各施工单位投资成本控制和造价优化提供坚实的支撑。本文根据特高压工程样本少,工程造价高,造价数据不规范等造价特点,采用小样本原则和组合预测原则进行特高压工程造价预测。本文选取MLR、ANN、SVM、GASVM和PSOSVM五种适用于小样本的预测方法构建组合预测模型,并根据历史样本特点修正预测权重,最后根据修正权重用组合预测模型预测特高压工程造价。特高压直流换流站工程和直流线路工程为算例的预测结果表明:第一,采用基于小样本原则和组合预测原则的特高压工程造价组合预测模型具有较好的预测精度,能有效降低单一预测模型的误差;第二,本文基于五种造价预测方法构建的特高压工程造价组合预测模型具有一定的普遍适用性,即对任一小样本特高压工程造价均可应用这五种方法分别进行造价预测,再对各子模块的造价预测值应用误差分析准则、非负准则和
准则进行权重确定,即可求得精度较高的子模块造价组合预测值,从而求得精度较高的总造价组合预测值。