1. 引言
风能作为重要的可再生清洁能源,在推动全球能源结构转型、实现碳中和目标中发挥着不可替代的作用。乌兰察布市位于内蒙古中部,兼具高原、丘陵与城市多样地貌,其风能资源基础良好,是国家风电开发的重点区域。风能的有效开发离不开对风速和风向等核心气象参数的准确刻画,尤其在复杂地貌与气候条件下,建立更加精确的概率模型成为关键挑战。
传统风速建模方法中,Weibull分布因其形式简洁、参数物理意义明确而广泛应用于风电场选址与功率评估。但随着观测数据的积累和风资源建模精度要求的提升,越来越多的研究发现实际风速分布往往呈现出多峰、厚尾或极端值等复杂特性,Weibull模型拟合效果受限。因此,研究者们提出了多种替代分布与改进模型,例如郑晓伟等[1]的研究以大理地区风速日值数据为例,探究风速风向联合概率分布,对比发现Gumbel分布更适合描述该地区风速规律;分别基于谐波函数与乘法定理、混合von Mises分布与AL模型构建联合概率密度函数,结果是AL模型得到的函数拟合效果更优。Jia Junmei等[2]提出Topp-Leone Lindley (TLL)分布可以更精细地刻画内蒙古10个站点风速变化特征,显著优于传统分布。Yang Zihao等[3]-[5]基于风玫瑰图分组数据构建风速与风向联合分布模型,并开发出相应的伪随机数生成算法,用于风能潜力的量化评估,并且进一步探索了海上风场中风速与风切变的双变量关系,提出混合模型解决传统单峰分布在复杂风况下的适配性问题,之后提出基于Vine Copula理论的半参数三元模型,将空气密度引入建模框架,成功揭示了风速–风向–空气密度之间的耦合特征,拓展了多维风资源建模路径。安晓燕等[6]结合新疆富蕴县数据,采用核密度估计与四阶von Mises分布建模风向,利用Frank Copula构建风速–风向联合分布,验证了非参数方法在极值建模中的优越性。针对中国香港地区的研究中,Huang Shiji等[7] [8]先后采用不同Copula函数评估风速–风向的联合概率密度和极值估计问题,提出Bernstein Copula与Frank Copula分别在城市、山顶和近海区域具有最优拟合性能,强调风速与风向联合效应在抗风设计和风能密度评估中的关键作用。Wang Lingzhi等[9]进一步提出引入Gumbel分布改善低风速段拟合误差,通过蛇优化器(SO)与非线性最小二乘法(NLS)联合求解参数,提高模型整体精度。Ul Haq等[10]则在理论层面提出Marshall-Olkin长度偏倚指数(MOLBE)分布,作为Weibull分布的替代形式,提升对风速尾部概率的刻画能力。Dong Sheng等[11]针对热带气旋背景下的非平稳极端风速特征,在GAMLSS框架下引入周期性参数变化,提出了最优GEV模型构造策略,对周期性设计风速估计提供方法支持。Luo Ying等[12]通过构建Copula联合模型,分析了风向性对极端风速分布估计的影响,强调了风向分区策略对风险评估的敏感性。Xu Fei等[13]则以洋山港为例,综合使用Weibull模型、六阶von Mises分布和Gumbel Copula,系统建构风速–风向联合概率模型,为港区风能资源评估提供了方法示范。
尽管风速和风向的单独建模已取得显著进展,但两者之间的相依关系却较少被深入研究。实际中,风速和风向往往并非独立变量,其联合分布对风能资源评估和风机布局优化至关重要。Copula函数作为一种连接边缘分布的工具,能够灵活刻画变量间的非线性相依结构,近年来在多元气象数据分析中展现出强大潜力。综上所述,本研究以内蒙古乌兰察布市化德县(高原丘陵区)、四子王旗(开阔平原区)和集宁区(城市干扰区)为研究对象,依托2015~2024年逐小时风速与风向观测数据,构建风速分布的多模型比较体系,探索von Mises多阶模型在风向建模中的适用性,并引入Copula函数进行风速–风向联合建模。通过AIC、RMSE与R2等多种统计指标评估模型性能,从而揭示风能资源在不同地貌条件下的概率结构差异,提升区域风电规划的科学性与精准度。
2. 数据与方法
2.1. 数据来源与研究区域
本研究选取2015年1月1日至2024年12月31日乌兰察布市化德县、四子王旗及集宁区的风速风向数据作为研究样本,数据涵盖风速、风向等核心气象要素。乌兰察布市年平均风速为3.0~3.2 m/s,主导风向为西南、西北风,风能资源等级达I级。研究的三个站点如表1所示。乌兰察布市地处内蒙古自治区中部,风力资源蕴藏丰富,其中化德县地处乌兰察布市东北部,县域内地形以高原和丘陵为主,地势呈现南高北低态势,作为内蒙古强风带的核心区域,其风速高、密度大,且可利用时间长;四子王旗位于乌兰察布市西北部,北与蒙古国接壤,南部为山地与山前丘陵,北部则是地势平坦开阔的内蒙古高原;集宁区地形以低山丘陵为主,其作为城市核心区,周边楼宇密集,在一定程度上可能干扰风数据的观测。本研究所用的风速风向数据,源自三地所设的国家基本气象站,数据来源于中国气象数据网,数据源为NCDC (美国国家气候数据中心,National Climatic Data Center),数据来自NCDC的公开FTP服务器ftp://ftp.ncdc.noaa.gov/pub/data/noaa/isd-lite。
Table 1. Locations of three stations
表1. 三站点位置
站点 |
经度 |
纬度 |
海拔 |
化德县 |
41.9 |
114 |
1484 |
集宁区 |
41.033 |
113.067 |
1416 |
四子王旗 |
42.4 |
112.9 |
1152 |
2.2. 统计模型
2.2.1. 风速模型
风速是风能资源评估中的核心变量,其概率特征直接影响风电场发电能力预测、风机类型选择及经济效益分析。由于风速具有非负性、偏态性以及在某些区域呈现多峰、厚尾或极端事件等特征,因此准确选择合适的概率分布模型对其进行拟合具有重要意义。为了全面评估不同风速建模方法在乌兰察布市典型站点的适用性,本文对五种常见风速模型[1]-[5] [13]进行拟合对比,选择出最优符合乌兰察布2015~2024年风速数据的分布。
Weibull分布:概率密度函数为
(1)
累积分布函数定义为
(2)
其中
是形状参数,
是尺度参数;
Gamma分布:概率密度函数为
(3)
累积分布函数定义为
(4)
其中
是形状参数,
是尺度参数;
Burr分布:概率密度函数为
(5)
累积分布函数定义为
(6)
其中
,
是形状参数,
是尺度参数,为三参数模型,适用于厚尾数据;s
GEV分布:概率密度函数为
(7)
累积分布函数定义为
(8)
其中
是形状参数,
是尺度参数,
是位置参数,适用极值理论模型,捕捉极端风速事件;
Lognormal分布:概率密度函数为
(9)
累积分布函数定义为
(10)
其中
是对数尺度位置参数,
是对数尺度形状参数,适用于偏态风速数据。
2.2.2. 风向模型
风向作为风能资源评价的关键因素之一,具有明显的周期性特征。在对风向进行建模时,常规线性分布如正态、Gamma分布等,难以准确刻画其环状特性,因此需要采用适用于圆形变量的专门分布模型。其中,von Mises分布是描述方向性数据最为经典的概率模型之一。该分布被广泛应用于风向统计建模与风能潜力评估领域。为应对多主导风向或多峰分布的复杂风场特征,本文进一步引入混合von Mises分布模型[14],以提升模型拟合的灵活性与准确性。
混合von Mises分布的概率密度函数和分布函数[6]可表示为:
(11)
(12)
其中
表示风向角变量,取值范围
,
是位置参数,
是尺度参数,
是权重系数,
是模型阶数,
为零阶修正的第I类Bessel函数:
(13)
混合von Mises模型共包含3N个待估参数,本文基于MATLAB平台的fittype()函数对风向概率密度进行非线性拟合时,需要输入各参数的初始值,并且准确的参数初始值能显著提高拟合精度和效率[1]。
2.2.3. Copula函数
风速与风向之间存在显著的统计依赖关系,尤其在复杂地形与季节变动条件下,其联合行为对风能资源评估具有重要影响。传统的联合建模方法大多采用线性相关性或条件概率建模,难以刻画其潜在的非线性依赖结构。为此,本文引入Copula函数理论,构建风速与风向的联合分布模型,在分离边缘分布与联合结构的基础上,实现对二者依赖特征的精准建模。Copula函数可用于描述多元随机变量之间的相依结构,该函数将多元随机向量的边缘分布连接以建立联合概率分布。本文选取了三种常见Copula函数分别是Gumbel,Clayton,Frank,用于刻画二元随机变量风速和风向的相依关系[7] [8] [12] [13],见表2。
Table 2. Binary Copula functions
表2. 二元Copula函数
类别 |
分布函数 |
生成元 |
参数取值范围 |
Clayton |
|
|
|
Frank |
|
|
|
Gumble |
|
|
|
在Copula模型参数估计方面,当前主流方法主要包括极大似然估计法(MLE)和边缘分布推断法(IFM)等。其中,MLE方法因其在处理高维依赖建模中具有较高的估计精度和数值稳定性,成为广泛采用的方法。本文采用极大似然估计法对不同Copula函数进行参数估计,并进一步利用赤池信息准则(AIC)对各类 Copula 模型的拟合优度进行比较与筛选。
2.2.4. 风能评估方法
准确的风能资源评估不仅为风电项目的可行性研究提供数据支持,还直接影响风电场选址、风电机组布局优化、发电效率提升及后续的能量预测和系统调度等环节。风能资源评估的核心目标是定量化单位面积上可利用风能的功率密度(WPD)。WPD是衡量风能资源的重要指标,它的准确评估有助于揭示不同区域的风能潜力,从而为风电项目的设计与决策提供理论依据。
风能密度是衡量某一区域单位面积内风能资源可利用程度的核心指标,其理论表达式为:
(14)
其中,
为空气密度,通常取1.225 kg/m³;
为风速;
为风速的概率密度函数。该公式假设风向均匀分布、不考虑风向变化对风能获取的影响,存在一定局限性。考虑风向影响的情形下,风能密度可扩展为联合积分形式[2]:
(15)
其中,
的联合概率密度函数。该模型能够更全面地评估风场中不同风向与风速结合所产生的实际风能潜力。
2.2.5. 拟合优度检验
使用四个指标来定量评价所选统计模型的性能,即:平均绝对误差(AAE)、均方根误差(RMSE)、决定系数(R2)和赤池信息准则AIC [2]。其表达式如所示:
(16)
(17)
(18)
(19)
3. 结果与分析
3.1. 风速分布拟合
根据各分布函数的表达式,利用极大似然估计法,估计出乌兰察布市三个站点各分布函数的参数值,结果如表3:
Table 3. Estimates of five distributed parameters
表3. 五种分布参数估计值
分布 |
参数 |
化德县 |
集宁区 |
四子王旗 |
Weibull |
κ |
4.109 |
2.991 |
5.258 |
|
λ |
2.163 |
1.986 |
2.463 |
Lognormal |
μ |
1.166 |
0.842 |
1.443 |
|
σ |
0.505 |
0.500 |
0.447 |
Gamma |
α |
4.247 |
4.081 |
5.426 |
|
β |
0.854 |
0.646 |
0.858 |
GEV |
κ |
0.058 |
0.199 |
0.022 |
|
σ |
1.339 |
0.884 |
1.622 |
|
μ |
2.769 |
1.929 |
3.747 |
Burr |
α |
4.817 |
2.147 |
6.310 |
|
c |
2.772 |
3.649 |
3.133 |
|
κ |
2.240 |
0.856 |
2.464 |
拟合效果图如图1
Figure 1. The wind speed fitting effect diagram, which are respectively for Huade County, Jining District and Siziwang Banner
图1. 风速拟合效果图,分别为化德县、集宁区、四子王旗
由上表可知五个分布函数参数值,接着对本文选取数据进行分布函数拟合优度检验,得到各个站点五种分布函数的R2、AAE、RMSE,结果如表4:
Table 4. Test values of goodness-of-fit for five distributions
表4. 五种分布拟合优度检验值
|
分布 |
R² |
AAE |
RMSE |
化德县 |
Weibull |
0.949 |
0.013 |
0.020 |
|
Lognormal |
0.981 |
0.008 |
0.012 |
|
Gamma |
0.986 |
0.007 |
0.010 |
|
GEV |
0.976 |
0.009 |
0.013 |
|
Burr |
0.974 |
0.009 |
0.014 |
集宁区 |
Weibull |
0.909 |
0.021 |
0.036 |
|
Lognormal |
0.994 |
0.005 |
0.010 |
|
Gamma |
0.973 |
0.012 |
0.019 |
|
GEV |
0.981 |
0.009 |
0.016 |
|
Burr |
0.976 |
0.010 |
0.018 |
四子王旗 |
Weibull |
0.969 |
0.009 |
0.013 |
|
Lognormal |
0.972 |
0.008 |
0.012 |
|
Gamma |
0.993 |
0.003 |
0.006 |
|
GEV |
0.983 |
0.006 |
0.010 |
|
Burr |
0.984 |
0.006 |
0.009 |
由上表结果比较得到化德县、集宁区、四子王旗三站点风速最优模型分别为:化德县风速拟合为Gamma分布;集宁区:Lognormal分布;四子王旗:Gamma分布。
为了更加严谨地验证不同概率分布模型对风速数据的拟合效果,本文进一步引入了分位数–分位数(Quantile-Quantile, Q-Q)图作为诊断工具。与数值指标不同,Q-Q图能够直观反映理论分布与观测数据在全分布区间内的一致性,尤其是在极端分位(尾部分布)处的拟合偏差情况。若观测分位数与理论分位数点列紧密分布在45˚参考直线附近,则表明模型对样本分布的刻画较为充分;若在高分位或低分位出现系统性偏离,则提示模型在极端风速的拟合上存在不足。
图2展示了集宁区、化德县和四子王旗在最优分布模型下的Q-Q图。具体表现为:
化德县(Gamma分布):整体拟合良好,但在高分位区间出现轻微偏离,表明Gamma分布在刻画极端大风事件时存在一定的适用性局限。
集宁区(Lognormal分布):点列与参考直线高度重合,决定系数R2达到0.9935,RMSE仅为0.0095,说明对数正态分布能够较好地描述城市干扰区风速的偏态特征,其在全分位范围内均表现出较强的稳定性。
四子王旗(Gamma分布):拟合效果最为理想,点列几乎完全落在参考直线之上,决定系数高达0.9927,RMSE仅0.0063,表明在开阔平原风场中Gamma分布能够充分捕捉风速的整体概率结构及尾部特征。
综上所述,Q-Q图验证结果与统计指标分析结论高度一致,进一步巩固了Lognormal分布与Gamma分布在不同地貌条件下的适配性。更重要的是,Q-Q图揭示了模型在极端分位的表现差异,为后续风能资源评估及极端风速风险分析提供了可靠的参考依据。
Figure 2. The optimal fitting Q-Q graph, which represents Huade County, Jining District and Siziwang Banner respectively
图2. 最优拟合Q-Q图,分别为化德县、集宁区、四子王旗
通过对比筛选出两种对本文所选实际风速数据拟合效果较好的分布,接着对风向数据进行对比选择。
3.2. 风向分布拟合
在风向分布拟合中,von Mises模型十分有效,本文采用此模型以分析乌兰察布市三站点风向规律。为进一步探究不同阶数模型的拟合效果,对比了2阶、3阶、4阶及5阶的混合von Mises模型效果,用MATLAB中的fittype函数计算模型参数,结果见表5。
Table 5. Comparison of goodness of fit of models with different components
表5. 不同组分模型拟合优度比较
|
化德县 |
集宁 |
四子王旗 |
N |
R2 |
RMSE |
R2 |
RMSE |
R2 |
RMSE |
2 |
0.987 |
0.0152 |
0.921 |
0.0291 |
0.973 |
0.0225 |
3 |
0.991 |
0.0128 |
0.921 |
0.0292 |
0.983 |
0.0179 |
4 |
0.991 |
0.0127 |
0.901 |
0.0326 |
0.993 |
0.0111 |
5 |
0.990 |
0.0133 |
0.984 |
0.0130 |
0.960 |
0.0274 |
由上表可以看出,N = 4时,化德县(R2 = 0.991)、四子王旗(R2 = 0.993)拟合最优,集宁区因城市建筑干扰需N = 5组分(R2 = 0.984)。对三站点进行不同阶数的von Mises模型参数估计得到下表6:
Table 6. Comparison of estimated values of parameters for different component models
表6. 不同组分模型参数估计值较
|
化德县 |
集宁区 |
四子王旗 |
N |
|
|
|
|
|
|
|
|
|
2 |
0.720 |
1.098 |
4.187 |
0.640 |
0.702 |
3.142 |
0.919 |
1.753 |
4.364 |
|
0.273 |
5.705 |
5.037 |
0.363 |
4.166 |
4.686 |
0.078 |
8.122 |
0.799 |
3 |
0.281 |
0.300 |
3.142 |
0.363 |
4.151 |
4.686 |
0.037 |
23.826 |
3.142 |
|
0.408 |
4.789 |
5.029 |
0.610 |
0.708 |
3.142 |
0.090 |
6.750 |
0.801 |
|
0.311 |
2.633 |
3.970 |
0.030 |
0.596 |
3.156 |
0.864 |
1.992 |
4.402 |
4 |
0.280 |
2.958 |
3.986 |
0.329 |
3.897 |
4.689 |
0.136 |
6.707 |
3.143 |
|
0.417 |
4.777 |
5.024 |
0.006 |
0.381 |
4.394 |
0.636 |
3.747 |
4.374 |
|
0.055 |
1.748 |
3.193 |
0.324 |
0.605 |
3.386 |
0.111 |
7.556 |
5.494 |
|
0.248 |
0.161 |
3.158 |
0.348 |
0.608 |
3.383 |
0.114 |
5.118 |
0.794 |
5 |
0.300 |
5.683 |
5.073 |
0.142 |
17.309 |
5.266 |
0.301 |
1.922 |
4.463 |
|
0.112 |
2.775 |
4.424 |
0.155 |
21.460 |
4.182 |
0.125 |
7.471 |
4.411 |
|
0.198 |
0.002 |
3.725 |
0.243 |
0.076 |
3.717 |
0.195 |
1.894 |
4.043 |
|
0.192 |
1.235 |
4.028 |
0.136 |
42.641 |
4.612 |
0.183 |
1.749 |
4.612 |
|
0.201 |
1.952 |
3.997 |
0.326 |
1.874 |
2.778 |
0.199 |
0.974 |
4.574 |
为简单起见,记n阶Von Mises模型参数为
,化德县、集宁区和四子王旗的风向Von Mises模型分布函数分别为
,根据上表参数计算结果可知,三站点风向分布函数分别为:
(20)
(21)
(22)
拟合效果图如图3
Figure 3. The wind direction fitting effect diagram, which are respectively for Huade County, Jining District and Siziwang Banner
图3. 风向拟合效果图,分别为化德县、集宁区、四子王旗
3.3. Copula模型拟合
应用极大似然方法分别计算基于三种阿基米德Copula函数建立的三站点风速风向联合分布参数估计值,结果如下表7。
Table 7. Estimated values of Copula function parameters and AIC test
表7. Copula函数参数估计值及AIC检验
|
GumbleCopula |
FrankCopula |
ClaytonCopula |
化德县 |
α = 1.127 |
α = 1.506 |
α = 0.345 |
|
AIC = −629.310 |
AIC = −1512.602 |
AIC = −1407.360 |
集宁区 |
α = 1.127 |
α = 1.150 |
α = 0.214 |
|
AIC = −683.296 |
AIC = −780.583 |
AIC = −439.842 |
四子王旗 |
α = 1.049 |
α = 1.199 |
α = 0.214 |
|
AIC = −110.596 |
AIC = −975.652 |
AIC = −625.292 |
利用AIC准则选择最优函数,Gumble Copula和Clayton Copula模型的AIC值相比较大,不适合用于研究该站点风速分布。而Frank Copula模型的AIC值最小,表现出较好的拟合结果,用Frank Copula构建的化德县、集宁区和四子王旗风速风向联合概率密度和联合分布分别为:
(23)
(24)
(25)
(26)
(27)
(28)
其中,
和
分别表示各区域在边缘分布建模中所选最优模型对应的PDF与CDF结果。联合概率密度如图4所示
Figure 4. The three-dimensional graph of the joint probability density, which are respectively Huade, Jining and Siziwang Banner
图4. 联合概率密度三维图,分别为化德、集宁、四子王旗
3.4. 风能资源评估
在完成风速与风向的边缘分布建模及Frank Copula联合分布构建的基础上,进一步开展风能资源评估研究,以评估风能利用潜力。风能密度的计算结果如表8所示。
Table 8. Wind energy density W/m²
表8. 风能密度W/m²
|
化德县 |
集宁区 |
四子王旗 |
WPD |
60.65 |
22.41 |
109.88 |
以上风能密度(WPD)值表明,乌兰察布市的风能资源在地形复杂性和风场结构的影响下,呈现出较大的空间差异。化德县作为风能资源较为丰富的区域,风能密度较高,而集宁区由于城市化影响,风能资源相对较低。四子王旗的风能资源潜力较大,适合进行风电开发。
4. 结论
本文以乌兰察布市化德县、集宁区、四子王旗为例,采用Gamma分布对风速分布拟合,并用von Mises分布对风向分布进行研究,得到两个边缘分布函数后基于Copula函数的理论和方法建立了风速和相应风向的联合概率分布。结果表明:Gamma分布和Lognormal分布拟合本文所选取的三站点风速分布规律的效果远好于传统的威布尔模型,对于风向数据采用von Mises分布进行研究,拟合优度检验时发现,四组分和五组分von Mises模型能高效表征复杂风向分布。采用三种常见的Copula函数构造风速风向联合概率分布,其中基于Frank Copula函数建立的模型的AIC值达到最小。将该模型联合概率密度三维图、风速风向独立时的联合概率密度图与实际观测数据作对比分析。基于联合分布计算的风能密度(WPD)结果显示,乌兰察布市化德县、集宁区和四子王旗三个典型地区的WPD分别为60.65 W/m2、22.41 W/m2与109.88 W/m2,充分体现了不同地形和风场结构对风能资源的空间差异性。相比传统的单变量风速评估方法,联合建模方法不仅在理论上更为完备,而且能够更真实地反映复杂风场条件下风能资源的分布特征,为风电场的科学选址、机组布局优化及能量预测提供了更为可靠的数据支持。本文的研究为风能资源评估提供了一种新的思路,也为风电开发中的资源量化与规划决策提供了重要参考。
基金项目
国家自然科学基金项目(12361058);内蒙古自治区自然科学基金(2024LHMS01015)。
NOTES
*通讯作者。