1. 背景
沥青路面长期性能包括耐久性、功能性、承载力等方面,是交通荷载与环境共同作用的结果 [1],路面温度是环境作用的一个重要方面。温度变化直接影响沥青路面的应力应变状况、材料损失演变 [2] [3],温度预测模型是构建沥青路面长期性能演变模型的重要一环,具有理论与实践价值。目前沥青路面温度预测有理论、数理统计两类方法。
理论法的理论模型是傅里叶建立的热传导方程,可通过初边值条件求解 [3]。Dong Wang [4] 针对2层已知路面表面温度的时间序列的条件,采用分离变量法及杜哈梅积分获得无穷级数解答,对单天温度的预测偏差小于3℃,该方法推广应用于FWD测试数据的温度修正 [5]。Bagdat Teltayev [6] [7] 建立了沥青路面温度场的有限单元模型,对单天的预测偏差小于1.7℃。Yinghong Qin [8] 用多项三角函数项表示路面温度变化,依据路面表面热流平衡关系获得沥青路面表面最高与最低温度解答。Jiaqi Chen [9] 针对多层路面结构,在已知路面表面温度条件下用分离变量法、格林函数法获得求解。张丽娟 [10] 将路面表面热流简化为太阳辐射、气温、路面表面温度的线性组合,用拉普拉斯变换求得多层路面温度场解答,对单日温度的预测偏差,最大值为2.8℃。王路君 [11] 借助Laplace-Fourier 积分变换,利用解析层元法推导温度荷载作用下非稳态热传导时层状路面体系的温度响应解答。
Arian Asefzadeh [12] 建立路面不同深度的极值预测式,考虑的因素有气温极值、太阳辐射、深度位置,模型的相关系数达0.91,均方差为16.6。王琨 [13] 分析路面不同深度位置峰值出现时刻,提出由路面表面温度、气温、深度相关的多项式路面温度预测方程,预测结果超过10 cm后置信区间大于4℃,判定系数R2大于0.92。宋小金 [14] 意识到雨天、晴天对路面温度影响较大,越往内部路面温度预测越难,分别建立预测模型,模型主要参数包括路面表面温度、深度的指数函数、时间的三角函数。模型在19 cm深度内精度较高,残差绝对值的平均值小于1.8℃。李伊 [15] [16] 引入历年的月平均气温作为地区修正系数,考虑气象数据的累计平均值创建模型,标准预估误差为2.89℃,R2大于0.95。李萍 [17] 考虑气象参数的累计值、延后值,建立模型。Zafrul H. Khan [18] 在模型中考虑风速度、湿度对路面温度的影响。
理论方法包括偏微分方程的数值解法和理论解法。实际环境中许多因素无法直接在偏微分方程中定量完整的体现出来,如空气湿度、云量等因素。但理论法建立了路面温度随时间迭代的关系式,能够反映路面温度演变的连续过程。统计法选定的目标关系式通常有较好的地区适用性,但各种外界因素的累计性影响,目前尚缺少合适的显式的表达方法。而统计方法能够对某一时刻难以定量的因素做出较为可信的估计。如果能够结合两种方法的优点,沥青路面温度预测的准确性与实用性将会有较大的提高。
循环神经网络已经在时间序列预测有较多的高效应用 [19] [20] [21]。循环神经网络 [22] 的正向传播过程是时间步的迭代,每个迭代步内可以模拟复杂的数学函数关系。本文将考察路面温度演化过程,将路面温度场分解为时间步迭代表述的时间序列过程。通过神经网络初始值、网络结构的设定,构建可覆盖路面温度迭代运算的长短记忆(LSTM)循环神经网络,建立沥青路面温度的预测模型。
2. 模型
2.1. 路面温度场理论
一维路面温度场路面温度的变化与热流量梯度线性相关,可以用如下偏微分方程描述 [4]
(1)
式中:h为路面深度坐标,T为温度,H为路面内热流量函数,t为时间变量。
在路面内部,热流H与温度梯度线性相关,有
(2)
式中:
为导温系数。
路面温度场在初边值条件下存在定解。初始值偏差随时间较快的消散。求解的关键条件是路面温度场的边值条件,即边界热流。路面内部热流减小,路面内3 m处地面温度的月度内波动不超过2℃。路面温度变化的最主要热源来自于路面表面。
路面表面热流量可显式表示的部分包括气温与路面温差造成的热流量、太阳辐射、路面对天空辐射 [5]。降雨、空气湿度等也会影响路面表面热流,但当前未有显式表达。
(3)
(4)
(5)
式中:
Qs为太阳辐射强度(KW/m2);
Tair为空气温度(℃);
TsurfTsurf,K为不同温标下路面表面温度(℃、K);
Tsky,K为天空温度,与路面周围环境,露点温度、蒸汽压、相对湿度相关;
hc为对流换热系数,与路面表面风速相关;
γ为路面太阳辐射反射率;
σ、ε分别为物理常数。
式5中气温与路面表面温度差异范围较小,可以采取线性近似方法表示 [6]。因此热流式(3) (4) (5)都可以近似表示为环境参数的线性组合。
t时刻表面热流可以表述为
(6)
其中:qelse为无法定量描述的其他热流;
为t时刻路面表面热流的与气象因素的相关项,为气象因素的线性组合;
为t时刻路面表面温度的温度,μ为与材料环境相关的系数。
2.2. 路面温度场的数值建模
路面温度的深度、时间关系可以示意为图1。

Figure 1. Schematic diagram of pavement temperature change at adjacent time
图1. 路面相邻时刻温度变化示意图
从t1至t2时刻,T0、Ti处温度的变化幅度可以用下式表示。
(7a)
(7b)
其中:Ri为路面点i与i+1之间的热流,R0为路面表面热流。
di为路面点i与相邻点之间的平均距离,d1为路面表面与点1的距离。
t2时刻的路面温度可以表示为t1时刻路面温度、路面表面热流的线性组合关系式。
路面最低点Tdmax的热流可以通过路面恒温层联系而获得。
联立式(6)、(7),能够由外部气象环境、路面初始温度,推导出路面温度的时间演化历程。
2.3. LSTM神经网络原理
长短记忆神经网络LSTM的单个循环神经网络由遗忘门、输入门、输出门构成 [22],每一个时间步的输出由输入和单元内的长短记忆确定,基本的构架和运算如下图2,式8;

Figure 2. LSTM single unit architecture
图2. LSTM单个单元架构图
(8)
式中:x(t)为时间步t的输入向量;
y(t)为时间步t的输出向量;
h(t)为时间步t的内部短期记忆向量;
c(t)为时间步t的内部长期记忆向量;
为数组对应元素乘法运算,
为对应加法运算。
每一个时间步,神经元输出y(t)由x(t)、c(t − 1)、h(t − 1)通过内部运算确定,并同步更新c(t)、h(t)。
LSTM神经元的四个门运算,各W系数矩阵的大小为[门输入向量个数 × 单元输出向量个数]。单元核心运算是短记忆h(t)与输入变量x(t)的线性组合,形如
,与路面温度场迭代式(6)、(7)的运算相同。
LSTM内部其他运算过程主要是为了解决模型输出存在长期依赖,及做长时间序列分析时梯度爆炸的问题。LSTM长时间跨度内训练模型参数效果较好,能够学习拟合出时间步内的关系式(
等系数矩阵)。
2.4. 路面温度时间序列循环神经网络模型
循环网络的深度n表示神经元的一次处理时间序列的长度。输入序列X1 − Xn为各时刻温度场影响变量。输出序列Y1 − Yn为各时刻路面温度预测值。路面温度场以天为单位做类周期的波动,n的时长为24、48 h较为合适。0点时路面温度分布较为均匀,热流较小,便于路面温度、热流初始值的确定,因而定为时间起点。
路面温度的LSTM深度循环网络建构如下图3,左为架构图、右为时间轴展开图。

Figure 3. 2-layer LSTM rrchitecture and deployment
图3. 2层LSTM架构与展开图
2层神经网络结构中,LSTM1为表面热流模拟层,LSTM2为路面温度模拟层。
LSTM1层为表面热流计算层,输入为气象因素X,输出为路面表面热流
(不含路面表面温度项),初始值为0;层内神经网络各门的主要运算与式(6)吻合。式(6)中环境因素的各项系数通过神经网络学习获得。LSTM1层输入、输出向量的项数根据模型效果确定。
LSTM2层为路面温度计算层,输入为LSTM1层输出,初始值为0点前路面内部节点温度。训练时初始值采用实测值,预测时采用简单估计值。层内神经网络各门的运算对应式(7)。LSTM2层输出向量的项数等于路面温度点数。
每一轮对时间序列迭代计算后,用目标函数(loss function)做评价。模型目标函数(loss function)计算预测值Yt与实际值Dt的偏差,通过下式度量。
(9)
目标函数计算的时间范围可以灵活选取,m − 1为训练的延迟时间。j − m + 1为训练时间长度。
RMSE误差通过神经网络反向传播,计算每个神经元节点的误差由此进行LSTM1、LSTM2参数的更新,重新运行神经网络,直到目标偏差在设定范围内。
具体模型训练步骤为:
a选择气象数据组合作为模型输入Xp,n,item,p为批次训练量,n为时间序列长度,item为气象参数个数。
b数据标准化处理,防止输入数量级差别导致模型系数更新慢,将各输入缩放为N(0,1)分布。
c数据集划分为训练集(武汉、唐山数据)、验证集(上海、苏州数据)。
d构建深度循环网络模型,选择数据训练时间和延迟时间参数m,j;定义其他训练参数,目标函数,训练参数更新方法。
e用训练集前24 h数据训练模型,比较后24 h的实测值与预测值的偏差,综合选出较好模型架构与参数。
f将训练集所有时间长度的数据用于训练模型。
g用验证集数据评价模型。
3. 模型训练
3.1. 数据采集
气温、太阳辐射采用就近气象站的测量数据,其余数据来源于国家气象科学数据中心 [23],具体见表1。武汉、唐山、苏州、上海高速公路埋设传感器,积累了历时5个月的路面温度数据 [6]。

Table 1. Meteorological data collected
表1. 采集的气象数据
气象数据的相关性、分布范围如图4。采集的数据统计中,太阳辐射、路面温度的分布如图5。
3.2. 降雨气象的数据标注
潮湿路面存在明显的热、水耦合现象,水分的转移与蒸发会同步引起路面温度的变化,图6。干燥路面比热容变小,升温速度更快,路面极端高温会在干燥状态下出现。
因未收集到实时的降雨信息,为避免模型的偏差大,路面温度突然大幅度快速降低的时段,太阳辐射较强路面升温缓慢时段,路面温度出现不规则波动时段。把存在降雨段的数据标注出来,做模型评价时,适当的降低权重。
(a) 太阳辐射的分布
(b) 路面温度分布
Figure 5. Statistics of collected meteorological data
图5. 采集气象数据的统计
3.3. 站点路面测量数据统一
各个路面测温站点的测试深度不同,训练模型时数据需要统一,把路面温度每时刻的深度分布以3次曲线多项式拟合,推算出各深度的路面温度数据,标准化示例见图7。从图中可以看出,路面内部实测温度存在着不光滑的情况,造成这些的因素是沥青路面内有空气、沥青、石料3种导热性能截然不同的材料,热流从微观上有不均匀的情况。沥青路面在短时间升温值与深度近似呈线性关系,图7中的采用3次多项式拟合路面温度的深度数据,能够较好的反映深度变化趋势。

Figure 7. Example of normalization for measured temperature
图7. 温度归一化示例
3.4. 模型训练参数与评价
为验证模型效果,寻找最优的模型训练参数,为此进行了多模型、多参数的组合。武汉、唐山的数据用于模型训练,苏州、上海的数据用于模型验证。模型气象输入数据量为(121 + 25) × 48 × 14 (48为连续2天的数据,30天的观测可以构造出29条48小时的训练数据,121条用于模型训练与选择、25条用于模型验证)累计数据量约9万个,近7000条。数据量为(121 + 25) × 48 × 8,累计约5万个。模型训练参数的情况见表2。
模型训练长度总长不超过24小时,每条总长度48小时数据的后24小时作为模型的评价数据集。评价方式有均方差、误差分布2种方法。
4. 模型训练
为方便参数比选选择最优的训练模型,设定基准的模型参数为:训练次数为100000,单次训练长度22小时,滞后时间为2小时,学习率0.001。
1) 学习率、迭代次数的影响
本文LSTM模型的时间深度超过24且为双层,神经网络训练采取小学习率 + 多次循环的方法,以避免参数陷入局部最优解。采用不同的学习率更新神经网络权重值,模型的标准差变化过程见图8,模型训练数据后24 h的偏差分布见图9。
(a) 0 cm 深度
(b) 4 cm深度
Figure 8. Absolute mean of prediction deviation as learning rate and training times
图8. 学习率、训练次数模型预测偏差的绝对平均值
(a) 箱图
(b) 预测偏差分布图
Figure 9. 4 cm depth prediction temperature under 0.001 learning rate
图9. 0.001学习率下 4 cm深度的模型预测温度
图8可以看出2万次训练后,模型预测的标准差就已经达到了一个稳定的区间,学习的效果明显减弱。4 cm深度处预测值的偏差较0 cm深度处小。模型采用0.001、0.0001的学习率在路面表面0 cm深度的学习效果较好,模型采用0.001、0.0002的学习率在4 cm深度的学习效果更好。综合评价学习率采用0.001较为合适。
图9在0.001学习率下,从(a)箱图看训练2.4万次后模型预测值的偏差范围就比较稳定,50%的值在[−1.5℃, 1.5℃]范围内,剔除离群值的极限偏差值也小于4℃。而(b)误差分布图显示,训练达到8万次,预测值的形态分布仍旧在改善中。训练循环次数增多的效果是偏差为0℃的占比升高,绝对偏差大于2℃的占比减小,分布曲线的峰值更加明显。这也反映出某些情况下标准差更多的反映了偏离较大数据的情况,这可能与本文中短时降雨的情况对应。
2) 训练时间的影响
式(9)计算RSME选用m至j时刻的模型输出。采用不同m、j组合,模型训练的效果如图10。
(a) 4 cm
(b) 8 cm图标前面数字为开始时间m后面为截止时间j
Figure 10. The deviation of model prediction under different training time combinations
图10. 不同训练时间组合下模型预测的偏差
图10中2~16 h的训练时间组合的效果最差,误差分布曲线集中度差,超过3℃的偏差部分占比较多;2~24 h的时间组合效果最好;0~24 h的训练效果其次。大体上模型训练时间越长,验证关系式越充分,训练效果越好。但训练开始时间并不是取0最好,可能原因是热流层初始值的设定存在一定的偏差。
3) 气象参数
气象因素决定了路面表面热流的主要部分,根据因素分析选择如表3的气象组合。模型训练效果对比如图11。

Table 3. Meteorological input combinations of model
表3. 模型输入的气象因素组合
(a) 4 cm
(b) 8 cm
Figure 11. Deviation of model prediction under different meteorological input combinations
图11. 不同气象输入组合下模型预测的偏差
图11中,4 cm深度处b、c组合的峰值占百分比最小,d组合的峰值占百分比最大但是峰值不出现在偏差0的位置。e组合的峰值占比较大,且出现在偏差为0的位置。
8 cm深度处d、e组合的峰值占比较大,且出现在偏差为0的位置;其余组合偏差曲线中心偏离0度位置,不对称特征明显。同样的深度越大模型的预测效果越好。
4) 模型层数与单元个数的影响
为寻找最优模型架构,设计了多种微调架构。模型代号以每层LSTM单元输出变量个数的连接标识,3 + 2 + 5表示3层LSTM模型,第一层的输出为3个变量,第二层输出为2个变量。本文所有模型最终的输出变量为0、2、4、6、8 cm深度的路面温度,因而模型代号最后一个数字都为5。
(a) 4 cm
(b) 8 cm
Figure 12.Prediction deviation under model training with different layers and units
图12. 不同层数与单元数模型训练下的预测偏差
图12表明3层模型的效果差于2层模型,2层模型中输出变量4、5的预测效果越好。同理深度越大,模型的预测效果越好,8 cm处模型2摄氏度的偏差已经低于5%了。同时4 + 5模型架构存在拟合变量少的优点,能够减少过拟合现象。
5. 模型验证与因素分析
5.1. 模型验证
综上所述,选择模型架构为4 + 5双层模型,气象组合选择e组合,训练时间段为2~48 h。用全部训练集数据训练模型,对预测集路面温度做预测,结果如图13。
(a) 验证集误差分布曲线
(b) 验证集误差累计曲线
Figure 13. Error analysis of “2 + 5” layers model verification
图13. 2 + 5模型验证的误差分析
图13看出路面表面的温度预测效果较差,偏差绝对值大于2℃的样本数超过了30%。但是随着深度增加,预测效果迅速改善。8 cm深度处偏差绝对值大于2℃的样本数已经小于10%。
路面表面温度预测效果差,可能因路面表面受到短时降雨或者不稳定气象的影响。要改善效果只能够通过采取更加细致的气象数据,如云量、风速度、短时降雨等。
训练集数据与预测集数据来源于不同的地区、时间段,预测结果较好,说明模型具有较好的可扩展性。
5.2. 模型因素分析
为评价模型的合理性,按照比例改变气象数据,分析预测路面温度的变化。基准组为所有气象因素不变化,其余组别为单组气象因素放大1.1倍。不同输入,分组情况序号及13、28 h预测值对比见表4。

Table 4. Pavement temperature change as meteorological factors * 1.1
表4. 气象因素*1.1路面温度变化℃
气温改变对路面温度最显著,提高幅度可以达到1.2℃。累年日平均水汽压升高对路面温度有明显的降低作用,降低幅度为4~6℃。风速度对路面温度有轻微影响。
太阳辐射升高对路面高温时段有升温效果,在夜晚反而有轻微的降温。可能的解释是,在晴朗天气下太阳辐射高,天空云量少,但夜晚路面长波辐射输出会有增加的热量散失。
降雨量对路面温度影响微小,气象数据中降雨量的多年平均值存在较大的跳跃,提供的有效信息较少,对模型的影响较小。
按照常理风速度越大、路面温度越低,但是这里需要放在一个路面、气温的系统来看,风速度增大会降低气温和路面温度,在同样气温下,风速度变大了,反映的是路面温度更加高。多年平均气温变大,预测的路面温度偏低了。可能是因为多年平均气温偏大表明路面内部温度升高,对外热量的散失增加,因而预测温度降低。气温是路面与环境作用的最主要媒介,同时也是路面与环境作用后结果的体现。
6. 结论
文章建立了用于路面温度预测的多层LSTM深度神经网络模型。通过模型训练、优选、验证,提出了适用性良好的预测模型。通过研究发现
1) 适当架构的循环神经网络其运行模式与路面热传导偏微分方程耦合。文章建立的2层LSTM模型能够有较好的可移植性。
2) 短期降雨情况下,路面表面温度存在较多的不连续出、呈现锯齿状。缺乏降雨气象资料时,对路面温度预测存在大的影响。
3) 2层LSTM神经网络用于预测路面温度效果最佳,层数增多后存在模型参数多、易过拟合等问题。模型对路面内的温度预测结果好于接近路面表面的温度预测结果。
4) 路面气象环境是一个相互作用的系统,气温与路面温度关系紧密,很多气象因素对路面温度的影响需要结合气温来综合考虑。
5) 要对路面表面温度做更加准确的估计需要有更加细致的反映降雨、云量等因素的气象数据。预测路面内部较深处温度,通常可以不用降雨数据。
基金项目
湖南省教育厅项目、沥青路面极限高温的循环神经网络预测模型研究(19C0841);广东省科技厅项目、新型高性能市政道路超薄磨耗层设计与施工关键技术研究,广东省企业科技特派员专项(GDKTP2020036600)。