1. 引言
近几十年以来,随着经济的迅猛发展和人民生活水平的不断提高,MSW (MSW)也日渐增多,然而大量垃圾的产生会破坏生态环境,影响人民的日常生活,因此对其进行有效的处理至关重要,准确预测MSW清运量是对其进行减量化、资源化、无害化处理的重要步骤。已有研究中关于MSW清运量的预测模型主要包括:多元线性回归模型、深度学习模型和时间序列预测模型等 [1] 。Olanrewaju [2] 利用英格兰各城市的人口指标与MSW清运量建立线性回归关系来对其进行预测;Nguyen等人 [3] 选取城市人口、月平均消费支出和总零售额为关键影响因素,使用随机森林模型来预测越南选定居民区的MSW;Vaishnavi等人 [4] 采用时间序列模型和极端梯度增强模型来预测北爱尔兰的MSW清运量。然而在使用多元线性回归模型进行预测时,需结合相关影响因素,无法直接使用单一数据进行预测;使用深度学习模型进行预测时,通常需要大量的数据对模型进行训练才能获得精确的结果,但由于客观环境和主观认知的局限性,很难获得大量的数据 [5] 。
时间序列数据反映的是数据随着时间不断变化的趋势,时间序列预测模型就是从数据中挖掘出这种趋势规律,并利用其对将来的数据进行预测,且不需要大量的数据,因此,已被广泛应用于各领域。贾逸卿等人 [6] 使用趋势外推法对中国废钢的资源化利用趋势进行预测,发现到2035年全国废钢比将提升至40%左右;张兴文等人 [7] 使用趋势外推法对2021~2035年浙江省11个地级市的人口进行预测,预测精度均大于93%,结果发现人口总量仍有十年以上的持续增长期;李之领 [8] 使用修正的趋势外推模型对GDP进行预测,预测精度高达97%;宋娜 [9] 使用ARIMA模型在中等收入群体比重、收入水平和居民收入差异三个维度上分析预测了中国共同富裕发展水平的总体变化规律特征趋势,结果发现,中国共同富裕发展水平呈稳步上升的趋势,但同时各维度的变化差异较大;张小斐等人 [10] 在2006年提出可以对短期时间序列数据进行有效预测的平滑ARIMA模型,以国内生产总值为例进行实证研究并取得了精确的拟合预测结果;赵梅等人 [11] 使用ARIMA和平滑ARIMA模型对中国的棉花价格进行了预测,结果表明平滑ARIMA模型的预测精度更高;逯晓娣等人 [12] 使用趋势外推模型和ARIMA模型对中国成年人的蓄肉平均摄入量进行预测,结果表明ARIMA模型的预测结果最好。上述研究领域中的数据使用时间序列模型预测均获得了理想的结果,MSW清运量同样为时间序列数据,因此,可以使用时间序列模型进行预测研究。
2000年,国务院发布《关于推进城市污水、垃圾处理产业化发展意见的通知》,大力推动了MSW的处理,2010年中央政府提出要加强源头治理,尤其是要重视垃圾分类制度的规范建设 [13] 。2000年北京市成为全国首批垃圾分类收集试点城市,2010年北京市实施垃圾分类政策,2020年新版《北京市生活垃圾管理条例》正式实施,北京市进入强制垃圾分类阶段,以上政策的实施均会对MSW清运量产生一定程度的影响。MSW的清运量受各方面因素的影响而产生变化,不同时间范围内MSW清运量呈现出不同的变化趋势,已有研究在对其进行预测时很少考虑时间尺度对模型预测精度的影响。本文将MSW清运量划分为三个时间尺度的数据,研究不同时间尺度对于趋势外推模型、修正趋势外推模型、ARIMA模型和平滑ARIMA模型对全国和北京地区预测精度的影响,通过对比分析得出最佳结果,并预测2023~2030年全国和北京市的MSW清运量。
2. 使用须知
2.1. 数据与研究方法
2.2.1. 数据来源
本研究所使用数据来源于《中国统计年鉴2022》、北京统计局官网(http://tjj.beijing.gov.cn/)和《北京统计年鉴2022》。北京市MSW清运量在2000年和2010年时出现明显拐点,因此,为了对比不同时间尺度对模型拟合预测精度的影响,本研究选择1991~2022年(32年)、2000~2022年(23年)和2010~2022年(13年)三个时间尺度的数据对全国和北京市MSW清运量进行拟合及预测研究。
2.2.2. 研究方法
1) 趋势外推模型
趋势外推模型即根据已有数据的变化趋势来预测未来数据的方法。以时间t为横坐标,时间序列数据
为纵坐标得到时序图,通过观察已知数据的变化趋势,选择合适的函数对曲线进行拟合,常见函数有一次函数、二次函数、三次函数、指数函数和正弦函数等,一般需进行多次拟合检验来选出最佳函数模型
,基于此模型即可对未来数据进行预测。
2) ARIMA模型
ARIMA模型即整合移动平均自回归模型,记作ARIMA(p,d,q),其中,p为自回归项数,d为差分阶数,q为移动平均项数。ARIMA模型包含自回归过程(AR)、滑动平均过程(MA)、自回归滑动平均过程(ARMA)。
若时间序列数据
与过去值
之间存在线性关系:
(1)
称模型(1)为p阶自回归模型,其中,
是自回归系数,
为误差项。
若时间序列数据
与误差项
之间存在线性关系:
(2)
称模型(2)为q阶滑动平均模型,其中,
是滑动平均系数。
当时间序列数据
与两者都有关系时,为自回归模型和滑动平均模型的组合:
(3)
称模型(3)为自回归滑动平均模型。
以上三种模型均要求数据为平稳数据,当数据不平稳时,需对数据进行差分得到平稳数据,ARIMA模型为:
其中,
表示数据经d阶差分得到平稳数据,
是一个平稳序列,
是ARMA(p,q)模型的自回归系数多项式,ARMA(p,q)模型的移动平均系数多项式为
。
使用Eviews 9.0软件实现ARIMA模型的拟合预测过程有以下步骤:1) 使用ADF单位根来检验数据的平稳性,若数据序列非平稳,则通常对数据取对数或进行差分处理使数据变为平稳序列;2) 观察平稳序列的自相关函数图(ACF)和偏相关函数图(PACF)对模型进行识别定阶,确定参数p和q的取值,此过程通常需多次尝试,根据最小AIC和SIC准则来确定出最佳模型;3) 检验残差序列是否为白噪声序列,若为白噪声序列则表明所选模型已充分提取有效信息,若不是,则需要对模型进行调整;4) 使用Eviews 9.0软件中的forecast功能即可对已有数据进行拟合,对未来数据进行预测。
3) 修正趋势外推模型
修正的趋势外推模型为趋势外推模型和时间序列模型的组合,即将趋势外推模型得到的预测值与实际值计算得到残差数据,使用ARMA模型对残差值进行修正来进一步修正趋势外推模型所得的预测值。
4) 平滑ARIMA模型
使用简单平均的方法对原始时间序列数据列
进行填充:
(4)
得到平滑后数据列:
(5)
使用ARIMA模型对平滑后数据列进行预测。
2.2.3. 模型检验
使用平均绝对百分比误差(MAPE)来对比各模型之间的预测精度。
实际数据为:
(6)
预测数据为:
(7)
MAPE值的计算公式为:
(8)
其中
。
3. 结果与讨论
3.1. 全国MSW清运量的拟合预测
3.1.1. 1991~2022年MSW清运量拟合预测
分别采用趋势外推模型、修正趋势外推模型、ARIMA模型和平滑ARIMA模型对1991~2022年全国MSW清运量进行拟合预测。首先,观察1991~2022年全国MSW清运量的数据变化趋势,根据不同函数对曲线的拟合程度,最终筛选出拟合精度最高的函数
作为拟合预测模型,该模型对于拟合部分数据中部分波动数据的拟合效果不太理想,MAPE值为3.28%。其次,根据趋势外推模型得到的预测值和实际值计算得到的残差序列为平稳序列,选择ARMA(2,1)模型对残差部分进行修正,结果发现ARMA模型修正后的结果对于已知数据中存在波动部分的拟合效果很好,有效的修正了趋势外推模型中存在不足的部分,MAPE值为1.80%,明显提高了拟合精度。再次,1991~2022年的时间序列数据为非平稳序列,经二次差分后转为平稳序列,选择ARIMA(0,2,1)模型对数据进行拟合预测,发现数据拟合值与实际值虽差距不大,但均有一定的误差,MAPE值为3.08%,拟合预测效果略优于趋势外推模型。最后,对数据进行平均值填充处理后使用平滑ARIMA(1,2,1)模型进行拟合预测,发现拟合值与实际值之间的几乎没有差距,MAPE值为0.80%,说明该模型有效地提高了传统ARIMA模型对于1991~2022年全国MSW清运量数据的拟合预测精度。
在1991~2022年的时间尺度下,基于这四种模型对未来2023~2030年MSW清运量的预测数据(图1)均呈现逐年增长趋势。从模型的预测部分来看,四种模型对于全国MSW清运量2023~2030年的预测结果趋势均符合已知数据的变化趋势,趋势外推模型和修正趋势外推模型对于2023~2030年的预测值相近且明显高于ARIMA模型和平滑ARIMA模型的预测值,ARIMA模型的预测结果增长趋势较为平缓。
(a)(b)
(c)(d)
Figure 1. Fitting and forecasting results of the removal transport weight of MSW on a 32-year time scale in China; (a) Trend extrapolation model; (b) Modified trend extrapolation model; (c) ARIMA model; (d) Smooth the ARIMA model
图1. 32年时间尺度下的全国MSW清运量拟合预测结果;(a) 趋势外推模型;(b) 修正趋势外推模型;(c) ARIMA模型;(d) 平滑ARIMA模型
3.1.2. 2000~2022年MSW清运量拟合预测
同样,分别采用趋势外推模型、修正趋势外推模型、ARIMA模型和平滑ARIMA模型对2000~2022年全国MSW清运量进行拟合预测。通过观察2000~2022年全国MSW清运量序列数据的变化趋势,经多次尝试,选择预测精度最高的函数
对清运量数据进行拟合预测,发现大多拟合数据与实际数据相差不大但存在数据波动的部分有较大的误差,MAPE值为3.20%。残差序列为平稳序列,选定ARMA(1,2)模型对趋势外推模型的结果进行修正,发现波动部分的数据的预测误差较小,整体拟合曲线与实际数据重合度较高,说明拟合效果较好,MAPE值为1.78%,有效地修正了趋势外推模型的预测结果。该时间尺度下数据经二次差分后转变为平稳序列,选定ARIMA(0,2,1)模型进行拟合预测,发现该模型对于前期数据的拟合误差较大,后期数据的误差较小,且对于数据序列中波动点的预测效果不理想,MAPE值为2.35%。对该序列数据同样进行平均值填充处理后,经一阶差分处理后转化为平稳序列,选定ARIMA(0,1,1)模型,结果显示,仅对与前期数据的预测结果存在较小误差,后期数据的结果基本不存在误差,
(a)(b)
(c)(d)
Figure 2. Fitting and forecasting results of the removal transport weight of MSW on a 23-year time scale in China; (a) Trend extrapolation model; (b) Modified trend extrapolation model; (c) ARIMA model; (d) Smooth the ARIMA model
图2. 23年时间尺度下的全国MSW清运量拟合预测结果;(a) 趋势外推模型;(b) 修正趋势外推模型;(c) ARIMA模型;(d) 平滑ARIMA模型
MAPE值为0.45%,同样有效提高了传统ARIMA模型的预测精确度。该时间尺度下四种模型对于2023~2030年MSW清运量的预测结果(图2)均符合已知数据的变化趋势,趋势外推法与修正趋势外推法的预测值相似,且均明显高于ARIMA模型和平滑ARIMA模型的预测值,平滑ARIMA模型的预测结果增长较为缓慢。
3.1.3. 2010~2022年MSW清运量拟合预测
根据2010~2022年全国清运量数据的整体变化趋势,选定
函数对实际数据进行拟合预测,结果表明拟合数据的误差均较小,数据的整体拟合效果较好,MAPE值为1.47%。在该时间尺度下趋,由于MSW清运量数据、势外推模型的预测值与实际值得到的残差序列均为白噪声序列,且趋势外推法获得的拟合结果相对较好,因此不对数据进行修正的趋势外推模型处理和ARIMA模型预测,直接使用平滑ARIMA模型,平滑后序列数据经一阶差分后转化为平稳数据,选定ARIMA(0,1,1)方法对数据进行拟合预测,结果表明,所有拟合值与真实值之间均存在较小的误差,整体拟合效果不佳,MAPE值为2.12%。对于2023~2030年的预测结果(图3),趋势外推模型预测的MSW增长幅度高于平滑ARIMA模型预测的MSW增长幅度。
(a)(b)
Figure 3. Fitting and forecasting results of the removal transport weight of MSW on a 13-year time scale in China; (a) Trend extrapolation model; (b) Smooth the ARIMA model
图3. 13年时间尺度下的全国MSW清运量拟合预测结果;(a) 趋势外推模型;(b) 平滑ARIMA模型
3.2. 北京市MSW清运量的拟合预测
3.2.1. 1991~2022年MSW清运量拟合预测
与全国MSW清运量预测类似,分别采用趋势外推模型、修正趋势外推模型、ARIMA模型和平滑ARIMA模型对北京市MSW清运量进行拟合预测。1991~2022年北京市MSW清运量的数据相较于全国该时间尺度下MSW的数据波动性较大,因此考虑使用正弦函数,选择函数f(t) = 298.60 + 16.77t + 116.04 sin (0.27t + 19.96)对实际数据进行趋势外推模型的拟合预测,结果表明,拟合数据部分的误差均较大,数据拐点处的拟合值与实际值之间的差距过大,MAPE值为10.61%,整体的拟合预测效果不理想。根据趋势外推法得到的预测值与实际值得出残差序列,该残差序列为平稳序列选用ARMA(2,1)模型对趋势外推法进行修正,结果表明,极大部分数据的拟合值与实际值的误差较小,只有拐点处的数据拟合误差相对较大,MAPE值为4.06%,说明ARMA模型对趋势外推模型的预测结果有很大的修正作用。该序列经二阶差分后转化为平稳序列,选定ARIMA(1,2,1)模型对数据进行拟合预测,结果表明,拟合值与实际值之间均有一定的误差,且拐点处误差相对较大,MAPE值为5.89%。对数据进行平均值的平滑处理后经一阶差分转化为平稳序列,选定ARIMA(0,1,1)模型对平滑后数据进行拟合预测,结果表明,数据拟合值与实际值间的误差均较小,且拐点处预测值精度也较为精确,MAPE值为1.08%,整体预测效果较好,说明对于此序列平滑ARIMA模型可有效提高传统ARIMA模型的预测精度。在此时间尺度下基于四种模型得出的2023~2030年的预测结果(图4)中除ARIMA模型的结果为下降趋势不符合已知数据的整体变化趋势外,其他三种模型预测结果的趋势均为先下降后增长,与已知数据的变化趋势相似,趋势外推模型与平滑ARIMA模型在2026~2030年的预测结果十分相近。
(a)(b)
(c)(d)
Figure 4. Fitting and forecasting results of the removal transport weight of MSW on a 32-year time scale in Beijing; (a) Trend extrapolation model; (b) Modified trend extrapolation model; (c) ARIMA model; (d) Smooth the ARIMA model
图4. 32年时间尺度下的北京MSW清运量拟合预测结果;(a) 趋势外推模型;(b) 修正趋势外推模型;(c) ARIMA模型;(d) 平滑ARIMA模型
3.2.2. 2000~2022年MSW清运量拟合预测
通过观察2000~2022年北京市MSW的数据变化趋势,选定
函数对实际数据进行拟合预测,发现拟合曲线前期拟合效果较好,但后期拟合误差较大,且不能有效的拟合出原始数据中波动的部分,MAPE值为8.78%,拟合效果较差。通过趋势外推模型和实际值的计算得到残差序列,该序列为平稳序列,选定ARMA(1,0)模型对趋势外推模型进行修正,结果发现,同样存在预测前期拟合误差小,后期拟合误差较大的情况,但预测数据能够拟合出实际数据波动部分,且误差相对较小,MAPE为5.67%,说明有效的修正了趋势外推模型的拟合预测值。该序列数据经二阶差分处理后转化为平稳序列,选用ARIMA(0,2,1)模型进行拟合预测,发现拟合结果与修正趋势外推模型的拟合结果相似,但整体拟合误差相对较大,MAPE值为6.29%。对数据进行平均值填充处理后的数据经一阶差分处理后为平稳序列数据,选定ARIMA(0,1,1)型对数据进行拟合预测,结果显示拟合值与实际值之间的拟合误差均很小,且拐点处数据拟合的也较为准确,MAPE值为0.93%,极大提高了传统ARIMA模型的预测精度,拟合预测效果很好。在该时间尺度下,基于四种模型对于2023~2030年MSW清运量的预测结果(图5)中,趋势外推模型和ARIMA模型的结果为下降趋势但后者下降趋势过大不符合常理,修正趋势外推模型结果为先下降后上升再下降趋势,平滑ARIMA模型为先下降后上升趋势,两者均与已知数据的变化趋势相符。
(a)(b)
(c)(d)
Figure 5. Fitting and forecasting results of the removal transport weight of MSW on a 23-year time scale in Beijing; (a) Trend extrapolation model; (b) Modified trend extrapolation model; (c) ARIMA model; (d) Smooth the ARIMA model
图5. 23年时间尺度下的北京MSW清运量拟合预测结果;(a) 趋势外推模型;(b) 修正趋势外推模型;(c) ARIMA模型;(d) 平滑ARIMA模型
3.2.3. 2010~2022年MSW清运量拟合预测
2010~2022年北京市MSW清运量数据为先上升后下降趋势,且趋势变化明显,经多次尝试后选用预测精度最高的函数
对数据进行拟合预测,结果表明该函数能够较好的拟合原始数据的变化趋势,对于2018年前的数据拟合误差较小,后期的拟合误差相对较大,且2023~2030年的预测值与已知数据的趋势十分相似,为先下降后上升趋势(图6(a))。由于MSW清运量数据、势外推模型的预测值与实际值得到的残差序列均为白噪声序列,且趋势外推法获得的拟合结果相对较好,因此不对数据进行修正的趋势外推模型处理和ARIMA模型预测,直接使用平滑ARIMA模型,对该序列数据进行平滑处理后经一阶差分后为平稳序列,选用ARIMA(0,1,1)模型进行拟合预测,结果表明数据的拟合误差均较小,数据拐点处的预测也较为准确,MAPE值为2.65%,说明拟合效果很好,对于2023~2030年的预测值呈现“S”型趋势,且变化程度相较于趋势外推模型的结果较为缓慢,变化范围较小(图6(b))。
(a)(b)
Figure 6. Fitting and forecasting results of the removal transport weight of MSW on a 13-year time scale in Beijing; (a) Trend extrapolation model; (b) Smooth the ARIMA model
图6. 13年时间尺度下的北京MSW清运量拟合预测结果;(a) 趋势外推模型;(b) 平滑ARIMA模型
3.3. 模型预测精度对比及影响因素分析
对全国MSW清运量的三种时间尺度、四种不同模型的预测精度如图7(a)所示,不同时间尺度不同模型间的拟合误差整体相差不大,在1991~2022年和2000~2022年的时间尺度下的结果中修正趋势外推模型均优于趋势外推模型,平滑ARIMA模型均优于ARIMA模型,其中,平滑ARIMA模型的结果最佳,在2010~2022年时间尺度下,两种模型拟合预测结果相似,模型类型对其没有太大影响。北京市MSW清运量的预测精度如图7(b)所示,发现不同时间尺度下、不同模型间的拟合误差相差较大,这三种时间尺度下的数据均使用平滑ARIMA模型的预测误差最小,拟合预测效果最佳,且远小于其他三种模型的误差,1999~2022年与2000~2022年趋势外推模型与ARIMA模型的拟合误差相似。从数据波动的角度分析发现,三个时间尺度的数据中全国MSW清运量的数据波动变化不大,模型间最大平均相对误差值相差2.83%,不同模型对于无明显波动变化数据的拟合预测误差影响较小,北京市MSW清运量的数据均呈现较大的波动变化,模型间最大的平均相对误差值相差9.68%,说明不同模型对于波动较大数据拟合预测误差的影响较大。在两个不同范围、三个不同的时间尺度下,趋势外推模型的拟合预测误差整体相较于其他模型较大,因此,不建议直接使用趋势外推模型对时序数据进行预测,平滑ARIMA模型的结果整体优于其他三种模型,建议使用该模型对时序数据进行预测,以得到理想的结果。
(a)(b)
Figure 7. Comparison of model prediction accuracy; (a) Prediction error of the MSW in China; (b) Prediction error of the MSW in Beijing
图7. 模型预测精度对比;(a) 全国MSW的预测误差;(b) 北京MSW的预测误差
已有研究中极少使用平滑ARIMA模型来预测MSW的清运量,本研究中,使用该模型对2000~2022年全国和北京MSW清运量的数据进行拟合预测,拟合精度分别为99.54%和99.07%,均大于表1中使用其他模型预测MSW的精确度以及平滑ARIMA模型预测其他领域数据的精确度,因此使用平滑ARIMA模型来预测MSW清运量是高度可行的。

Table 1. Comparison of prediction accuracy
表1. 预测精度对比
在2000~2022年时间尺度下,使用平滑ARIMA模型得到的全国和北京市2023~2030年MSW清运量的预测值如表2所示,结果表明,预计到2030年全国MSW清运量将会上涨26.38%,达到32768.74万吨,北京市MSW清运量将会上涨25.36%,达到928.37万吨。由此可知,到2030年全国和北京市的MSW清运量将会持续且快速增长,为防止出现“垃圾围城”的情况及影响人们的日常生活工作,亟需对MSW进行有效处理,从源头实现MSW的减量,需优化垃圾分类政策、增加垃圾分类的宣传引导、不同部门协调配合实现对MSW的闭环管理 [18] 。
4. 结论
本研究使用趋势外推模型、修正趋势外推模型、ARIMA模型和平滑ARIMA模型对全国和北京市的MSW清运量进行拟合预测,分析研究在1991~2022年、2000~2022年、2010~2022年三种时间尺度下四种模型对拟合预测精度的影响,可得以下结论。

Table 2. Predicting results of the removal transport weight of MSW (10,000 t)
表2. MSW清运量的预测结果(万吨)
1) 综合三个时间尺度,全国和北京地区MSW清运量的拟合预测结果发现,ARMA模型可有效修正趋势外推模型的结果,提高预测精度,平滑ARIMA模型也比传统的ARIMA模型的预测精度高。在2000~2022年时间尺度下,使用平滑ARIMA模型预测全国和北京MSW清运量的拟合预测结果最佳。
2) 北京市MSW清运量数据的波动程度明显大于全国MSW清运量数据的波动程度,四种模型在预测波动程度较大的数据时,对预测精度的影响也较大。
3) 预测2023~2030年全国和北京的MSW清运量,全国MSW清运量的增速略高于北京MSW清运量的增速,本研究可为MSW进行减量化、资源化、无害化处理提供数据参考。
基金项目
本研究受到国家水体污染控制与治理科技重大专项(2017ZX07101)资助。