1. 引言
港口作为综合交通运输体系的核心枢纽,其货物吞吐量是反映区域经济活力、贸易往来强度的关键指标,也是衡量国家物流与供应链效率的重要标尺。近年来,随着全球贸易格局调整、国内“双循环”新发展格局深化,全国港口货物吞吐量的波动特征与发展趋势,既关联着沿海沿江产业带的布局优化,也影响着国际贸易通道的资源配置效率[1]。因此,准确把握港口货物吞吐量的变化动态,对港口运营调度、物流基础设施规划乃至区域经济政策制定均具有重要的实践价值。时间序列分析作为捕捉数据动态趋势的经典方法,能够有效挖掘序列中的趋势性、季节性与随机性特征,为吞吐量的拟合与预测提供科学支撑。
孙晓聪等提出RF-ARIMA-BLSTM组合预测方法,将ARIMA与经随机森林筛选影响因素的LSTM、BLSTM结合,应用于青岛港、大连大窑湾港船舶交通流量预测,验证了该方法的最优预测精度[2];常祎妹等针对温州港构建优化的灰色马尔科夫预测模型,利用2002~2022年数据验算得出模型平均相对误差约2.1%,精度优于单一灰色模型,同时预测2023~2027年温州港吞吐量呈波动上升趋势[3];戴红伟等则为提升宁波港货物吞吐量预测准确性,构建MPA-BPNN和ARIMA模型,且明确数据波动较小时ARIMA更适用于短期预测、神经网络更适用于中长期预测[4]。赵一棋则以我国沿海港口外贸货物吞吐量为研究对象,经数据处理后构建乘积季节模型并完成检验,证实该模型能较好刻画吞吐量变化过程,预测效果良好,可为港口改扩建工程决策提供有效参考[5]。由此,本文基于时间序列分析方法,针对全国港口货物吞吐量展开时序特征挖掘与预测研究,为精准把握全国港口货物吞吐量的发展规律与变化趋势,为相关政策制定提供科学的量化参考。
2. ARIMA模型简介
ARIMA模型全称为自回归移动平均模型,是统计模型中最常用的一种用来对时间序列进行预测的模型。它基于如下理论:要预测的时间序列是由某个随机过程生成的,如果生成序列的随机过程不随时间变化,则该随机过程的结构可以被确切地刻画和描述。利用序列过去的观察值,可以推出序列的未来值。在ARIMA模型中,序列的未来值被表示成滞后项和随机干扰项的当期及滞后期的线性函数。ARIMA模型也可以对具有季节效应的序列进行建模。根据季节效应与其他效应之间的关系,又分为ARIMA加法模型与ARIMA乘法模型。
根据ARIMA与ARIMA模型的建模步骤,本文建模的基本步骤如下图1所示。
Figure 1. Steps for time series modeling
图1. 时间序列建模步骤
3. 我国港口货物吞吐量的预测分析
3.1. 数据来源与预处理
研究选取2019年1月~2024年12月期间的全国港口货物吞吐量月度数据作为分析样本,样本跨度涵盖6个完整年度,共计70个观测值,数据来源为国家交通运输部发布的官方统计公报及港口行业月度运行报告,确保了数据的权威性与可靠性。全国港口货物吞吐量作为反映宏观经济运行态势、国际贸易活跃度及物流行业景气度的核心指标,其月度数据的波动特征与趋势变化具有重要的研究价值。
在建模前的预处理阶段,为消除异方差性对建模结果的干扰,提升数据的稳定性与模型拟合效果,本研究对原始吞吐量数据实施自然对数变换处理。
3.2. 对数据进行建模
在构建ARIMA模型开展时序数据预测前,需要对数据进行平稳性检验与白噪声检验。平稳性检验用于判断时间序列是否满足均值、方差恒定且自协方差仅与时间间隔相关的统计特征,唯有平稳序列才能作为ARIMA模型的建模基础,非平稳序列需通过差分等方式处理后再开展后续分析;白噪声检验则用于判别序列中是否存在可挖掘的时序规律,若序列为白噪声序列,说明其无显著自相关特征,不具备建模价值,仅非白噪声序列可进一步进行模型阶数识别、参数估计等后续建模操作。
3.2.1. 数据平稳性检验
使用ADF检验数据的平稳性。检验结果如表1所示。原始序列(差分阶数为0)的t统计量为−0.445,大于5%显著性水平临界值−2.912,p值为0.902,无法拒绝存在单位根的原假设,表明数据变换后的序列为非平稳序列;1阶常规差分在5%显著性水平下通过平稳性检验(t = −3.134, p = 0.024),而1阶差分结合季节差分则在1%的更高显著性水平下达到平稳(t = −11.831, p = 0.000)。这表明后者的平稳性更为可靠,能够为后续的ARIMA建模提供更稳定的基础。并且,1阶差分结合季节差分的AIC值为959.257,较单纯1阶差分的1178.573降低了219.316。根据AIC准则的评判标准,AIC值降低超过10即可认为模型改进显著,故采用一阶差分12步季节差分对数据进行差分处理。
Table 1. ADF test results
表1. ADF检验结果
变量 |
序列 |
t |
P |
AIC |
临界值 |
1% |
5% |
10% |
port |
原序列 |
−0.445 |
0.902 |
1208.276 |
−3.546 |
−2.912 |
−2.594 |
1阶差分 |
−3.134 |
0.024** |
1178.573 |
−3.546 |
−2.912 |
−2.594 |
1阶差分~12步季节差分 |
−11.831 |
0.000*** |
959.257 |
−3.548 |
−2.913 |
−2.594 |
2阶差分 |
−7.918 |
0.000*** |
1187.791 |
−3.548 |
−2.913 |
−2.594 |
2阶差分~12步季节差分 |
−5.579 |
0.000*** |
955.498 |
−3.563 |
−2.919 |
−2.597 |
注:***、**、*分别代表1%、5%、10%的显著性水平。
3.2.2. 数据白噪声检验
在进行建模之前,有必要对数据的随机性进行检验,检验结果如下表2所示,给定显著性水平α = 0.05,p值小于α,则拒绝数据为白噪声序列的原假设,认为序列值彼此之间蕴涵着相关关系,为非白噪声序列。
Table 2. White noise test of the original sequence
表2. 原始序列的白噪声检验
延迟阶数 |
卡方统计量 |
p值 |
6 |
78.957 |
<0.001 |
12 |
146.82 |
<0.001 |
3.3. 模型构建与检验
3.3.1. 确定模型参数
Figure 2. Autocorrelation graph of cargo throughput at ports nationwide
图2. 全国港口货物吞吐量的自相关图
Figure 3. Partial autocorrelation plot of cargo throughput at ports nationwide
图3. 全国港口货物吞吐量的偏自相关图
考察自相关系数(图2)和偏自相关系数(图3)的性质,给拟合模型定阶。自相关图除了1阶自相关系数显著大于2倍标准差,其他阶数的自相关系数基本都在两倍标准差范围内。偏自相关图显示出明显的下滑轨迹,这是典型的拖尾属性。所以尝试拟合MA(0,1)模型。考虑到前面进行的差分,实际上就是拟合季节加法模型ARIMA(0,(1,12),1)。该模型的参数估计结果如表3所示。
Table 3. Parameter estimation results for the ARIMA(0,(1,12),1) model
表3. ARIMA(0,(1,12),1)模型的参数估计结果
参数项 |
系数 |
标准误(s.e.) |
σ2估计值 |
对数似然 |
AIC信息准则 |
θ1 |
−0.4934 |
0.1162 |
0.002531 |
92.54 |
−181.08 |
3.3.2. 模型检验
对ARIMA模型拟合结果进行残差白噪声检验与参数的显著性检验,检验结果分别如表3所示。显然,检验统计量的p值都大于显著性水平α(0.05),可以认为拟合模型的残差序列为白噪声序列。参数的显著性检验显示参数显著非零。这说明ARIMA(0,(1,12),1)模型对该数据的拟合结果显著成立。
Table 3. Validation results of the ARIMA(0,(1,12),1) model
表3. ARIMA(0,(1,12),1)模型检验结果
残差的白噪声检验 |
参数的显著性检验 |
延迟阶数 |
卡方统计量 |
p值 |
待估参数 |
t统计量 |
p值 |
6 |
0.26102 |
0.9997 |
θ1 |
4.1601 |
<0.001 |
12 |
3.7861 |
0.987 |
|
|
|
3.4. 模型优化
为进一步筛选最优模型,在已通过检验的模型基础上,拓展构建了6组不同参数组合的ARIMA模型(涵盖不同AR、MA阶数),并通过AIC、BIC准则,量化对比模型拟合效果(指标数值越小,模型拟合优度越高)。通过批量拟合与指标提取,得到各模型的AIC/BIC结果,并可视化对比如下图4所示。
Figure 4. Model optimization results
图4. 模型优化结果
上图显示不同模型的AIC、BIC值存在明显差异:模型1 [ARIMA(0,(1,12),1)]的AIC值显著低于其他模型,同时BIC值也处于较低水平;其余模型(如模型2 [ARIMA(0,(1,12),1)]、模型3 [ARIMA(0,(1,12),1)]等)的AIC/BIC值均高于模型1。
结合“信息准则越小,模型拟合效果越优”的原则,可确定ARIMA(0,(1,12),1)为本次研究的相对最优模型——其在保证模型简洁性的同时,实现了更优的拟合精度,能够更可靠地捕捉全国港口货物吞吐量序列的趋势性与季节性特征。
3.5. 模型拟合与预测
将数据的拟合值、观察值、预测值联合作图,如下图5所示,通过图示也可以直观看出该模型对序列的拟合效果良好。并且将对数尺度的预测值还原为原始数据,得到的2025年12期的预测结果如表4所示。
Table 4. Prediction results for 12 periods in 2025
表4. 2025年12期预测结果
阶数(时间) |
预测结果 |
95%置信区间下限 |
95%置信区间上限 |
1 Jan |
118472.7 |
107400.5 |
130686.4 |
2 Feb |
144468.8 |
129071.0 |
161703.6 |
3 Mar |
153879.8 |
135762.5 |
174414.7 |
4 Apr |
152632.2 |
133134.3 |
174985.5 |
5 May |
159179.2 |
137391.2 |
184422.5 |
6 Jun |
155422.4 |
132837.4 |
181847.3 |
7 Jul |
149747.4 |
126809.5 |
176834.3 |
8 Aug |
157943.2 |
132583.9 |
188152.8 |
9 Sep |
151845.9 |
126407.3 |
182403.9 |
10 Oct |
160313.0 |
132395.8 |
194116.8 |
11 Nov |
160454.6 |
131502.2 |
195781.4 |
12 Dec |
162865.0 |
132497.3 |
200192.8 |
Figure 5. Fitting and prediction results of the ARIMA additive model.
图5. ARIMA加法模型拟合与预测结果
4. 分析与结论
从建模结果来看,ARIMA(0,(1,12),1)模型在AIC和BIC准则下均表现最优,其残差通过白噪声检验,参数显著非零,表明该模型能够较好拟合数据。经过对数变换和一阶差分加季节差分处理后,序列呈现出良好的平稳性,验证了港口吞吐量数据中存在的显著年度周期性特征。
根据模型预测,2025年全国港口货物吞吐量将呈现稳步增长态势,12个月份的预测值分布在11.8万至16.3万之间,2025年2月、3月及12月将出现吞吐量高峰,全年呈现“年初回暖、年中平稳、年末冲高”的季节性特征。本研究的模型选择凸显了季节性因素在港口运营中的关键影响。港口作业受气候条件、节假日安排、国际贸易周期等多重因素影响,呈现出明显的季节性波动,这与我国港口运营的实际特征高度吻合。但需注意的是,本文的模型仅捕捉了序列的季节性与趋势性特征,尚未纳入港口基建升级、航运航线优化调整、新能源产业物流需求激增等结构性变量,此类因素若在2025年形成显著影响,将导致预测结果出现一定偏差。
从全球贸易格局与国内经济发展的双重维度来看,2025年全国港口货物吞吐量稳步增长的预测结果,既是国内“双循环”新发展格局深化落地的直观体现,也是我国港口物流体系适配全球贸易调整节奏的必然结果。在国内,内需市场的持续扩容带动了大宗商品、消费品的港口装卸需求,沿江沿海产业带的布局优化进一步提升了港口集疏运效率,为吞吐量增长筑牢了内需根基;在国际层面,尽管全球贸易保护主义带来了外部不确定性,但我国持续推进的自贸试验区建设、一带一路国际贸易通道升级等举措,有效稳定了港口外贸货物流通,成为吞吐量增长的重要外部支撑。而“年初回暖、年中平稳、年末冲高”的季节性特征,更是国内经济运行节奏与全球贸易周期相互叠加的结果,春节后复工复产的产业需求、年末外贸订单集中交付的贸易规律,共同塑造了港口吞吐量的年度波动轨迹,也印证了我国港口经济与宏观经济、全球贸易的高度关联性。
本研究预测结果也提示,要实现港口货物吞吐量的持续增长,仍需在多方面协同发力。特别是当前全球经济、贸易保护主义的背景下,港口运营面临的外部挑战不容忽视。综合来看,全国港口货物吞吐量在经历疫情冲击后已步入恢复性增长通道,但增长动能仍需加强。通过科学预测把握发展趋势、精准施策破解瓶颈制约,我国港口有望在构建新发展格局中发挥更大作用,为经济高质量发展提供坚实支撑。