几类预测模型对我国酒店行业的发展趋势分析
Analysis of the Development Trend of China’s Hotel Industry Based on Several Kinds of Prediction Models
摘要: 本文以2015年至2019年我国酒店行业中的连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重为数据基础,分别建立单变量灰色预测模型、多项式趋势曲线模型和指数曲线模型。计算结果表明三种预测模型都能够得到比较精确的数值结果。基于此,本文进一步给出了2020年至2023年中国的连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重,计算结果可为我国酒店行业决策者提供参考。
Abstract: Based on the data of the number of chain hotels, the number of hotel rooms and the proportion of chain hotel rooms in the number of hotels in China from the year of 2015 to 2019, this paper establishes a single variable grey prediction model, a polynomial trend model and an exponential curve model. The computational results show that the three prediction models can get accurate numerical results. Based on this result, this paper further gives the number of chain hotels, the number of hotel rooms, and the proportion of chain hotel rooms in the number of hotels in China from 2020 to 2023. The calculation results can provide reference for the decision makers of China’s hotel industry.
文章引用:柳孟娟, 左凯. 几类预测模型对我国酒店行业的发展趋势分析[J]. 统计学与应用, 2021, 10(3): 547-555. https://doi.org/10.12677/SA.2021.103056

1. 引言

受益于宏观经济企稳、供需关系改善、居民消费升级,我国旅游业发展迅速,而旅游业作为酒店行业的上游的一个重要组成部分,直接影响着我国酒店行业的发展状况,因此旅游业的快速发展带动了酒店行业的蓬勃成长,连锁酒店规模由2015年3.08家增长至2019年的5.56家,年复合增速达16%。客房数量方面,则从2015年的约280万间,增长至约490万间左右,年复合增速达15%。但从发展增速来看,近年来随着中产阶级消费群体的崛起,消费升级导致顾客需求发生极大的变化,酒店提供的服务能否满足新型消费者个性化、多元化、移动化、体验化、社群化的需求,对酒店行业形成了极大的挑战。在这种情况下,对我国未来几年的连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重等指标的预测就显得格外重要。相关决策者可从计算数据提前进行规划、布局以满足消费群体的需要。

在本文的研究中,主要采用三种统计预测模型:灰色预测模型、多项式趋势模型和指数曲线模型。灰色预测模型是邓聚龙教授于1982年提出的,其中单变量灰色预测模型(简记为GM(1,1)模型) [1] 是灰色预测模型的基础,其主要内容有白化方程和对应的差分离散方程。GM(1,1)中的GM表示grey model,第一个1表示白化方程是一阶微分方程,第二个1表示模型中只有一个变量。自该模型提出以来,其广泛的应用在经济、生活、生产的各个方面,并产生了很好的效益 [2] - [8]。多项式趋势曲线是描述时间序列趋势性的一类非常重要的模型,被广泛应用在农业工业、环境能源等领域。在统计学教材 [1] [2] 或者时间序列分析教材 [3] 中提到,当研究现象的趋势随着时间的推移呈现出稳定的增长或下降的线性变化,则可用线性趋势模型来对现象进行研究分析。当研究现象的趋势随着时间的推移呈现出某种非线性变化趋势,则需要拟合适当的趋势曲线。特别地,如果现象的趋势变化中只有一个拐点,则可以拟合二阶多项式趋势曲线;如果现象的趋势变化中有两个拐点,则可以拟合三阶多项式趋势曲线;如果现象的趋势变化中有多个拐点,则需要拟合多项式趋势曲线。关于这方面的研究工作可见文献 [9] [10] [11] [12] [13]。另外,在对数据预测分析中,指数曲线也是很重要且常见的一类预测模型。当现象的长期趋势每期大体按照相同的增长速度递增或者递减变化时,可以用指数曲线进行拟合,相关文献可见 [14] - [19]。

在本文中,我们将利用灰色预测模型、多项式趋势曲线模型和指数曲线模型对我国酒店行业中的连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重进行研究分析,并给出2020年至2023年中国的连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重的数值结果。本文的结构具体安排如下:第2节给出单变量灰色预测模型、多项式趋势曲线模型和指数曲线模型。第3节以2015年至2019年我国酒店行业中的连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重为数据基础建立相应的预测模型,并给出未来几年的数值计算结果。第4节给出了本文的结论。

2. 三类统计预测模型

在本节中,我们将给出单变量灰色预测模型、多项式趋势曲线模型和指数曲线模型的具体建模步骤。

2.1. 单变量灰色预测模型

设原始数据为 X ( 0 ) = ( x ( 0 ) ( 1 ) , x ( 0 ) ( 2 ) , , x ( 0 ) ( n ) ) ,其中数据 x ( 0 ) ( k ) 0 k 1 ,则称 X ( 1 ) = ( x ( 1 ) ( 1 ) , x ( 1 ) ( 2 ) , , x ( 1 ) ( n ) ) 为序列 X ( 0 ) 的一次累加生成序列,其中有关系表达式 x ( 1 ) ( k ) = i = 1 k x ( 0 ) ( k ) k = 1 , 2 , , n ,称

d x ( 1 ) ( t ) d t + a x ( 1 ) ( t ) = b (1)

为灰色GM(1,1)模型的白化方程。进一步,称

x ( 0 ) ( k ) + a z ( 1 ) ( k ) = b (2)

为灰色GM(1,1)模型的离散差分形式,其中 z ( 1 ) ( k ) = 0.5 x ( 1 ) ( k 1 ) + 0.5 x ( 1 ) ( k )

由灰色GM(1,1)模型的白化方程,可以得到模型的时间响应函数和还原值的表达式为

x ^ ( 1 ) ( k ) = [ x ( 0 ) ( 1 ) b a ] e a ( k 1 ) + b a , k = 1 , 2 , (3)

x ^ ( 0 ) ( k ) = e a 1 a ( b x ( 0 ) ( 1 ) ) e a ( k 1 ) , k = 1 , 2 , (4)

由灰色GM(1,1)模型的离散差分形式,可以推导模型参数的矩阵表达式为

( a b ) = ( B T B ) 1 B T Y (5)

其中 B = ( z ( 1 ) ( 2 ) 1 z ( 1 ) ( 3 ) 1 z ( 1 ) ( n ) 1 ) Y = ( x ( 0 ) ( 2 ) x ( 0 ) ( 3 ) x ( 0 ) ( n ) )

2.2. 多项式趋势曲线模型

由文献 [20] 的13章可知,多项式趋势曲线模型的一般形式为

x ( 0 ) ( t ) = a k t k + a k 1 t k 1 + + a 1 t + a 0 (6)

其中 a k 0 。对参数 a k , a k 1 , , a 0 的具体表达式可采用分段求和的思想给出。具体做法是:把用于建模的时间序列分成相等的 ( k + 1 ) 个数组,每个组有m项,即用于建模的数据量为 ( k + 1 ) m 。根据趋势值 x ^ ( 0 ) ( t ) ( k + 1 ) 个局部总和分别等于原序列观察值 x ( 0 ) ( t ) ( k + 1 ) 个局部总和来确定参数 a k , a k 1 , , a 0 。记观察值的 ( k + 1 ) 个局部总和分别为 S 1 , S 2 , , S k + 1 ,得

S i = t = ( i 1 ) m + 1 i m x ( 0 ) ( t ) , i = 1 , 2 , , k + 1 (7)

于是,得到如下方程

{ S 1 = a k t = 1 m t k + a k 1 t = 1 m t k 1 + + a 1 t = 1 m t + a 0 m S 2 = a k t = m + 1 2 m t k + a k 1 t = m + 1 2 m t k 1 + + a 1 t = m + 1 2 m t + a 0 m S k + 1 = a k t = k m + 1 ( k + 1 ) m t k + a k 1 t = k m + 1 ( k + 1 ) m t k 1 + + a 1 t = k m + 1 ( k + 1 ) m t + a 0 m . (8)

通过求解矩阵方程(8),即可得到参数 a k , a k 1 , , a 0 的值,然后代入多项式趋势曲线方程即可对数据进行拟合、预测。

· 当 k = 1 时,求解线性趋势曲线 x ( 0 ) ( t ) = a 1 t + a 0 参数的表达式。首先,有

{ S 1 = a 1 t = 1 m t + a 0 m , S 2 = a 1 t = m + 1 2 m t + a 0 m . (9)

通过对方程(9)的求解得到,

{ a 1 = S 2 S 1 m 2 , a 0 = S 1 m ( m + 1 ) ( S 2 S 1 ) 2 m 2 . (10)

· 当 k = 2 时,求解线性趋势曲线 x ( 0 ) ( t ) = a 2 t 2 + a 1 t + a 0 参数的表达式。首先,有

{ S 1 = a 2 t = 1 m t 2 + a 1 t = 1 m t + a 0 m , S 2 = a 2 t = m + 1 2 m t 2 + a 1 t = m + 1 2 m t + a 0 m , S 3 = a 2 t = 2 m + 1 3 m t 2 + a 1 t = 2 m + 1 3 m t + a 0 m . (11)

通过对方程(11)的求解得到,

a 2 = ( 6 S 1 6 S 3 ) m ( 3 m + 1 ) ( 6 S 1 6 S 2 ) m ( 5 m + 1 ) 6 m ( m + 1 ) ( S 2 S 3 ) 2 m 3 ( 12 m 2 + m + 1 )

a 1 = 2 m ( S 1 S 2 ) ( 38 m 2 + 15 m + 1 ) 2 m ( S 1 S 3 ) ( 14 m 2 + 9 m + 1 ) 2 m 3 ( 12 m 2 + m + 1 ) + 4 m ( S 2 S 3 ) ( m + 1 ) ( m + 1 2 ) 2 m 3 ( 12 m 2 + m + 1 )

a 0 = m [ S 1 ( 3 m + 1 ) S 2 ( m + 1 ) ] ( 38 m 2 + 15 m + 1 ) 2 m 4 ( 12 m 2 + m + 1 ) + m [ S 1 ( 5 m + 1 ) S 3 ( m + 1 ) ] ( 14 m 2 + 9 m + 1 ) 2 m 4 ( 12 m 2 + m + 1 ) 2 m 2 [ S 2 ( 5 m + 1 ) S 3 ( 3 m + 1 ) ] ( m + 1 ) ( m + 1 2 ) 2 m 4 ( 12 m 2 + m + 1 )

2.3. 指数曲线模型

当现象的长期趋势每期大体按照相同的增长速度递增或递减变化时,可用指数曲线模型进行拟合。由文献 [20] [21] [22],经典的指数曲线方程为

x ( 0 ) ( t ) = a b t (12)

为了估计参数a,b,一般首先将方程(12)两端取对数,得

ln x ( 0 ) ( t ) = ln a + t ln b (13)

然后运用最小二乘法和方程(13),得到如下方程

{ ln x ( 0 ) ( t ) = n ln a + ( t ) ln b t ln x ( 0 ) ( t ) = ( t ) ln a + ( t 2 ) ln b (14)

估计出参数 ln a ln b ,再取反对数,即可得到参数a、b的估计值。

2.4. 模型精度的评价准则

在预测模型研究中,有许多评价模型精度的准则,其中百分比误差、平均绝对百分比误差、均方根误差是常用的评价准则,其表达式如下。

· 百分比误差(APE)

APE ( k ) = | 1 x ^ ( 0 ) ( k ) x ( 0 ) ( k ) | × 100 % , k = 1 , 2 , , n (15)

· 平均绝对百分比误差(MAPE)

MAPE = 1 n 1 k = 2 n | 1 x ^ ( 0 ) ( k ) x ( 0 ) ( k ) | × 100 % (16)

· 均方根误差(RMSPE)

RMSPE = 1 n 1 k = 2 n ( 1 x ^ ( 0 ) ( k ) x ( 0 ) ( k ) ) 2 × 100 % (17)

3. 我国酒店行业发展趋势分析

在本节中,我们将采用上述三种趋势预测模型对我国连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重进行建模分析,原始数据来源于网站公布的数据, (https://bg.qianzhan.com/trends/detail/506/210302-8b7c33be.html),具体见下面的表1

Table 1. Historical data of the number of chain hotels in China, the number of hotel rooms in the hotel industry in China, and the proportion of the number of chain hotel rooms in the number of hotels in China

表1. 我国连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重的历史数据

3.1. 我国连锁酒店数量发展趋势分析

本小节研究我国连锁酒店数量的发展趋势,首先基于2015年至2019年的历史数据,分别建立单变量灰色预测模型、二阶多项式趋势曲线模型和指数曲线模型。经过计算得到单变量灰色模型(记为GM(1,1)模型)中模型参数的取值分别为a = −0.15,b = 2.78,二次多项式趋势曲线模型(记为PR(2)模型)中参数的取值为a2 = 0.06,a1 = 0.27,a0 = 2.75,指数曲线模型中参数的取值为a = 2.62,b = 1.16。进一步,得到拟合值和预测值以及相应的误差大小,具体见表2

Table 2. Calculation results of the number of chain hotels in China by the three prediction models

表2. 三类预测模型对我国连锁酒店数量的计算结果

3.2. 我国酒店业客房数量发展趋势分析

本小节研究我国酒店业客房数量的发展趋势,首先基于2015年至2019年的历史数据,分别建立单变量灰色预测模型、二阶多项式趋势曲线模型和指数曲线模型。经过计算得到单变量灰色模型中模型参数的取值分别为a = −0.15,b = 246.22,二次多项式趋势曲线模型中参数的取值为a2 = 7.14,a1 = 9.14,a0 = 266.00,指数曲线模型中参数的取值为a = 237.35,b = 1.15。进一步,得到拟合值和预测值以及相应的误差大小,具体见表3

Table 3. Calculation results of the number of guest rooms in China’s hotel industry by the three prediction models

表3. 三类预测模型对我国酒店业客房数量的计算结果

3.3. 我国连锁酒店客房数量占全国酒店数量的比重发展趋势分析

本小节研究我国连锁酒店客房数量占全国酒店数量的比重的发展趋势,首先基于2015年至2019年的历史数据,分别建立单变量灰色预测模型、二阶多项式趋势曲线模型和指数曲线模型。经过计算得到单变量灰色模型中模型参数的取值分别为a = −0.11,b = 14.69,二次多项式趋势曲线模型中参数的取值为a2 = 0.30,a1 = 0.32,a0 = 15.86,指数曲线模型中参数的取值为a = 14.41,b = 1.11。进一步,得到拟合值和预测值以及相应的误差大小,具体见表4

Table 4. Calculation results of the proportion of the number of guest rooms of chain hotels in the total number of hotels in China by the three prediction models

表4. 三类预测模型对我国连锁酒店客房数量占全国酒店数量的比重的计算结果

从上面的计算结果可以看到,三类统计预测模型对酒店行业的三个指标的计算结果都很精确,误差都在3%以内。因此,基于上述三类统计预测模型的预测是具有一定信服度的。对于我国连锁酒店数量的发展趋势,从2020年的6.4万家左右到2023年的10万家左右。对于我国酒店业客房数量的发展趋势,从2020年的560万间左右到2023年的880万间左右。对于我国连锁酒店客房数量占全国酒店数量的比重的发展趋势,从2020年的27.7%左右到2023年的40%左右。上述结果表明,我国酒店行业在未来几年将继续保持增长的发展趋势。

4. 结束语

本文采用三种统计预测模型:单变量灰色预测模型、多项式趋势曲线模型和指数曲线模型,以及2015年至2019年我国酒店行业中的历史数据,分别对我国连锁酒店数量、酒店业客房数量、连锁酒店客房数量占全国酒店数量的比重的发展趋势进行预测。计算结果表明,我国酒店行业在未来几年将继续保持增长的发展趋势,相关决策者可依据此计算结果提前进行规划、布局以满足消费群体的需要。

基金项目

成都师范学院大学生创新创业训练计划项目(S201914389163),教育部协同育人项目(201902272080)。

NOTES

*通讯作者。

参考文献

[1] Deng, J.L. (1982) Control Problem of Grey Systems. System & Control Letters, 1, 288-294.
https://doi.org/10.1016/S0167-6911(82)80025-X
[2] 姜忠军. GM(1,1)模型及其残差修正技术在土地承载力研究中的应用[J]. 系统工程理论与实践, 1995(5): 72-78.
[3] 王宇熹, 汪泓, 肖峻. 基于灰色GM(1,1)模型的上海城镇养老保险人口分布预测[J]. 系统工程理论与实践, 2010, 30(12): 2244-2253.
[4] 汪行, 范中启. 基于改进GM(1,1)模型的能源消费预测研究[J]. 煤炭技术, 2017, 36(8): 305-307.
[5] 徐宁, 党耀国. 特征自适应型GM(1,1)模型及对中国交通污染排放量的预测建模[J]. 系统工程理论与实践, 2018, 38(1): 187-196.
[6] 胡忠君, 刘艳秋, 李佳. 基于改进GM(1,1)的洪涝灾害应急物资动态需求预测[J]. 系统仿真学报, 2019, 31(4): 702-709.
[7] 卢捷, 李峰. 基于初始值和背景值改进的GM(1,1)模型优化与应用[J]. 运筹与管理, 2020, 29(9): 27-33.
[8] 蒋玉婷, 程世娟. 基于GM(1,1)背景值重构的可靠性预测模型[J]. 数学的实践与认识, 2020, 50(24): 134-140.
[9] 刘田, 谈进. 基于局部多项式回归去势的非线性趋势序列的单位根检验[J]. 数量经济技术经济研究, 2012, 29(8): 137-149.
[10] 段树乔, 段方婕. 基于多项式回归函数的电网公司售电量预测方法[J]. 数学的实践与认识, 2012, 42(18): 76-81.
[11] 高峰, 余志豪. 基于二次多项式趋势曲线预测模型的农业生产用电市场研究——以浙西地区进行实证分析[J]. 南京工程学院学报(社会科学版), 2015, 15(4): 25-29.
[12] 左凯, 李虎, 张玉林, 吴文青. 一种确定k阶趋势曲线参数的新方法[J]. 应用数学进展, 2019, 8(8): 1384-1391.
[13] 兰玲, 左凯. 多项式趋势曲线分析及其在白条猪价格指数中的应用[J]. 理论数学, 2019, 9(8): 849-856.
[14] 陈善雄, 王星运, 许锡昌, 余飞, 秦尚林. 路基沉降预测的三点修正指数曲线法[J]. 岩土力学, 2011, 32(11): 3355-3360.
[15] 欧阳明, 丁伯阳, 石吉森. 单桩荷载-沉降曲线的修正指数曲线模型拟合研究[J]. 水运工程, 2013(1): 31-38.
[16] 程健, 陈志平, 苏文强, 唐小雨, 范海贵. 基于指数曲线法沉降预测模型的在役储罐疲劳寿命分析[J]. 化工机械, 2017, 44(6): 690-695, 730.
[17] 孙海峰, 胡海峰, 宋征宇. 基于指数曲线的运载火箭推力调节电机速度控制方法[J]. 航天控制, 2018, 36(1): 55-59.
[18] 谭生源. 具有振荡项的指数曲线及其在一次能源消费中的应用[J]. 运筹与模糊学, 2019, 9(2): 140-146.
[19] 左凯, 李虎, 张玉林, 吴文青. 具有时间一次项的指数曲线研究[J]. 运筹与模糊学, 2019, 9(3): 235-242.
[20] 贾俊平, 何晓群, 金勇进. 统计学[M]. 第7版. 北京: 中国人民大学出版社, 2019.
[21] 宋廷山, 王坚, 刁艳华, 郭思亮. 应用统计学——以EXCEL为分析工具[M]. 第2版. 北京: 清华大学出版社, 2018.
[22] 周永道, 王会琦, 吕王勇. 时间序列分析及应用[M]. 北京: 高等教育出版社, 2016.