1. 引言
随着我国经济发展,消费市场的逐步发展,市场上的消费模式不断变化,逐渐由“以物为主”转变成“以客为主”的销售模式 [1]。消费者的需求日趋多样化、个性化,对应的市场供应也需调整。在此类销售模式和这类特殊需求的推动下,新零售企业的生产模式逐步向多品种、小批量迈进,这让商场内零售店铺里的饰品和玩具等种类变得更加琳琅满目,然而需求小众,单品的购买量小 [2]。要求门店种类繁多,数量少。本文要解决的具体问题是以种类为层级给出按月精准需求预测,并给出商场进货建议。
2. 数据来源
本文用到的数据来自某大型商贸平台给定区域内2018~2019年不同销售小类的产品销售信息,本文预测给定区域内目标小类在2019年10月1日后3个月中每个月的销售量,与实际比较后,给出每个月预测值的平均绝对百分比误差(MAPE)。其中,目标小类为历史销售时间处于2019年6月1日至2019年10月1日内且累计销售额排名前10的小类。本文最后给出了部分数据样表。
3. 主成分分析回归模型的建立
3.1. 研究方法
主成分分析在物质科学领域对复杂现象的研究,这是通过将粗糙但相关性高的成分组合,并挑选其中贡献率大的指标来研究现实问题,得以更清晰看待问题。这里用来研究影响目标小类的销售量的因素,合适性比较好 [3]。
由于影响目标小类销售的因素很多,各因素之间具有一定的相关性,进行回归预测之前需要采用主成分分析法选取贡献率高的主成分,构造出与主成分之间的回归预测模型 [4]。
1. 首先样本自变量矩阵进行标准化处理:
按列计算均值
和标准差
标准化数据
2. 计算R的特征值和特征向量
3. 计算主成分贡献率以及累计贡献率
本文通过matlab求解矩阵得到主成分分析,结果如表1所示。

Table 1. Summary of principal component analysis results
表1. 主成分分析结果汇总表
利用结果分析,前三个主成分分析已经达到99.8%,包含了大部分信息部分,所以我们取前三个作为指标。
对三主成分解释:
对
有着高度的正载荷,对
高度的负载荷,可以解释为库存与价格平衡度。
对
,
有着高度的负载荷,对
有高度的正载荷,可以解释为折扣敏感度。
对
有着中等的正载荷对
高度的负载荷,可以解释为销售价波动感知。
3.2. 基于主成分分析的回归模型建立
通过以上分析和计算,我们用3个新变量来替代5个可量化变量 [5]。这两个新变量相互独立,且充分反映了原来5个影响因素包含的信息。这3个主成分体现了之前5个可量化指标99.8%的信息,提取效果较好。
接下来我们用得出的三个新变量用最小二乘法来建立回归模型 [6]。将F使用主成分得到主成分指标,并将因变量销量y标准化,整理得到主成分自变量分析表,如表2所示。

Table 2. Analysis table of independent variables
表2. 自变量分析表
R检验所得到的
,而R2越接近于1,则说明模型的拟合程度越好,因此本模型的拟合是比较好的。利用F检验判断回归方程显著性的时候,则关注目标小类的回归预测方程:
本文通过Excel对2019年目标小类10月到12月的三个月销量的预测(表3~表5)。

Table 3. October 2019 forecast table
表3. 2019年10月份预测表

Table 4. November 2019 forecast table
表4. 2019年11月份预测表

Table 5. Sales volume in December 2019
表5. 2019年12月份销售量
由此可见,主成分回归预测中,百分比误差不稳定,甚至个别达到了百分之八十,于是接下来我们在主成分回归的基础上建立灰色预测模型。
4. 灰色预测GM(1,1)模型的建立
4.1. 研究思路方法
灰色预测模型是一种灰色系统理论提出了一种新的分析方法即关联度分析方法 [7],即根据因素之间发展态势的相似或相异程度来衡量因素间关联的程度,它揭示了事物动态关联的特征与程度 [8]。目标小类商品销售信息如表6。

Table 6. Sales information of target small categories of goods
表6. 目标小类商品销售信息
1. 为了保证建模方法的可行性,需要对已知数据进行必要的检验处理,
设参数数据为:
计算数列的级比
按照GM (1,1)模型可以得到预测值:
2. 检验预测值
(1) 残差检验:
令残差,计算
如果残差 < 0.2,则可以认为达到一般要求,如果则认为达到比较高的要求。
(2) 级比偏差检验:
首先由参考数据计算出级比偏差,再用发展系数a求出相应的级比偏差。
如果
,则可认为达到一般要求;如果
,则认为达到较高的要求
4.2. 灰色预测模型求解
选取连续标签号27092025作为例子,对齐1~9月份的值进行建立灰色预测模型,如表7所示,用matlab计算解出10~12月份的预测值,并与其实际值比较 [7],得出MAPE。
2019年10到12月的销售量预测值分别为110337,103520,106440,如表8所示。
销量的预测以及误差分析如表9。

Table 7. Small label sales for the first 9 months
表7. 小标签前九个月销售量

Table 8. Predicted values of small labels from October to December 2019
表8. 小标签2019年10月到12月所求预测值

Table 9. Sales forecast and error analysis
表9. 销量的预测以及误差分析
回归曲线:
分析依然可以得知,除了个别值有较大的偏差,其余值都在误差10%以内,说明灰色预测模型较好的符合本模型,个别值可能考虑是特殊因素或者季节因素,为了验证对于2019年缺失1~9月份的数据的类似离散值进行灰色预测的可行性,我们取值第一组的27050401的数值进行验证,数据如表10~11:

Table 11. Sales forecast for October-December 2019
表11. 2019年10~12月份预测销售量

Table 12. Error analysis of 2019 sales volume
表12. 2019年销售量误差分析
回归方程
由表12可以看出,灰色预测的其误差值均在8%左右,拟合程度较好。
5. 结果分析
发现经过主成分分析回归预测,和灰色预测GM(1,1)模型比较,发现基于主成分分析的回归预测后的灰色预测能够校正主成分分析中的个别偏大误差,得出的模型结合两种模型的优点可以用于预测销售量,在进货上根据预测值进货、备货。
基金项目
河南省高校省级大学生创新创业训练计划项目(S202010464052),河南科技大学SRTP项目(2020169) 2019年河南省高等教育教学改革研究与实践项目(2019SJGLX262),河南科技大学教育教学改革研究与实践项目(2019YBZD-009)。
数据样表