基于ARIMA-Kendall模型的智能家居跨境电商销售情况分析——以速卖通平台某店铺为例
Analysis of Smart Home Cross-Border E-Commerce Sales Based on ARIMA-Kendall Model—Taking a Store on AliExpress Platform as an Example
摘要: 本文旨在通过跨境电商平台速卖通(AliExpress)上的某智能家居品类店铺铺货及销售历史数据,对于未来一季度的销售趋势进行预测,提炼智能家居品类的销售规律,帮助该品类电商运营者掌握季节性变化与热销商品属性,进一步采取有效定价策略,从而促进销量提升。研究使用了2022年5月至2023年4月期间店铺的真实订单数据进行预处理和多维度分析,构建了ARIMA模型以预测销售趋势,并运用Kendall一致性检验来探究热销商品销量与价格的具体关系。分析结果显示商品销量呈上升趋势,价格策略对销量有显著影响,据此本研究从精细化价格管理、动态库存调整、产品多样化与创新、加强技术驱动的数据分析四个维度提出了相关建议。
Abstract: The purpose of this paper is to forecast the sales trend in the coming quarter by using the historical data of store rollout and sales of a smart home category on the cross-border e-commerce platform AliExpress, to refine the sales pattern of the smart home category, and to help e-commerce operators of this category grasp the seasonal changes and the attributes of hot-selling commodities, and to further adopt effective pricing strategies, so as to promote the improvement of sales. The study used real order data from stores between May 2022 and April 2023 for preprocessing and multidimensional analysis, constructed an ARIMA model to predict sales trends, and applied the Kendall consistency test to explore the specific relationship between sales volume and price of hot-selling commodities. The analysis results show an upward trend in merchandise sales, and price strategy has a significant impact on sales. Accordingly, this study puts forward relevant recommendations in four dimensions: refined price management, dynamic inventory adjustment, product diversification and innovation, and enhanced technology-driven data analysis.
文章引用:吴雨荷, 杨星, 敬纯一. 基于ARIMA-Kendall模型的智能家居跨境电商销售情况分析——以速卖通平台某店铺为例[J]. 电子商务评论, 2024, 13(3): 8376-8388. https://doi.org/10.12677/ecl.2024.1331027

1. 引言

近年来,随着人们生活水平的提高,消费者对于家居生活的品质和舒适度有了更高的要求。智能家居系统以能够为消费者提供更加智能化、个性化、便捷化的服务同传统家居区分开来,形成了家居行业的新风口。而自动化技术,云计算、物联网及人工智能技术的发展让智能家居的精品化运营有了产品优化的土壤。又得益于智能产品市场在近五年来的不断扩大从而拉动了细分领域智能家居市场的增速,更多的科技巨头与小微企业也相继试水研发新的精品智能家居。无独有偶,互联网+浪潮之下跨境电商市场发展喜人,预计到2025年,市场将突破8000亿大关。得益于跨境电商市场成熟化和深度发展的支持,智能家居品牌正突破技术关与地域关,走向世界各地分销与精品化深入发展的赛道。然而如何进行精准的销售额预测与热销商品属性分析使得智能家居品类的电商从业者拥有更成熟的数据分析范式仍然是一道棘手的难题。因此本报告聚焦于某一真实智能家居品类店铺1年内的实际订单数据,时间跨度为2022年5月~2023年4月,运用时间序列数据分析与一致性检验探索数据中的潜在趋势与规律。

2. 研究方法

2.1. 自回归移动平均模型

ARIMA模型,即自回归移动平均模型(AutoRegressive Integrated Moving Average Model),是一种用于分析时间序列数据的模型[1] [2]。它是由自回归模型(AR模型)和移动平均模型(MA模型)结合发展而来。该模型的基本原理包括以下三个部分:自回归、移动平均和差分。

自回归释义:ARIMA模型中的自回归部分指的是模型中的系数是时间序列自身的过去值的线性组合。通过自回归,模型能够捕捉到时间序列数据中的滞后影响,即过去的数据值对当前的数据值的影响。

移动平均释义:移动平均部分指的是该模型使用一个滑动窗口来计算平均值,以消除时间序列数据中的短期波动和噪声。移动平均可以平滑数据,减少数据的波动性,从而使模型更好地捕捉长期趋势和周期性变化。

差分释义:差分在ARIMA模型的应用中是针对性去处理时间序列数据非平稳的问题。如果时间序列数据不是平稳的,那么直接进行自回归和移动平均可能会产生误导性的结果。通过差分,可以达到稳定数据的目的,使其更适合建模。

模型公式如下:

y t =υ+ i=1 p γ i y ti + ϵ t + i=1 q σ i ϵ t1 (1)

2.2. 肯德尔检验

Kendall一致性检验,是一种用于测量两个变量之间相关程度的统计方法,其统计假设如下:

H0:观察数据是独立的,即两个变量之间的观察结果不会相互影响。

H1:观察数据具有单调性,即随着一个变量的增加,另一个变量的值也会随之增加,或者随着一个变量的减少,另一个变量的值也会随之减少。

3. 模型构建

3.1. 数据预处理

本研究使用AliExpress全球速卖通平台上某一真实智能家居品类店铺1年内的实际订单数据的数据集作为模型输入数据,在使用该时间序列数据进行预测前剔除了其中共2393个异常订单记录。同时,对于该店铺四个不同季度的销售数据表进行了合并处理,旨在获得依照时间变化的销售额曲线。对于商品月度销售的平均单价,研究使用商品总金额除去订购商品数量来代表每笔订单所购买的商品单价,并按月度分别计算该月售出的商品平均单价。此外,研究还依照总销量对于前十位热销智能家居商品订购数额为1的订单成交金额进行平均,得到对应的新特征变量商品平均单价。

3.2. 销售额与销售量趋势探索

3.2.1. 销售量时间趋势分析

Figure 1. Changes in the total sales volume of smart home products in stores from May 2022 to April 2023 (unit: piece)

1. 2022年5月~2023年4月店铺智能家居商品总销售量变化情况(单位:件)

根据AliExpress所给出的2022年5月到2023年4月的店铺销售数据,绘制销售量按月度变化的柱形图,可以发现销量呈基本上升趋势,但在2022年九月及2023年2月与4月出现了小幅度下滑,在2023年1月店铺销量达到峰值,总共售出9576件智能家居商品,具体销量变化见图1。而2022年5月~10月所出现的销量相对低迷的情况可能是由于疫情因素导致的物流延迟等综合作用下产生的。

3.2.2. 商品销售价格趋势波动分析

根据该店铺2022年~2023年度的全部销售数据,绘制该店铺售出的智能家居商品销售平均单价波动趋势的折线图,可以发现,2022年的7月与2022年10月的平均商品单价相较于前后几个月跌幅明显,有可能店铺是为拓宽销路而采取的相对低价的战略,结合智能家居本身高客单价带来的高利润特点,并观察店铺从2022年5月~2023年4月的整体销售量变化曲线不难发现,低价或相对优惠的价格确实带来了一定较为明显的销售增量。2022年5月之后的价格最高点出现次月,也是整个年度中价格的最高点,达到了20.66美元。在2022年末至2023年初中,商品销售的平均单价有小幅上涨,波动区间为14.40~17.42美元,具体波动状况见图2

Figure 2. Monthly average price changes of smart home products in stores from May 2022 to April 2023 (Unit: $)

2. 2022年5月~2023年4月店铺智能家居商品月度平均价格变化情况(单位:美元)

Figure 3. The average amount changes of each order of smart home products in stores from May 2022 to April 2023 (unit: $)

3. 2022年5月~2023年4月店铺智能家居商品每笔订单平均金额变化情况(单位:美元)

3.2.3. 店铺每笔订单销售额月度趋势波动分析

根据数据集中的2022年~2023年度的全部数据,绘制该店铺每月每笔订单平均销售额与总销售额。数据显示,单笔订单平均销售额最高为2022年6月份,达到了平均每笔订单24.49美元,主要原因可能是6月的商品平均定价为2022年5月~2023年4月期间的最高历史平均定价。最低平均销售额出现在2022年的12月,该月份平均每笔订单金额为16.92美元,每笔订单平均金额变化具体情况见图3

3.2.4. 店铺总销售额月度趋势波动分析

每个月度的总销售额由该月度每笔订单的金额加总求和得出。数据显示,商品销售总额最高点出现在2023年1月,达到了153381.7美元,最低总销售额出现在2022年的5月,该月份总销售额为16908.83美元,具体波动状况见图4

Figure 4. Changes in total sales of smart home products in stores from May 2022 to April 2023 (unit: $)

4. 2022年5月~2023年4月店铺智能家居商品总销售额变化情况(单位:美元)

3.2.5. 店铺销量增长速度分析

销量增长对跨境智能家居电商店铺的意义重大。一方面,销量的增加能够有效提高店铺信誉和知名度:一件商品销量变多意味着更多的顾客购买和好评,这将极大地提高店铺的信誉度和知名度。这对于新顾客的吸引力和转化率有着直接的影响。另一方面,销量的增加有利于拓宽店铺的利润空间:随着销量的提升,店铺可以从中获得更多的销售额。

而销量增长率,也是在电子商务财务绩效评价中常用的一种度量店铺销量增长速度的指标。我们根据每个月度的总销售量计算出相较于上一个月度店铺整体销量提升的比率,从而绘制增长率折线图。下图表明,增长率在一年中出现了三个波峰,第一次波峰为2022年7月的38.10%,标志着该月份由低价策略主导的价格战取得了较为显著的成效。第二次销量增长率的波峰出现2022年10月,这一个月度的商品平均定价达到了历史最低点。最近一次销量增长率的波峰出现在2023年3月,相较于2月与4月,3月份的商品平均定价较低。因此,可以看出总体上销量增长率与月度商品平均单价的走势相同,增长率总体波动情况见图5

Figure 5. Fluctuation of monthly commodity growth rate of store smart home from May 2022 to April 2023 (unit: %)

5. 2022年5月~2023年4月店铺智能家居各月度商品增长率波动情况(单位:%)

3.3. 智能家居销量ARIMA模型

3.3.1. ADF检验

ADF检验通常用于判断时间序列数据是否存在单位根,即是否为非平稳序列。如果时间序列数据存在单位根,则说明该序列是非平稳的,反之则是平稳的[3]

2022年5月~2023年4月智能家居月度销量时间序列检验的具体结果见表1,基于变量月度销量数据,在差分为1阶时,显著性P值为0.037**,水平上呈现显著性,拒绝原假设,该序列为平稳的时间序列。在差分为2阶时,显著性P值为0.000**,效果较好,具体结果见图6。因此,我们选取了2阶差分后的时间序列进行后续检验。

Figure 6. The best differential sequence diagram of monthly sales time series data of smart home from May 2022 to April 2023

6. 2022年5月~2023年4月智能家居月度销量时间序列数据最佳差分序列图

Table 1. ADF test table for monthly sales time series data of smart home from May 2022 to April 2023

1. 2022年5月~2023年4月智能家居月度销量时间序列数据ADF检验表

变量

差分阶数

t

P

AIC

临界值

1%

5%

10%

月均销量
数据

0

0.246

0.975

122.876

−4.939

−3.478

−2.844

1

−2.979

0.037**

121.288

−4.939

−3.478

−2.844

2

−5.44

0.000***

111.427

−4.473

−3.29

−2.772

注:******分别代表1%、5%、10%的显著性水平。

3.3.2. ACF检验与PACF检验

两种检验常用于检测时间序列数据中是否存在自相关性。其中,ACF检验是对所有时间点进行观察,查看其自相关性;而PACF检验则是对滞后的自相关性进行检验。通过观察两者的检验结果图,可以确定用于ARIMA模型的参数p和q,使模型拟合效果更佳。我们使用SPSSPRO平台进行检验建模,结果见图7

Figure 7. Final difference autocorrelation function (ACF) of monthly sales time series data of smart home from May 2022 to April 2023)

7. 2022年5月~2023年4月智能家居月度销量时间序列数据最终差分自相关图(ACF)

图8所示,自相关与偏自相关图均拖尾,因此选择PACF、ACF图中最显著的阶数(最小值) 1,1作为模型参数p、q的取值。

Figure 8. The final differential data partial autocorrelation graph of monthly sales time series data of smart home from May 2022 to April 2023

8. 2022年5月~2023年4月智能家居月度销量时间序列数据最终差分数据偏自相关图

3.3.3. 模型参数确立

经过前述的多种检验,最终得到的结果如表2所示:

Table 2. ARIMA model test table of monthly sales of smart home

2. 智能家居月度销量ARIMA模型检验表

符号

Df Residuals

7

样本数量

N

12

Q统计量

Q6 (P值)

0.042 (0.837)

信息准则

AIC

183.09

BIC

184.3

拟合优度

R2

0.708

注:******分别代表1%、5%、10%的显著性水平。

根据模型ARIMA模型(1,2,1)检验表结果显示,基于变量:月度销量数据,从Q统计量结果分析可以得到:Q6在水平上不呈现显著性,不能拒绝模型的残差为白噪声序列的假设,同时模型的拟合优度R2为0.708,模型表现较为良好,模型基本满足要求[3]。在此基础上,我们进一步对于模型的残差进行检验,得到的参数结果整理为表3

Table 3. Parameter table of ARIMA model for monthly sales of smart home

3. 智能家居月度销量ARIMA模型参数表

系数

标准差

t

P > |t|

0.025

0.975

常数

−161.686

1199.003

−0.135

0.893

−2511.689

2188.318

ar.L1

−0.999

0.694

−1.44

0.15

−2.36

0.361

ma.L1

0.316

1.143

0.277

0.782

−1.924

2.556

sigma2

2288327.971

1297649.158

1.763

0.078

−255017.644

4831673.585

注:******分别代表1%、5%、10%的显著性水平。

在参数确定后,基于变量月度销量数据,根据模型ARIMA模型(1,2,1)参数表与检验表,将模型公式发展如下:

y( t )=161.6860.999y( t1 )+0.316ε( t1 ) (2)

3.3.4. 模型预测结果

图9表4可以发现销售额在接下来的时间里将会先小幅跌落而后稳定增长。

Figure 9. ARIMA model prediction results figure of smart home monthly sales

9. 智能家居月度销量ARIMA模型预测结果图

Table 4. Table of three-month forecasting results for monthly sales of smart home based on ARIMA model

4. 智能家居月度销量ARIMA模型后三月度预测结果表

阶数(时间)

预测结果

1

6039.804324982654

2

3167.8240209141945

3

3565.154205899326

3.3.5. 模型拟合值与真实值对比

在商业决策中,准确的预测可以帮助跨境电商店铺更好地管理库存、调整生产计划和制定销售策略,减少由于预测不可靠而带来的风险。通过比较拟合值和真实值,可以帮助模型使用者评估时间序列模型的预测准确性。如果拟合值与真实值非常接近,说明模型能够很好地捕捉到数据的动态变化和趋势。

Table 5. Smart home commodity sales time series fitting value and real value comparison table

5. 智能家居商品销量时间序列拟合值与真实值对比表

时间

真实值

拟合值

2022-07-31

1555

1986

2022-08-31

1926

1472

2022-09-30

1822

2332

2022-10-31

3288

1870

2022-11-30

5676

3471

2022-12-31

7500

7677

2023-01-31

9576

9669

2023-02-28

7349

11,208

2023-03-31

8191

8041

2023-04-30

5479

5851

表5中,我们观察到拟合值与真实值在趋势上较为接近,这表明本研究所确立的ARIMA模型的预测准确性较高。

3.4. 智能家居销量与热销属性一致性检验

3.4.1. Kendall模型构建

在实际应用中,Kendall一致性检验的实施步骤如下:

将两个研究者需要测量的变量进行排序,并计算它们之间的差异。利用所计算得到的差异值与一个常数(Kendall常数)进行比较,以确定它们之间的相关程度。如果差异值大于该常数,则认为两个变量之间存在正相关关系;如果差异值小于该常数,则认为两个变量之间存在负相关关系。

我们对于包含热销前十智能家居商品所在的37,201条订单数据进行处理,将其所对应的平均单价与销量作为主要变量,即N为37,201,使用SPSSPRO平台建立智能家居商品销量与价格的Kendall一致性模型,最终结果如表6所示:

Table 6. Kendall consistency test results of smart home commodity sales and prices

6. 智能家居商品销量与价格的Kendall一致性检验结果

名称

秩平均值

中位数

Kendall’s W系数

X2

P

商品平均单价

1

14.99

1

10

0.002***

商品销量

2

1771

注:******分别代表1%、5%、10%的显著性水平。

Kendall系数一致性检验的结果显示,总体数据的显著性P值为0.002***,水平上呈现显著性,拒绝原假设,因此数据呈现一致性,同时模型的Kendall协调系数值为1.0,因此热销智能家居商品的销量与价格相关性的程度为几乎完全一致性[4]

3.4.2. 不同价格区间对热销商品销量的影响分析

对于热销前十智能家居商品的商品平均单价进行分区,以5元的价格差为组距,划分出6个区间组,1~6组分别对应价格区间在小于10美元、大于10美元但小于等于15美元、大于15美元但小于等于20美元、大于20美元但小于等于25美元、大于25美元但小于等于30美元、大于30美元的商品。

表7图10可以看出,并非越低价的商品为最热销商品,商品的平均单价区间位于10美元~20美元的商品占据了热销商品销量的绝大部分,而大于20美元的商品销量出现了明显的下降趋势。可能原因是高价智能家居商品所提供的服务相较于评价智能家居商品而言并未出现断层提升,因此消费者更倾向选择性价比高的10美元~20美元区间的智能家居商品。

Figure 10. Overview chart of sales volume for top 10 best-selling smart home products in different price ranges in stores from May 2022 to April 2023

10. 2022年5月~2023年4月店铺智能家居热销前十不同价格区位组销量一览图

Table 7. Distribution table of different price ranges of popular smart home goods sales

7. 热销智能家居商品销量不同价格区间分布表

价格区间(单位:美元)

热销商品销量

<10

1611

>10 ≤ 15

19,271

>15 ≤ 20

11,900

>20 ≤ 25

0

>25 ≤ 30

1289

>30

446

4. 研究结论与建议

本文以2022年5月至2023年4月某速卖通智能家居品类专营店销售数据作为研究对象,通过历史销售数据趋势探索和ARIMA模型构建,对于以速卖通为代表的跨境电商平台智能家居销量季节性规律进行挖掘,发现其于春季达到销售峰值后将缓慢下降。此外,进一步使用肯德尔检验对于热销商品销量及其价格一致性进行探索,结果显示其具有强一致性。特别是,在10美元至20美元的价格区间内的商品销量占据了主导地位,这表明消费者在追求性价比的同时,对智能家居产品的功能和品质也有一定的期待。对于以上结论,本文提出如下跨界电视智能家居品类店铺运营建议:

4.1. 精细化价格管理

店铺实际销量数据显示,热销商品的价格区间集中在10美元至20美元,这意味着消费者在选择智能家居产品时往往更倾向于性价比高的产品。因此,店铺应当制定精细化的价格管理策略,根据不同功能和品质的产品设定合理的价格区间,以满足不同消费者群体的需求。在具体实践中,店铺可以借助市场调研和竞品分析,确定一个既能吸引消费者又能保证一定利润率的价格点。同时,遵循动态定价策略,根据市场供需和季节性变化灵活调整价格,以保持自身竞争力。

4.2. 动态库存调整

ARIMA模型的预测结果可以为智能家居跨境电商店铺洞察未来销售趋势提供可靠依据,使运营者能够提前调整库存水平,确保热销商品的充足供应,进一步避免因库存预测失误实际配货缺货而造成的销售损失。反之,对于预测销量较低的商品,店铺可以选择减少库存,避免因过剩库存导致的资金占用和仓储成本增加。通过这种方式,店铺可以优化库存管理,降低整体运营风险。

4.3. 产品多样化与创新

尽管价格是影响销量的重要因素,但产品功能和品质同样受到消费者的重视。店铺应该持续推动产品创新,开发具备新功能或改进现有功能的产品,以满足消费者不断变化的需求。例如,在引进智能家居商品时注重语音控制、远程监控等智能化特性,或研发时着力提高产品的耐用性和设计感,通过产品迭代创新水平强化市场竞争力,从而提振店铺销量。

4.4. 加强技术驱动的数据分析

在跨境电商环境下,大数据分析和人工智能算法的应用可以显著提升市场趋势预测的准确性和响应速度。通过分析用户行为、搜索关键词、点击率等数据,智能家居跨境电商店铺可以更精确地了解客户需求,快速作出反应。与此同时,利用以上技术,店铺运营者能够进行更为细致的客户分类,为个性化产品推荐奠定基础,间接提高转化率和复购率。此外,将销量数据配合智能家居供应链产品数据进行综合分析,能够有效优化库存管理和物流效率,降低既定成本,提高运营效益。

参考文献

[1] 王侨蓝, 马景璇, 张洛宁, 谢林伸. 尘肺病预后分析模型研究[J]. 工业卫生与职业病, 2023, 49(5): 459-462+467.
[2] 张涛, 闫晋博, 汤恒, 龚胜生. 湖北省青少年艾滋病时空分布、影响因素及趋势预测[J]. 中国公共卫生, 2023, 39(5): 568-576.
[3] 孙少勤, 郭琴琴. 基于行业异质性的中国工业碳排放影响因素分析[J]. 企业经济, 2014(9): 103-108.
[4] 牟力科. “互联网+”时代人工智能学院学生学习特征分析与研究[J]. 现代信息科技, 2022, 6(19): 171-175.