基于K-Means聚类算法的快消企业库存优化研究——以S公司为例
Research on Inventory Optimization of Fast-Moving Consumer Goods Enterprises Based on K-Means Clustering Algorithm—Taking Company S as an Example
DOI: 10.12677/orf.2025.155230, PDF, HTML, XML,   
作者: 郭季民:上海理工大学管理学院,上海;黄 河:上海理工大学管理学院,上海;上海理工大学智慧应急管理学院,上海
关键词: K-Means聚类算法库存优化ABC-XYZ分类CV变异系数K-Means Clustering Algorithm Inventory Optimization ABC-XYZ Classification CV Coefficient of Variation
摘要: 在快消行业,库存管理水平犹如企业运营的“晴雨表”,直接牵动着资金周转效率、市场响应速度与最终盈利能力。对于主营日化类快消品的企业而言,其供应链的多层级特征,从海外供应商、国内总仓到区域分仓,再到终端零售网点,进一步放大了库存管理的复杂性。因此,精准平衡供需、优化库存周转,成为日化快消企业提升竞争力的核心课题。本研究以S企业2024年全品类库存数据为基础,先通过传统ABC-XYZ分类法对产品进行初步分类,再选取月均销量、CV变异系数、ABC-XYZ分类构建三维特征空间,运用K-Means聚类算法对产品库存进行更精准地分类。以S企业为案例,根据研究结果,针对快消行业不同类别的产品制定差异化库存优化策略,旨在降低库存成本并减少缺货率,为快消企业的库存管理提供参考。
Abstract: In the fast-moving consumer goods (FMCG) industry, inventory management level is like a “barometer” of business operation, directly affecting the efficiency of capital turnover, market response speed and ultimate profitability. For FMCG enterprises mainly dealing in daily chemical products, the multi-level characteristics of their supply chain, from overseas suppliers, domestic central warehouses to regional distribution centers, and then to terminal retail outlets, further amplify the complexity of inventory management. Therefore, precisely balancing supply and demand and optimizing inventory turnover have become the core issues for FMCG enterprises to enhance their competitiveness. This study, based on the full-category inventory data of S enterprise in 2024, first classifies products through the traditional ABC-XYZ classification method, and then selects average monthly sales volume, CV coefficient of variation, and ABC-XYZ classification to construct a three-dimensional feature space. The K-Means clustering algorithm is then used to classify product inventories more accurately. Taking S enterprise as a case, based on the research results, differentiated inventory optimization strategies are formulated for different types of products in the FMCG industry, aiming to reduce inventory costs and decrease out-of-stock rates, providing a reference for inventory management in FMCG enterprises.
文章引用:郭季民, 黄河. 基于K-Means聚类算法的快消企业库存优化研究——以S公司为例[J]. 运筹与模糊学, 2025, 15(5): 49-58. https://doi.org/10.12677/orf.2025.155230

1. 引言

快消品具有消费频率高、使用时限短、拥有广泛消费群体等特点,其市场需求受季节性促销、节假日及竞品活动等因素影响显著,这使得快消企业的库存管理面临巨大挑战。这类企业常面临三重典型困境:高价值进口品类因采购周期长、市场预判偏差,易出现大规模积压,占用大量资金并增加仓储成本;而爆款商品因需求波动剧烈,若补货节奏滞后,极易陷入缺货危机,不仅错失销售机会,还可能导致消费者流失;更棘手的是临期品损耗,日化产品保质期有限,一旦滞销临近过期,只能折价清仓甚至销毁,直接侵蚀利润。因此,精准平衡供需、优化库存周转,成为日化快消企业提升竞争力的核心课题。

S企业作为日本某跨国集团在中国的全资子公司,主营日化类快消品,其供应链结构复杂,上游依赖日本进口核心产品,中游通过华东、华南两大区域仓覆盖全国分销网络,下游对接商超、便利店及电商平台等多元化渠道。在此多层级供应链体系下,长期受高价值进口库存积压严重、爆款商品缺货率较高、临期品损耗较大等问题困扰,这些问题不仅增加了企业的运营成本,还影响了企业的市场竞争力。有效的库存管理是快消企业实现可持续发展的关键。通过科学合理的库存优化策略,企业能够在保证市场供应的前提下,最大限度地降低库存成本,减少资金占用,提高资金周转率。本研究将K-Means聚类算法应用于库存管理中,通过对产品进行精准分类并制定差异化策略,为解决库存管理痛点提供切实可行的方案。同时,本研究的成果也可为其他快消企业的库存优化提供借鉴,具有一定的理论和实践意义。

本研究旨在以S企业为例针对快消行业不同类别的产品制定差异化库存优化策略,旨在降低库存成本并减少缺货率,为快消企业的库存管理提供参考,2024年全品类库存数据为基础,通过K-means算法构建多维度商品分类模型,设计差异化库存策略,实现降低S企业的库存成本及减少缺货率的目标。研究内容如下:

(1) 收集并预处理S企业2024年的销售数据,包括异常值清洗和缺失值填充,并对产品进行传统的ABC-XYZ库存分类。

(2) 基于K-Means算法,选取月均销量、CV变异系数、ABC-XYZ分类构建三维特征空间,对产品库存进行聚类分析。

(3) 结合聚类结果,为不同类别的产品制定相应的安全库存策略和优化建议。

2. 文献综述

库存管理始终是学术界与企业界聚焦的重点领域。在国内,传统库存管理方法中的经济订货量(EOQ)模型,被诸多学者探讨其在实际应用中的局限性。例如,有研究指出该模型假设需求恒定,与现实市场中需求的动态变化不符,致使其在指导企业订货决策时存在偏差。安全库存模型同样受到关注,周群(2021)认为制造企业可借助制造系统(CIM)和资源管理系统(SAP)实现信息共享,以此优化安全库存的确定[1]。然而,实际操作中安全库存的设定非常依赖经验,缺乏精准的科学依据。伴随供应链管理理念在国内的深入发展,各类先进库存管理方法不断涌现。李梅(2020)基于中国传统企业存货管理的复杂环境,提出运用ERP管理系统对企业存货进行动态管控,从而实现采购、生产配送及售后环节的精细化管理,提升企业存货管理水平[2]。供应商管理库存(VMI)方面,熊璐(2020)从第三方物流视角,探讨了供应链管理存货对企业存货成本的影响[3]。联合库存管理(JMI)强调供应链各节点企业协同参与库存管理,通过信息共享与协同决策优化库存配置,国内相关研究表明,JMI有助于提升供应链整体的响应速度与效率。此外,国内在库存管理领域还积极探索新技术的应用,如物联网、大数据等,以实现库存的实时监控与精准预测。

聚类算法作为无监督学习算法,在国内库存管理研究中得到了极为广泛的应用。其中,K-Means聚类算法凭借其原理易懂、运算高效等特性,深受众多学者青睐,成为该领域的研究焦点。盛剑等(2017)基于Spark + MLlib的K-Means+算法,通过考察零售户的年销售量和年库存量,对卷烟零售户行为进行聚类分析,将客户分为三大类别,为卷烟销售和库存管理策略的制定提供了有力的决策支持[4]。刘文杰等(2024)在平均单位成本、全年货币使用量和提前期这三种库存决策要素的基础上,提出基于密度峰值聚类方法的多准则ABC库存分类模型,经研究发现,在成本–服务绩效方面,该DPC模型优于K-Means模型[5]

ABC分类法依据产品的重要程度,如销量、利润等指标,将产品分为A、B、C三类,A类产品作为价值高、对企业影响大的部分,需重点管理;B类产品次之;C类产品价值相对较低,可采用较为宽松的管理策略。XYZ分类法则根据产品需求的稳定性,即需求波动率,将产品分为X、Y、Z三类,X类产品需求最为稳定,预测准确性高;Z类产品需求波动剧烈,预测难度大。国内研究将两者结合,形成ABC-XYZ分类法,这种融合方式能从价值和需求稳定性两个维度出发,更全面地反映产品特征。相关研究运用该分类法对产品进行分类,并制定与之适配的库存策略,有效提高了库存管理效率。徐晨伟(2025)提出结合ABC与XYZ分类法,实现库存的动态分级管理,并探讨滚动分类的必要性,为库存管理提供了新的思路[6]。孟超(2018)指出,传统ABC-XYZ分类法存在明显不足,其分类维度相对单一,难以全面涵盖产品在复杂市场环境中的特征。例如,产品的供应周期这一重要因素在传统分类法中未得到充分考虑,而供应周期长的产品可能需要提前规划库存,以避免缺货风险[7]

3. 研究框架

3.1. 模型的构建

K-Means聚类算法的核心逻辑是通过迭代优化实现数据的智能分组,其核心目标是让同一簇内的样本具有高度相似性,而不同簇的样本则表现出显著差异。这种“簇内紧凑、簇间分离”的特性,能够精准捕捉数据中隐藏的结构模式,为后续分析提供清晰的分类依据。K-Means聚类算法的基本思想是将n个样本划分为k个簇,使得簇内样本的相似度较高,而簇间样本的相似度较低。其具体步骤如下:

(1) 随机选择k个样本作为初始聚类中心。

(2) 计算每个样本与各个聚类中心的距离,将样本分配到距离最近的聚类中心所在的簇。

(3) 重新计算每个簇的聚类中心,即簇内所有样本的均值。

(4) 重复步骤(2)和(3),直到聚类中心不再发生明显变化或达到预设的迭代次数。

在本研究中,选取月均销量、CV变异系数、ABC-XYZ分类作为特征变量,运用K-Means算法对产品进行聚类分析。为确定最优聚类数量k,研究采用肘部法则与轮廓系数进行双重验证。肘部法则通过计算不同k值对应的误差平方和(SSE)——即所有样本到所在簇中心的距离平方总和,绘制SSE-k曲线。随着k增大,SSE持续下降,但当k超过某一临界值后,下降幅度显著放缓,形成“肘部”拐点,此时的k值在聚类精度与模型简洁性间达到平衡。轮廓系数则从样本个体层面评估聚类质量,通过计算样本与同簇其他样本的平均相似度、与最近异簇样本的平均相似度,得出单个样本的轮廓系数,整体系数越接近1,说明聚类效果越优;接近−1则提示分类错误;接近0则表明样本处于簇边界。

3.2. 数据来源及实验平台

数据来源及处理

(1) 数据来源

本研究的数据来源于S企业2024年一整年的销售数据,包括产品编码、销售数量和销售金额等信息。

(2) 数据处理

1) 异常值清洗:通过箱线图法检测销售数据中的异常值,发现部分产品存在销量或销售金额异常偏高或偏低的情况。对于异常偏高的数据,核实是否为促销活动等特殊情况导致,若为正常数据则保留,否则进行修正或删除;对于异常偏低的数据,检查是否为数据录入错误,若为错误则进行修正,否则保留。

2) 缺失值填充:在收集到的销售数据中,存在少量缺失值。对于缺失值较少的产品,采用该产品相邻月份的销量或销售金额的均值进行填充;对于缺失值较多的产品,由于其数据的可靠性较低,予以删除。

3) ABC分类:根据产品的销售金额占比进行分类。A类产品销售金额占比约60%,B类产品销售金额占比约30%,C类产品销售金额占比约10%。

4) XYZ分类:根据产品销量的变异系数(CV)进行分类。X类产品CV系数较小,需求相对稳定;Y类产品CV系数适中,需求有一定波动;Z类产品CV系数较大,需求波动较大。

5) 数据转换:为了使数据更符合K-Means算法的要求,对月均销量进行对数转换,以降低数据的偏态性。同时,对ABC-XYZ分类结果进行数值化处理,如将AX类记为1,AY类记为2,以此类推。对原始数据进行异常值清洗和缺失值填充,并进行传统的ABC-XYZ库存分类。

本实验使用的工具包括Python (Scikit-Learn, Pandas, Matplotlib)和EXCEL。其中,Python主要用于数据预处理、K-Means算法的实现、聚类结果的可视化等;EXCEL用于数据的初步整理和统计分析。算法核心是先对S企业的产品进行传统ABC-XYZ分类后,选取月均销量、CV变异系数、ABC-XYZ分类,基于K-Means聚类算法对产品库存进行分类。

4. 实验及结果分析

4.1. K-Means算法实验步骤

特征选择:选取月均销量、CV变异系数、ABC-XYZ分类构建三维特征空间。

(1) 绘制月均销量和CV变异系数的正态分布图,见图1

Figure 1. Shows the normal distribution of the average monthly sales volume and the coefficient of variation of CV

1. 月均销量和CV变异系数的正态分布图

通过绘制月均销量和CV变异系数的正态分布图(图1),发现两个因子都呈现了极大的偏态特征,说明数据中存在较多的异常值,这也进一步验证了进行数据预处理的必要性。

(2) 数据清洗及异常值处理

对原始数据进行简单的数据处理,剔除实际销售数量不满六个月的产品,以保证数据的完整性和可靠性。

(3) 对产品库存进行ABC-XYZ分类

根据ABC-XYZ分类方法,对预处理后的产品进行分类。

(4) 聚类分析选取最优K值

通过肘部法则和轮廓系数评估,最终确定最优K值为4,见图2

将K = 4代入K-Means算法,对产品进行聚类分析,从月平均销量、CV系数、ABC-XYZ分类三个维度建立坐标系,得到三维聚类分布图,见图3

4.2. 聚类分析结果

4.2.1. 聚类中心点分析

不同聚类类别的产品在月平均销量、CV系数和ABC-XYZ分类等方面存在明显差异。Cluster 1的月平均销量最高,达到901,472.06,CV系数最小,为0.36,属于AX类产品,说明该类产品销量高且需求稳定;Cluster 2的月平均销量最低,仅为2491.79,CV系数最大,为2.19,属于CZ类产品,表明该类产品销量低且需求波动大;Cluster 3的月平均销量和CV系数处于中间水平,属于BX类产品;Cluster 0的月平均销量较低,CV系数适中,属于CX类产品,见表1

Figure 2. Evaluation diagram of elbow rule and contour coefficient

2. 肘部法则和轮廓系数评估图

Figure 3. Three-dimensional clustering distribution map

3. 三维聚类分布图

Table 1. Cluster center points corresponding to different materials

1. 不同物料对应的聚类中心点

聚类类别

月平均销量

CV系数

ABC-XYZ

ABC-XYZ分类

数量

Cluster 0

6415.51

0.68

7.33

CX

255

Cluster 1

901,472.06

0.36

1

AX

3

Cluster 2

2491.79

2.19

9

CZ

29

Cluster 3

44,671.42

0.59

3.55

BX

131

4.2.2. 典型样本分析

不同族类的典型样本展示,见表2~5

Table 2. Typical samples of cluster 0

2. Cluster 0典型样本

物料编码

月平均销量

CV系数

ABC-XYZ

S00496

6356.57

0.547405

7

S00238

160.25

0.83161

8

S00084

1250.4

0.771605

7

Table 3. Typical samples of cluster 1

3. Cluster 1典型样本

物料编码

月平均销量

CV系数

ABC-XYZ

S00020

675,950.1

0.304478

1

S00022

738,038.2

0.414355

1

S00381

1,290,428

0.355678

1

Table 4. Typical samples of cluster 2

4. Cluster 2典型样本

物料编码

月平均销量

CV系数

ABC-XYZ

S00328

8575.33

1.513705

9

S00325

1099.17

1.673994

9

S00350

593.83

3.627305

9

Table 5. Typical samples of cluster 3

5. Cluster 3典型样本

物料编码

月平均销量

CV系数

ABC-XYZ

S00052

25,792.58

0.476468

4

S00498

19,984

0.482501

4

S00291

12,390.33

0.332407

4

通过对典型样本的分析,可以进一步验证聚类结果的合理性。例如,Cluster 1的典型样本S00020、S00022、S00381的月平均销量均较高,CV系数较小,符合AX类产品的特征;Cluster 2的典型样本S00328、S00325、S00350的月平均销量较低,CV系数较大,符合CZ类产品的特征等

4.3. 库存优化策略

4.3.1. Cluster 1 (AX类)优化策略

(1) 特征分析

Cluster 1的产品具有超高销量(90万+/月)、需求高度稳定(CV = 0.36)的特点,且仅有3个SKU。这类产品是S企业的核心产品,对企业的销售收入贡献较大,一旦缺货将严重影响企业的业绩。

(2) 优化策略

1) 保障核心库存

采用连续补货策略(如VMI供应商管理库存),由供应商根据S企业的库存水平和销售数据主动进行补货,确保库存充足,避免缺货影响收入。设置自动补货触发点,如安全库存为月销量的10%~20%,当库存水平低于触发点时,自动发出补货请求。利用高销量特性,通过批量采购降低单位采购成本,同时优化仓储布局,提高仓储空间的利用率,降低单位仓储成本。

2) 优化供应链优先级

与供应商签订长期协议,争取最优价格和快速响应时间。在供应链的各个环节,如采购、运输、仓储等,优先保障该类产品的供应。优先分配仓储空间至核心区域,缩短分拣路径,提高订单处理效率。

3) 动态监控

尽管该类产品需求稳定,但仍需定期(每周)检查销量趋势,密切关注市场动态和竞争对手的情况,防范突发性需求波动(如促销活动、竞品推出等)。建立预警机制,当销量出现异常波动时,及时采取应对措施。

4.3.2. Cluster 3 (BX类)优化策略

(1) 特征分析

Cluster 3的产品具有中等销量(4.4万/月)、需求较稳定(CV = 0.59)的特点,共有131个SKU。这类产品是S企业的重要产品,对企业的收入和利润有一定的贡献,需求波动相对较小,但仍需关注库存的平衡。

(2) 优化策略

1) 平衡库存与成本

采用定期补货策略(如每2周补货),结合经济订单量(EOQ)模型计算最优的订货数量,降低采购和持有成本。设置动态安全库存,如覆盖1.5倍标准差需求,根据历史数据校准波动范围,确保在需求波动时能够及时满足市场供应。

2) 分类管理

对BX类中CV系数接近0.5的产品(更稳定)实施轻度优化,如适当降低安全库存水平,减少库存持有成本;对CV系数接近0.7的产品(波动增大),按CY类部分策略处理,如增加库存检查频率,提高安全库存水平等。

4.3.3. Cluster 0 (CX类)优化策略

(1) 特征分析

Cluster 0的产品具有低销量(约6400/月)、需求波动中等(CV = 0.68)的特点,共有255个SKU。这类产品销量较低,占用一定的库存资金和仓储空间,若管理不当容易造成库存积压。

(2) 优化策略

1) 降低持有成本

推行JIT (准时制生产)按需补货,根据市场需求及时采购,减少库存积压。将周转率目标提高至行业基准的1.2倍,通过提高库存周转率降低库存持有成本。对非关键SKU采用供应商代管库存(Consignment Stock)模式,由供应商负责库存的管理和维护,S企业只有在使用或销售产品后才支付货款,减少资金占用。

2) SKU精简与整合

分析255个SKU中是否存在功能重叠或低效产品,淘汰尾部20%的滞销品,减少SKU数量,降低库存管理复杂度。对保留的SKU实施捆绑销售或阶梯定价,刺激需求,提高销量和库存周转率。

4.3.4. Cluster 2 (CZ类)优化策略

(1) 特征分析

Cluster 2的产品具有极低销量(约2500/月)、需求高度不稳定(CV = 2.19)的特点,共有29个SKU。这类产品销量低且需求波动大,库存管理风险较高,容易出现库存积压或缺货的情况。

(2) 优化策略

1) 最小化库存风险

采用按单采购(Make-to-Order)模式,仅在接到客户订单后才进行采购或生产,减少库存积压的风险。设置最高库存上限,如不超过月均销量的50%,当库存水平超过上限时,停止采购,强制定期清理滞压库存。

2) 退出或转型评估

对连续3个月无销售的SKU启动下架流程,避免无效库存占用资源。对有一定市场需求但销量较低的SKU,转为预售制测试市场需求,根据预售情况决定是否继续生产或采购。探索定制化服务可能性,将CZ类产品转化为高附加值服务的一部分,提高产品的竞争力和盈利能力。

5. 研究总结

通过对S企业2024年销售数据的分析和处理,运用K-Means聚类算法将产品分为4个类别,并针对不同类别的产品制定了差异化的库存优化策略。实验结果表明,该分类方法能够准确地反映不同产品的销售特征和需求波动情况,所制定的优化策略具有一定的针对性和可行性。与传统的ABC-XYZ分类法相比,K-Means聚类算法考虑了更多的特征变量,能够更全面地反映产品的特性,分类结果更加精准。例如,传统的ABC-XYZ分类法可能将一些销量中等但需求波动较大的产品归为同一类别,而K-Means聚类算法能够根据多个特征将其与其他产品区分开来,为制定更合理的库存策略提供依据。

本研究以S企业为研究对象,将K-Means聚类算法应用于库存管理中,通过对产品进行精准分类并制定差异化的库存优化策略,取得了以下结论:

1. K-Means聚类算法能够有效地对S企业的产品进行分类,选取月均销量、CV变异系数、ABC-XYZ分类作为特征变量,确定最优聚类数量为4,得到的4个聚类类别在销售特征和需求波动方面存在明显差异。

2. 针对不同聚类类别的产品制定的差异化库存优化策略,具有一定的针对性和可行性。Cluster 1 (AX类)应保障核心库存,优化供应链优先级;Cluster 3 (BX类)应平衡库存与成本,进行分类管理;Cluster 0 (CX类)应降低持有成本,精简SKU;Cluster 2 (CZ类)应最小化库存风险,进行退出或转型评估。

研究的局限性:数据范围有限,本研究仅使用了S企业2024年的销售数据,数据的时间跨度相对较短,可能无法完全反映产品的长期销售趋势和季节性波动。后续研究可以尝试使用其他更先进的聚类算法,如层次聚类、密度聚类等,与K-Means聚类算法的结果进行对比分析,选择更适合S企业库存管理的聚类算法。同时,建立动态管理框架具有重要的现实意义——企业需建立定期复盘机制,每季度或每半年重新运行数据分析与聚类模型,以此适配产品生命周期的动态变化。​这一框架的核心逻辑在于,SKU的分类标签并非终身性标识。例如,一款刚上市的BX类产品,经过市场培育和营销策略调整,可能在数月后成长为AX类;反之,曾经的明星产品也可能因竞品冲击或需求饱和,从AX类滑落至CX类。若企业沿用固定分类进行管理,极易陷入用静态策略应对动态市场的困境,导致资源错配或错失增长机会。

结合机器学习算法,如回归分析、时间序列分析等,对产品的销量进行预测,为库存优化策略的制定提供更有力的支持。

总之,库存管理是一个复杂的系统工程,需要不断地探索和创新。本研究为快消企业的库存优化提供了一种新的思路和方法,希望能够为企业的实践提供有益的参考。

参考文献

[1] 周群. 制造企业SAP系统下存货管理问题研究[J]. 中国集体经济, 2021(18): 36-37.
[2] 李梅. 中小零售企业存货管理存在的问题及改进[J]. 现代经济信息, 2020(13): 35-36.
[3] 熊璐. 面向第三方物流的供应商管理库存研究[J]. 内燃机与配件, 2020(6): 202-203.
[4] 盛剑, 樊红, 龚天任, 等. K-Means算法及其在卷烟零售门店库存聚类分析中的应用[J]. 商业经济, 2017(3): 128-129.
[5] 刘文杰, 杨海军, 杨硕, 等. 基于密度峰值聚类方法的多准则ABC库存分类模型[J]. 黑河学院学报, 2024, 15(6): 67-71.
[6] 徐晨伟. 基于ABC-XYZ矩阵分析的烟用包装材料库存管理研究——以烟用胶黏剂为例[J]. 上海包装, 2024(9): 14-18, 162.
[7] 孟超. ABC-XYZ矩阵在烟草配送中心库存管理中的应用[J]. 中国储运, 2018(1): 120-124.