1. 引言
快消品具有消费频率高、使用时限短、拥有广泛消费群体等特点,其市场需求受季节性促销、节假日及竞品活动等因素影响显著,这使得快消企业的库存管理面临巨大挑战。这类企业常面临三重典型困境:高价值进口品类因采购周期长、市场预判偏差,易出现大规模积压,占用大量资金并增加仓储成本;而爆款商品因需求波动剧烈,若补货节奏滞后,极易陷入缺货危机,不仅错失销售机会,还可能导致消费者流失;更棘手的是临期品损耗,日化产品保质期有限,一旦滞销临近过期,只能折价清仓甚至销毁,直接侵蚀利润。因此,精准平衡供需、优化库存周转,成为日化快消企业提升竞争力的核心课题。
S企业作为日本某跨国集团在中国的全资子公司,主营日化类快消品,其供应链结构复杂,上游依赖日本进口核心产品,中游通过华东、华南两大区域仓覆盖全国分销网络,下游对接商超、便利店及电商平台等多元化渠道。在此多层级供应链体系下,长期受高价值进口库存积压严重、爆款商品缺货率较高、临期品损耗较大等问题困扰,这些问题不仅增加了企业的运营成本,还影响了企业的市场竞争力。有效的库存管理是快消企业实现可持续发展的关键。通过科学合理的库存优化策略,企业能够在保证市场供应的前提下,最大限度地降低库存成本,减少资金占用,提高资金周转率。本研究将K-Means聚类算法应用于库存管理中,通过对产品进行精准分类并制定差异化策略,为解决库存管理痛点提供切实可行的方案。同时,本研究的成果也可为其他快消企业的库存优化提供借鉴,具有一定的理论和实践意义。
本研究旨在以S企业为例针对快消行业不同类别的产品制定差异化库存优化策略,旨在降低库存成本并减少缺货率,为快消企业的库存管理提供参考,2024年全品类库存数据为基础,通过K-means算法构建多维度商品分类模型,设计差异化库存策略,实现降低S企业的库存成本及减少缺货率的目标。研究内容如下:
(1) 收集并预处理S企业2024年的销售数据,包括异常值清洗和缺失值填充,并对产品进行传统的ABC-XYZ库存分类。
(2) 基于K-Means算法,选取月均销量、CV变异系数、ABC-XYZ分类构建三维特征空间,对产品库存进行聚类分析。
(3) 结合聚类结果,为不同类别的产品制定相应的安全库存策略和优化建议。
2. 文献综述
库存管理始终是学术界与企业界聚焦的重点领域。在国内,传统库存管理方法中的经济订货量(EOQ)模型,被诸多学者探讨其在实际应用中的局限性。例如,有研究指出该模型假设需求恒定,与现实市场中需求的动态变化不符,致使其在指导企业订货决策时存在偏差。安全库存模型同样受到关注,周群(2021)认为制造企业可借助制造系统(CIM)和资源管理系统(SAP)实现信息共享,以此优化安全库存的确定[1]。然而,实际操作中安全库存的设定非常依赖经验,缺乏精准的科学依据。伴随供应链管理理念在国内的深入发展,各类先进库存管理方法不断涌现。李梅(2020)基于中国传统企业存货管理的复杂环境,提出运用ERP管理系统对企业存货进行动态管控,从而实现采购、生产配送及售后环节的精细化管理,提升企业存货管理水平[2]。供应商管理库存(VMI)方面,熊璐(2020)从第三方物流视角,探讨了供应链管理存货对企业存货成本的影响[3]。联合库存管理(JMI)强调供应链各节点企业协同参与库存管理,通过信息共享与协同决策优化库存配置,国内相关研究表明,JMI有助于提升供应链整体的响应速度与效率。此外,国内在库存管理领域还积极探索新技术的应用,如物联网、大数据等,以实现库存的实时监控与精准预测。
聚类算法作为无监督学习算法,在国内库存管理研究中得到了极为广泛的应用。其中,K-Means聚类算法凭借其原理易懂、运算高效等特性,深受众多学者青睐,成为该领域的研究焦点。盛剑等(2017)基于Spark + MLlib的K-Means+算法,通过考察零售户的年销售量和年库存量,对卷烟零售户行为进行聚类分析,将客户分为三大类别,为卷烟销售和库存管理策略的制定提供了有力的决策支持[4]。刘文杰等(2024)在平均单位成本、全年货币使用量和提前期这三种库存决策要素的基础上,提出基于密度峰值聚类方法的多准则ABC库存分类模型,经研究发现,在成本–服务绩效方面,该DPC模型优于K-Means模型[5]。
ABC分类法依据产品的重要程度,如销量、利润等指标,将产品分为A、B、C三类,A类产品作为价值高、对企业影响大的部分,需重点管理;B类产品次之;C类产品价值相对较低,可采用较为宽松的管理策略。XYZ分类法则根据产品需求的稳定性,即需求波动率,将产品分为X、Y、Z三类,X类产品需求最为稳定,预测准确性高;Z类产品需求波动剧烈,预测难度大。国内研究将两者结合,形成ABC-XYZ分类法,这种融合方式能从价值和需求稳定性两个维度出发,更全面地反映产品特征。相关研究运用该分类法对产品进行分类,并制定与之适配的库存策略,有效提高了库存管理效率。徐晨伟(2025)提出结合ABC与XYZ分类法,实现库存的动态分级管理,并探讨滚动分类的必要性,为库存管理提供了新的思路[6]。孟超(2018)指出,传统ABC-XYZ分类法存在明显不足,其分类维度相对单一,难以全面涵盖产品在复杂市场环境中的特征。例如,产品的供应周期这一重要因素在传统分类法中未得到充分考虑,而供应周期长的产品可能需要提前规划库存,以避免缺货风险[7]。
3. 研究框架
3.1. 模型的构建
K-Means聚类算法的核心逻辑是通过迭代优化实现数据的智能分组,其核心目标是让同一簇内的样本具有高度相似性,而不同簇的样本则表现出显著差异。这种“簇内紧凑、簇间分离”的特性,能够精准捕捉数据中隐藏的结构模式,为后续分析提供清晰的分类依据。K-Means聚类算法的基本思想是将n个样本划分为k个簇,使得簇内样本的相似度较高,而簇间样本的相似度较低。其具体步骤如下:
(1) 随机选择k个样本作为初始聚类中心。
(2) 计算每个样本与各个聚类中心的距离,将样本分配到距离最近的聚类中心所在的簇。
(3) 重新计算每个簇的聚类中心,即簇内所有样本的均值。
(4) 重复步骤(2)和(3),直到聚类中心不再发生明显变化或达到预设的迭代次数。
在本研究中,选取月均销量、CV变异系数、ABC-XYZ分类作为特征变量,运用K-Means算法对产品进行聚类分析。为确定最优聚类数量k,研究采用肘部法则与轮廓系数进行双重验证。肘部法则通过计算不同k值对应的误差平方和(SSE)——即所有样本到所在簇中心的距离平方总和,绘制SSE-k曲线。随着k增大,SSE持续下降,但当k超过某一临界值后,下降幅度显著放缓,形成“肘部”拐点,此时的k值在聚类精度与模型简洁性间达到平衡。轮廓系数则从样本个体层面评估聚类质量,通过计算样本与同簇其他样本的平均相似度、与最近异簇样本的平均相似度,得出单个样本的轮廓系数,整体系数越接近1,说明聚类效果越优;接近−1则提示分类错误;接近0则表明样本处于簇边界。
3.2. 数据来源及实验平台
数据来源及处理
(1) 数据来源
本研究的数据来源于S企业2024年一整年的销售数据,包括产品编码、销售数量和销售金额等信息。
(2) 数据处理
1) 异常值清洗:通过箱线图法检测销售数据中的异常值,发现部分产品存在销量或销售金额异常偏高或偏低的情况。对于异常偏高的数据,核实是否为促销活动等特殊情况导致,若为正常数据则保留,否则进行修正或删除;对于异常偏低的数据,检查是否为数据录入错误,若为错误则进行修正,否则保留。
2) 缺失值填充:在收集到的销售数据中,存在少量缺失值。对于缺失值较少的产品,采用该产品相邻月份的销量或销售金额的均值进行填充;对于缺失值较多的产品,由于其数据的可靠性较低,予以删除。
3) ABC分类:根据产品的销售金额占比进行分类。A类产品销售金额占比约60%,B类产品销售金额占比约30%,C类产品销售金额占比约10%。
4) XYZ分类:根据产品销量的变异系数(CV)进行分类。X类产品CV系数较小,需求相对稳定;Y类产品CV系数适中,需求有一定波动;Z类产品CV系数较大,需求波动较大。
5) 数据转换:为了使数据更符合K-Means算法的要求,对月均销量进行对数转换,以降低数据的偏态性。同时,对ABC-XYZ分类结果进行数值化处理,如将AX类记为1,AY类记为2,以此类推。对原始数据进行异常值清洗和缺失值填充,并进行传统的ABC-XYZ库存分类。
本实验使用的工具包括Python (Scikit-Learn, Pandas, Matplotlib)和EXCEL。其中,Python主要用于数据预处理、K-Means算法的实现、聚类结果的可视化等;EXCEL用于数据的初步整理和统计分析。算法核心是先对S企业的产品进行传统ABC-XYZ分类后,选取月均销量、CV变异系数、ABC-XYZ分类,基于K-Means聚类算法对产品库存进行分类。
4. 实验及结果分析
4.1. K-Means算法实验步骤
特征选择:选取月均销量、CV变异系数、ABC-XYZ分类构建三维特征空间。
(1) 绘制月均销量和CV变异系数的正态分布图,见图1:
Figure 1. Shows the normal distribution of the average monthly sales volume and the coefficient of variation of CV
图1. 月均销量和CV变异系数的正态分布图
通过绘制月均销量和CV变异系数的正态分布图(图1),发现两个因子都呈现了极大的偏态特征,说明数据中存在较多的异常值,这也进一步验证了进行数据预处理的必要性。
(2) 数据清洗及异常值处理
对原始数据进行简单的数据处理,剔除实际销售数量不满六个月的产品,以保证数据的完整性和可靠性。
(3) 对产品库存进行ABC-XYZ分类
根据ABC-XYZ分类方法,对预处理后的产品进行分类。
(4) 聚类分析选取最优K值
通过肘部法则和轮廓系数评估,最终确定最优K值为4,见图2。
将K = 4代入K-Means算法,对产品进行聚类分析,从月平均销量、CV系数、ABC-XYZ分类三个维度建立坐标系,得到三维聚类分布图,见图3。
4.2. 聚类分析结果
4.2.1. 聚类中心点分析
不同聚类类别的产品在月平均销量、CV系数和ABC-XYZ分类等方面存在明显差异。Cluster 1的月平均销量最高,达到901,472.06,CV系数最小,为0.36,属于AX类产品,说明该类产品销量高且需求稳定;Cluster 2的月平均销量最低,仅为2491.79,CV系数最大,为2.19,属于CZ类产品,表明该类产品销量低且需求波动大;Cluster 3的月平均销量和CV系数处于中间水平,属于BX类产品;Cluster 0的月平均销量较低,CV系数适中,属于CX类产品,见表1。
Figure 2. Evaluation diagram of elbow rule and contour coefficient
图2. 肘部法则和轮廓系数评估图
Figure 3. Three-dimensional clustering distribution map
图3. 三维聚类分布图
Table 1. Cluster center points corresponding to different materials
表1. 不同物料对应的聚类中心点
聚类类别 |
月平均销量 |
CV系数 |
ABC-XYZ |
ABC-XYZ分类 |
数量 |
Cluster 0 |
6415.51 |
0.68 |
7.33 |
CX |
255 |
Cluster 1 |
901,472.06 |
0.36 |
1 |
AX |
3 |
Cluster 2 |
2491.79 |
2.19 |
9 |
CZ |
29 |
Cluster 3 |
44,671.42 |
0.59 |
3.55 |
BX |
131 |
4.2.2. 典型样本分析
不同族类的典型样本展示,见表2~5:
Table 2. Typical samples of cluster 0
表2. Cluster 0典型样本
物料编码 |
月平均销量 |
CV系数 |
ABC-XYZ |
S00496 |
6356.57 |
0.547405 |
7 |
S00238 |
160.25 |
0.83161 |
8 |
S00084 |
1250.4 |
0.771605 |
7 |
Table 3. Typical samples of cluster 1
表3. Cluster 1典型样本
物料编码 |
月平均销量 |
CV系数 |
ABC-XYZ |
S00020 |
675,950.1 |
0.304478 |
1 |
S00022 |
738,038.2 |
0.414355 |
1 |
S00381 |
1,290,428 |
0.355678 |
1 |
Table 4. Typical samples of cluster 2
表4. Cluster 2典型样本
物料编码 |
月平均销量 |
CV系数 |
ABC-XYZ |
S00328 |
8575.33 |
1.513705 |
9 |
S00325 |
1099.17 |
1.673994 |
9 |
S00350 |
593.83 |
3.627305 |
9 |
Table 5. Typical samples of cluster 3
表5. Cluster 3典型样本
物料编码 |
月平均销量 |
CV系数 |
ABC-XYZ |
S00052 |
25,792.58 |
0.476468 |
4 |
S00498 |
19,984 |
0.482501 |
4 |
S00291 |
12,390.33 |
0.332407 |
4 |
通过对典型样本的分析,可以进一步验证聚类结果的合理性。例如,Cluster 1的典型样本S00020、S00022、S00381的月平均销量均较高,CV系数较小,符合AX类产品的特征;Cluster 2的典型样本S00328、S00325、S00350的月平均销量较低,CV系数较大,符合CZ类产品的特征等
4.3. 库存优化策略
4.3.1. Cluster 1 (AX类)优化策略
(1) 特征分析
Cluster 1的产品具有超高销量(90万+/月)、需求高度稳定(CV = 0.36)的特点,且仅有3个SKU。这类产品是S企业的核心产品,对企业的销售收入贡献较大,一旦缺货将严重影响企业的业绩。
(2) 优化策略
1) 保障核心库存
采用连续补货策略(如VMI供应商管理库存),由供应商根据S企业的库存水平和销售数据主动进行补货,确保库存充足,避免缺货影响收入。设置自动补货触发点,如安全库存为月销量的10%~20%,当库存水平低于触发点时,自动发出补货请求。利用高销量特性,通过批量采购降低单位采购成本,同时优化仓储布局,提高仓储空间的利用率,降低单位仓储成本。
2) 优化供应链优先级
与供应商签订长期协议,争取最优价格和快速响应时间。在供应链的各个环节,如采购、运输、仓储等,优先保障该类产品的供应。优先分配仓储空间至核心区域,缩短分拣路径,提高订单处理效率。
3) 动态监控
尽管该类产品需求稳定,但仍需定期(每周)检查销量趋势,密切关注市场动态和竞争对手的情况,防范突发性需求波动(如促销活动、竞品推出等)。建立预警机制,当销量出现异常波动时,及时采取应对措施。
4.3.2. Cluster 3 (BX类)优化策略
(1) 特征分析
Cluster 3的产品具有中等销量(4.4万/月)、需求较稳定(CV = 0.59)的特点,共有131个SKU。这类产品是S企业的重要产品,对企业的收入和利润有一定的贡献,需求波动相对较小,但仍需关注库存的平衡。
(2) 优化策略
1) 平衡库存与成本
采用定期补货策略(如每2周补货),结合经济订单量(EOQ)模型计算最优的订货数量,降低采购和持有成本。设置动态安全库存,如覆盖1.5倍标准差需求,根据历史数据校准波动范围,确保在需求波动时能够及时满足市场供应。
2) 分类管理
对BX类中CV系数接近0.5的产品(更稳定)实施轻度优化,如适当降低安全库存水平,减少库存持有成本;对CV系数接近0.7的产品(波动增大),按CY类部分策略处理,如增加库存检查频率,提高安全库存水平等。
4.3.3. Cluster 0 (CX类)优化策略
(1) 特征分析
Cluster 0的产品具有低销量(约6400/月)、需求波动中等(CV = 0.68)的特点,共有255个SKU。这类产品销量较低,占用一定的库存资金和仓储空间,若管理不当容易造成库存积压。
(2) 优化策略
1) 降低持有成本
推行JIT (准时制生产)按需补货,根据市场需求及时采购,减少库存积压。将周转率目标提高至行业基准的1.2倍,通过提高库存周转率降低库存持有成本。对非关键SKU采用供应商代管库存(Consignment Stock)模式,由供应商负责库存的管理和维护,S企业只有在使用或销售产品后才支付货款,减少资金占用。
2) SKU精简与整合
分析255个SKU中是否存在功能重叠或低效产品,淘汰尾部20%的滞销品,减少SKU数量,降低库存管理复杂度。对保留的SKU实施捆绑销售或阶梯定价,刺激需求,提高销量和库存周转率。
4.3.4. Cluster 2 (CZ类)优化策略
(1) 特征分析
Cluster 2的产品具有极低销量(约2500/月)、需求高度不稳定(CV = 2.19)的特点,共有29个SKU。这类产品销量低且需求波动大,库存管理风险较高,容易出现库存积压或缺货的情况。
(2) 优化策略
1) 最小化库存风险
采用按单采购(Make-to-Order)模式,仅在接到客户订单后才进行采购或生产,减少库存积压的风险。设置最高库存上限,如不超过月均销量的50%,当库存水平超过上限时,停止采购,强制定期清理滞压库存。
2) 退出或转型评估
对连续3个月无销售的SKU启动下架流程,避免无效库存占用资源。对有一定市场需求但销量较低的SKU,转为预售制测试市场需求,根据预售情况决定是否继续生产或采购。探索定制化服务可能性,将CZ类产品转化为高附加值服务的一部分,提高产品的竞争力和盈利能力。
5. 研究总结
通过对S企业2024年销售数据的分析和处理,运用K-Means聚类算法将产品分为4个类别,并针对不同类别的产品制定了差异化的库存优化策略。实验结果表明,该分类方法能够准确地反映不同产品的销售特征和需求波动情况,所制定的优化策略具有一定的针对性和可行性。与传统的ABC-XYZ分类法相比,K-Means聚类算法考虑了更多的特征变量,能够更全面地反映产品的特性,分类结果更加精准。例如,传统的ABC-XYZ分类法可能将一些销量中等但需求波动较大的产品归为同一类别,而K-Means聚类算法能够根据多个特征将其与其他产品区分开来,为制定更合理的库存策略提供依据。
本研究以S企业为研究对象,将K-Means聚类算法应用于库存管理中,通过对产品进行精准分类并制定差异化的库存优化策略,取得了以下结论:
1. K-Means聚类算法能够有效地对S企业的产品进行分类,选取月均销量、CV变异系数、ABC-XYZ分类作为特征变量,确定最优聚类数量为4,得到的4个聚类类别在销售特征和需求波动方面存在明显差异。
2. 针对不同聚类类别的产品制定的差异化库存优化策略,具有一定的针对性和可行性。Cluster 1 (AX类)应保障核心库存,优化供应链优先级;Cluster 3 (BX类)应平衡库存与成本,进行分类管理;Cluster 0 (CX类)应降低持有成本,精简SKU;Cluster 2 (CZ类)应最小化库存风险,进行退出或转型评估。
研究的局限性:数据范围有限,本研究仅使用了S企业2024年的销售数据,数据的时间跨度相对较短,可能无法完全反映产品的长期销售趋势和季节性波动。后续研究可以尝试使用其他更先进的聚类算法,如层次聚类、密度聚类等,与K-Means聚类算法的结果进行对比分析,选择更适合S企业库存管理的聚类算法。同时,建立动态管理框架具有重要的现实意义——企业需建立定期复盘机制,每季度或每半年重新运行数据分析与聚类模型,以此适配产品生命周期的动态变化。这一框架的核心逻辑在于,SKU的分类标签并非终身性标识。例如,一款刚上市的BX类产品,经过市场培育和营销策略调整,可能在数月后成长为AX类;反之,曾经的明星产品也可能因竞品冲击或需求饱和,从AX类滑落至CX类。若企业沿用固定分类进行管理,极易陷入用静态策略应对动态市场的困境,导致资源错配或错失增长机会。
结合机器学习算法,如回归分析、时间序列分析等,对产品的销量进行预测,为库存优化策略的制定提供更有力的支持。
总之,库存管理是一个复杂的系统工程,需要不断地探索和创新。本研究为快消企业的库存优化提供了一种新的思路和方法,希望能够为企业的实践提供有益的参考。