基于数据挖掘的超市商品销量预测
Supermarket Commodity Sales Forecast Based on Data Mining
DOI: 10.12677/HJDM.2018.82008, PDF,  被引量   
作者: 姜艳梅, 卜庆凯:青岛大学电子信息学院,山东 青岛
关键词: LightGBM动态特征提取SVR模型组合LightGBM Dynamic Feature Extraction SVR Model Combination
摘要: 针对超市商品短时间内销量预测问题,本文通过对比几种基本模型,提出了一种基于LightGBM和支持向量回归模型相结合的预测模型。该模型不仅通过对用户的行为数据进行量化特征提取和商品属性的特征提取,同时结合了时间滑动窗口在特征处理上的优势,将商品的销售数据作为前后关联数据进行动态特征提取,再通过多模型关系的融合,对商品数据进行预测。实验结果显示,经过滑窗法特征提取后,通过对比支持向量回归模型和LightGBM预测模型,发现LightGBM预测模型效果略优于支持向量回归模型,通过组合支持向量回归模型和LightGBM模型,发现超市销量预测模型的均方根误差仅为1.23209,明显高于单模型预测结果。因此,该模型是短期超市商品销量预测的一种有效方法。
Abstract: Based on the comparison of several basic models, a prediction model based on LightGBM and support vector regression model is proposed in this paper. This model not only extracts the features of the user’s behavior data and the features of commodity attributes, but also combined with the advantages of time sliding window in feature processing, extracts dynamic features by using the sale data of the commodity and correlation data, and then uses the fusion of multiple models to predict the commodity data. The experimental results show that after the feature extraction of sliding window method, by comparing support vector regression model and LightGBM prediction model, it is found that the effect of LightGBM prediction model is slightly better than the support vector regression model. By combining the support vector regression model and the LightGBM model, the root-mean-square error of the supermarket sales forecast model is 1.23209, which is significantly higher than the single model prediction results. Therefore, this model is an effective method to predict the sales volume of short-term supermarket.
文章引用:姜艳梅, 卜庆凯. 基于数据挖掘的超市商品销量预测[J]. 数据挖掘, 2018, 8(2): 74-78. https://doi.org/10.12677/HJDM.2018.82008

参考文献

[1] 朱明. 数据挖掘[M]. 北京: 中国科学技术大学出版社, 2002.
[2] 冯萍, 宣慧玉. 数据挖掘技术及其在营销中的应用[J]. 食品科学技术学报, 2001, 19(1): 52-58.
[3] Jiawei Han, Micheline Kambe. 数据挖掘: 概念与技术[M]. 机械工业出版社, 2012, 21(3): 105-106.
[4] 赵改平, 刘丽兰, 程功勋, 树志松. 销售预测分析系统的研究与应用[J]. 现代制造工程, 2011(3): 28-31.
[5] 李斌, 鄱涛, 史明华, 等. 基于支持向量机的交通流组合预测模型[J]. 天津工业大学学报, 2008, 27(2): 73-76.
[6] 杨金芳, 翟永杰, 王东风, 徐大平. 基于支持向量回归的时间序列预测[J]. 中国电机工程学报, 2005, 25(17): 110-114.
[7] 侯振雨, 蔡文生, 邵学广, 等. 主成分分析-支持向量回归建模方法及应用研究[J]. 分析化学, 2006, 34(5): 617-620.
[8] Wang, D., Zhang, Y. and Zhao, Y. (2017) LightGBM: An Effective miRNA Classification Method in Breast Cancer Patients. Proceedings of the 2017 International Conference on Computational Biology and Bioinformatics, Newark, NJ, 18-20 October 2017, 7-11. [Google Scholar] [CrossRef
[9] 姚登举, 杨静, 詹晓娟. 基于随机森林的特征选择算法[J]. 吉林大学学报(工学版), 2014, 44(1): 137-141.
[10] 王焱. 基于随机梯度提升决策树的行人检测算法设计与实现[D]: [硕士学位论文]. 杭州: 浙江大学, 2017.
[11] 王丰效, 郭天印. 季节性商品销售量预测模型[J]. 陕西工学院学报, 2003, 19(2): 84-87.
[12] Cappellari, L. and Jenkins, S.P. (2003) Multivariate Probit Regression Using Simulated Maximum Likelihood. The Stata Journal, 3, 278-294.
[13] 戴亮, 孟晶. 零售业销售预测方法[J]. 商场现代化, 2011(1): 83-85.
[14] 叶倩怡. 基于Xgboost方法的实体零售业销售额预测研究[D]: [硕士学位论文]. 南昌: 南昌大学, 2016.
[15] 张婧. 基于数据挖掘的零售业商品销售预测研究[D]: [硕士学位论文]. 成都: 四川师范大学, 2008.