基于数据挖掘技术的葡萄酒评价体系研究
The Study on Evaluation System of Wine Based on Data Mining
DOI: 10.12677/AAM.2015.44047, PDF, HTML, XML, 下载: 3,350  浏览: 6,643  科研立项经费支持
作者: 王思哲*:中南大学信息科学与工程学院自动化专业1301班,湖南 长沙 ;王志刚*, 何勇:海南大学信息科学技术学院,海南 海口
关键词: 葡萄酒评价数据挖掘技术方差分析聚类分析回归分析Evaluation System of the Wine Data Mining Technology One-Way ANOVA Cluster Analysis Regression Analysis
摘要: 本文以2012年高教社杯全国大学生数学建模竞赛A题为例,利用数据挖掘技术建立葡萄酒评价体系。葡萄酒质量一般是通过聘请有资质的品酒员进行品尝评分,由于品酒员主观因素导致对酒样品的评分差异悬殊,我们通过方差分析对品酒员评分进行可信性研究;通过提取酿酒葡萄多个理化指标的公共因子,对因子得分和葡萄酒评分进行聚类,将酿酒葡萄进行分级研究;通过对葡萄酒理化指标和酿酒葡萄理化的数据进行相关性分析,利用逐步回归分析模型建立它们之间的依赖关系;利用葡萄酒芳香物质与葡萄酒评分之间的回归模型,找出决定葡萄酒质量的关键理化指标,最后指出现行葡萄酒评分体系的不足。
Abstract: Based on Question A of Mathematical Contest in Modeling for college students in 2012, the empha-sis in this paper is mainly on the establishment of evaluation system of wine based on data mining technology. The wine quality is determined by the score of the wine tasting. We analyze the credi-bility of the liquor score by one-way ANOVA. We classify the wine grape by extracting common factors of some physical and chemical indicators from the wine grape, and by clustering the factor score and wine score. The stepwise regression model is established through the correlation be-tween the physical and chemical indicators and the physical and chemical indicators of wine grapes. By the regression model between the aroma substances and the score of the wine, the key physical and chemical indicators of wine quality will be found. In the end, some shortcomings of current rating system of wine will be pointed out.
文章引用:王思哲, 王志刚, 何勇. 基于数据挖掘技术的葡萄酒评价体系研究[J]. 应用数学进展, 2015, 4(4): 376-384. http://dx.doi.org/10.12677/AAM.2015.44047

参考文献

[1] 吴孟达, 成礼智, 等. 数学建模教程[M]. 北京: 高等教育出版社, 2008.
[2] 陈光亭, 裘哲勇, 主编. 数学建模[M]. 北京: 高等教育出版社, 2010.
[3] 杨小平. 统计方法与SPSS应用教程[M]. 北京: 清华大学出版社, 2008.
[4] 姜启源, 谢金星, 叶俊. 数学模型[M]. 北京: 高等教育出版社, 2003.
[5] 高新波. 模糊聚类分析及其应用[M]. 西安: 西安电子科技大学出版社, 2004.
[6] 朱道元, 吴诚鸥, 秦伟良. 多元统计与软件SAS[M]. 南京: 东南大学出版社, 2003.
[7] 汪晓银, 邹庭荣. 数学软件与数学实验[M]. 北京: 科学出版社, 2008.
[8] 王志刚. 应用随机过程[M]. 合肥: 中国科学技术大学出版社, 2009.
[9] 欧宜贵. 数学实验[M]. 合肥: 中国科学技术大学出版社, 2012.
[10] 潘伟, 王志刚. 概率论与数理统计[M]. 北京: 高等教育出版社, 2010.
[11] 符一平, 王志刚. 基于ARCH模型对上证综指的实证研究[J]. 应用数学进展, 2015, 4(2): 124-128.
[12] Tang, K.W., Liu, R.S., Su, Z.X. and Zhang, J. (2014) Structure-Constrained Low-Rank Representation. IEEE Transactions on Neural Networks and Learning Systems, 25, 2167-2179.
http://dx.doi.org/10.1109/TNNLS.2014.2306063
[13] Elhamifar, E. and Vidal, R. (2013) Sparse Subspace Clustering: Algorithm, Theory, and Applications. IEEE Transactions on Pattern Analysis and Machine Intelligence, 35, 2765-2781.
http://dx.doi.org/10.1109/TPAMI.2013.57