基于主成分分析的居民消费水平模型
Residents’ Consumption Level Model Based on Principal Component Analysis
DOI: 10.12677/SA.2022.113052, PDF,   
作者: 魏倩茹, 江礼松, 张圆新, 张雪静:河南科技大学数学与统计学院,河南 洛阳
关键词: 多重共线性SVD分解主成分回归Multicollinearity SVD Principal Component Regression
摘要: 在冗杂的高维数据中,往往容易出现数据之间存在严重共线性的现象,导致模型参数存在不可估性,故消除多重共线性对探讨实际问题有着重要意义。本文是以居民消费水平为研究对象,通过运用方差膨胀因子对数据的多重共线性进行判断,再基于SVD分解对观测数据矩阵进行主成分回归以消除自变量之间的多重共线性,并建立原始数据之间的线性关系。国家通过居民消费水平来得到地方的发展状况,以制定更加符合发展的政策。因此,该研究具有一定的现实意义。利用SVD分解的方法进行主成分分析,简化了求解特征值及贡献率的计算问题,且通过主成分回归的方法进行共线性消除,避免了直接删除变量所导致重要变量被舍去的可能。结果表明,该模型相对误差小,故该方法所得的模型具有可靠性。In the high-dimensional data, it is easy to have collinearity among data, which leads to the immeasurable of model parameters. Therefore, eliminating multicollinearity is important to discuss practical problems. This paper takes the consumption level as the research object, uses VIF to judge the multicollinearity of the data, then carries out principal component regression(PCR) on the observation matrix based on SVD to eliminate the multicollinearity among independent variables and builds the linear relation among the original data. The state gets local development status by the consumption level of residents so as to formulate policy more in line with development. Thus the study has realistic meaning. PCA based on SVD simplifies the calculation of eigenvalue and contribution rate, and it can avoid the possibility that important variables are deleted to use PCR to eliminate the collinearity. The result shows the relative error of the model is small, so the model obtained by this method is reliable.
文章引用:魏倩茹, 江礼松, 张圆新, 张雪静. 基于主成分分析的居民消费水平模型[J]. 统计学与应用, 2022, 11(3): 487-492. https://doi.org/10.12677/SA.2022.113052

参考文献

[1] 蒙伟, 何川, 陈子全, 郭德平, 周子寒, 寇昊, 吴枋胤. 岭回归在岩体初始地应力场反演中的应用[J]. 岩土力学, 2021, 42(4): 1156-1169.
[2] 卢维学, 吴和成, 万里洋. 基于融合随机森林算法的PLS对降水量的预测[J]. 统计与决策, 2020(18): 27-31.
[3] 周菲, 赵凤兰, 魏兴民, 王世钦. Logistic回归模型多重共线性诊断及在医学中的应用[J]. 甘肃中医学院学报, 2014, 31(1): 90-93.
[4] 程介虹, 陈争光, 衣淑娟. 最小相关系数的多元校正波长选择算法[J]. 光谱学与光谱分析, 2022, 42(3): 719-725.
[5] 钱晓莉. 基于特征值的多重共线性处理方法[J]. 统计与决策, 2004(10): 7-9.
[6] 任雪松, 于秀林. 多元统计分析[M]. 北京: 中国统计出版社, 2010.
[7] 赵松山. 对多重共线性的深入思考[J]. 当代财经, 2003(6): 125-128.
[8] 刘芳, 董奋义. 计量经济学中多重共线性的诊断及处理方法研究[J]. 中原工学院学报, 2020, 31(1): 44-48+55.
[9] 徐贵红, 郭剑峰, 杨涛存, 东春昭. 主成分分析与奇异值分解技术在铁路数据预处理中的应用[J]. 铁路计算机应用, 2016, 25(9): 55-57+62.
[10] 黄云, 林鸿志, 杜长城. 薄壁圆筒强度计算的相对误差分析[J]. 长春大学学报, 2019, 29(8): 10-13+45.