应用数学进展  >> Vol. 6 No. 5 (August 2017)

利用支持向量机和人工神经网络填补缺失数据
The Use of Support Vector Machines and Artificial Neural Networks to Fill Missing Data

DOI: 10.12677/AAM.2017.65080, PDF, HTML, XML, 下载: 1,184  浏览: 2,183  科研立项经费支持

作者: 张楠, 程理, 王鹏:北京林业大学理学院,北京

关键词: 生物样本填补缺失数据支持向量机人工神经网络Biological Sample Filling Missing Data Support Vector Machine Artificial Neural Network

摘要: 本文从R内置数据集iris中按需要选取样本数据建立学习样本,模拟生物样本属性值缺失和类别缺失两种缺失数据的情况,以MATLAB为工具,利用支持向量机和人工神经网络对缺失值进行填补。对于生物样本数据中存在属性值缺失的情况,可以分别采用支持向量机和人工神经网络进行回归填补,并对BP神经网络和RBF神经网络的适用性进行了对比;对于生物样本数据中存在样本类别缺失的情况,采用支持向量机分类填补。结果显示,用神经网络预测填补缺失的属性值时,RBF网络对隐层神经元数目选取的自适应性使之比BP网络更为稳定;相比人工神经网络,支持向量机对有限的样本更为适用,并且不依赖设计者经验,泛化能力强。
Abstract: In this paper, we use the built-in data set iris to select the sample data according to the need to es-tablish the learning samples, simulate the missing values of the biological sample attributes and the missing two types of missing data. Using MATLAB as the tool, we use the support vector machine and the artificial neural network to carry out the missing values to fill. For the case of missing attribute values in the biological sample data, the support vector machine and the artificial neural network can be used for the regression filling, and the applicability of the BP neural network and the RBF neural network can be compared. For the sample of the biological sample, missing situation, using support vector machine classification to fill. The results show that the adaptability of the number of hidden neurons in the RBF network is more stable than that of the BP network when the neural network is used to predict the missing attribute values. Compared with the artificial neural network, the support vector machine for the application, do not rely on the designer experience and has generalization ability.

文章引用: 张楠, 程理, 王鹏. 利用支持向量机和人工神经网络填补缺失数据[J]. 应用数学进展, 2017, 6(5): 677-684. https://doi.org/10.12677/AAM.2017.65080

参考文献

[1] 陈爱军. 最小二乘支持向量机及其在工业过程建模中的应用[D]: [博士学位论文]. 杭州: 浙江大学, 2006.
[2] MATLAB中文论坛. MATLAB神经网络30个案例分析[M]. 北京: 北京航空航天大学出版社, 2010: 133-140.
[3] 王洪波. 单分类支持向量机的学习方法研究[D]: [博士学位论文]. 杭州: 浙江大学, 2012.
[4] 束洪春, 邬乾晋, 张广斌, 孙士云, 刘可真. 基于神经网络的单端行波故障测距方法[J]. 中国电机工程学报, 2011, 31(4): 85-92.
[5] 卓金武. MATLAB在数学建模中的应用[M]. 第2版. 北京: 北京航空航天大学出版社, 2014: 99-125.
[6] 司守奎, 孙兆亮. 数学建模算法与应用[M]. 第2版. 北京: 国防工业出版社, 2015: 350-356, 761-776.
[7] 周永权. 前向多层代数神经网络隐层神经元数目估计方法[J]. 广西民族大学学报(自然科学版), 2000, 6(3): 190- 192.
[8] 卢金娜. 基于优化算法的径向基神经网络模型的改进及应用[D]: [博士学位论文]. 太原: 中北大学, 2015.
[9] 徐国志, 李茂元. 基于Matlab神经网络工具箱进行港口集装箱运量预测[J]. 港工技术, 2003(4): 15-17.
[10] 张昕. 基于SVM方法的医学图像分类研究[D]: [硕士学位论文]. 杭州: 浙江大学, 2006.
[11] 李巍. 基于宏观经济指标和人工智能方法的上证综合指数预测[D]: [硕士学位论文]. 成都: 西南财经大学, 2012.
[12] 平源. 基于支持向量机的聚类及文本分类研究[D]: [博士学位论文]. 北京: 北京邮电大学, 2012.
[13] 刘斌. 支持向量机及其在信号处理中的应用[D]: [硕士学位论文]. 大庆: 大庆石油学院, 2006.