基于GAN的高企认定申报数据异常检测模型
Abnormal Detection Model of High Enterprise Identification and Declaration Data Based on GAN
DOI: 10.12677/CSA.2022.1211262, PDF,    科研立项经费支持
作者: 陈丽丽, 胡 意:广东省科技创新监测研究中心信息规划部,广东 广州;孙 伟:广东工业大学计算机学院,广东 广州;洪英汉:韩山师范学院计算机学院,广东 潮州
关键词: 异常检测生成对抗网络门控循环神经网络高企申报材料Anomaly Detection Generating Adversarial Network Gated Recurrent Neural Network High Enterprise Application Materials
摘要: 高新技术企业认定需要审核的数据繁多,企业在申报过程中经常出现错填、漏填、数据出错、数据不完整等数据异常问题,影响高新技术企业的正常评定程序。通过对广东省高新技术企业认定系统已有数据的研究分析,提出一种基于门控循环神经网络和生成对抗网络的高新技术企业认定申报数据异常检测模型。基于生成对抗网络(GAN)的申报数据异常检测模型在通过生成网络G学习正常样本的分布,使用判别网络D来判别申报数据是不是“真实的”,从而实现数据异常检测。在高新技术企业认定事项管理数据集上进行了实验,实验结果证明了本文提出的模型优于其他模型。
Abstract: There are a lot of data that need to be reviewed for the identification of high-tech enterprises. In the process of declaration, enterprises often have abnormal data problems such as misfiling, missing filling, data error and incomplete data, which affect the normal evaluation procedure of high-tech enterprises. Based on the research and analysis of the existing data of the identification system of high-tech enterprises in Guangdong Province, this paper proposes an anomaly detection model based on the gated recurrent neural network and the generative adversarial network. The reported data anomaly detection model based on Generative Adversarial Network (GAN) learns the distribution of normal samples by generating network G, and uses discriminant network D to determine whether the reported data is “real”, so as to realize data anomaly detection. The experiment is carried out on the data set of the identification of high-tech enterprises, and the experimental results prove that the model proposed in this paper is superior to other models.
文章引用:陈丽丽, 孙伟, 洪英汉, 胡意. 基于GAN的高企认定申报数据异常检测模型[J]. 计算机科学与应用, 2022, 12(11): 2573-2583. https://doi.org/10.12677/CSA.2022.1211262

参考文献

[1] 陈辛. 国家高新技术企业认定系统的设计与应用——以广东省为例[D]: [硕士学位论文]. 广州: 广东工业大学, 2017.
[2] 陈之瑶, 罗军, 黄海滨. 促进广东省高新技术企业发展的政策研究[J]. 广东科技, 2016, 25(14): 82-85.
[3] 徐倩. 科技创新驱动发展——广东省高新技术企业培育和认定政策解读[J]. 广东饲料, 2016, 25(7): 15-18.
[4] 王晓湘, 刘洞天, 刘南江, 丁一, 姜立新. 基于LSTM的震后通信数据异常检测分析[J]. 中国地震, 2022, 38(2): 270-279.
[5] 解峰, 蔡江辉, 杨海峰, 荀亚玲. 一种基于邻近性和团的异常数据检测算法[J]. 计算机与数字工程, 2021, 49(5): 971-976.
[6] 鲁统伟, 徐子昕, 闵锋. 基于生成对抗网络的知识蒸馏数据增强[J]. 计算机工程, 2022, 48(4): 70-80. [Google Scholar] [CrossRef
[7] 韩来平, 李榕, 张萌. 科研审计与监管: 科学与政治的有机边界活动[J]. 科研管理, 2017, 38(11): 88-94.
[8] 王凤芹, 高龙, 徐廷学, 王丽娜. 基于LSTM-GAN的无人机飞行数据异常检测算法[J]. 中国惯性技术学报, 2022, 30(2): 264-271. [Google Scholar] [CrossRef
[9] Habler, E. and Shabtai, A. (2018) Using LSTM Encoder-Decoder Algorithm for Detecting Anomalous ADS-B Messages. Computers & Security, 78, 155-173. [Google Scholar] [CrossRef
[10] 陈斌, 陈松灿, 潘志松, 等. 异常检测综述[J]. 山东大学学报(工学版), 2009, 39(6): 13-23.
[11] 赵飏, 李晓, 马博, 王保全, 周喜. 基于LSTM-GAN的加油时序数据异常检测[J]. 计算机应用与软件, 2022, 39(7): 13-19.
[12] 于冰, 丁友东, 谢志峰, 等. 基于时空生成对抗网络的视频修复[J]. 计算机辅助设计与图形学学报, 2020, 32(5): 769-779.
[13] Zhang, D.Y., Jie, S., Hu, C. and Gao, L.L. (2017) Sharp and Real Image Super-Resolution Using Generative Adversarial Network. In: Liu, D., Xie, S., Li, Y., Zhao, D., El-Alfy, E.S., Eds., International Conference on Neural Information Processing, Vol. 10636, 217-226. [Google Scholar] [CrossRef
[14] Saxena, D. and Cao, J. (2021) Generative Adversarial Net-works (GANs): Challenges, Solutions, and Future Directions. ACM Computing Surveys, 54, 1-42. [Google Scholar] [CrossRef