基于大数据多模式互验的水资源计量数据异常检测方法
A Method for Abnormal Detection in Water Resource Measurement Data Based on Big Data Multimode Mutual Verification
DOI: 10.12677/jwrr.2025.145049, PDF,    科研立项经费支持
作者: 雷四华, 许 怡, 吴 巍:南京水利科学研究院,水灾害防御全国重点实验室,江苏 南京;高若凡, 单心怡, 张擎天:河海大学计算机与软件学院,江苏 南京
关键词: 水资源计量数据数据异常检测大数据方法多模式互验Water Resource Measurement Data Data Anomaly Big Data Methods Multimode Mutual Verification
摘要: 水资源计量过程环节多,异常数据难于避免,开展数据异常检测是水资源计量管理重要内容。模型算法是快速自动发现水资源计量异常数据的核心技术,大数据挖掘技术已有较多算法在数据异常检测中应用,对模型算法有效利用是准确发现异常数据的工作基础。本异常检测方法是基于统计、分类、预测等3种大数据模型算法进行数据异常检测,研究完整设计了计算处理流程,并应用软件技术完成系统开发,实现计算参数自定义,采用消息控制多模式计算,有效实现交互验证处理;经实测数据应用检验,实验分析表明,该检测方法能有效提升异常发现准确率、提高修正的便利性。
Abstract: The process of water resource measurement involves multiple stages, and abnormal data is difficult to avoid. Conducting data anomaly detection is an important part of water resource measurement management. Model algorithms are the core technology for quickly and automatically discovering abnormal data. Big data mining technology has been widely applied in data anomaly detection, and effective utilization of model algorithms is the foundation for accurately discovering abnormal data. Based on three big data model algorithms, including statistics, classification, and prediction, research was conducted, and a calculation processing flow was designed. Software technology was applied to complete system development, achieving custom calculation parameters and using message control for multi-mode calculation and effectively achieving interactive verification processing; Applying measured data for application calculations, experimental analysis shows that this detection method can effectively improve the accuracy of anomaly detection and the level of intelligence for correction.
文章引用:雷四华, 高若凡, 单心怡, 许怡, 吴巍, 张擎天. 基于大数据多模式互验的水资源计量数据异常检测方法[J]. 水资源研究, 2025, 14(5): 451-457. https://doi.org/10.12677/jwrr.2025.145049

参考文献

[1] 熊明, 梅军亚, 杜耀东, 吴琼. 水资源监测数据的质量控制[J]. 人民长江, 2018, 49(9): 41-46.
[2] 刘怀利, 徐浩. 水资源取水计量数据精确采集方法探讨[J]. 水利信息化, 2014(5): 46-50.
[3] 刘予伟, 刘东润, 陈献耘. 大数据在水资源管理中的应用展望[J]. 水资源研究, 2015, 4(5): 470-476.
[4] RACITI, M., CUCURULL-JUAN, J. and NADJM-TEHRANI, S. Anomaly detection in water management systems. In Critical Infrastructure Protection. Berlin: Springer, 2012: 98-119.[CrossRef
[5] 赵和松, 王圆圆, 孙爱民. 一种基于ARIMA模型与3σ准则的取水异常检测方法[J]. 水利信息化, 2022(1): 35-41.
[6] INOUE, J., YAMAGATA, Y., CHEN, Y., et al. Anomaly detection for a water treatment system using unsupervised machine learning. In 2017 IEEE international conference on data mining workshops (ICDMW). Washington DC: IEEE Computer Society, 2017: 1058-1065.[CrossRef
[7] 巫朝星. 基于孤立森林模型的企业用水异常检测研究[J]. 企业科技与发展, 2019(11): 61-64.
[8] 赵东升, 姜蒙, 彭婷婷. 大数据时代计量管理质量提升路径研究[J]. 中文科技期刊数据库(全文版)工程技术, 2021(12): 3.
[9] 李达, 邢智慧. 水资源监测网络研究[J]. 水资源研究, 2009, 30(3): 9-10.
[10] 雷四华, 吴永祥, 王高旭. 国家水资源监控能力建设项目数据库设计[J]. 水资源研究, 2020, 9(4): 386-393.
[11] 于善奇. 计量抽样检验的标准差法[J]. 中国质量与标准导报, 2022(2): 76-77+80.
[12] 穆宝胜, 刘欣, 朱文艳. 基于n个标准差法和箱线图法识别变形监测中异常值的应用探究[J]. 南通职业大学学报, 2023, 37(2): 100-104.
[13] 魏泰, 贺少雄, 胡子武, 等. 基于改进孤立森林算法的风电机组异常数据清洗[J]. 科学技术与工程, 2024, 24(9): 3691-3699.
[14] 丁红翔. 基于降雨-蒸发量的靛坑河流量时间序列预测研究[J]. 水利科技与经济, 2023, 29(11): 112-114.
[15] 国家市场监督管理总局. JJF2210-2025, 取水计量数据质量控制技术规范[S]. 北京: 质检出版社, 2025.
[16] 雷四华, 吴永祥, 毛学文, 等. SZY301-2018, 国家水资源监控能力建设标准——基础数据库表结构与标识符[S]. 北京: 国家水资源监控能力建设项目办, 2018.
[17] 吴永祥, 雷四华, 毛学文, 等. SZY302-2018, 国家水资源监控能力建设标准——监测数据库表结构与标识符[S]. 北京: 国家水资源监控能力建设项目办, 2018.