基于数据增强的小样本字符识别模型
Small Sample Character Recognition Model Based on Data Augmentation
DOI: 10.12677/CSA.2022.125128, PDF,   
作者: 乔雨轩, 方建安:东华大学信息科学与技术学院,上海
关键词: 机器学习小样本学习数据增强Machine Learning Few-Shot Learning Data Augmentation
摘要: 小样本学习是机器学习的重要研究方向,过去的几十年里,针对小样本学习已经展开了许多研究。针对一些银行支票原始数据积累不足、支票磁条码字符识别准确率低的问题,提出了一种基于数据增强的小样本字符识别方法。通过原始少量样本设计了定制的数据增强方案,有效解决了小样本冷启动的问题,提高模型泛化能力,实现磁条码的准确识别。经测试,该方法的识别准确率达到了95%以上。
Abstract: Small sample learning is an important research direction of machine learning. In the past decades, many researches have been carried out on small sample learning. Aiming at the problem of insufficient original data accumulation and low character recognition accuracy of magnetic bar code of check in some banks, a small sample character recognition method based on data enhancement is proposed. A customized data enhancement scheme is designed through a small number of original samples, which effectively solves the problem of cold start of small samples, improves the model generalization ability, and realizes the accurate recognition of magnetic bar codes. Through testing, the recognition accuracy of this method is more than 95%.
文章引用:乔雨轩, 方建安. 基于数据增强的小样本字符识别模型[J]. 计算机科学与应用, 2022, 12(5): 1280-1291. https://doi.org/10.12677/CSA.2022.125128

参考文献

[1] 徐伟伟. 基于光学字符识别技术的支票识别系统设计[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2015.
[2] 陈楠. 支票磁码自动识别技术研究[D]: [硕士学位论文]. 成都: 电子科技大学, 2014.
[3] 孙志军, 薛磊, 许阳明, 王正. 深度学习研究综述[J]. 计算机应用研究, 2012, 29(8): 2806-2810.
[4] Jankowski (2011) Meta-Learning in Computational Intelligence. Springer, Berlin. [Google Scholar] [CrossRef
[5] 李锦明, 曲毅, 裴禹豪, 扆泽江. 预训练卷积神经网络模型微调的行人重识别[J]. 计算机工程与应用, 2018, 54(20): 219-222+229.
[6] 高友文, 周本君, 胡晓飞. 基于数据增强的卷积神经网络图像识别研究[J]. 计算机技术与发展, 2018, 28(8): 62-65.
[7] 刘鑫鹏, 栾悉道, 谢毓湘, 黄明哲. 迁移学习研究和算法综述[J]. 长沙大学学报, 2018, 32(5): 28-31+36.
[8] 赵凯琳, 靳小龙, 王元卓. 小样本学习研究综述[J]. 软件学报, 2021, 32(2): 349-369.
[9] 刘靖明, 韩丽川, 侯立文. 基于粒子群的K均值聚类算法[J]. 系统工程理论与实践, 2005(6): 54-58.
[10] Liu, Z., Lin, Y.T., Cao, Y., Hu, H., Wei, Y.X., Zhang, Z., Lin, S. and Guo, B.N. (2018) SWIN Transformer: Hierarchical Vision Transformer Using Shifted Windows.
[11] 刘成, 李正辉, 高基豪. 基于深度学习的银行卡号识别研究与应用[J]. 湖南邮电职业技术学院学报, 2020, 19(4): 35-38.
[12] 王璐, 王雷欧, 王东辉. 基于Faster-rcnn的水下目标检测算法研究[J]. 网络新媒体技术, 2021, 10(5): 43-51+58.
[13] Wu, L., Zhang, C.Q., Liu, J.M., Han, J.Y., Liu, J.T., Ding, E. and Bai, X. (2019) Editing Text in the Wild. Proceedings of the 27th ACM International Conference on Multimedia, Nice, 21-25 October 2019, 1500-1508. [Google Scholar] [CrossRef
[14] Shi, B., Xiang, B. and Cong, Y. (2016) An End-to-End Trainable Neural Network for Image-Based Sequence Recognition and Its Application to Scene Text Recognition. IEEE Transac-tions on Pattern Analysis & Machine Intelligence, 39, 2298-2304. [Google Scholar] [CrossRef
[15] 黄子涵, 黄豪, 林丹盈, 曹洋瑞, 张泽填, 肖振球. 基于CRNN的自然场景多语言文本检测方法[J]. 电脑知识与技术, 2022, 18(1): 98-100.
[16] 华春梦, 臧艳辉, 马伙财. 一种基于CRNN的车牌识别算法研究与应用[J]. 现代信息科技, 2021, 5(20): 78-81+86.
[17] 郑祖兵, 盛冠群, 谢凯, 唐新功, 文畅, 李长晟. 双网络模型下的智能医疗票据识别方法[J]. 计算机工程与应用, 2020, 56(12): 141-148.
[18] 刘明, 王命延. 支持向量机在小字符集识别中的应用[J]. 计算机与现代化, 2006(12): 7-9.