1. 引言
系统集成是指将各个独立的系统组合成一个整体,实现协同工作和资源共享 [1] [2] [3] 。随着我国工业“智改数转”的快速发展,为有效避免工业人工检测的高差错率、降低人工成本、提高企业竞争力,“非标检测设备”行业整体呈现一个显而易见的上升趋势,甚至某些传统产业将可能成为潜力最大的市场 [4] [5] 。对于非标测试设备来说,在其快速发展的过程中还存在着一些系统集成与优化待解决的问题,如其在系统集中各种非标检测设备很难进行大规模的量产、存在接口不统一、通讯协议编码译码协议差异等问题 [6] [7] 。针对“非标检测设备”目前在系统集成与优化方面存在的问题与现状,以实现多种非标检测设备的对比分析或系统集成为目的,本文提出基于图像数字识别技术的非标检测系统集成设计与开发。
本文所研发系统主要分为硬件设计及软件编程两部分。硬件部分主要由非标检测设备自带的存储设备或数字高清实时摄像采集系统组成,从而为软件部分的数字图像识别技术提供数据来源。软件编程部分主要通过动态/静态数字图像识别技术来实现多种非标检测系统的系统集成与对比。通过完成系统搭建及动态数据测试实验,实验结果显示:本文所提系统具有动态/静态数字图像识别能力,便于用户实现多种非标检测设备的对比分析或系统集成,可满足用户多种非标检测设备检测信息的采集、存储、对比等功能需求,具有响应时间快、识别准确率等特性。实验结果证实本文所设计系统在多种非标检测系统集成控制方面具有一定的应用价值。
2. 系统设计
为实现本文所述基于图像数字识别技术的非标检测系统集成设计与开发主要分为硬件设计及软件编程两部分。其中,硬件部分主要用于实现非标检测系统软件所需数据的采集与存储,而软件部分主要通过图像数字识别技术来实现非标检测系统数据的对比分析、结果判定及实现具备可随时访问特性数据的存储等功能。硬件部分主要由非标检测设备自带的存储设备或本文所述系统构建的数字识别实时图像采集系统硬件组成。软件部分主要通过动态/静态数字图像识别技术来实现多种非标检测系统的系统集成与对比。系统设计总体框图如图1所示。

Figure 1. Overall system design block diagram
图1. 系统设计总体框图
3. 硬件简介
本文所述基于图像数字识别技术的非标检测系统集成设计与开发硬件部分主要可分为两种模式:一是非标检测设备自带的存储设备;二是对于非标检测设备不具备自带存储设备的,需要根据系统要求自行设计一套高清实时摄像采集系统。对于第一种方式若非标检测设备自带有存储设备且允许本文所述系统安装其控制系统内。这对于本文所述系统将实现极大便利且在很大程度上降低本文所述系统的成本投入,从而在一定程度上使得本文所述系统具有低成本的显著有点。然而,受限于量产难、接口不一、通讯协议等,目前大部分非标检测系统硬件很难做到第一种的处理方式,尤其随着大型多样化设备系统集成的发展,第一种硬件部分存在的可能性越来越小。
基于上述分析,本文所述系统硬件部分包含第二种硬件模式,根据系统要求自行设计一套高清实时摄像采集系统。该高清实时摄像采集系统主要分为光源、高清相机及采集处理系统三个部分。其中光源的主要作用在于为高清相机提供有效的光源,从而提升系统硬件信息采集的清晰度,避免出现因光照不足带来的误差 [8] ;高清相机主要用于捕捉不同非标检测设备动态/静态的检测数据从而便于后期数据分析与处理 [9] ;采集处理系统主要用于与高清相机的通讯实现数据的采集,并为本文所述系统软件提供硬件服务平台从而便于实现软件部分的运行。因高清实时摄像采集系统为本文所述系统为不同非标检测设备需求所自行设计 [10] 。因此,其在数据采集、通信及处理存储方面存在极大的自主性,从而一定程度上保证本文所述系统具有大规模集成化、系统化的特性。
4. 软件实现
本文所述系统的软件部分主要通过动态/静态数字图像识别技术来实现多种非标检测系统的系统集成与对比。为有效解决传统技术在自然场景下的泛化性不足,不能有效处理场景中的倾斜、模糊、阴影等问题,本文以Python为基础语言,选取百度开源的ocr检测 + 识别系统(PP-OCR)作为软件部分数字识别的基础系统。PP-OCR的中文字符识别模型仅3.5 M,支持识别6622个中文字符,英文字符识别模型2.8 M,支持识别63个英文字符,并且PP-OCR还支持识别法语,韩语,日语,德语等多国语言 [11] 。为了进一步提升本文所述系统动态数字识别的效果与效率及兼顾系统模型大小的基础上,本文选取PP-OCRv3作为本文所述系统的核心软件模型。PP-OCRv3,速度可比情况下,中文场景效果相比于PP-OCRv2再提升5%,英文场景提升11%,80语种多语言模型平均识别准确率提升5%以上。其中,PP-OCRv2相比于之前的PP-OCR mobile,耗时更少,效果更好,同时与PP-OCR Server相比,模型更小,速度更快,性能甚至还要好一些,模型效果相比PP-OCR mobile提升超7%;速度比PP-OCR server提升超220%;11.6 M大小,可部署到服务器和移动端 [12] 。
结合上述本文软件所选模型PP-OCRv3及本文系统所需非标检测系统动态/静态数字图像识别技术,构建本文所需的软件系统。本文所设计软件编程的程序流程框图如图2所示。

Figure 2. Software programming flowchart
图2. 软件编程流程框图
其中,部分核心代码概述如下:
主函数:
if __name__ == __main__:
args = utility.parse_args()
ifargs.use_mp:
p_list = []
total_process_num = args.total_process_num
forprocess_id in range(total_process_num):
cmd = [sys.executable, -u] + sys.argv + [
--process_id={}.format(process_id),
--use_mp={}.format(False)]
p = subprocess.Popen(cmd, stdout=sys.stdout, stderr=sys.stdout)
p_list.append(p)
for p in p_list:
p.wait()
else:
main(args)
PP-OCRv3模型导入:
logger.info(In PP-OCRv3, rec_image_shape parameter defaults to '3, 48, 320', )
动态/静态图像导入识别:
img,flag_gif,flag_pdf= check_and_read(image_file)
if not flag_gif and not flag_pdf:
img = cv2.imread(image_file)
if not flag_pdf:
ifimg is None:
logger.debug(error in loading image:{}.format(image_file))
continue
imgs = [img[0]]
else:
page_num = args.page_num
ifpage_num>len(img) or page_num == 0:
page_num = len(img)
imgs = img[:page_num]
数字识别结果返回:
res = [{ transcription: rec_res[i][0],
points: np.array(dt_boxes[i]).astype(np.int32).tolist(),}
fori in range(len(dt_boxes))]
iflen(imgs) > 1:
save_pred = os.path.basename(image_file) + '_' + str(index) + \t + json.dumps(res, ensure_ascii=False) + \n
else:
save_pred = os.path.basename(image_file) + \t + json.dumps(res, ensure_ascii=False) + \n save_results.append(save_pred)
5. 系统测试
在完成系统硬件构建及软件编程的基础上,对本文所述系统进行系统性能测试。通过本文所构建高清实时摄像采集系统对不具备自带存储功能的非标检测系统(如数字高精度频率计)进行动态数据采集,如图3所示。进而,以此为系统数据输入对本文所述系统进行动态性能数字测试。
(a)
(b)
(c)
(d)
Figure 3. Image acquisition of non-standard detection system
图3. 非标检测系统图像采集
将图3所得动态数字图像导入本文所述软件系统获得性能测试,如图4所示。
(a) 75129
(b) 75160
(c) 75197
(d) 75229
Figure 4. Comparison of dynamic data recognition results
图4. 动态数据识别结果对比图
由图4动态数据识别结果图可得:本文所述系统针对动态数字可实现及时迅速的有效数字识别,在识别准确率、动态响应方面表现出一定的优异特性,在非标检测系统集成设计方面具有一定的实际应用价值。
6. 总结
针对“非标检测设备”目前在系统集成中存在的问题与现状,如其在系统集中各种非标检测设备很难进行大规模的量产、存在接口不统一、通讯协议编码译码协议差异等问题,本文提出了基于图像数字识别技术的非标检测系统集成设计与开发。本文所提出系统主要分为硬件设计及软件编程两部分。硬件设计部分主要由非标检测设备自带的存储设备或数字高清实时摄像采集系统组成,从而为软件部分的数字图像识别技术提供数据来源。软件编程部分以Python为基础语言,选取百度开源的ocr检测 + 识别系统(PP-OCRv3)作为软件部分数字识别的基础系统来实现多种非标检测系统的系统集成与对比。在完成系统硬件构建及软件编程的基础上,通过本文所构建高清实时摄像采集系统对不具备自带存储功能的非标检测系统(如数字高精度频率计)进行动态数据采集并进行动态数据识别性能测试。性能测试结果表示:本文所述系统针对动态数字可实现及时迅速的有效数字识别,在识别准确率、动态响应方面表现出一定的优异特性,在非标检测系统集成设计方面具有一定的实际应用价值。
基金项目
江苏省市场监督管理局科技项目“燃气预警系统远程测试装置及检测方法研究”(项目编号:KJ2022051)。