1. 引言
在交通信息化建设中,标准是保证信息系统实现业务协同、信息共享、避免重复建设、发挥投资效益的重要手段,由于信息化工作的复杂性,使得标准的要求更加迫切。交通运输部一直重视交通运输信息化标准的建设。遵照国际惯例、国家相关标准等,交通运输行业近年来出台了多项信息化标准,包括术语、数据、编码、代码、安全、管理等方面的标准。这些标准自颁布以来,成为交通行业信息系统进行建设必备的依据,对提高信息系统建设的规范性起到了重要的作用。
但目前我国交通行业信息化标准的制定、修订工作仍然滞后。省交通运输厅作为交通信息化建设的主体,是标准的建设和执行的主要单位。但在省级交通信息化标准的应用存在两个主要问题:
1) 标准执行缺乏监督机制和技术手段,使得国家及交通运输行业相关信息化标准在系统建设中未能全面、有效贯彻;
2) 标准化工作管理薄弱,使用单位针对标准的应用意见缺乏常规反馈渠道,无法形成标准制修订工作的良性循环。
2019年交通运输标准化管理办法 [1] 对标准化规划、标准制定、标准实施与监督等进行了规定,提出“县级以上人民政府交通运输主管部门应当加强计量、检验检测、认证认可基础能力建设,完善相关制度,提升技术水平,增强标准化工作监督检查及服务能力”,但管理办法是宏观指导意见,未对具体管理方法进行规定。文献 [2] 报道浙江成立交通标准化技术委员会,陕西省也于2020年成立了交通运输标准化技术委员会,各省都对标准化工作提升了重视程度,但标委会的工作都刚开始。黄海来 [3] 结合轨道交通业务分布和管理特点,分析了常州轨道公司标准化工作的机构设置、标准制/修订、标准实施、检查、评价和改进等管理机制。张绍阳 [4] [5] 在对当前交通运输数据标准研究和编制现状介绍的基础上,对交通运输数据标准化的基本思想、数据标准规划和标准建设中存在的不足进行了分析,建立了数据标准的关系,最后对数据标准符合性检测理论、方法和系统开发等工作进行了全面介绍。李玉辉 [6] 开展了二、三级交通运输企业安全生产标准化考评细则的制订,对推进过程中的问题提出了对策及建议。苏贵军 [7] 以山西交科集团为例浅析企业如何通过重视标准、研究标准、制定标准,全面提升标准化能力。李亚敏 [8] 构建和完善了交通运输标准化政策制度体系框架,并提出了加强标准化政策制度体系建设的建议。梁天宇 [9] 阐述了天津市交通信用标准化建设流程。Shaoyang Zhang提出从标准符合性检测角度开展标准化管理 [10]。文献 [10] [11] [12] [13] 从技术角度开展标准的管理。在其他行业,标准化管理的研究也都在开展 [14] - [21]。可以看出,目前研究从省级管理部门的角度对信息化标准实现全面管理的研究和报到较少,技术研究也不足。
为此,本文针对省级交通运输信息化中标准管理、标准执行及标准制定中存在的问题,提出管理办法和技术并重的策略,包括1) 编制管理细则,使得交通运输信息化工作中的标准落地具有可操作性的规定和依据;2) 设计与管理细则对应的标准管理系统,使得管理由抓手,促进信息化工作中的各方沟通畅通、不同领域标准协调一致发展、标准执行形成闭环控制。
2. 主要思路
技术路线如图1所示。其核心思路是管理和技术并重。一方面,通过管理规定,使得技术实施有依据;另一方面,通过技术研究和实施,支撑管理办法的落地。
其中,关键支撑技术包括2个部分,其一为数据标准符合性检测技术,实现信息系统的数据与标准的一致性,保障数据类标准的执行。其二为文本型标准检测技术研究,实现文本型标准的检测,促进文本类标准的执行。
3. 交通运输信息化标准工作管理办法
1) 内容和适用范围
管理细则对省级交通运输信息化标准工作的组织管理架构、标准的执行和检测、标准的制修订和意见反馈、考核办法等进行规定。适用于省各级交通运输信息系统和数据中心等的设计、建设、验收、维护和日常工作中的标准管理。标准管理架构如图2所示。
2) 标准的执行和检测
省厅立项的交通运输信息系统建设项目应从项目的前期(可行性研究和初步设计)、招标、项目实施、试运行、验收等各个阶段进行标准化管理。本部分内容对以上各阶段的要求进行规定。
3) 标准的制修订和意见反馈
本部分内容对省交通运输信息化标准的制修订原则、制修订流程以及标准的意见反馈进行了规定。
4) 标准工作考核
对标准考核工作的大类指标进行规定。主要的大类指标包括管理、标准制修订、意见反馈、标准执行等环节。
4. 管理系统总体设计及接口
管理系统分公众服务与管理功能两部分。用户角色分为6类:管理决策角色(厅科技处)、后台管理角色(监测中心)、业务单位角色(各直属单位及地市交通局)、项目用户角色(项目实施单位)、技术支持(技术支持单位)、匿名用户。
系统总体架构、用户角色和边界如图3所示。

Figure 3. Overall system architecture and boundaries
图3. 系统总体架构和边界
管理系统与外部四个系统进行交互:
1) 交通运输部标准管理网站。系统利用Post请求,从该网站直接请求交通运输部颁布的标准体系和标准文本链接。
2) 国标委标准查询网站。系统利用Post请求,从该网站查询国家颁布的交通运输类标准的文本。标准文本利用国标委提供的链接进行远程在线查看。
3) 数据标准符合性检测系统。该系统从本系统中读取用户提交的数据字典文件,进行检测。并发布数据字典和数据库检测结果到网站。
4) 文本型问卷生成系统。对于省交通运输信息化工程中涉及到的国标、部标、省厅技术文件等的文本,生成相应的问卷,并上传到系统中。
5. 关键技术
5.1. 数据标准符合性检测
数据标准符合性检测需要首先将数据项与标准对应,对应方法宜采用标准项编号或中文名称对应两种方式。标准项编号对应使用该数据项指定的标准项编号直接在标准库中查找。中文名称对应使用数据项中文名称和标准项中文名称进行智能对应或人工对应。数据项智能对应完成后,应采用人工方式进行核查。
1) 基于加权二部图的中文短语对应方法
二部图又称作二分图,是图论中的一种特殊模型。数据项和标准项的中文短语中的词语非常类似于二部图中的A 和B中的顶点,词语之间的关系构成了二部图的边,如果将词语之间的相似度作为二部图中边的权重,则可以利用二部图的最大权重匹配之和的均值作为两个短语的相似度。其方法为:首先对短语分词,其次采用短语主干抽取算法抽取每个短语的主干词语。把短语中的主干词语当作二部图的一个顶点,短语主干词语之间的相似度作为二部图边的权值系数。基于二部图短语相似度计算模型如图4所示。

Figure 4. Bipartite graph phrase similarity calculation model
图4. 二部图短语相似度计算模型
2) 数据项检测方法
数据项的检测项目和方法及结果处理如表1所示。

Table 1. Detection method and result processing
表1. 检测方法和结果处理
5.2. 文本型标准的问卷生成
文本型标准的执行效果难以考核,本文通过问卷对文本型标准的执行效果进行检测。问卷生成首先需要将标准中的一致性条款进行抽取。一致性条款是从标准中抽取的条纹,规定了系统符合标准所要遵循的全部要求的内容。条款的识别与业务相关,可采用人工为主自动化辅助的方法进行识别。在问卷生成方面,本文给出一种基于序列到序列(Seq2Seq)的问卷生成思路。
序列到序列是一种建模两个序列间关系的通用深度学习模型,其可以被用于多种序列化的任务当中,如问答系统、作文生成、机器翻译等。该模型的输入和输出分别称为输入序列和输出序列。标准的Seq2Seq模型由编码器(Encoder)和解码器(Decoder)两部分组成,如图5所示。编码器部分负责读入文本的输入序列并将其编码成一个大小固定的向量,称为编码向量。这个固定大小的编码向量理论上包含了输入文本的全部信息。解码器部分利用编码器生成的固定大小的编码向量来预测文本的输出序列。编码器可以使用GRU、LSTM等RNN结构、CNN结构、纯Attention或者将上述方法混合方式来进行编码产生编码向量。解码器同样可以用GRU、LSTM或CNN等结构。

Figure 5. Structure diagram of Encoder-Decoder
图5. Encoder-Decoder结构示意图
6. 结语
本文成果在陕西省“十三五”在建的交通运输信息化重大工程中开展了数据标准符合性的检测工作,并对部分工程进行了文本型标准的问卷生成。有力的提升了省交通运输信息系统的标准化情况。论文所提方法在其他省份也有适应性,可推广应用到全国,促进我国交通运输信息化的发展。
进一步的工作将提升文本型标准的覆盖面,形成标准条款的问卷知识库,不仅可以为检测提供支持,还可以为标准培训、测试等奠定基础。
基金项目
陕西省交通科技项目(16-39R);
陕西省交通运输标准化项目(19-63B)。