1. 引言
采购文件编制贯穿整个采购过程,构建招标代理机构的采购文件知识图谱,是对大数据环境下知识资源的有效组织和利用,提高采购编制效率和质量。知识图谱作为一种智能、高效的知识组织方式,能够帮助用户迅速、准确地查询到自己需要的信息。针对现有招标大理机构的知识图谱多为知识的静态映射问题,本文引入知识图谱理论研究、现状分析和案例分析对采购文件知识图谱的构建方法。分析招投标活动中的关键业务的信息抽取、知识融合、本体构建等环节,基于结构化语义网络的特点,知识图谱能够围绕采购文件编制全过程提供知识搜索、知识推荐等有价值的应用,有效提升整个招投标活动的实施质效。
2. 相关理论和案例研究及借鉴
2.1. 理论研究与借鉴
知识地图作为知识资源的图形导航工具,具有将分布广泛和结构复杂的知识进行关联及汇集的作用,并向一定范围内的用户提供基于视图的知识获取、交流和开发利用的服务 [1]。包括导航、知识关联、知识整合等功能。用户通过知识地图的形式,可以对来自知识文库或其它系统的知识进行体系化梳理并展示。知识地图一般由用户手动进行创建,具体场景是根据用户对所连接知识内容的体系化理解构建的。
而知识图谱强调语义检索能力,是大数据发展环境中的一项新技术,是将互联网中海量的数据信息以语义网络的方式连接起来,形成一个巨大的网络知识库,并将其存储在数据库中,并实现可视化的展示 [2]。知识图谱可以知识结构化管理、提供知识引导服务、推动智能应用发展。
知识图谱以图形展示知识网络的特性,围绕知识搜索、导航和智能推荐等功能应用设计符合招投标业务活动的知识管理系统及辅助应用工具,可以大大提升招标采购专业化水平。
2.2. 案例研究与借鉴
南方电网公司面对急剧增长的新知识,采用知识图谱技术的智能化人工助手,代替服务人员与用户展开问答。针对电力系统的知识图谱被应用于调度自动化系统业务与流程检索、电网设备质量综合管理查询系统等业务环节。南网公司将计算机领域中广泛应用的知识图谱技术引入电力系统领域,通过分析知识图谱逻辑结构,将电力系统知识图谱划分为数据层和模式层。知识在两个层次中均以“实体–关系–实体”三元组或“实体–属性值–属性值”的形式存储。数据层用于存储事实和实例,实体一般为电力系统中较为具体的实际事物,如人、电网设备、组织机构、地点等。模式层用于存储概念、规则、公理和约束条件,实体一般为电力系统中经过提炼的抽象名词,也称为本体。模式层是数据层的概念模型和抽象逻辑,数据层是模式层的实例化和事实应用。知识图谱在辅助决策方面为电力系统提供了多场景的应用,可以实现智能化搜索和深度问答。在用户发起知识检索时,搜索引擎根据用户查询的关键字进行解析和推理,向用户返回搜索结果。
该案例分析启示,服务于电网企业的招标代理机构,在明确知识图谱的应用方向后,应该以知识获取、知识融合、知识加工为主线,实现知识抽取标准化、知识表示结构化和知识应用场景化的目标,完善知识图谱数据层、模式层和应用层的框架体系,推动知识图谱构建,发挥语义搜索、智能问答、知识推理等智能服务功能在招投标业务活动中的作用。
3. 招标代理机构知识图谱现状分析与诊断
3.1. 知识现状需求分析
采购文件的编制和使用在招标代理业务中占据重要的位置,并需要借助跨专业的知识、消耗大量的时间进行编制,本课题以授权采购文件为研究对象,梳理文件编制活动中所需的专业知识内容,包含文件结构性要素组成,及各组成单元的固定内容和可变内容等。通过梳理授权采购文件,按照文件构成进行排列,明确采购文件是由采购公告、应答人须知、评审办法、应答文件格式、合同条款及格式、技术标准和发包人要求六个关键要素构成。通过识别组成文件的结构性要素及单元内容,进一步挖掘出文件编制所涉及的知识内容,一般可分为基础类知识、专业类知识和法规类知识。其中,基础知识是指关于开展采购文件编制的操作实务、程序步骤等方面的知识,可引导编制人员有效有序开展文件工作。专业类知识是指涉及工程服务采购的评审办法、价格计算方式等专业知识,用于保障采购评审的客观性、科学性。法规知识是指与工程服务类采购项目有关的国家和地方法律法规等知识,支撑文件规范化编制。
3.2. 管理现状
采购文件支撑整个招投标业务的开展,文件编制效率和质量将影响招标采购结果。公司在业务活动中积累了大量知识和经验,作为重要的知识资产在管理上呈现出如下状况。
1) 组织结构有待优化。公司以扁平化结构组织管理其业务活动,业务人员只负责各自的业务模块,一方面造成知识无法传播和分散沉淀的情况;另一方面未按照标准统一的要求储存。
2) 知识共享有待加强。采购文件作为重要的知识资产,具有支撑业务活动的属性,但大量文档资料从模板选择、编制、发布至回收、处理等过程都汇集在个别业务人员手中,无统一的存储空间,不利于形成知识的共享和交流形势,造成知识信息暂无储存媒介。
3) 知识管理有待重视。日常招标代理业务活动积累了大量知识信息,内部尚未形成知识共享意识。因此,围绕知识采集、处理、储存、应用和更新一系列知识管理活动未创建统一规范的制度。
4) 管理系统有待创新。日常招标代理业务会涉及知识查询、交流学习及业务协作等环节应用,需要借助信息化工具进行支撑,现阶段尚未建立知识管理平台推动知识共享、辅助业务活动等相关应用。
4. 知识图谱架构设计
4.1. 系统架构
采购文件编制是招投标活动中的关键业务环节,知识图谱基于结构化语义网络的特点,能够围绕采购文件编制全过程提供知识搜索、知识推荐等有价值的应用,提升整个招投标活动的实施质效。如图1所示,知识图谱应用系统设计结合知识图谱框架结构进行设计,分为数据层、模式层和应用层进行构建 [3]。

Figure 1. System architecture diagram based on knowledge graph
图1. 基于知识图谱的系统架构图
4.2. 系统功能
4.2.1. 知识导航
知识导航功能是对储存在知识库中的知识数据和关联知识进行分析,对需求知识进行处理和组织,实现知识信息被计算机系统理解的智能化查询。基于知识图谱开发的搜索功能,结果指向有具体关系属性的相关实体,依托于招投标专业领域关联数据,针对采购文件编制业务场景提供法律法规、规章制度、业务实施规范和历史项目资料等关联的知识数据,实现知识检索服务。
4.2.2. 知识搜索
知识搜索功能是依托搜索引擎对储存在知识库中的各类知识实现快速检索。知识库中不仅储存了招投标有关业务知识,也纳入了采购文件编制环节的业务流程和执行标准,通过输入关键字实现对各领域知识的快速查询应用,并结合知识图谱导航功能,查询模糊需求的知识信息,帮助业务人员挖掘潜在的知识需求。一方面作为业务规则规范文件编制;另一方面指导业务人员快速查询采购文件编制流程,通过梳理文件编制规则,形成逻辑化的知识引导模式,提升编制效率,并降低新进人员因业务生疏导致错误的发生概率。
4.2.3. 知识推荐
知识推荐功能是一项协作型智能工具,基于业务逻辑,按流程输出知识需求信息,为采购文件编制人员智能推荐所需的知识信息。基于招投标活动构建的知识图谱各类应用功能可以有效引导文件编制和文件编制规范的形成与验证,并且及时推送关联知识信息,更好的普及文件编制标准和执行规范,有效杜绝错误现象发生,全面规范文件编制过程,降低和避免错误率,从而提升采购文件编制质效。
5. 知识图谱应用方案设计
5.1. 设计内容
知识图谱在采购文件编制环节有效应用需要围绕以下两方面开展,一是对授权采购文件编制的知识组成进行梳理,识别招标业务知识图谱构建的知识类别与数据来源;二是对知识图谱的构建方法、构建路径以及应用流程进行探索,基于知识图谱功能特点提升采购文件编制效率。
5.2. 实施步骤
1) 知识获取
知识数据获取路径可以从相关信息系统,包括内部业务系统等,企业外部工商税务部门系统、第三方平台系统等;非结构化数据可以通过招标采购相关知识信息,包括法律法规、制度规范、业务操作手册等文档或图片资料等;半结构化数据则主要是招标采购中有结构却不方便模式化的动态信息,例如:项目采购需求、技术规范等难以固化的信息。
在明确全类型数据的抽取和分类工作后,通过关系抽取获取语义信息得到实体间的关联关系。围绕采购文件编制方面的应用,实体关系一般与前后实体形成“<实体1> <关系> <实体2>”结构的三元组表示形式进行保存,图谱中的每个节点表示实体,实体间的有向边表示关系。如“采购文件包含采购公告模块”,知识抽取的结果为“<采购文件> <包含> <采购公告>”,如图2所示。

Figure 2. Knowledge triad relationship example
图2. 知识三元组关系范例
2) 知识融合
知识融合是通过融合招标采购领域各层面的专业知识,用于支撑知识图谱构建,应用于招标文件编制环节。抽取的知识中可能包含大量的冗余和冲突信息,为了提升知识的逻辑性和层次性,确保文件编制质量和效率,需要进行实体消歧和实体对齐的操作对知识进行融合,删除错误和冗余的知识,消歧矛盾和冲突知识,从而提升企业知识质量。如图3所示,标准授权采购全过程文件中的竞谈文件与采用竞谈采购方式的评审报告,都包含实体“评审标准”,在对评审方法、分值权重等知识进行关联时都将指向“评审标准”这一知识点,但在竞谈文件与竞谈评审报告中描述性内容有所差异,需要通过实体消歧、实体对齐的方法将不同来源的“评审标准”这一知识信息进行融合,以避免“评审标准”在知识图谱中重复出现或知识关联出现无法融合的情况。
3) 知识表示
以采购文件组成单元为例,通过抽取采购文件组成要素及各单元作为知识数据,将知识整合起来,形成采购文件组成的知识库,进而实现知识的融合。采购文件包含了法规、公司制度、文件模板等方面知识,基于文件编制涉及编制程序等方面知识,建立合适的知识分类体系,以三元组结构表示知识,并通过建模将知识以一种规范、合理的方式组织起来,形成适用于采购文件编制的知识体系。

Figure 3. An example of knowledge integration of procurement documents
图3. 采购文件知识融合范例
4) 知识加工
在完成知识融合和表示后,可以基于采购文件形成大量的知识表示形式,但要形成知识网络,还需要对知识节点和关系作进一步的加工处理。
a) 本体构建
根据自底向上构建知识技术流程,以数据驱动为主、人工构建为辅,结合采购文件知识特点和应用方向进行抽取和建模,构建采购文件知识图谱本体。本体构建过程包含三个阶段:实体并列关系相似度计算、实体上下位关系抽取、本体的生成,图4展示了本体构建的前后对比情况。

Figure 4. Comparison before and after ontology construction
图4. 本体构建前后对比
b) 知识推理
通过知识计算和推理,能够更深层次的发现知识间的关联和逻辑关系,从而构建更为紧密、丰富的知识网络体系。以“采购文件组成”为例,运用三元组结构表示出知识点的关系,已知三元组“<需求一览表> <包含> <具体项目采购采购内容>”和“<采购公告> <包含> <需求一览表>”,可以推出新的三元组“<采购公告> <包含> <具体项目采购采购内容>”。以此类推,可以极大地丰富“采购知识组成”的知识网络,最终形成知识体系。
5.3. 应用场景
知识图谱快速检索和智能推荐等功能应用有助于支撑采购文件全流程核心节点的辅助编制工作,提高招投标业务效率和效能。如图5所示,在当下数字化技术快速发展的情况下,电网企业带动相关业务伙伴向智能化、自动化和网络化方向转变,以采购文件编制为研究对象构建知识图谱,利用沉淀的招投标知识数据驱动知识图谱功能应用,在知识查询、知识推荐和辅助采购文件编制等方面提供技术支撑。

Figure 5. Knowledge graph supports the application system of bidding business
图5. 知识图谱支持招投标业务的应用体系
6. 总结
企业核心竞争力正在逐渐聚焦于数字化运营能力,在企业大规模进入数字化转型的时代背景下,作为服务企业的招标代理机构,应紧跟时代和技术演变的步伐,探索技术创新驱动采购文件编制等业务创效的新模式。知识作为企业重要的数据资产,是驱动业务变革的基石,以知识图谱新技术为基础支撑知识应用工具在公司业务中的应用。通过对知识图谱的应用经研究,其在招投标活动重点应用场景比较有限,局限于语义搜索、知识推荐等范围,均处于应用的初级阶段,仍具有广阔的应用与推广前景 [4]。结合业务和技术的发展趋势来看,依托知识图谱不断扩大强化的知识库,帮助业务人员对业务活动中遇到的特殊问题进行分析、推理、辅助决策。