1. 引言
当今时代,人工智能技术迅速发展,以期通过大量训练使机器能够像人一样感知、学习、思考、决策和行动等,目前相关应用已经大幅提高人工工作的速度、效率、准确性[1]。自然语言处理(NLP)作为人工智能的一个重要分支,帮助计算机对人类自然语言进行理解、分析和生成的技术,在以技术为驱动的世界中扮演着重要角色。如智能客服,银行智能客服24小时不间断为用户提供服务,无论是查询账户信息、办理业务,还是咨询金融知识,用户都能得到及时、准确的回应。智能客服打破传统客服人员的工作时间和人力成本的限制因素,提高服务效率,提升用户体验。智能学习助手,科大讯飞AI学习机,1对1指导学生在语文写作、数学辅导,英文口语训练等方面遇到的问题,并给出个性化学习方案,帮助学生提高成绩。
在数字经济的时代背景下,人工智能是引领新科技革命的重要驱动力,能够激活数据要素价值,从而大幅提升科技创新、生产以及资源配置的效率,创造出成倍的经济和社会效益,对发展新质生产力、扩大企业影响力具有重大意义[2]。电力有关企业在日常运营管理过程中产生了庞大的文本数据,然而传统分析方法无法高效挖掘文本数据的内在价值。公司研究基于NLP技术的电力应急物资调配数字助理,准确识别电力领域的术语、俗称,实现现场抢修人员与物资应急受理人员之间快速且准确地信息交流,从而显著提高应急响应效率和准确性,提升供应链运营质效。
2. 电力应急物资调配环节的现状分析及研究路径
2.1. 电力应急物资调配环节的现状分析
公司致力于打造供应链现代物流体系,提升产业链供应链韧性和安全水平。电力应急物资调配是提升供应链应急物资保障韧性的重要环节,公司积极开展“大、云、物、移、智”等新技术与物资业务的融合应用探索,通过新技术应用提高供应链应急保障能力,但在实际应急物资调配过程中,仍然存在以下问题:
一是专业俗称影响需求提报效率。由于专业的连续性和特定习惯,各专业均保留了物料主数据未涵盖的俗称。这些俗称在不同的工作环节中时常需要反复核对和确认,从而增加工作的复杂性,降低需求提报效率。
二是应急响应过程效率低下。现场抢修人员与物资应急受理人员之间的沟通模式具有单向且重复性的特征。当现场抢修人员提出需求时,物资应急受理人员以手工方式记录需求,随后对系统进行多次反复复查。这一过程中,他们需要反复将排查结果反馈给现场抢修人员,这种应急响应机制不仅效率低下,而且极易出现错误,影响了抢修工作的顺利进行。
传统的业务操作模式以及分析方法已经难以有效处理在实际业务场景中的痛点、堵点、卡点问题,人工智能技术的发展为电力应急物资调配提供了新思路。NLP技术作为人工智能的一个重要分支,能够通过帮助计算机理解人类语言,即从非结构化的文本数据中提取结构化信息,理解特定领域的专业术语、俗语,解决电力应急物资调配过程中的问题[3]。
2.2. 电力应急物资调配数字助理的技术路径
依托公司现有平台建设,深化应用人工智能,通过NLP技术、知识图谱技术等研究电力应急物资调配数字助理,识别出电力领域的术语、俗称等,实现抢修人员与物资应急受理专员的高效沟通,取代当前低效手动记录,反复系统排查,确定需求的低效工作模式。电力应急物资调配数字助理研究的技术路径如图1所示:
Figure 1. The technical path of digital assistant for power emergency supplies deployment
图1. 电力应急物资调配数字助理研究的技术路径
应急物资调配业务分析,采用文献法、调查法以及案例分析法对业务进行调研,厘清应急物资调配环节的业务现状,支撑研究团队对实际业务的诊断与归纳总结。
数字助理需求分析,采用定性定量的分析方法,将语音识别技术迁移到电网物资领域,结合应急物资调配业务分析结果明确数字助理的研究需求。
数字助理方案设计,基于人工智能理论、数字员工理论、NLP技术以及数字助理的需求分析结果,结合电力领域的文本数据,进行语音交互式的应急物资智能调配方案设计[4]。
数字助理的应用,在应急物资调配环节,根据实际业务需要,设计数字助理的应用方案,并试点应用,科学评估试点应用结果,进一步优化完善数字助理的设计。
3. 数字助理研究内容
3.1. 主要技术应用
3.1.1. NLP技术
NLP技术赋予机器阅读、理解和从人类语言中获取意义的能力,包括自然语言的理解和生成、语言模型、词法分析、句法分析、语义分析、语音识别、文本分类、信息检索等。通过自然语言模型,可基于语言统计规律和结构特征,理解句子的结构和语法规则,从而进行语义分析和语法分析。词法分析是自然语言处理中重要的一步,对文本进行分词、词性标注,将语句进行分割并明确每个词的词性,是后续文本分析的基础。语音识别是将人类语音信号转换为文本形式,从而实现人机交互的自然语言沟通。
数字助理的研究主要是基于NLP技术的术语抽取,研究在电力领域的专业术语和习惯俗称,是从海量电力运营场景中的文本数据中自动识别出电力领域的专业词汇、术语。高质量的术语抽取可以在信息检索场景下提高数字助理定位到用户查询内容的位置,精准回答用户问题,提升电力应急物资调配质效[5]。
3.1.2. 知识图谱
知识图谱是一种用于表示和组织知识的信息模型,是一个结构化语义数据库,用于描述物理世界中的概念及其相互关系,即存储和呈现实体、概念和它们之间的关系。知识图谱由数据层和模式层构成,数据层以“实体–关系–实体”或“实体–属性–属性值”的三元组存储,形成一个图状知识库,是实体与属性值之间的映射关系。模式层是知识图谱的概念模型和逻辑基础,对数据层进行规范约束。知识图谱的数据来源包括结构化数据(如数据库)、半结构化数据(如XML文档)和非结构化数据(如文本文档)。构建知识图谱的过程涉及数据抽取、实体识别、关系抽取、实体链接、知识推理等技术,通过将知识表示为图谱的形式,可以更好地理解和组织知识,从而提供更智能、个性化的服务和应用。
知识图谱应用在数字助理研究中,通过存储关于用户个人喜好、兴趣和日程安排等信息为用户,为用户提供个性化的建议和服务;基于用户历史查询的问题及答案,通过图谱的推理和查询能更准确地回答用户的问题,提升数字助理的服务质量[6]。
3.2. 构建电网物流专业术语、俗语词分析模型
3.2.1. 建立电网物资专业术语词库和流俗语词库
电力物资领域产品众多,涵盖从发电到输配电再到电力设备等各个方面,如发电设备、输电设备、配电设备等。基于电网物资电工装备平台中的相关应急物资,构建相对应的专业术语词库和流俗语词库应遵循以下步骤[7]:
第一步,确定范围。明确电网物资范围是电工装备中的应急物资,包括设备、材料、技术等;
第二步,收集术语。通过查阅电力工程、电网建设、能源管理等领域的文献、标准、资料,以及相关的行业报告和网站,广泛地收集与电网物资相关的专业术语。通过分析十年电力供应链领域应急受理数据,基于机器自动抽取和人工干预相结合的方式,针对性地收集与电网应急物资相关的专业术语、简称、俗语;
第三步,整理分类。将收集到的术语按照类别或主题进行整理分类,可以根据设备类型、材料分类、技术领域等进行划分,支撑后续的数据处理。
第四步,明确定义。为每个术语提供清晰准确的定义,确保用户能够准确理解该术语在电网物资领域的含义和用法。
第五步,创建术语表。将整理好的术语及其定义整合到一份术语表中,可以使用电子文档或电子表格进行创建。
第六步,添加示例和注释。如果有必要,可以为某些术语添加示例用法或注释,帮助用户更好地理解术语的具体应用场景。
第七步,更新和维护。定期更新和维护术语词库,添加新的术语,修订过时的术语,并确保术语表的准确性和完整性。
第八步,接受反馈。接受用户反馈,根据用户需求和建议对术语表进行改进和完善,以提高其实用性和适用性。
3.2.2. 电网物资专业术语词、俗语简称分析模型库
基于已建立应急物资专业术语词库和流俗语词库,开展应急物资专业术语词、俗语简称分析模型库构建,高质量的分析模型可显著提高应急响应效率,降低供应链断供风险。分析模型的构建包括数据预处理、特征提取、模型选择、模型训练、模型评估、优化调整、部署应用、优化完善[8]:
数据预处理。对文本数据进行预处理,包括分词、去除停用词、词干化等处理,以准备数据用于构建模型。
特征提取。从专业术语词库和流俗语词库中提取特征,可以使用词袋模型(Bag of Words)、TF-IDF (Term Frequency-Inverse Document Frequency)等方法将文本转换为可供模型处理的数值特征。
模型选择。选择适合处理文本数据的机器学习或深度学习模型,例如朴素贝叶斯分类器、支持向量机、深度神经网络等。
模型训练。使用已标记的数据集对选择的模型进行训练,以便模型学习电网物资专业术语的词汇和语境。
模型评估。评估训练后的模型的性能,可以使用交叉验证、混淆矩阵、准确率、召回率等指标来评估模型的效果。
优化调整。根据评估结果对模型进行调整和优化,以提高模型的准确性和泛化能力。
部署应用。将训练好的模型部署到应用程序或平台上,以便用户可以使用该模型进行电网物资专业术语、简称、俗语的词汇分析。
优化完善。定期更新模型,监测模型性能,根据用户反馈和新数据对模型进行改进和优化,以确保模型的准确性和实用性。
4. 应急物资智能调配数字助理方案设计与应用
4.1. 语音交互式的应急物资智能调配数字助理方案设计
基于NLP技术和公司数字化部RPA (Robotic Process Automation)技术中台以及建设应急物资调配数据模型,完成智能人机交互语音查询检索前端展现功能建设。通过人机对话的方式和引擎,从数据接口中获取查询数据,同时实现智能人机交互语音查询检索前端展现功能封装,满足一线业务人员查询相关应急物资所属的仓储信息,提升一线用户的操作效率。
语音交互式的应急物资智能调配数字助理系统架构主要由人机交互客户端、人工智能服务平台和知识图谱服务端构成,如图2所示:
1) 人机交互客户端,应急物资智能调配数字助理的客户端包括桌面应用程序和移动APP应用程序,是实现人和机器对话交流的界面,用户可通过文字输入和语音输入等方式与机器进行交流。
2) 人工智能服务平台将用户语音转换成文字,为后续的模型运行提供文本数据,将查询到的文本结果,根据用户偏好转化成语音输出,实现人机无障碍沟通。
Figure 2. System architecture diagram
图2. 系统架构图
3) 知识图谱服务端是基于NLP技术和电网物资专业术语词、俗语简称分析模型库,利用知识图谱技术将实体(如人、地点、组织等)和关系(如属性、类别、相关性等)以结构化的方式表示,从而使计算机能够理解这些知识,并进行复杂的查询和推理,提高数字助力的工作效率[9]。
4.2. 数字助理试点应用
原来应急响应过程是现场抢修工作人员通过电话向物资应急受理人员提出需求,受理专员手动记录需求,对现场抢修工作人员提到的电力物资俗语、简称反复确认,直到可以确认对应的电力物资专业术语,反复的细节确认与核实不仅影响抢修的响应效率,更容易因为物资的错发、漏发降低抢修质量。
数字助理在应急场景受理场景下的试点应用后,现场抢修人员通过移动端数字助理APP,语音提出抢修需求,数字助理将语音数据翻译处理为文本数据,通过模型分析,准确地识别俗语、简称对应的电力物资专业电工装备标准物料描述。数字助理将原来应急响应的单向反复沟通转变为高效的双向一次确认,实现精准高效的物资需求识别确认,提高应急响应水平。
5. 小结
应急物资数字助理在应急受理场景下的应用,成功解决现场抢修人员与物资应急受理人员纵向沟通不畅的问题,通过对电力俗语的分析解析,实际支撑一线业务工作人员,提高物资调配的及时性和准确性,数字助理可以7 × 24小时在线工作,打破非工作时间抢修应答缓慢的低效工作模式。应急物资数字助理通过加强行业内人员的共同参与和维护,提高电力行业的工作效率,减少交流障碍,未来可以在更多场景下应用数字助力,促进物资供应链健康发展。