1. 绪论
目前,设备画像技术在我国铁路机务数字化转型的发展相对滞缓,已成为影响智能化深度推进的关键制约因素。尽管6A、CMD等系统已在国铁集团广泛部署,但应用场景多集中于事件追溯[1],数据资源尚未充分发挥作用。其次,管理规范的迭代机制目前仍是经验驱动模式占据主导地位[2]。相比如单机系统,国铁集团这样超级庞大、复杂的网络系统,任何规范或模式的变革都是牵一发而动全身,所以经验驱动模式下的渐进改良是合理选择。此外,画像技术所倚重的数据自适应机制与既有铁路系统的垂直化管理体系之间存在调适空间,跨部门数据的协同共享机制尚需完善。造成这种现象的原因,在于机务信息化过程中,往往优先选择具有一定独立性的业务板块开发。因而造成数据孤岛、标准不统一、部门协调难等问题。这种现状本质上反映了铁路机务系统的网络特征和“一票否决”的安全文化对确定性的高要求与画像技术概率性认知逻辑之间尚需进一步融合,相关研究在标签动态性、语义完整性与业务闭环性等维度仍有深化空间。因此,本文旨在系统构建机车画像的认知谱系,梳理我国铁路机车画像演进路径与节点,探索未来发展方向。
2. 画像思想的跨领域溯源:从用户画像到设备画像
2.1. 互联网领域的用户画像
信息技术影响了企业管理模式、消费者行为和二者之间的关系。其中最大的变化是供应商企业掌握了消费者的行为“踪迹”,并被用来描述客户特征和预测客户消费行为。最早是Xerox公司的首席科学家Mark Weiser所带领的团队于1994年首次提出通过网站访问日志构建用户兴趣模型,被视为现代用户画像技术的前身。
王宪朋从画像基础、画像目标与画像方法三方面概括客户画像技术内容:通过搜集与整合用户数据以形成画像的前提和基础;为更好地服务公司战略,一般是针对特定业务的特定客户(重要客户)画像;利用海量数据建立数学建模,挖掘出目标用户的深层次信息,并展示出有价值的信息供决策者参考。余孟杰也认为企业通过从海量数据中建模并整合出的客户标签信息,可以形成用户画像[3]。总体来讲,画像技术最先使用于个性化营销。
2.2. 工业界的设备画像
工业设备画像研究始于客户画像,但是技术部分源自客户画像,部分是独立发展的。首次将画像研究扩展至移动设备领域的是对用户手机数据进行分析。但是这个分析的真正目的是人,不是设备(手机)。真正专门针对设备进行画像的实践是通用电气公司[4]。用户画像技术向设备画像迁移的关键事件如表1所示。
Table 1. Key migration milestones from user profiling to equipment profiling
表1. 用户画像技术向设备画像迁移的关键事件
理论 |
研究对象 |
研究内容 |
直接目的 |
关键人物或机构 |
用户画像 |
用户 |
用户属性、行为信息 |
客户管理 |
Alan Cooper,1998 |
设备指纹技术 |
设备(如IMEI、MAC地址) |
设备的硬件、软件及网络特征信息 |
精准识别和管理设备,设备管理 |
瑞典的FPC 美国的AuthenTec |
设备画像(指纹技术应用) |
设备(移动电话) |
通过设备运行特征信息映射人的行为 |
预测用户行为,客户管理 |
MIT媒体实验室,2005 |
设备画像(数字孪生) |
设备(航发、能源设备) |
设备运行状态信息 |
预测设备故障,设备健康管理 |
GE 2013 |
设备画像与用户画像的核心逻辑均是通过多源异构数据采集、特征提取与标签化建模,来构建目标对象的数字化画像[5]。以用户属性数据和行为踪迹数据为基础建立的用户画像可以作为企业的产品设计与营销的决策支持。以设备属性数据和运行数据(含环境数据)为基础建立的设备画像则是作为设备的所有者或配属部门进行设备运维管理决策的支持。两者相比,设备画像对对象的研究更深入。但是两者共同之处在于都依赖数据驱动、模型计算与标签体系。2010年后,随着工业物联网技术的快速发展,设备画像逐步聚焦健康管理与维修养护领域,形成了独立的技术体系。用户画像技术与设备技术的关系如表2所示。
Table 2. A comparative study of user profiling and equipment profiling in methodology, technological evolution, and purpose
表2. 用户画像与设备画像在方法论、技术演进路径和目的方面的比较
理论名称 |
方法论同源 |
技术演进路径交叉 |
业务目的互补 |
用户画像 |
都是通过数据建模建立目标对象的数字化抽象 |
从分析用户数据给用户画像——到借用设备指纹技术分析用户携带设备的数据,辅助用户画像 |
优化用户体验、改进营销策略与产品设计。 |
设备画像(数字孪生) |
借用用户画像方法,使用设备指纹技术,给设备画像 |
优化生产运作流程、降低运维成本 |
2.3. 轨道交通装备的画像实践
铁路机车设备画像是设备画像在铁路机务专业的具体应用,是根据海量的机车运维数据,按照已建立的标签体系建立单台机车或类群机车的画像标签。这实际上是通过对机车数据的表达更加规范化、形象化和可读化,从而实现对机车健康状态的精准、科学、直观地把控,实现机车运用维护的数智化管理。
到目前为止,国铁集团已建设和推广了一系列专业信息系统,包括但不限于机车远程监测与诊断系统(Condition Monitoring and Diagnosis System, CMD)、机车车载安全防护系统(6A)、动车组司机操控信息分析系统(Electric Multiple Unit Engineer Operation Analysis System, EMU EOAS)、列车运行监控装置(LKJ)等。而且已经按照“一车一档”模式,建立了机车及重要零部件的电子档案。通过地面综合应用子系统,已经实现LKJ、TCMS、6A的信息集成,具有初步的统计分析功能。最重要的是,通过这些信息系统,机务专业积累了海量的多源异构数据资源,为机车画像奠定了基础。
文献[6]指出利用机车多源异构数据,提出了机车设备画像3级静态标签体系技术架构和构建方法。并用K-means聚类算法提高标签获取的精度和稳定性。与机车画像密切相关的PHM技术已在国铁集团示范应用,这些为画像技术的高层标签生成提供了技术参照,如基于CMD、6A等系统数据,在走行部轴承故障诊断、牵引系统健康评估等方面的研究均已取得明显进展[7]。PHM作为画像的核心内容之一,但是还不能取代多维度标签体系。机车画像的应用场景还包含行车调度安全[8]。
3. 铁路机务信息管理中的画像雏形
中国铁路早期推广使用的机车统计计算机系统已经实现了机车运用日报、检修台账的电子化处理。随后在机车履历电子化、状态监测、检修记录结构化与故障案例库建设等领域的技术与数据积累,已具备画像技术的某些初级特征,只是尚未完成从数据记录到认知表征的范式跃迁。
3.1. 机车履历电子化
我国学者在机车履历电子化领域已形成多年研究积累。这些工作虽在系统架构、履历标准化及电子档案应用等方面取得进展,但本质是业务功能驱动而非认知表征驱动,技术履历字段停留于条目式描述,缺乏可计算、可演化的标签抽象;数据依赖人工录入更新,未与6A、CMD等动态监测数据系统对接,其本质还是档案电子化而非认知型画像,是具有静态属性的基础标签。数字化机务系统的一个子系统,机车履历管理信息为整个数字化机务段系统的开发打下了基础[9]-[12]
3.2. 机车状态监测
机车状态监控产生了时序数据,促使机务信息化从静态履历转向动态状态监测。我国铁路机务已建成并运用以6A系统与CMD系统为核心的实时数据采集体系,形成类状态标签的原始数据源。6A系统机车车载安全防护系统,实时采集轴温、振动、压力等关键参数,记录异常事件。CMD系统则作为车地传输中枢,将LKJ、TCMS、6A等数据实时下发至地面。6A系统不仅能处理达到报警阈值的明显异常事件,还能存储连续的工况数据,为后续通过地面专家系统对这些数据进行离线综合评估时,可追溯状态漂移的全过程,为机车维护提供依据,进一步印证其感知正常工况下状态漂移的能力。但是这种状态描述以原始传感器数值为主,并未建立分级标签体系,监测数据与检修履历、运用环境等异构信息未能在标签层面融合,导致状态标签孤立化、碎片化,无法支撑精准画像构建[13]。但是这些系统对连续工况记录的技术与能力也为未来的状态标签、流式标签的建立提供了坚实的基础。
3.3. 检修记录结构化
梳理我国铁路机车维修记录结构化进程可分为三个阶段。第一阶段(1999年及以前):维修模式是计划修,人工登记的纸质台账,数据内容主要包含检修时间、故障现象等信息,主要满足事后追溯需求。第二阶段(2000~2019):铁路机务信息化与标准化早期。部分机车(如和谐型)的关键部件具备状态修条件。2003年TMIS上线,就实现了维修数据电子化存储,2016年颁布的《高速铁路设备维修规则》推动了机车维修记录内容的规范化,但数据孤岛与系统间壁垒等问题仍十分突出,检修记录电子化仅仅是纸质记录的数字化。第三阶段(2020年至今):这一阶段以数字化整合与智能化赋能为主要特征。国铁集团机车健康管理系统投入使用,一些场景通过手持机实现维修数据实时上传与交互,基本实现维修环节全程可视化。维修记录结构化已成为故障预测、寿命评估的数据来源。国际上,欧盟EN17095:2019标准明确了机车维修记录的核心内容与责任追溯要求。我国《“十四五”现代综合交通运输体系发展规划》要求提升维修数据利用率、统一数据接口标准,部分铁路局集团已实现维修记录的全生命周期可追溯,部分隐性维修信息难以结构化,且跨区域维修数据的标准统一与共享机制尚未完全建立[14] [15]。
我国铁路机务管理虽已实现履历电子化、状态实时监控与维修数据结构化,奠定了画像构建的数据基础,但仍处于数据积累而非画像构建、简单分类而非标签体系的阶段,主要表现在数据缺乏关联融合,多系统孤立呈现单一维度信息;标签缺乏语义化与赋能性,仅为简单属性标注;应用体现在事后查询追溯,未形成从数据、标签、知识、决策的闭环。
3.4. 机车画像融合构建
虽然我国铁路机务数据资产的建设离机车画像所需的知识图谱还有一定距离。作为机车画像技术的核心内容之一的PHM,已在试点路局实现了多源异构数据的融合建模[16],文献[17]运用全息实时监控状态数据的融合技术,建立数字孪生模型,从而实现机车运行状态实时监控与数据融合建模分析系统。文献[18]通过对机车物理设备运行状态分析、虚拟设备建模、孪生数据采集、实时数据驱动数字孪生体及人机交互界面创建,基于串口通信技术实现物理设备与虚拟模型间的实时数据交互。文献[19]以管人、管车与控安全、控质量为目标,建立机务大数据中心。这标志着画像构建从记录数字化向实体数字化的范式转换已经启动,虽然还是处于早期阶段。
Figure 1. Schematic of technical paradigm evolution in railway locomotive profiling
图1. 铁路机车画像技术范式演进图
图1是铁路机车画像范式演进架构。在数据源层,通过机车履历电子化、车载传感器的状态实时监控数据回传、检修记录结构化和机务系统其他物联网数据的多年变革积累,已经可以为画像系统提供输入数据;数据底座层,是机务画像系统从信息管理向认知智能进行范式转换的基础设施,经过时序数据库与知识图谱的相互融合,可以实现数据资产的知识化,完成语义淬炼;认知智能是一项模仿人类思维过程的技术,它具备知识推理和决策的能力,同时还能够学习和适应不断变化的环境[20]。而范式执行层是实现从信息管理范式转换到认知智能范式的关键,基于规则驱动的是信息管理,基于算法驱动的是认知智能。在融合决策层,是一个画像融合显性化多源异构数据的过程,融合的目标是构建一个集静态档案、动态状态、预测能力于一体的机车画像,并输出至认知决策服务,至此完成业务价值的实现;闭环反馈机制层,通过PDCA循环实现持续不断的改进,则是画像系统评估、优化的动态闭环机制。
3.5. 分析与评论
我国机车的特殊性在于代际并存与持续改造。以“牵引电机轴承异常磨损”为线索,可从两个维度来阐述。
维度一为技术代际(车型载体):SS9型机车的数字化改造属于典型的“retrofit (后装改造)”范式,与21世纪后原生数字化设计的和谐、复兴系列存在本质区别。HXD3型(2006年定型量产)可作为21世纪初信息化与大数据范式的典型载体,与SS9型(1990年代电子化)和复兴号(2010年代数字孪生原生设计)形成清晰的技术代际对比。
维度二是从数据部署方式的角度分为后改造范式和原生设计范式。SS9型为后期加装6A系统、CMD系统等设备,虽能实现数据传输,但传感器布局受限、数据孤岛严重、缺乏原生数字模型支撑,其状态数据通过车载系统监测、记录,预警研判由人来完成,本质仍属于数据可见不可融合的信息管理阶段。而CR400AF型则在设计阶段即植入超过2000个测点、统一数据总线、内置数字孪生体,实现认知智能层级的应用,即从多源融合到知识推理,并实现仿真推演。
国外虽然也有老旧机车,但存量规模、处理逻辑与技术路径与中国不同。典型的如美国、日本、德国等,因市场化程度高,其机车的设计寿命30年左右。对老旧机车的处理,形成了强制报废与二手车出口的消化模式。所以国外机车数字化是线性演进的,1970年代的模拟监控、1990年代数字控制、2000年代车载诊断、2010年代数字孪生原生,每一代技术都内嵌于新车型,老车随新车上市自然淘汰[21]。而中国则是跨越式演进:2000年代初期SS9的电子化、2000年代末期至2010年代SS9加装6A、2010年代HXD3半原生设计、2020年代CR400AF全原生智能。同一车型在不同时期承载不同范式,这是我国独有的行业现象。
“交通强国”战略要求最大化存量资产利用率,老旧机车改造既是政治任务,也是经济任务,有专项资金支持,而且现实中也存在改造的迫切需要。国铁集团推动CMD、6A等系统强制装车,形成后装改造的标准化范式,延长了机车使用寿命,对缓解运能紧张局面起到关键作用。
4. 铁路机车画像领域的发展方向展望
铁路机车画像研究与实践从多领域独立纵向发展的信息管理向体系化设备画像转型,技术层面,需要贯通从数据、模型到应用的技术链条,组织方面在于制度、流程与画像技术的一致性变革。因此,未来如果在数据语义融合、模型协同机制、决策闭环集成等层面实现系统性突破,则将有助于推动机车画像范式转变。
(1) 数据范式认知化:机车数据从聚合到语义本体淬炼的转向
数据底座层面,时序数据库与知识图谱尚未打通,监测数据与履历信息仍需人工关联,这成为制约从数据到标签的语义淬炼的效率的关键环节。文献[22]的分析表明,传感器数据融合是该领域的研究热点方向,故障诊断、遥感、安全以及智能电网等是数据融合应用的热点场景。文献[23]提出了一种基于知识图谱与大语言模型的电力行业知识检索分析系统。该论文用大语言模型进行需求挖掘,用知识建模、知识融合等策略构建结构化知识图谱,并可视化。机车画像领域未来在数据端的发展,可强化数据底座建设,打通时序数据库与知识图谱,建立标签自动化提取与动态更新机制,提升多源异构数据的画像级融合能力。
(2) 模型架构生态化:机车认知架构从协同到孪生的重构
数字孪生技术早期应用领域也已扩展至电力、汽车、船舶、铁路等各行业[24]。设备场景的实时性要求与资源约束决定了设备画像未来的技术演进方向将从数据上传、云端训练到模型下发的简单循环,转向双向知识流动。由于设备画像的主要挑战在于数据极度异构,单一模型无法捕捉全貌,因而多模态模型的自组织协同是避免显式通信主要方向。这种协同可以分为横向(同层级模型的协作)和纵向(大小模型的协同)。
(3) 范式闭合与制度同构:机车技术与组织异步性陷阱的突破
机车画像领域的技术升级与组织管理体系发展出现不同步、不匹配,进而导致先进技术难以落地见效,组织流程成为阻碍机车运维效率提升、安全保障强化等核心目标实现的问题。未来机车画像技术落地实现的方向或突破点在组织流程与技术范式的同构,这可以说是又一次的流程再造[25]。技术进步不能无视组织能力与现实需求,组织要变革以配合技术更新,方能发挥新技术的效益与效率。
基金项目
横向项目、面向多应用场景的机车画像标签体系构建与动态管理机制研究、LTKY202526-1。
NOTES
*通讯作者。