1. 引言
从广义上讲,云计算囊括边缘计算,边缘计算是云计算的扩展,二者为互补而非替代关系。只有云计算与边缘计算相互协同(简称边云协同),才能更好的满足各种应用场景下的不同需求。边云协同计算继承了云计算与边缘计算的优势,以同时达到高精度、低消耗、快响应、低延时的应用场景需求。目前边云协同在电力物联网应用已经具备一定的基础,随着电力设备的增加,电力设备产生海量电力数据,面对巨大数据量,现有的边云应用协同机制存在一定不足,迫切需求进行改进和完善。
2. 研究背景
随着全球化发展和信息技术的快速进步,社会经济结构转型加速了数字经济时代的来临,知识和信息成为新的创造高附加值的社会资源,出现了“自由流动空间”和“自由流动资源”。企业需要将其业务数字化并采用数字化工具进行管理和运营,越来越多的企业开始实施数字化转型战略,这就要求企业的员工必须具备相应的数字化能力和技术知识,这也意味着员工必须适应新的工作方式和流程。在数字化转型过程中,企业需要拥有具备数字化技能和能力的员工,以便能够更好地应对市场竞争和客户需求的变化。因此,数字化员工建设成为了企业数字化转型过程中非常重要的一环。
在电力行业,数字化发展定位于业务赋能,班组作为电网企业各项业务组织的最小单元,既是企业运营的直接参与者,又是专业业务的具体实施者,开展班组数字化建设,建立更加全能、灵活、快速的数字化班组,有利于全面提升班组人员的知识能力、协同能力、学习能力和业务能力,深入推进员工数字化转型。
从业务领域来看,目前电网企业数字化班组的建设涉及运维检修、装接采集、客户服务、施工建设、仓储履约、调度监控等多类现场作业业务,而这类业务的处理,通常面向多类型电力数据的边云交互,基于边云应用协同机制实现数据的分级分类存储、计算、处理和分析。虽然当前各行各业对边云应用协同技术有一定的研究,但在边云应用协同机制的研究方面少之又少。本文通过整理大量资料,归纳总结了边云应用协同机制的研究现状和实现方式,最后结合数字化班组现场作业场景,提出了一种基于数字化员工现场作业场景的边云应用协同机制。
3. 边云协同机制研究现状
3.1. 国内外边云协同机制研究现状
近年来随着“工业4.0”和“中国制造2025”等国家战略的推进,对于边云协同基础技术的深入研究越来越受到国内外科研团队的重视。目前,国内外研究人员在面向智能制造、工业物联网、智能工厂、智能生产线等领域开展了较为深入的研究,尤其在高可靠、高安全性技术等方面取得了大量的研究成果。但是从整体上来看,面向边云协同机制的研究还处于发展阶段,依然有很多具有挑战性的工作需深入研究。以下围绕边云协同的推理机制、边云协同群智感知中隐私增强多任务分配机制、端边云协同机制等方面,对当前国内外相关研究与发展现状进行阐述分析。
边云协同的推理机制不同于传统的云边协同 [1] ,除业务、数据、服务等协同外增加了算法协同。算法协同具备算力资源分配、准确率验证、模型分区调用等机制。云边协同的推理机制弥补边缘侧算力不足导致的低准确率现象,避免数据短时增长带来的算力波峰,减少云侧带宽压力,提升服务速率,解决数据不出域问题,有效地提高了系统稳定性和资源的整体使用效率。王辉等提出了边云协同群智感知中隐私增强多任务分配机制 [2] ,在该机制中,设计实现了一种边云协同多任务分配算法。该算法基于参与者与任务匹配度,为每个任务挑选出最佳参与者集合,此外,同态加密结合边缘服务器相互协作的策略使得该算法能够有效保护参与者的位置和感知数据隐私。为了提高边云协同多任务分配算法的鲁棒性,提出了GCEA算法,有效解决了多任务分配产生的冲突。考虑到参与者信誉值对任务分配和数据质量的重要性,设计一种动态信誉值更新算法,有效提高了任务分配的合理性和感知数据的质量。文献 [3] 研究了综合考虑了在物联网内进行协作计算的移动云计算和移动边缘计算,将复杂的任务依赖关系简化为多个简单模块队列,并将问题转化为一个线性规划问题,设计了一种迭代的启发式算法来动态做出卸载决策。
3.2. 边云协同机制典型案例研究
中科院海云协同社会化服务平台面向“海–网–云”环境中日益复杂的人机物融合系统的快速开发和创新需求,以局部智能、边缘自治、全局协同为目标,以Docker容器生命周期管理能力为基础,首先实现了云端负载均衡、服务发现、租户管理、租户健康检查、云端资源调度和应用的快速部署能力,然后基于海云共性服务(简称SCCS)实现了海云分形服务架构的创新,有效解决“知识产权保护、无私地合作和共享”之间的矛盾,促进利益最大化。
上海市科委“基于国产处理器的存储服务器和系统软件研究及应用示范”项目,定位于智能制造、工业互联网领域数据存储、计算、安全等技术研发,研发了服务器及运行其上的数据服务系统软件,开展基于国产处理和国产TCM可信计算芯片的存储服务器原型机和数据服务系统软件的研制,实现支持基于工业云的并行数据采集、处理、存储、多模式计算和可信计算环境。同时完成面向智能制造领域的安全、可靠和可用的公共数据服务需求的验证,可以服务于5~10平方公里规模的智能制造园区的建设。
上海市面向化工区产业集群的智慧公共管廊云平台和云服务系统的工业互联网示范项目,结合成熟的边云协同计算技术、人工智能与展现技术,以物联网感知技术为基础,以大数据分析技术为引擎,以云端服务技术为纽带,重点关注化工区管廊发展公司提升管廊智慧化服务的快速构建能力与拓展能力,进而提升盈利能力、提升运营安全和决策水平、提升服务质量和客户满意度、智慧管廊全国推广和面向化工产业集群生态发展需求。
由此可见,在现代化工业互联网系统架构下,采集与传感设备被广泛密集部署在工业现场,这带来了海量的非结构化数据,同时带来了一批具有更高时延敏感度、更多计算量的任务,面对这些任务的较高要求,移动边缘计算和移动云计算被提出。但在网络边缘计算任务数据量爆炸式增长的现代工业场景下,由于中心云服务器和本地设备端之间存在着传输链路长、时延高的特性,这种集中式的移动云计算模式会带来带宽不足、功耗过高等一系列问题,无法满足任务的时效性要求,因此设计一种基于现场作业场景的边云应用协同机制,以达到协同利用中心云服务器、边缘服务器和本地设备端的计算资源的目的,对于工业互联网的智能高效运行具有重要意义。
4. 边云应用协同机制实现方式
4.1. 边云应用协同总体能力与内涵
边云协同是融合通信、算力、数据存储、应用服务的分布式开放平台 [4] ,相对于云侧的全局性、长周期、高时延、大数据的计算特点,边缘计算的短周期特性可以更好地支持本地业务。因此边缘侧与云侧并不是简单的替代关系,而是互补协同的合作关系。通过对资源协同、数据协同、算法协同、应用协同、服务协同等协同领域构建统一高效的协同框架,实现云边互补,资源融合。其涉及基础设施服务(IaaS)、平台服务(PaaS)、软件服务(SaaS)各层面的协同。EC-IaaS与云端IaaS可实现对网络、虚拟化资源、安全等的资源协同,EC-PaaS与云端PaaS可实现数据协同、智能协同、应用管理协同、业务管理协同,EC-SaaS与云端SaaS可实现服务协同。
资源协同:边缘节点提供计算、存储、网络、虚拟化等基础设施资源、具有本地资源调度管理能力,同时可与云端协同,接受并执行云端资源调度管理策略,包括边缘节点的设备管理、资源管理以及网络联接管理。
数据协同:边缘节点主要负责现场/终端数据的采集,按照规则或数据模型对数据进行初步处理与分析,并将处理结果以及相关数据上传给云端;云端提供海量数据的存储、分析与价值挖掘。边缘与云的数据协同,支持数据在边缘与云之间可控有序流动,形成完整的数据流转路径,高效低成本对数据进行生命周期管理与价值挖掘。
智能协同:边缘节点按照AI模型执行推理,实现分布式智能;云端开展AI的集中式模型训练,并将模型下发边缘节点。
应用管理协同:边缘节点提供应用部署与运行环境,并对本节点多个应用的生命周期进行管理调度;云端主要提供应用开发、测试环境,以及应用的生命周期管理能力。
业务管理协同:边缘节点提供模块化、微服务化的应用/数字孪生/网络等应用实例;云端主要提供按照客户需求实现应用/数字孪生/网络等的业务编排能力。
服务协同:边缘节点按照云端策略实现部分ECSaaS服务,通过ECSaaS与云端SaaS的协同实现面向客户的按需SaaS服务;云端主要提供SaaS服务在云端和边缘节点的服务分布策略,以及云端承担的SaaS服务能力。
并非所有的场景下都涉及到上述边云协同能力。结合具体的使用场景,边云协同的能力与内涵会有所不同,同时即使是同一种协同能力,在与不同场景结合时其能力与内涵也会不尽相同。
4.2. 边云应用协同参考框架
边缘计算总体系统架构主要包括云–边–端架构、边–端架构、多接入边缘架构和分布式D2D架构四种 [5] 。边缘计算产业联盟(ECC)与工业互联网产业联盟(AII)在2018年11月联合发布了边缘计算参考架构3.0,将整个边缘架构分为云、边缘和现场设备3层,其中边缘层介于云和现场层之间,起承上启下的作用,主要包括边缘管理器和边缘计算节点两部分。由此可见,支持边云协同的参考架构需考虑其连接能力、信息特征、资源约束性、资源、应用于业务的管理编排。
连接能力:有线连接与无线连接,实时连接与非实时连接,各种行业连接协议等。
信息特征:持续性信息与间歇性信息,时效性信息与非时效性信息,结构性信息与非结构性信息等。
资源约束性:不同位置、不同场景的边缘计算对资源约束性要求不同,带来边云协同需求与能力的区别。
资源、应用与业务的管理与编排:需要支撑通过边云协同,实现资源、应用与业务的灵活调度、编排及可管理。
根据以上因素,对云边协同参考架构的模块进行规划,如图1所示。

Figure 1. Edge cloud application collaborative reference framework
图1. 边云应用协同参考框架
边缘侧包含基础设施能力、边缘平台能力、管理与安全能力、应用与服务能力。云端包含平台能力和边缘开发测试能力。
基础设施能力:需包含计算、存储网络、各类加速器以及虚拟计划能力,考率嵌入式对时延等方面的要求。
边缘平台能力:需包含数据协议模块(可扩展支撑行业通信协议)、数据处理分析模块。
管理与安全能力:管理包括边缘节点设备、基础设施资源、边缘应用管理等。安全则为多层次安全,包括芯片级、操作系统级、平台级、应用级等。
应用与服务能力:分为两类进行考虑,具备部分特征的应用于服务部署在边缘节点,部分部署在云端,云边协同提供一站式应用服务;部分模块部署在边缘节点,部分模块部署在云端,云边协同提供某一整体的应用与服务。
平台能力:包括边缘接入、数据处理分析、边缘管理与业务编排。数据处理分析需对时序数据库、数据整形、筛选、大数据分析、流分析、函数、人工智能集中训练进行规划。边缘管理与业务编排需对边缘节点设备、基础设施资源、应用、业务等生命州及管理以及各类应用的业务编排进行规划。
边缘开发测试能力:在某些场景中,涉及通过提供云边协同的开发测试能力以满足整个生态系统发展需求。
4.3. 边云应用协同模式
边缘计算的快速发展,并不意味着要彻底放弃云计算,相反,越来越多的应用场景需要在云计算的基础上协同边缘计算技术,才能发挥更好的效果。云计算的优势在于处理长周期、计算密集的任务数据,因此可以有效应对需要大量数据分析的业务领域;而边缘计算的优势在于处理短周期、实时性的任务数据,因此可以更好地应用于注重实时性的本地业务领域。针对于云计算与边缘计算之间的协同关系,主要有两种协同方式。
中心云主导的边云协同:在这种模式下,由云计算中心负责接收终端设备所上传的任务数据,并进行数据计算、模型训练,以及任务预测。然后,中心云将部分计算与预测结果发送至边缘服务层,并指导边缘层进行资源部署与任务调度。
边缘服务层主导的边云协同:在这种模式下,首先由边缘服务层来接收终端用户所上传的任务数据,并对其进行计算;然后,边缘服务层会及时将任务的处理结果回传至终端设备。若边缘服务层的计算能力有限,不能满足用户任务的实际需求,则边缘服务层会将任务继续卸载至中心云服务器中处理。
4.4. 边云应用协同机制实现方式
边云应用协同CROSS价值体系包括五个方面,联接的海量和异构(Connection),业务的实时性(Real-time),数据的优化(Optimization),应用的智能性(Smart)和安全隐私保护(Security)。由此可见,边云应用协同的机制不同于传统的云边协同,除业务、数据、服务等协同外增加了算法协同。算法协同具备算力资源分配、准确率验证、模型分区调用等机制。边云应用协同的机制能够弥补边缘侧算力不足导致的低准确率现象,避免数据短时增长带来的算力波峰,减少云侧带宽压力,提升服务速率,解决数据不出域问题,有效地提高系统稳定性和资源的整体使用效率,并实现更复杂的应用场景。一些常见的边云应用协同机制包括以下内容:
消息传递与远程调用:边缘设备和云端通过消息传递或远程调用的方式进行通信和交互。边缘设备将需要处理的数据或任务发送给云端,云端接收并进行处理,并将结果返回给边缘设备。这种方式可以使用消息队列、RPC (远程过程调用)等技术来实现。
数据分发与处理:边缘设备将部分数据进行预处理或筛选,并将需要进一步处理的数据传输到云端进行处理。这样可以减轻边缘设备的计算负担,并利用云端的大规模计算资源来完成复杂的任务。
分布式计算框架:利用分布式计算框架,例如Apache Spark、Hadoop等,将边缘设备和云端资源组织起来,实现任务的划分和分配。边缘设备和云端之间可以通过框架提供的通信机制进行数据传输和协同工作。
任务卸载与迁移:对于计算密集型的任务,边缘设备可以将部分或全部任务卸载到云端进行处理。同时,当云端负载过高或网络延迟较高时,也可以将任务从云端迁移到边缘设备进行处理。
资源协调与优化:边缘设备和云端可以通过协同工作来共享资源,例如存储空间、计算能力等。这样可以充分利用各自的资源,并优化整个系统的性能和效率。
数据同步与一致性:在边缘设备和云端之间进行数据同步和一致性管理,确保数据的准确性和一致性。通过合适的同步机制和数据管理策略,可以确保数据在边缘设备和云端之间的一致性,并避免数据丢失或不一致的情况。为了实现数据的同步和一致性,可以采用一些数据同步和复制策略。例如,可以采用分布式数据库、数据复制和更新机制等技术手段,实现数据的同步和一致性管理。
动态资源调度与负载均衡:边缘设备和云端之间的资源调度和负载均衡非常重要。可以使用一些调度算法和策略,根据实时的负载情况和资源需求,动态地将任务分配给边缘设备或云端进行处理。
边缘智能与协同决策:边缘设备通过具备一定智能能力的算法和模型来做出决策,并与云端进行协同工作。例如,边缘设备可以根据自身的感知数据和环境情况,决定是否将任务卸载到云端或其他边缘设备进行处理。
总而言之,边云应用协同机制是在边缘计算和云计算融合应用场景下,实现边缘设备和云端之间协同工作的关键机制。这些机制可以提高系统性能和效率,同时满足数据的安全性和一致性需求。
5. 基于数字化班组现场作业场景的边云应用协同机制
5.1. 基于数字化班组现场作业场景的边云应用协同机制研究需求
边云协同智能技术能够促进电力领域智能化水平的全面发展,使得电力物联网的万物互联蓝图成为现实,边云协同核心算法弥补了电力物联网的智能化有待提升的缺陷,基于边云协同的带宽时延强约束数据分析技术为电力场景下的图片/视频类应用提供支撑,而面向海量敏感、非贯通数据的边云协同智能技术将有效满足电力用户隐私保护的需求。由此可见,边云应用协同是建立数据驱动的数字化员工现场作业应用场景的关键环节,具有快速联接、实时响应、数据处理、安全与隐私保护等优势,在数字化班组现场作业应用场景中边云协同主要有以下几方面的作用:
高效率低时延:边缘计算实现许多电力设备终端在本地进行电力数据分析,应对紧急事件,提高处理效率,减轻云计算的负荷。在网络边缘处理大量临时数据,不再全部上传云端,这极大地减轻了网络带宽和数据中心功耗的压力。
精确分析精准调度:边缘计算的分布式计算特点可以更精确更迅速对本地用电数据做出分析和反应,和云计算技术结合对电网形成完整的状况分析和全域调度,极大地提升了综合管理效率。
定制化快速响应:边缘计算设备可以通过智能组件实现定制化和智能化,针对电力用户不同用电需求进行个性化定制服务,为用户提供更快的需求响应,为电力客户实现一站式的管控。在靠近数据生产者处做数据处理,不需要通过网络请求云计算中心的响应,大大减少了系统延迟,增强了服务响应能力。
隐私保护强:边缘计算将用户隐私数据不再上传,而是存储在网络边缘设备上,减少了网络数据泄露的风险,保护了用户数据安和隐私。
5.2. 基于数字化班组现场作业场景的边云应用协同框架
一般来说,在电力物联网的边云应用协同中,边云应用协同框架主要发挥以下作用:
应用(APP)控制。物联网管理平台发出控制命令后,由边缘代理(边缘帧)来接收它们,并作为代理来控制云中的APP。
数据共享。服务APP收集的数据将数据缓存在边缘关联代理上,并提供了一种不同APP之间的数据共享机制。
边缘计算。边缘端基于实时数据、高速缓存数据和物联网管理平台发布的模型进行边缘计算。
云端协作。云端协作系统包括资源协作、数据协作、智能协作、应用程序管理协作、业务管理协作和服务协作。
应用程序开发。为了简化APP的开发,有必要对数据缓存、安全访问、数据采集、APP管理等通用接口进行细化,形成统一的软件开发工具包(SDK)。
随着公司大力推进全业务数字化班组建设,基于统一物联接入平台实现各类采集监测装置、移动装备、智能装备的接入和应用标准化,支持IOT创新应用场景,迫切需要进行基于数字化班组现场作业场景的边云应用协同机制研究。在借鉴云计算、边缘计算的理念和技术的基础上,构建了具备“云、管、边、端”四层架构的,基于数字化班组现场作业场景的云边一体化能源物联网系统架构,如图2所示。该系统架构,以“边云协同、边缘智能”为核心特征,“边缘云、云化网关”为主要落地形态,“软件APP化”为实现方式,通过云主站提供基础服务,通过边缘侧接入算力,具备采集、通信、网络、计算、存储、分析、控制、应用等功能。

Figure 2. A collaborative framework for edge cloud applications based on digital team site operation scenarios
图2. 基于数字化班组现场作业场景的边云应用协同框架
该边云应用协同架构,主要为实现以下目标:
现场作业智能辅助:面向现场作业人员,以智能终端设备为核心,基于RISC-V指令集,辅助研制感知–控制–优化一体化的自主可控边缘网关装置,为设备资产管理、能效管理提供边缘计算平台,提高设备全息感知能力及海量数据接入能力。基于边缘计算节点,获取边缘节点基础计算和分析结果,在边缘端进行设备故障问题的初步诊断和原因预判。
变配电运维状态感知与预测性运维:针对配电网边缘数据处理压力大、通信层网络自治性能低等问题,在边缘进行传感数据的接入和部署优化,基于云、管、边、端泛在协作的通信、感知、推理一体化体系架构,建立设备健康诊断与故障预测模型,辅助构建面向全局优化的配网设备状态评估诊断系统,实现面向设备的预测性运维服务,及时发现部件的老化或潜在故障,避免设备非计划停机,提高设备运行稳定性,为配电网整体运行及设备状态感知提供边缘智能服务。
台区重过载预估与运行模式优化:通过边缘计算装置对台区设备采集的数据进行处理和数据融合,进行区域网络的数据共享共用,在云端通过深度学习对大区域网络大规模数据进行关联分析,构建配网负荷多源、强耦合数据采集、清洗与汇聚的专用数据处理框架,结合台区设备运行数据与外部天气、用能需求数据,自动提取并优化提炼重要特征,预测未来负荷趋势,细化评定设备运状态,对比区域设备额定容量,评估识别未来一定时间段内可能发生设备重过载的概率,辅助设备运行模式优化和台区智能调度。
线缆设备过热自动化判定:在边缘端基于红外扫描装置,直接融合利用红外扫描数据、设备常规状态数据、设备基础温升数据等多类信息,在筛选出有效图片的基础上,从红外扫描图片中锁定并分离出线缆设备,并针对性提取其色温等衡量指标,通过与设备基础温升的对比,自动化判定设备当前是否超过正常阈值,存在过热的风险,并进行精准告警。
5.3. 基于数字化班组现场作业场景的边云应用协同机制
因为硬件资源限制的边缘计算节点无法在底层满足所有应用部署,为满足数字化班组现场作业场景多样化、定制化需求,因此引入“云端协同”机制,通过“云”侧微服务与“边”侧微应用的数据交互、协同计算来更好满足数字化班组现场作业业务需求。具体来说,就是将边缘计算节点与云主站相结合,从资源、数据、接口、通信、安全等多方面、多维度切入,遵循边缘计算自身的就近原则、边云层级对应原则以及云主站统一管理原则。边云协同可实现边缘计算节点负载云主站的数据处理,减少数据往返云端等待时间和网络带宽成本,满足终端侧实时需求,同时提高云主站承担复杂工作的效率,降低边云管理的难度和系统资源成本,共同完成更多更复杂工作目标的过程。对数字化班组现场作业业务场景来讲,边云协同的数据处理机制可实现“区域自治”,特定区域的部分数据无需上传云主站可以本地分析、决策,充分利用数据资源,提高实时性。其核心是实现云、边的资源协同、数据协同、智能协同、应用管理协同、业务管理协同和服务协同。
本论文结合设备故障问题诊断、设备健康诊断与故障预测、负荷趋势预测、设备过热自动化判定等数字化班组现场作业场景的典型特征,设计了云–边协同、边–边协同、边–端协同、云–云协同的应用协同机制。
云–边交互:云主站可根据自身需求主动召唤边缘计算节点侧数据或下发边缘节点侧管控机制。通过接口调用边缘计算节点容器编排引擎(Kubernetes)中集群控制节点和集群负载及任务执行节点实现对多设备容器集群管理和资源调度,召唤方式可按模型实例、指定数据对象集合等形式。管控机制主要分为边侧请求、定值下发、控制命令、区域广播4类。
边–边交互:即2个或多个边缘计算节点间的数据交互流程,边–边数据交互由数据代理模块和云主站共同实现,单个边缘计算节点服务于特定区域用户。边缘计算节点1若想获得边缘计算节点2的数据,需首先向云主站进行数据请求,随后云主站根据DNS解析判断该域名是否部署边缘计算节点,并将请求信息解析边缘计算节点2,然后边缘计算节点2进行数据响应通过云主站将数据传达给边缘计算节点1。
边–端交互:根据数据采集APP设计和端侧设备的数据采集能力进行数据的采集,同时边缘计算节点将云主站或本身控制指令APP产生的控制命令下发到端侧设备实现双向的数据交互,交互流程类似云–边交互。
云–云交互:云主站应具备REST API (Web Service)和采用消息队列(Kafka或Rabbit MQ)的接口,在规范化的数据共享机制下通过标准化接口完成与其他云主站系统(用电信息采集系统、生产管理系统等)之间的数据交互,实现跨系统数据共享共用,发挥数据资产价值。
6. 结语
现阶段,我国在电力物联网、云计算、边缘计算等方面均有了初步的探索和技术积累,可以为各种电力业务的智能化提供基本保障,但仍存在许多亟待解决的痛点。本论文面向数字化班组现场作业领域的边云协同智能技术研究展开探索和研究,设计了一套集物模型、边缘计算、边云协同计算以及边云交互于一体的边云应用协同机制,明确了云边协同的智能生态,使得相关现场作业场景既可以在云–边、边–边之间动态切换,又能通过云端有效管控边缘应用,满足数字化班组现场作业场景多样化的业务需求。