1. 电力教育培训调研及分析
1.1. 电力教育培训调研的目的
当前大数据时代,各类教育平台中逐步存储起各类数据,并且海量地增长着 [1] [2] [3] 。充分整合利用这些数据,作为教育决策依据,可提高决策的合理性、科学性和精准性。电力教育培训是中心的核心业务,其涉及到中心的教学、管理和服务等各个领域,因此本文对中心内部、系统内基层单位、上级主管培训部门以及20个系统内培训机构和100个系统外培训机构进行调研,从电力教育培训的各个领域进行调研设计并逐步展开实施,最后对调研结果信息进行全面性、针对性及实效性分析 [4] [5] [6] 。通过大数据平台来发现中心在电力教育培训中存在的缺陷,进而有针对性的去解决问题、转变工作思路,并以中心在电力教育培训中的可持续发展为目标去不断的尝试教学创新模式,提高电力教育培训的质量。
1.2. 电力教育培训调研内容
调研内容主要以各单位在电力教育培训领域中近十年的相关数据为依据,包括培训计划、培训方案、学员考核成绩、培训满意率及评价、教学视频监控等数据信息。主要调研对象如表1所示。
主要调研内容包括:
1) 针对培训过程不同阶段,制定了从不同角度出发的调研方案,具体如表2所示。
2) 从教学安排、学员组织、课程安排上调研:① 管理类及技能类培训的实训与理论课程安排情况;② 上下课时间;③ 教师安排;④ 辅导教师的确定;⑤ 答疑时间;⑥ 对困难学员的鼓励;⑦ 教师着装;⑧ 对于中心城市、三线城市、老少边地区的学院组织情况;⑨ 实训场地的安排、大小及配套设备。
3) 从数据信息采集的频率上调研:包括人数、次数、每课的频次数、每半天或每天的频次数及每班的频次数。
4) 从学习效果的影响因素上调研:包括时间安排、教学安排、教学组织、教学管理、培训师配置、培训师着装及学生情绪。
5) 从教室视频监控大数据分析上调研:学员情况调研、教师情况调研。

Table 2. Research content of different stages
表2. 不同阶段的调研内容
1.3. 电力教育培训调研分析
结合电力教育培训特点和大数据技术对调研结果分别从两个角度出发进行分析,分别是从大数据对电力教育培训的影响角度分析以及从培训数据本身分析。
1) 从大数据对电力教育培训的影响进行分析
改变电力教育培训中对数据价值的认识。大数据的最大特点和优点就是可以关注到学员的微观表现,例如学员上课接打手机次数、课堂上的表情和说话情况等。这些数据对其他个体没有意义,但将所有学员的数据综合起来就能解答许多在培训过程中的所遇到的各种疑问,甚至是一些在过去无法解决的难题。而与传统数据最明显的区别是,这些数据收集工作与学生自己的行为是完全独立的,这使得数据具有客观和真实性。
方便教师更全面了解每一个学员。大数据让教师能够更方便获得每一个学员的真实信息。另外,也能够帮助教师根据学员整体学习情况制定合理的培训管理方案,选择最合理、最能让全体学员接受的教学模式,从而提高教师的工作效率和学员的学习效率。
帮助学员进行个性化高效学习。学员借助“大数据”,可以更好地了解自己的学习状况,针对性开展自主学习,提高学习效率。大数据帮助我们以全新的视角判断事物的可行性和利弊性;详尽地展现了在传统教学方式下无法察觉到的深层次学习状态 [7] ,进而有条件为每个学员提供个性化教学服务。
2) 从培训数据本身分析
数据异构性:培训数据数量繁多、类型繁杂,主要分为各类结构化和非结构化数据,包括培训管理数据、培训资源数据、学员信息数据、视频监控数据等。若要从中提取出有用的信息,需在数据集成时将数据进行转换。
数据质量:培训数据量大不一定就代表信息量或者数据价值的增大,相反很多时候意味着信息垃圾的泛滥 [8] 。调研数据中存在数据不一致、数据重复录入等大数据集成中所遇到的问题,究其原因:一方面单个系统不能容纳从不同数据源集成的海量数据;另一方面如果在集成的过程中仅仅简单地将所有数据聚集在一起而不作任何数据清洗,会使得过多的无用数据干扰后续的数据分析过程。所以需对数据进行质量监控管理。
数据存储方式:在大数据时代下,对数据存储的要求越来越高,则需要采用新的数据存储方式来应对数据爆炸,不能再依赖传统的关系数据库存储数据。
数据共享性:对于电力教育培训工作人员、教师和学员,结构复杂的培训数据共享程度低,造成资源浪费,则需对数据进行整合平台建设,合理高效利用数据资源。
2. 电力教育培训大数据平台
通过调研,我们发现一方面历年教学培训积累了大量的数据,以前由于技术限制,对历史数据弃之不用是极大的浪费,其实历史数据是一座金山,可挖掘出无数可用的资源;另一方面这些数据本身量大,关系错综复杂,需要相应的方法来进行汇聚整合。因此,创建一个基于电力教育培训的大数据平台是十分有必要的,它一方面可以收集整理相关的海量数据,另一方通过对大数据的深度挖掘,获取有价值的信息来改善我们的电力教育培训。现今大数据技术的日趋成熟,让这些历史数据价值得已体现出来,我中心为了更好的利用历史数据来提高教学培训的质量,拟建设一个电力教育培训大数据平台,实现科技促进教学培训。
2.1. 思路
考虑电力教育培训相关主体的基本数据信息,各主体之间的相互关系,从大数据表现的特征为出发点,制定从数据收集、数据整合、数据分析及应用、数据可视化等一系列的处理模块,运用大数据技术发展的最新结果,对电力教育培训大数据平台提出“合理配置、精准培训”的总体思路。
2.2. 目标
围绕“合理配置、精准培训”,构建电力教育培训大数据平台,旨在掌握全面、客观的真实的电力教育培训数据,通过科学数据分析及有效的应用,充分体现其在培训计划、培训安排、资源配置、计划实施、评估等环节的重要作用,同时为培训教学理论和教学实践的研究提供强有力的数据支撑 [9] [10] 。该数据平台能够有效的汇聚、科学的整合相关数据信息,使参与电力教育培训活动的相关部门能够高效地协同工作,从而提供高质量的培训;能够及时掌握、智能预测电力教育培训活动进行中的可能出现的问题与发展的趋势,通过对问题的及时诊断,实现对电力教育培训活动状态的智能研判和预测,对教学培训活动的良好开展提供科学的决策依据。
2.3. 技术架构
综合分析电力教育培训中的各环节详细信息,结合各环节的实际需求,构建了一个基于电力教育培训的大数据平台如图1所示。
源数据层:这一层实现源数据的采集,涉及数据的来源和采集的策略。数据来源主要有三个方面,一是收集整理历年的教学培训的相关数据信息,包括教师、学员基本信息、教学计划、培训方案、培训班总结、师答疑情况、成绩考核、考勤表、请假单、视频等相关信息;二是每一次教学培训活动所新产生的实时数据;最后是影响教学活动的一些外在数据(如天气、假期、人际关系等)。数据采集策略,主要是涉及实时采集数据时,各种数据的采集规则,采集频次,采集范围等。
数据集成层:这一层包括了数据清洗和数据整合。由于数据在采集过程中由于某种原因造成数据有误,数据清洗可以发现并纠正数据文件中可识别的错误,包括检查数据的一致性,处理缺失值和无效值等。数据整合把在不同数据源的数据收集、整理、清洗、转换后加载到一个新的数据源中,为数据的使用者提供统一的数据视图。

Figure 1. Architecture diagram of big data platform
图1. 大数据平台架构图
文件存储层:对特有数据类型的数据以文件的形式进行存储,成本较低,共享性高。
数据存储层:数据存储层主要考虑数据计算时采用的不同的计算模式,而对数据采用不同的存储体系,便于数据计算。如采用MapReduce/Yarn编程模型,即采用Hbase存储,Samza/Storm编程模型,即采用Redis存储。
编程模型层:选用合适的编程模型,用于大规模数据集的并行运算,例如MapReduce编程来实现对数据集的并行运算,计算出相应的中间结果。
数据分析层:针对数据计算出的结果,根据需求做进一步的数据分析(Hive),得到有价值的信息。
数据应用层:将数据分析层得出的结果应用到电力教育培训实践活动的各个环节,如培训计划的生产,培训资源的合理配置等实际应用环节。
基于教学培训大数据平台,我们可以实现从源数据层、数据集成层、文件存储层、数据存储层、编程模型层、数据分析层到数据应用层的有效管理与开发应用。基于此平台我们可以充分挖掘大数据的潜在价值来有优化我们电力教育培训活动的各个环节,进一步提高整个教学培训的质量。
3. 电力教育培训大数据平台应用及分析
基于电力教育培训大数据平台,可以搭建起以培训服务为核心,后勤服务为保障,综合服务为辅助支撑的整个应用服务体系,如图2所示。
培训教学是电力培训的核心业务,面向培训中心员工、学员、培训师提供全方位的服务。面向中心层面,培训课程管理实现了对培训项目的全过程监控,对培训过程的全面的数据及信息化支撑。面向学员、培训师层面,网络课程管理提供了学员在线学习、培训师在线授课的互动交流平台。培训媒体资源库为培训提供了强大的数字媒体资源。后勤服务是培训项目、培训中心各项工作正常运转的保障。针对

Figure 2. Application system based on power education training big data platform
图2. 基于电力教育培训大数据平台的应用系统
培训项目,提供餐厅管理及客房管理及相关工作衔接。针对培训中心其他工作,主要包括物资采购、管理等。综合服务主要是对培训中心其他非培训教学工作的支撑,主要包括培训部门管理、党务管理、综合管理等。
基于电力教育培训大数据平台,通过培训服务、后勤服务和综合服务,可以形成包括学员库、师资库、课程库、课件库、案例库、培训室数据库、餐厅数据库、客房数据库、专题资料库、共享文档库等的强大的业务数据。通过对业务数据进行整理、挖掘、分析,可以实现对电力教育培训活动的各个环节实现综合管控,从而实现电力培训的智能决策。电力教育培训大数据平台可以应用到电力教育培训的相关的各个环节。
3.1. 培训过程智能改进
在培训过程中,可以通过对视频监控大数据分析,如:学员使用手机情况、提问及回答问题情况、课堂说话情况、进出教室情况等,以及学员学习成绩、培训师评价、服务评价等大数据的挖掘、分析,对培训学员培训过程的学习效果进行有效评估。同时在培训后通过对培训学员的工作岗位调整情况、职称晋级情况、绩效考核情况等数据的分析,进一步对培训效果进行跟踪评价。从而依据培训学员层次、培训师资情况、培训课程体系等,可以实现全面、合理、有效地培训评估体系。
3.2. 资源智能调度统筹
通过对历史培训大数据的分析,如:班级数、班级人数、师资安排、课程安排等,依据培训项目的时间需求、各类资源的实际情况、培训课程的紧急程度与优先程度等,实现培训课程的智能排程,辅助培训项目的整体规划。综合培训师的讲解情况、课堂管理情况、精神面貌以及网络课程的学习情况等数据分析,实现智能的师资、课程推荐,辅助培训方案设计。同时结合后勤服务、综合服务相关数据分析,辅助培训实施有效开展。从而可以实现培训过程的有效改进。
3.3. 培训效果智能评估
通过对培训教材使用、培训室使用、培训时间、多媒体设备使用、餐厅学员流量、客房入住流量等历史大数据的分析,依据培训项目的资源需求、时间约束、紧急与优先程度等,可以实现培训资源的合理利用,智能统筹。
4. 展望
基于电力教育培训大数据平台的应用,能够实现电力教育培训的合理配置、精准培训,从整体上提高电力教育培训的质量。随着大数据的深入发展以及大数据技术的深入研究,大数据在电力培训中的应用也将越发广泛。深度融合大数据、云计算、移动互联和人工智能等技术,电力培训也将实现从依托培训师个人水平的授课培训向依托知识库的定制培训模式转变,从提供无差别的标准服务向提供多层次增值服务转变,从传统的独立运营模式向虚拟化协作运营模式转变,从而实现向互联网+的培训教育模式转型。
基金项目
国网四川省电力公司群众性创新项目(大数据技术在教育培训中的应用研究,521922180002)。
参考文献