1. 引言
教育信息化发展已经步入“数字化校园”迈向“数字校园、智慧校园的时代”,通过数字化转型不断向“智能校园”、“孪生校园、元宇宙校园”的目标过渡。但是我校在迈向数字化转型中困难重重,面临数据私有化、数据冗余度高,重复数据采集,标准五花八门、数据共享交换难、数据无法资产化,数据隐私泄露等等问题。学校业务系统由原来的17个增至41个,数据资源不断丰富,虽然有软硬一体的安全防护手段,但是数据安全问题还是层出不穷,数据作为学校发展的立足点,在数字化转型的大方向下,我们更应借助各种资源、工具和策略做好数据治理和数据安全防护。
学校数字化治理的本质在于治理,在方法和手段上运用数字化技术作为支撑,不仅要从技术性的角度衡量,还要清醒地认识和正确把握“数字化”与“治理”之间的关系,“数字化”作为手段,要服从和服务于“治理”。不断推动高校数字化治理能力提升,坚持问题导向、服务导向,在智慧化校园基础上,运用数字化手段和措施解决部门壁垒、部门协同、数据孤岛问题,从整体性、全局性的角度出发,将思维延伸至数字化建设中,有效整合校内业务平台和数字化资源,协同各部门力量形成强大的治理能力,满足师生的业务需求,不断提升师生的信息化认同 [1] 。秉着数据可用不可见、数据不动、程序动、分享价值不分享数据的原则,在数据治理基础上进行数据分析,在数据中台上把校内资源价值充分展现,并发挥其最大作用。
2. 数据治理
在数字化校园基础上建设上转变思路,在以流程为核心,以规则为基础,以管理为目标的传统理念上,转向以数据为核心、以流程为基础、以服务为目标的新理念,数据资源坚持“用”字当头,平衡处理好数据资源,进行数据治理和数据分析,确保数据安全,如图1为数据治理框架。
2.1. 管理机制
学校成立网络安全和信息化办公室和建立信息化项目全生命周期管理,加强对信息化建设项目的统筹管理和宏观指导,制定管理制度和管理规范,做到“凡事有章可循、凡事有据可依、凡事有人负责、凡事有人监督”,在党委统一部署下进行,在网络安全信息化领导办公室统一协调下,以管理和技术双管齐下推动数据治理体系建设。如图2。
1) 学校成立网络安全和信息化办公室,统筹协调信息化工作。
2) 学校成立数字化治理工作组,各业务单位负责人为工作组成员,负责具体落实相关措施,确保各项任务落实到位。
3) 学校成立数字化治理专家组,成员由校内外的信息技术专家、行业系统专家构成,开展数字化转型重大问题研究,为学校数字化转型提供决策咨询,并指导相关方案的实施。
4) 学校建立《学校信息标准规范》《网络与信息安全管理办法》等相关制度体系,明确责任,推行标准,保障安全。
2.2. 设计理念
1) 顶层设计数据治理体系架构,以校园基础设施为依托,业务应用为方向,不断完善数据标准以及“一数一源、数据确权、数据共享”原则,构建学校数据中台,逐步实现学校全域数据中心,为构建学校数据大脑、大数据应用、大数据分析、元宇宙校园等奠定基础 [2] 。
2) 整合数据资源、建立一张表平台,构建学校全链条高效数据链路体系,实现学校各业务系统“环环都打通、事事可衡量”的业务闭环,实现学校业务系统的全链条数字化,解决部门壁垒、部门协同、数据孤岛等问题,保证数据的一致性,实现全域数据在多场景下的高效复用,实现业务边界清晰、权责明确、表格只填一次、办事只跑一趟等具体目标 [3] 。
3) 提升数据安全能力、完善数据安全保障体系。以校园数据的各个生产要素为基础,建立数据流动和网络传输通道大模型,从数据的产生–存储–应用等流程,分析数据的产生环境、存储机制、应用情况从而理清数据生产要素,建立数据溯源体系,分析数据从哪里来到哪里去,以及倒查回溯数据的源头,针对性的实施相关数据安全策略,确保数据资源安全共享,从而适应新时代、新形势、新任务下的新要求 [4] 。
4) 做好数据管理,数据管理的核心目标是学校治理能力和治理体系现代化,管理服务信息系统应实现数据融合、互通共享,构建一体化信息服务平台,做到数据集成互通、数据融合共享、办公事务协同、业务一网通办、报表自动生成、数据支撑管理决策。
2.3. 方法步骤
依据标准规范在智慧校园基础上对全校数据建设、管理和使用过程进行顶层设计、总体规划。依据国家标准、行业标准要求,结合学校业务现状,制定《学校信息标准规范》等标准,作为数据治理工作的指导原则,从原有20项标准,增加至100项,涵盖学校11个子类标准(包括:人事、学工、教务、教学、科研、财务、关键基础设备等),2000个标准代码,完善信息标准10类200项,建立元数据标准2类共10个,构建一数一源标准,规范体系建设。
1) 数据调研:对学校各部门组织架构、管理机制、管理信息系统、数据库现状进行深入调研,对数据的供需关系、共享交换要求、数据质量问题等进行深入了解。
2) 数据采集:通过数据汇聚组件对各业务系统的数据进行采集,存入共享数据库,等待清洗治理。在数据中台上对各个业务信息资源进行收集,具体过程为使用数据传输协议,将所采集到的基础业务信息数据发送到数据队列;数据队列对数据进行分类处理,区分实时数据与非实时数据,非实时数据存入存储计算平台,实时数据交由实时分布式数据库进行处理;也可以通过离线采集和文件导入的方式完成数据采集与汇聚工作。
3) 质量管理:通过数据质量管理组件对采集上来的数据进行质量检测,并形成数据质量分析报告,对存在质量问题的数据进行修复、纠正,确保数据质量。
4) 数据共享:建立数据分析模型,通过离线开发或实时开发对标准数据仓库的数据进行分析计算,形成数据分析产品,支撑各业务领域数据综合分析需求。
在智慧校园支撑平台上建立数据中台,构建校内全量数据中心,开展数据治理,实现数据采集、清洗、存储、应用全生命周期的闭环管理,打破各部门的信息壁垒,实现数据共享与融通。围绕师生日常业务办理需求,梳理办事流程,消除信息孤岛,构建校园网上办事与服务大厅,将办事、查询、系统等综合统一到平台进行管理,提高师生办事效率,如图3。
校内各个业务和节点的数据信息通过网络层进行传输,将各个业务数据和样本参数进行积累构成数据信息库,形成数据链,在线或离线导入数据中台,在数据中台针对采集的数据识别和记录,通过元数据管理工具进行来源标识,通过身份鉴别机制等技术防止数据采集点的仿冒或伪造,对内部和核心数据使用身份认证技术对传输用户进行确认,记录传输日志,日志审核,通过数据防泄漏技术保障数据传输安全,使用数据脱敏技术标识内容,对敏感数据进行数据转换变形等数据操作,确保数据安全治理体系中数据处理符合等级保护要求 [5] 。
3. 数据分析
3.1. 基础数据分析
数据中台汇聚了部分所需数据,针对学校特殊的应用进行数据分析,重点研究业务系统的结构化数据,对已有的结构化数据进行分类,针对特有属性,把数据分解成较简单的组成部分,并定义变量,在进行聚合运算 [6] 。
1) 通过聚合运算在数据中台上建立统一数据接口,数据的来源以人事系统数据为标准,同步教务、学生等业务系统。
2) 关键基础设施,如服务交换配置、资产配置、日志信息等在数据中台平台进行聚合和通过相应算法自动分析。
3) 在数据中台上对校内各个安全设备安全漏洞库、密码库、特征库等相关数据聚合,通过内置算法构建统一特征库和漏洞库。
3.2. 数据分析误区
在数据分析时,X因素很多,很多因素是可以避免的,在数据传输过程成,通过物理层隔离、网络层限制、应用层阻断等相关技术手段可以有效杜绝相关误区,尽量的得到最准确的数据资源,针对校园特性,明确在数据分析的过程中数据的血缘关系,找到数据关键性的指标,汇聚各个业务系统的数据字典,并在数据中台上实时同步,形成流程性处理模型,搭建指标体系,指标字典,最佳实践–数据指标拆解方法,排查异常指标。
3.3. 数据分析方法
在数据共享平台上对结构化数据和API、XML等半结构化数据进行解析关联,进行数据分析,形成数据报表。
数据分析法有聚类分析、特征数据分析、相关性分析和人工神经网络等方法,其中聚类分析法主要针对相似性采集信息数据实施有效分类和科学分组,促进相关信息按照分段形式展现。在学工系统和教职工系统,此类系统都是借助于在人事架构的基础上产生的相关数据,通过该种方法分析各种杂乱数据信息,结合分析目标对各种数据信息实施科学分组,并结合各种数据集内在联系提取有用信息,明确信息价值。
但是在实施聚类分析中存在一定问题,其学工和教务系统数据具有个性化特征,导致数据统计无法进行合理分析,影响数据识别。人工神经网络分析即通过模拟大脑神经网络的信息存储、处理方法,对原本混乱、复杂的数据信息实施全面抽象分析,顺利接收计算结果,提取价值信息。通过基于数学模型形成的人工神经网络技术通过创建全新算法,将神经网络数值输入其中。采集各种数据信息中联系现实需求合理分析相关数据,通过数据分析保障人工智能技术合理应用。相关性分析即借助大数据对数据库内各种数据联系实施科学分析和揭示,借助相关性分析可以帮助针对所采集信息数据实施科学分析,深入挖掘处理各种隐藏信息,准确辨别隐藏数据唯一性,应用该种方法具有较高准确性和目的性,同时可以支持数据进行精准分析 [7] 。
为进一步提高大数据识别简易性,需要在实施大数据识别中对相关搜寻数据信息进行完整、全面描述,但对于大数据识别网络的描述也具有重要作用。除此之外,因为大数据最终输出结果为基础数据集,需要对相关操作进行合理定义,进一步迎合用户多样需求,为此需要准确把握大数据识别主要数据来源。
4. 数据安全
1) 数据共享保障
在数据共享数据中台上管理和控制高密集数据流向低密集业务,建立数据共享体系,对共享数据可能造成安全影响范围环绕程度进行风险评估评判,对共享数据及接口进行共享检测,对数据所有操作行为都有相应日志记录,对操作行为及数据流进行审计,辨别高风险行为,提供数据完整性、数据可溯源。
2) 健壮数据资源
校内数据可用不可见、校内数据使用权和所有权相分离,责任分离,谁使用谁负责,设置相关人员作为管理权、操作权、审计权、监督权。业务部门负责使用,但不负责管理,尤其是一些敏感数据,对其不开放相关接口,做到数据库自主可控,保障校内数据的安全。对数据资源的合法性进行甄别,外联资源进行控制,建立安全特征库和安全漏洞库。总的原则是分享价值不分享数据,对于较好的数据资源推广相关价值给师生,但是其元数据和敏感数据不外漏。
3) 建立数据安全生命周期,理清数据治理、数据安全、数据要素的关系
依据安全能力成熟度模型(DSSM)将生命周期分为采集、传输、存储、处理、交换和销毁6个阶段。对数据在从采集到销毁的生命周期里进行安全管理,对数据分类,分级定制不同防御保护策略,建立数据安全体系结构和组织机制保障对数据全生命周期形成完整的安全管理和控制,包括保密性、可用性、完整性、数据身份鉴定识别、安全审计、验证可信性、防范入侵、防范恶意代码、数据的备份、数据的恢复、保护剩余信息、保护个人信息保护等安全控制点 [8] 。
4) 数据销毁机制
建立销毁机制,用可靠、有效、不可逆的销毁技术保障被删除的数据和被销毁的信息不能被还原,具体为逻辑数据销毁和物理销毁。逻辑销毁使用低级格式化、扇区破坏等方式,物理销毁使用消磁、盐酸滴注、焚毁等方式。对敏感数据和鉴定审核等信息数据的硬盘,移动存储、磁盘和光盘等存储设备在被清理或者再次使用前要完全清除数据。
5. 实施效果

Figure 4. Data governance effectiveness analysis
图4. 数据治理效果分析
学校在数据治理推进工作中始终以服务师生应用,驱动数据治理,用数据来说话,用数据来衡量,秉持数据思维;在推进过程中信息队伍人员全员参与协同共建共享,持续推动数据与业务的深度融合,持续推进业务系统用起来、通过校务数据融合,撬动学校教育教学、科学研究、管理与服务模式变革 [9] 。
1) 针对学校信息化发展过程中的“数据孤岛”问题,以人事系统为标准,建立学校数据标准体系,学校成立网络安全和信息化办公室并建立了数据管理制度,完善推进数据的分级分类和开放共享,实现校级层面数据资源的统一集中治理。
2) 为推动实现数据中心数据对外提供服务,完成数据共享交换治理平台,建立统一的数据共享服务接口标准,为不同应用提供统一的数据共享服务。
初步完成人事概况、学生概况、人员动态、教学概况、图书概况、科研概况、校园卡消费概况、资产概况等8个校情看板,为师生提供数据平台支撑科学决策。如图4。
6. 未来展望
为了进一步推进学校数字化治理能力的提升,还需要从汇聚数据资源、建立数据服务机制、完善数字化治理评价体系等方面努力 [10] 。
1) 进一步地利用数据资源开展数字化治理工作;进一步整合结构化业务数据和其它半结构化数据,实现数据资源的价值最大化。
2) 进一步构建数据服务工作机制,对学校数据资源不断加工处理,在数据中台上,不断增加轻服务、微服务、通过低代码方式服务于师生。与此同时把数据分析结果呈现给不同部门、不同学校,大家协同参与共建共享数据,不断探讨数据服务模式和内容,充分发挥数据价值,满足不同类型用户和应用的数据需求。
3) 不断完善学校数字化治理评价体系,引领学校的数字化治理工作,提升学校数字化治理的能力和水平。
数字化转型工作不是一蹴而就的,管理和治理是关键,管理变革永远在路上,数据治理永远在路上,必须在全校一盘棋的基础上,强化信息化一盘棋,通过沟通、协调、配合、联动等全方位的运作,促进信息技术与学校业务的全面深度融合,才能不断提高各个业务的应用水平,不断增加信息化对学校发展的贡献率,推动伊犁师范大学数据治理工作的数字化转型与升级。
基金项目
伊犁师范大学校级科研项目(2023YSYY005)。
参考文献
NOTES
*通讯作者。