1. 引言
在冰雪经济蓬勃发展的背景下,亚冬会等大型国际活动的助推下,黑龙江特色文旅产业找到了新的发展契机,特色历史文化景区受到了前所未有的好评和关注[1] [2]。如何应对旅游热门景区和地域历史文化网红打卡地的科学管理统筹规划问题,已成为一项亟需解决的热点问题[3]。景区能耗预测在运营管理和资源配置中起着关键作用,准确地预测景区能耗可以帮助优化能源使用,提高能源效率,减少能源浪费,并且客流与文旅变化趋势为特色历史文化景区的发展规划和绿色低碳持续发展提供决策支持。然而,由于景区系统的复杂性、不确定性和动态变化性,传统的能耗预测方法往往存在准确性不高、模型复杂度高和对专业知识依赖程度高等问题[4]-[6]。近年来,深度学习技术的快速发展为解决文化景区能耗预测问题带来了新的机会,深度学习算法具有强大的特征学习和模式识别能力。随着近些年机器学习算法的不断发展,虽然基于各种各样的机器学习算法并利用景区能耗历史数据可以建立预测模型从而预测出未来一段时期内的用电能耗,但由于景区种类多样、运行特点不一,导致没有统一的标准来指导管理人员针对不同景区类型选择适合的机器学习预测模型,增加了管理人员建立用电能耗预测模型的困难程度[7]-[9]。
文化景区的能源消耗被许多因素所影响,例如天气情况,游客数量,公共设施应用用电器要求,入住率等。这些较复杂的情况都使景区用电特征预测的难度一直处于较高水平,而基于Python、Java的建筑用电特征预测技术在近些年受到较高的期望,并且基于Python技术在此方面更具有灵活多变的特性,更加适用于在多变复杂的周围环境下进行精准的测量与预测[10]。本文使用Python语言、机器学习、TensorFlow、长短期记忆递归神经网络及相应技术和环境来完成主要功能实现,主要可以完成对预测目标建筑用电量预测和准确度,还可以对数据集数据、数据箱型图、数据稳定性归一化和数据预测效果进行可视化,进而明确清晰地为用户呈现目标景区的相关用电特征。本文对使用者所反馈的可视化结果,意在使其通过这些具有现实意义的用电特征来对目标景区未来一段时间内的用电量有一个清晰,明确的认识,这样能有效帮助景区在统筹规划管理等方面发挥重大意义。
2. 系统技术分析
本文主要采用Python语言开发,通过机器学习等方法对用户提交的用电量等特征进行训练并以此为前提,得到对未来一段时间用电特征分析结果,以此结果可以让用户了解当前景区用电特征和未来用电计划。
2.1. Python语言
Python被定义为一种解释性编程语言,不同于C和C++等其他编程语言,它的代码运行速度虽然会稍慢一些。但正是因为Python具有解释性这种优秀的特性,使得它能够具有编写速度快、调试简单等优点,而这些优点都是能够提高编程人员开发速度的重要特性。Python本身还具有极高的可扩展性,所谓扩展性就是它并不是所有的功能和特性都被集成到语言核心,而是分为了许多各种各样的“库”。Python提供了丰富的工具和程序之间的接口,这样可以让使用者能够轻松的使用C或C++等语言来扩充模块库,这些基础的代码库覆盖了常规使用的绝大部分领域。
Python还具有软件质量高、开发速度快、功能强大等优点,但也有许多缺点。其中最严重的就是使用Python所编程的代码是不能被加密的,这无疑与其他语言的加密性形成了鲜明的对比。当需要发布编程程序时,Python只能发布源代码,而像C语言等其他编程语言只需要发布程序相关的机器码就可以从机器码反推出代码。
2.2. TensorFlow框架
TensorFlow是完全基于Python而设计的开源软件,其设计初衷完全是为了以最简单的实现方式来完成机器学习和深度学习的各类任务,在一般条件下,为用户提供一定程度上的在各类程序接口之间链接的帮助,这就是Tensorflow的设计目的。而且TensorFlow还融入了数学代数等优化操作,这样可以让用户使用TensorFlow来计算和表达出各类数学表达式。
TensorFlow还可以完全运行深度学习网络等其他进程,并完美的在各类场景下运行出精准无误的结果,甚至在图像处理、递归神经网络和自然语言处理等需求下可以达到其他Python拓展库所达不到的水准。Tensorflow最大的优点是可以在多个GPU或CPU上灵活运行,甚至在移动端操作平台(比如安卓操作系统或IOS操作系统等)上也可以完美运行,它建构的灵活性,使它还具备了优秀的可扩展性,可以在各类网络模型(比如TCP/IP网络模型或OSI网络模型)上被支持。
2.3. 长短期记忆递归神经网络
长短期记忆递归神经网络又称为Long Short Term Memory (长短期记忆),简称为LSTM,是一种特殊的递归神经网络,属于神经网络中的全链接层。长短期记忆递归神经网络与其他的前馈递归神经网络有所不同,它可以通过分析时间序列对用户输入字符或其他类型的字符串进行处理。简单来说,当用户使用前馈神经网络时,它会自然而然地认为用户在前一秒的输入内容与以后所有时间内输入的任何内容都是完全不同且无关的。对于大多数情况,这种处理方式是完美的,但在自然语言处理或其他需要连续处理数据的情况下,只有合理的运用输入之前的内容、正在输入的内容来处理正在输入之后的数据就可以更加合理的使用用户所输入的数据信息。递归神经网络就是这样运用时间维度上的信息来处理各类问题。递归神经网络存在一个很大的缺点,那就是当前仍缺乏预测精度高、泛化能力强的短期预测模型。而长短期记忆递归神经网络的设计初衷就是为了解决上述的数据中普遍存在的长期依赖问题,使用LSTM可以有效的传输和表示长时间序列中的信息并且不会导致长时间前的有用信息被忽略。
3. 预测功能分析与设计
本文基于机器学习进行开发,Python语言实现,以黑龙江省典型历史文化景区为研究案例,使用长短期记忆递归神经网络等技术预测并分析景区用电能耗,在运行前需要收集目标景区一段时间内的用电量作为数据集,并将数据集以8:2划分为训练数据集和测试数据集,随后通过再一次对特征数据集和标签数据集进行细致地划分,在经过数据集缺失处理,数据集异常处理等操作后对数据集所反映出的景区用电特征进行可视化处理形成预测图。
3.1. 预测功能实现过程
本预测方法是在经过严谨的市场调研和采访用户需求的基础上所设计的各类实现功能,其中主要包含根据已经输入的数据来针对未来一段时间内用电数据的预测及所输入数据在相应时间内的波动情况。程序内实现的功能及结果完全足够让所使用者明确该景区的近期用电情况。
基于Python语言及相关功能结合机器学习和长短期记忆递归神经网络的景区用电特征预测分析功能实现具体步骤如下:
步骤一:将记录特定文化景区的近期一段用电数据记录在特定格式的文件中并放置在指定的计算机内存位置。
步骤二:使用由Python语言编写的景区用电特征预测分析的编程程序对指定文件数据进行处理并输出预测结果和数据波动情况。
步骤三:多次重复运行该程序并统计实验结果,使用数学统计等方法计算出该景区未来一段时间用电特征的平均值作为该景区未来用电特征结果。
步骤四:对景区用电特征预测结果进行可视化处理,在预测结果图呈现出预测的效果后程序结束。
3.2. 预测功能实现分析
本预测系统实现的功能,主要分为用户提供数据集在规定的时间跨度内的数据分布可视图,数据分布可视化箱型图、数据稳定性归一化可视图、数据预测效果可视图、数据预测结果可视图。在使用本预测功能时,需要先将Python及相关环境(例:Tensorflow、Numpy等),把应该使用的数据收集好后放置在程序指定的位置,在程序校对完成后就可以开始对目标景区进行预测。由于本文实现功能主要是对景区用电特征进行预测,所以数据集中的数据时间和总用电功率两项数据需要由用户收集或其第三方应用进程收集并以test.csv的格式存放在指定位置,在完成上述操作后即可开始从数据清洗、数据划分、结果可视化等工作。上述说明的流程结束后,数据就可以正常进行划分,预测等操作。操作步骤具体为:首先划分训练集和测试集,构造标签数据集和特征数据集,构造批数据,数据清洗,归一化处理,预测模型编译,预测模型验证,预测模型测试,最后是预测结果可视化。
4. 系统测试结果与分析
4.1. 系统数据集的选取
本预测系统数据集的选取主要是通过对黑龙江省多个典型历史文化景区日常运营所常见的总用电功率进行抽样统计,并对近几年的用电量都进行采集和测试,最后筛选出了常见景区类型的用电数据集为本系统所用数据集以达到对各类景区的用电特征进行预测分析的目的。本系统设计理念是想通过输入数据集来对当前景区用电特征等数据进行快速、准确地预测,所以在选取测试使用的数据集时选取了不同景区不同年份的用电数据集作为测试数据集,并且通过多次实验取平均值等方法,意在通过选取的数据集得出的结果符合一般景区运营实际。
在测试阶段选取的旅游淡季代表的是客流稀少时段和小型景区等规模有限的景区公共设施,此类景区具有用电总量小,突发用电功率大,用电时间比较短等显著特点,与之对应的是大型文化旅游景区,此类景区代表的是建设规模较大和客流量长期处于高位的等大型文化历史景区,其具有用电总量大,突发用电功率小,用电时间很长等特点。此两类数据集的选取基本可以代表现在大多数景区的用电数据,因此本系统的测试结果和规律很有代表性。
4.2. 系统测试可视化界面
本预测系统在进行数据预测测试前,配套准备了适合本系统调试的相应GUI界面,在以后此系统投入正常使用时,用户可以通过此GUI界面来达到查看对应预测结果图,包括:数据分布可视图、数据稳定性可视化箱型图、数据稳定性归一化可视图、数据损失函数可视图、数据预测效果可视图、数据预测结果可视图。本系统测试使用的GUI界面通过ImpleGUI和CV2两类扩展库实现,在页面表现过程中将原本测试中以次展现的结果图以图片的形式存储到系统程序内,在GUI界面中设置选项来调取相应测试结果可视图。
在使用本测试阶段使用的GUI界面调取景区用电量数据集时需注意选取数据集的时间跨度,由于本预测系统的测试原理是使用数据集内部原本的时间跨度内的20个数据点来预测用户想要的一段时间内的用电量,所以在选取数据集时,其内部的时间跨度对本预测系统的最后预测结果有着很大的影响。在使用GUI界面选取完数据集后,在本预测系统运行过程中,GUI界面会进入等待运行状态,在出现运行完成或运行结束的弹窗后,方可点击相应的想要查找的实验结果图。
4.3. 系统测试分析结果
4.3.1. 数据集可视化
本系统测试阶段,首先对测试数据集进行数据录入和数据划分,对不同时间跨度的数据集数据进行可视化,以某景区2023年全年的用电量分析为例,其可视化结果如图1所示。
Figure 1. Visual map of annual electricity consumption data distribution in a scenic area
图1. 某景区全年用电量数据分布可视图
4.3.2. 数据集数据分布
本系统测试阶段,针对数据集提供数据分布情况分析主要通过箱型图来展示,可以通过箱型图的对比来进一步展示数据集内数据的分布情况还可以解析出数据集的集中趋势、偏度和散布,以及突出异常值。可以从景区用电数据集可视化箱型图中观察到数据分布较为离散,异常值比较多,这说明了本系统测试所选取的景区用电特征随着文旅游客数量与季节变化具有用电量忽高忽低的明显变化特征,用电量在所选取时间跨度内并不稳定等特点,具体数据特征如图2所示。
Figure 2. Visualized box plot of stability of electricity consumption data in a scenic area
图2. 景区用电数据稳定性可视化箱型图
4.3.3. 数据稳定性分析
本系统测试阶段,针对数据集提供数据稳定性分析主要通过数据归一化可视图来展示,可以通过归一化后的图像来进一步展示数据集内数据在给定时间跨度内的数据特征表现。可以从用电数据集归一化可视图中观察到景区用电数据分布忽高忽低,且数据线性变化幅度较大,这进一步说明景区用电量较为不稳定、随季节与客流变化较大等特点,具体数据归一化可视图如图3所示。
Figure 3. Normalized visualization of the stability of electricity consumption data in a scenic area
图3. 景区用电数据稳定性归一化可视图
5. 结论
随着我国经济的快速发展,各类历史文化景区的能耗总量不断攀升,由此引发了各种各样的问题,其中以景区可持续发展问题尤为突出,在以节能减排为背景的当下,本文研究的系统能够恰好迎合时代需求。本文所讨论的预测系统主要通过用户提供的景区用电量来对未来时间的用电消耗总功率进行预测。预测系统主要基于Python编程语言设计,由机器学习,TensorFlow为框架和长短期记忆递归神经网络等技术实现对不同景区特征的用电量数据集进行数据训练,建立模型,模型训练和结果可视化并反馈等操作,以实现对景区用电量的准确预测。以景区历史能耗数据为数据集进行输入,采取机器学习,长短期记忆递归神经网络等技术对所输入数据集的景区能耗进行预测,用所得到的数据反馈给用户,使用户能够快速,准确地得到当前景区的用电能耗情况。通过将数据集内的数据可视化和对数据集时间内的预测数据进行对比可以较为清晰的结果。通过分析景区能耗和分析系统的设计需求,确定了功能实现总体思路,把用户提供的历史文化景区用电特征数据集作为输入数据,在多次实现去平均值等操作后,能够得到景区的预测分析结果,为景区的总体规划与发展提供科学依据。
基金项目
黑龙江省高等教育学会2023年高等教育研究课题(23GJYBB207);2024年度黑龙江省教育科学规划课题研究成果(GJB1424196);黑龙江省省属高等学校基本科研业务费科研项目(145409402);2024年齐齐哈尔大学教育教学改革研究项目(GJYJYB202401);黑龙江省高等教育教学改革研究项目(SJGZB2024187)。