1. 引言
气象数据最早可追溯到19世纪50年代,沙皇俄国同英法两国在巴尔干半岛爆发了克里木战争,在黑海展开激战时,风暴突然降临让没有心理准备的英法舰队险些全军覆没。之后对战时的天气进行复盘将气象数据进行分析绘制成天气图得出了风暴的来源。
现如今气象发展与计算机密切结合,在气象数据的处理加工、数据分析、可视化提供了便利,能够快速处理海量的气象数据得出结论,训练大气动力模型和数值天气预报模型提升对天气预测的准确性 [1] ,可视化气象数据生成图表、动画、仿真模拟加强对气象的理解。
气象业务高速发展的同时一些弊端逐渐显现,日常业务中受到网络攻击,数据传输时出现丢包,数据备份造成网络拥堵等影响气象业务的准确性和时效性。本文针对气象数据在传输过程中出现数据丢失、网络拥堵和数据传输的问题展开讨论,通过拓宽双通道线路利用LZ77 (数据压缩算法)算法和数据压缩并行传输提升数据的传输速率。第一节交代了研究的背景,第二节对现状进行分析,第三节对计算机与气象交叉应用进行介绍,第四部分对现有问题提供解决思路,第五部分得出结论。
2. 现状
2.1. 数据安全
2.1.1. 网络安全
网络发展带来便利的同时也增加了一些安全隐患 [2] 。气象业务系统每年都会遭受到多种网络攻击,造成网络拥堵数据丢失,网络维护对气象稳定发展起着重要作用,气象数据一旦被窃取进行非法利用造成损失将无法估量。现在如今,利用气象数据可人为的制造自然灾难,对一些地区进行精准打击,造成严重损失。
2.1.2. 传输过程中缺失
气象数据的完整性和准确性对于保障信息安全推动科技进步促进社会发展都至关重要。数据丢失对气象资料分析可能产生较大的误差,进一步影响训练气象模型对分析特殊天气造成影响。然而,数据传输中的缺失问题却层出不穷,信号干扰、传输延迟以及网络拥塞等问题均可导致数据包丢失或损坏,不仅如此数据传输过程中的人为操作失误也是导致数据缺失的重要原因之一。无论是操作人员的疏忽还是技术设备的故障,对气象数据保持的完整性都是不可逆的。
2.1.3. 历史数据
气象数据库中不但要存储每天的天气变化信息,而且历史数据也要安全保存。通常历史数据是指过去某一时期某一地区的气象数据记录,包括温度、湿度、降水量、风速等天气要素,可用于研究气候变化、天气模式预测、农业生产、交通运输等方面,对于各行各业都有重要的作用。这些重要的天气数据通常由气象部门或相关机构收集、整理、存储,并提供给需要使用的人员,集合了许多气象先辈的心血。
历史的气象数据占有海量的存储空间,备份难度大,通过网络远程传输存在安全隐患和不稳定性,因此气象部门通常利用磁带库备份送至备份点进行挂载拷贝大大提升工作效率和数据的安全性。
2.2. 安全隐患
2.2.1. 网络安全
气象高质量发展与计算机的联系日益紧密,由此衍生出一系列安全隐患。在同一部门系统中,为了方便办公,通常会多人共用一个业务账号来处理科室工作,这不但增加了业务账号被盗的风险而且也不利于统筹管理,因此需要一人一号,根据工作内容授予权限,保障气象业务系统安全。目前为了满足气象业务多元化每个地方的气象部门需同时使用多个业务系统。例如,气象业务共享网、天擎、天镜、气象信息综合监控平台等。
多个业务账号便于记住密码,通常会使用相同的密码,对于使用频率高的系统甚至会采用记住密码的策略方便下次登录系统,这样的使用方式增加了多个系统的被盗用的风险。为了提升系统的安全不但需要提升密码的复杂性增加身份认证减少多个账号使用相同的密码而且还要及时更新系统获取最新的安全补丁,提升系统耐攻击性 [3] 。对于来源不明的链接谨慎点击,特别是陌生邮件可能隐藏恶意软件和病毒导致气象数据信息泄露业务电脑感染病毒。
2.2.2. 数据丢失
气象业务的开展大都在线上进行,当出现网络拥堵、网络波动、设备过载、安全漏洞甚至断网,数据将会丧失完整性。网络故障问题有很多影响因素,排查分析可以从软件到硬件逐步开展,对于流量过载导致的数据包丢失可利用QoS (质量服务)合理分配带宽升级设备驱动,如是硬件问题则需及时更换新的网络交换机路由器等的设备。为了减少在数据传输过程中的丢包现象,尽可能使用VPN安全加密后进行传输。
鉴于以上存在的问题,本文研究主题聚焦于计算机技术在气象服务中的应用。通过引入先进的计算机技术优化数据处理和分析流程,提高数据传输和网络安全能力,增强数值模拟和天气预报的准确性,改善气象信息系统数据传输出现的网络拥堵、数据丢包的问题。
3. 计算机在气象中的应用
计算机技术在气象服务中的应用
计算机技术在气象服务中的广泛应用,成为提高气象工作效率加强监测预警能力提高气象预报准确性的重要工具 [4] 。计算机软件技术与雷达探测、卫星、自动站观察相互结合的方式,为气象预测提供丰富的演算资料。预测天气预报和人机交互平台及天擎实况专线保障,形成了以气象通信网络、高性能计算机、卫星数据海量存储的实时气象信息系统。气象数字化和现代化与计算机密切相连,提升了气象服务质量和天气预测的准确性。
数值模拟和数据处理
气象模拟是通过观测站观测设备收集气象要素,利用计算机对大气、海洋等要素进行数值模拟,推演未来天气的变化信息。随着计算技术和探测技术的进步,传统的天气预报方法已经得到了改进,引入了数值预报方法,并结合了气象雷达和卫星探测资料。利用数理统计原理和大气物理学原理,实现了对大气质量、能量和动量守恒原理的预测,显著提高了天气形势预报的准确性和客观性。
气象观测站每天采集的气象数据温度、湿度、气压、风速和风向等信息,传输到气象中心或其他数据处理中心进行分析处理,以提取影响天气的信息,分析数据的过程涉及统计方法、数学模型和计算机技术。计算机在数据存储、处理和分析方面有明显优势,能快速准确地处理数据,为气象科学研究和预报提供支持。
气象雷达和卫星监测
气象雷达是一种主动式微波大气遥感设备,专门用于探测大气变化、云图、降水等气象要素的基本情况,是监测和预报中小尺度天气系统(如台风和暴雨云系)的重要工具之一。计算机技术支持图像分析和解译,帮助识别天气系统特征。此外,计算机还支持气象模拟模型的运行和发展,通过数值模拟预测气象变化趋势和极端天气可能发生的情况。
气象信息系统
计算机网络和信息系统在气象服务中的应用使得气象信息能够迅速传递给需要的机构和个人,这包括建立气象信息数据库、开发气象移动应用程序等,提高公众获取气象信息的便捷性。以陕西省气象大数据云平台为例,为用户提供丰富的接口、算法和资料,获得授权就能按需下载对应的数据。小数据量的获取在客户端筛选关键词可直接保存,大数据量的获取使用系统提供的接口和SDK包,提供多种开发语言(如Java、Python、C/C++等),在Linux或Windows操作系统下批量获取数据。
4. 数据传输效率
4.1. 气象数据的精确性
气象数据的精确性受到多种因素的影响,包括观测条件、数据处理方法和模型的准确性等。因此,提高气象数据的精确性是一个综合性的工作,需要多方面的努力和持续改进。首先增加气象观测站点的数量,提高数据的覆盖范围减少数据的空白区域和不确定性,对观测数据进行校正和质量控制包括对数据进行校正,排除异常值和错误观测,并进行数据质量评估和验证。
计算机的发展逐渐取代了传统的数据采集方式,使得气象数据的获取更加便捷,数据源更加准确,处理数据更加高效。这些繁杂的数据会增加分析的难度,训练气象模型提升气象分析和预测结果的准确性 [5] 。用特定的算法进行训练建立模型,分析时传入对应的数据即可实现机器代替人工得出气象预测结果可视化构建气候变化动态图,即使不懂气象的人也可理解气候变化。
4.2. 拓宽双通道线路
随着气象业务的拓展,数据共享与传输的需求日趋提升,传统的单IP双线路的缺点越来越明显,所有流量集中在单IP上无法实现真正意义上的负载均衡。单网卡双IP是通过域名解析服务器作智能切换,一张网卡即可实现多个逻辑网络的隔离,方便维护和管理。优化网络架构和协议,提高数据传输速率,用以太网、光纤网络等高速网络设备,采用流行的网络协议和技术,比如TCP/IP协议、数据压缩和数据分流技术等,均可提升气象数据的传输速率。双网卡单IP与单网卡双IP示意图如图1。

Figure 1. Dual NICs with single IP addresses and single NICs with dual IP addresses
图1. 双网卡单IP与单网卡双IP
4.3. 专用带宽
专线实现互联网和数据网接入,将业务分部和总部连接实现统一管理。专线的拓展语音业务可实现单位内几百个电话内部通话及外部通话,单位内部采用内网通话减少电话监听,信息泄露的风险。利用专线开放80端口做单位内部网站定制接口外接其它平台,提升气象数据传输的安全性和稳定性,为气象部门多人使用提供便利。国家气象局与省级乃至地市级气象局之间铺设的专用线路,只提供内部独立使用其它的数据无法进入此线路,开通虚拟专用信道为用户保留一定的带宽,允许用户独享这部分带宽 [6] ,就像在公用信道上开辟了一个专属通道,只允许相应用户使用,并且用户的数据经过加密,确保网络安全可靠。
4.4. 数据压缩并行传输
气象数据的备份分为本地备份和异地备份两种,数据在备份时进行压缩不但能提升备份的效率而且还能减少带宽的传输压力。保密级别高的气象数据则需要借助移动存储设备为媒介运送至备份点进行拷贝挂载。备份的数据量较大时利用计算机技术进行压缩,减小数据传输和移动存储设备的存储压力,提高数据备份效率。
数据进行备份时,采用压缩算法设计模型对数据进行处理,减少存储空间的浪费。所谓压缩算法是指通过消除数据中的冗余信息和利用数据的统计特性来实现,主要用于数据清洗剔除空表。主流的压缩算法包括LZ77、LZ78、DEFLATE。LZ77是一种基于字典的无损压缩算法编码,在计算机文档存储和数据压缩中应用广泛,该算法针对过去数据进行处理包含动态窗口(Sliding Window)和预读缓冲器两部分 [7] ,前者主要用来存放输入流的前n个字节的有关信息,后者存放其对应的字节。LZ78算法与LZ77算法相反主要针对后来的数据进行处理,该算法首先对要输入的缓存数据依次进行对比扫描与字典进行匹配,无论是否匹配到都会将数据的位置、匹配的长度、匹配不到的数据添加到字典中。DEFLATE算法则类似于数据结构中的二叉树,该算法与树图关联,同时兼有LZ77算法与哈夫曼编码的一种无损压缩。根据业务的需要还可进行并行传输,将目标数据分为多个部分同时传输,这种传输方式一般采用多线程技术来实现,达到减少传输的等待时间对气象数据进行缓存的效果。
4.5. LZ77算法
LZ77是一种基于字典的算法具有唯一可译、无损压缩的性质,该算法将长字符串(即短语)编码成小标记,用小的标记代替数据中多次重复出现的长串来压缩数据,可以处理任意大小的符号。为了便于理解前向缓冲区存储短语并形成字典,将缓冲区描绘成
的字符序列,Fb是由字符组成的短语集合。从字符序列
,组成n个短语,定义如下:
(1)
例如,若前向缓冲区包含字符(a,b,d),则缓冲区中的短语为{(a),(a,b),(a,b,d)}。
数据中的短语依次通过前向缓冲区直到滑动窗口中变成字典的部分。为了方便理解短语在窗口中的滑动不妨当作序列记作
,且Bw是由这些字符组成的短语集合。从序列
产生短语数据集合的过程如下:
,其中
(2)
若滑动窗口中包含符号(a,b,c),则窗口和字典中的短语为{(a),(a,b),(a,b,c),(b),(b,c),(c)}。
LZ77算法的主要思想就是在前向缓冲区中不断寻找能够与字典中短语匹配的最长短语。在字典和缓冲区长度较小时压缩效果较好,基于该算法唯一可译、无损压缩的性质为数据异地备份减少数据冗余保障数据完整性和可靠性提供技术支撑。下图展示了用LZ77算法压缩字符串的过程,其中滑动窗口大小为8个字节,前向缓冲区大小为4个字节。在实际中,滑动窗口典型的大小为4 KB (4096字节)。前向缓冲区大小通常小于100字节。LZ77算法示意图如图2。


Figure 2. Schematic diagram of LZ77 algorithm compression (picture from the internet)
图2. LZ77算法压缩示意图(图片来源于网络)
4.6. 数据的传输速率
网络的传输速度直接影响工作效率和备份业务的进展。气象数据存储所占的空间巨大一般以BP为单位,为了防止数据丢失通常会备份存档。数据在线上传输备份时对网速和传输安全有很高的要求,需要在专线通道进行传输 [8] ,但实际的传输过程中通常会出现网络拥堵、流量过载等问题,选择更快的传输协议如FTP (文件传输协议),HTTP (超文本传输协议)或SFTP (安全文件传输协议)可大幅度提升数据的传输速度。对于大批量数据还可使用数据压缩算法减小数据提高传输速率。
数据传输过程
网络数据的传输是通过一台电脑向另一台电脑发送数据帧从而达到数据传输的目的。为了保证数据传输的方便性和一致性这里采用TCP/IP协议。

Figure 3. The layer where the packet arrives through unpacket unpacking
图3. 数据包通过对应设备拆包到达的层
在数据传输过程中,首先将加密压缩的数据转化为二进制格式,然后在应用层中使用内部的端口号将数据包传输到目标应用程序。在网络层,使用指定IP地址进行寻址,以实现不同网络间的数据传输。数据链路层负责寻找主机对应的MAC地址,而物理层负责将数字信号转换成模拟信号。TCP/IP协议传输数据时PC1在应用程序中打包数据,然后通过交换机和路由器使用TCP/IP协议对数据包进行拆包和封包最后找到PC2的地址,并将数据包在PC2对应的应用程序中打开。数据传输过程示意图如图3。
5. 结语
气象数据的安全性对于保护国家安全和民众生命财产具有重要意义。与传统的数据传输技术相比利用LZ77算法和数据压缩并行传输提升了数据传输速率减少网络拥堵,让数据快速到达数据中心进行气象分析和预报。数据压缩传输保护了一些敏感文件未授权进行访问的问题。身份认证能有效减少系统账号多人共用导致的数据泄露。这种数据压缩并行传输的方式提高了气象数据的传输效率和质量,为气象预报和灾害预警等应用提供支持。
本文主要讨论了气象数据在传输过程中出现的网络拥堵、数据量过大导致数据传输缓慢的问题,并提供了解决思路。计算机技术与气象密切结合保障了气象的快速发展,也增加了数据泄露和丢失的风险。因此,做好网络安全工作是稳定推进气象发展加强数据加密访问控制,建立健全的网络安全体系,保证气象数据的安全和可靠的重要途径。