基于Tableau的气象数据可视化及城市宜居度分析
Meteorological Data Visualization and urban Livability Analysis Based on Tableau
DOI: 10.12677/CSA.2023.1310185, PDF, HTML, XML, 下载: 378  浏览: 635  科研立项经费支持
作者: 蒋莎莎, 米 泓, 罗秋姣, 郭艳芬:成都信息工程大学计算机学院,四川 成都
关键词: 气象数据Tablea宜居性Meteorological Data Tablea Livability
摘要: 气象大数据和气象服务行业的快速发展,推动了气象数据信息可视化的发展。本文基于2022年四川省主要城市的气象和环境数据,分析不同城市的年平均气温、年平均降水量、年平均湿度、各市年平均气温、降水量和湿度的关系、平均气温和降水量概况、夏季平均相对湿度与平均气温的关系,建立的城市宜居度评价体系,分析气象数据与城市宜居度的相关性。利用Tableau可视化软件,将气象数据与城市宜居度的关系进行可视化呈现,为城市生态体系建设提供参考依据。本文所使用的分析方法和评价体系,可广泛应用于其他城市的象数据与城市宜居度分析,研究思路也可广泛应用于其他领域。
Abstract: Using Tableau to process and visualize meteorological and environmental data from major cities in Sichuan Province in 2022, we obtained the annual average temperature, annual average precipitation, annual average humidity, relationship between annual average temperature, precipitation and humidity in each city, overview of average temperature and precipitation, and relationship between summer average relative humidity and average temperature. Through the above information, we analyzed the correlation between meteorological data and urban livability. Using Tableau for analysis can quickly and accurately visualize data, shorten data processing and analysis time, and is an important approach to data statistics.
文章引用:蒋莎莎, 米泓, 罗秋姣, 郭艳芬. 基于Tableau的气象数据可视化及城市宜居度分析[J]. 计算机科学与应用, 2023, 13(10): 1870-1881. https://doi.org/10.12677/CSA.2023.1310185

1. 引言

随着近年来我国国民经济水平的不断提升,人们更加关注城市气候环境以及宜居指数。根据人民日报2022年12月19日发布的《打造宜居韧性智慧城市》报告说明 [1] ,习近平总书记在党的二十大报告中指出,打造宜居、韧性、智慧城市。这是以习近平同志为核心的党中央深刻把握城市发展规律,对新时代新阶段城市工作作出的重大战略部署。我国关于气象信息可视化的研究起步于20世纪90年代初,气象信息种类繁多,格式多样,包括地面全要素填图数据、高空全要素填图、通用填图和离散点等值线、格点数据、图像数据(卫星云图、雷达拼图及地形图)等19类数据 [2] ,但气象信息可视化技术应用存在局限性,没有充分发挥气象数据的潜力,也没有充分考虑数据的多样性和复杂性,因此要整理为有用信息并不容易。且目前气象信息可视化技术应用范围较小,在城市规划和管理中并没有得到广泛应用。

目前对于宜居度的评价指标体系缺乏相应的评价方法,城市宜居度评价指标体系有待进一步完善。

为了解决以上问题本文采用世界排名第一的商业智能数据分析软件Tableau,对2022年四川省主要城市的气候和环境数据集成进行可视化展示,通过数据分析将复杂的气象数据集转变成可视化信息,同时建立更为完善的城市宜居度评价体系,为探讨城市宜居性提供决策依据。

2. 基于Tableau的可视化技术介绍

2.1. Tableau可视化技术

在传统的数据分析中,条形图、折线图和饼图是三大基本图表,而大数据分析更强调大数据样本的宏观特征、分布规律和相互关系,所以就有了直方图、盒须图和散点图等高级图形。

Tableau正是顺应了这样的时代大趋势,从单一的可视化分析工具,快速成长为企业级的数据可视化分析平台。它将数据运算与美观的图表完美地结合在一起,不要求用户编写代码,仅仅通过拖拽方式就可以快速洞察数据,探索不同的视图,甚至可以轻松地将多个数据源组合在一起,完成数据展示、探索和分析工作 [3] 。

Tableau为各种行业,部门和数据环境提供解决方案,是目前全球最易于上手的报表分析工具,并且具备强大的统计分析扩展功能 [4] ,帮助用户更快、更好地整理数据,进一步提高数据分析的价值。

Tableau还可通过内存数据引擎查询外接数据库的访问。实时连接,数据更新,数据提取效率大大提高。Tableau还与多种数据库兼容,EXCEL、MySQL、MongoDB都可以与其连接使用。Tableau具有多种应用程序设计接口,如数据提取接口,JS接口,R的集成接口等。因此,具有极好的可拓展性。Tableau还具备仪表盘和故事功能。将图表整合到仪表盘,可以让可视化图表一览无余,将图表整合成故事,能够更方便的理解可视化图表 [5] 。

2.2. 数据可视化在气象方面的应用综述

在气象学中,数据可视化主要是通过图表和图形来展示数据的特征。通过对数据的分析和研究,可以得出一些有用的结论,并且对气象系统中存在的问题进行预警 [6] 。

气象资料信息以表格形式表达,主要是为了便于信息的传播,一般采用一种简明扼要、一目了然、易于接受的形式。但随着气象资料数据量的不断增加,数据类型和内容也越来越复杂,为更好地理解和使用这些复杂的资料信息,就需要对这些资料进行处理和分析。气象学中常用数据可视化图表有直方图、散点图、柱状图、折线图等。气象资料信息是按时间序列变化的,一般采用时间序列分析方法来分析各种气象要素资料。通过对气象资料进行趋势分析、周期分析、概率密度分布和相关系数等方法对资料进行分析和研究。

在实际应用中,常常会根据需要选择合适的图表类型和风格来表达数据信息。如利用直方图来直观地展示数据变化趋势;利用散点图来直观地展示数据分布规律;利用折线图来展示时间序列分析结果等。

而数据可视化技术其本质是将每一个数据对象以单个图元元素进行表示的图元集合,即数据图像。如图1,数据可视化技术可以将数据对象的属性以多维的形式表示出来,通过不同的角度、维度对数据进行更深入的观察与分析。这里的数据对象代表了组成了生成数据可视化图表的数据集合,每一个数据对象都代表了一个实体题。

Figure 1. The process of digital visualization

图1. 数字可视化的过程

3. 数据源介绍

3.1. 数据来源

本文所用到的数据来源于国家统计局下的四川省统计局在2022年所发布的《2022年四川统计年鉴》,是一部全面反映四川省经济和社会发展情况的综合性统计资料年刊 [7] 。年鉴收录了全省和各市(州)、县(市、区)2020年经济和社会发展各方面的大量统计数据,以及历史重要年份和近年来的全省主要统计数据。

在本文中,我们主要用到的数据有主要城市平均气温,降水量,平均相对湿度,如图2~4。出于统计分析的需要,本文在原数据的基础上进行了一些数据整合,方便后续统计和分析。

Figure 2. Average temperature in major cities

图2. 主要城市平均气温

Figure 3. Precipitation in major cities

图3. 主要城市降水量

Figure 4. Average relative humidity of major cities

图4. 主要城市平均相对湿度

3.2. 数据预处理

3.2.1. 数据预处理概念

数据的预处理是大数据开发过程中占比很大的关键步骤。数据的预处理能够直接影响后面所有步骤的结果质量。实际环境下,原始数据一定存在不可避免的噪音和误差,同时,数据的模式及特征通常会隐藏起来。数据与处理技术可以使原本混乱无章的数据按照预想的结果进行改变。在这里我们采用数据清洗的方法来预处理数据。

3.2.2. 数据清洗

真实场景下的数据一般是不完整的、有噪声的、不一致的。数据的清洗包括缺失值的填充,可以将不完整的数据通过删除记录、人工填写、全局常量填充等方法进行填补。另一方面,数据的清洗包括噪声数据与离群点数据的处理。噪声数据一般指错误的数据,离群点数据一般指数据集当中的特殊数据。这些数据会影响数据可视化结果的准确性。所以可以通过分箱、回归函数等方法处理噪声数据与离群点数据。最后,对于不一致的数据,可以进行人工干预进行修正。

正确的数据对于数据可视化很重要,它直接影响了可视化的结果。对于本文所用到的数据,我们通过如下方式进行清洗:

1) 首先将数据导入Tableau当中,将缺失值进行填充,剔除不完整的、有噪声的、不一致的数据。

2) 对已经得出的数据图表进行集中数据分析,将明显异常和无意义的数据剔除。

4. 气象数据可视化及城市宜居度

研究思路及方法

气象数据可视化设计探讨城市宜居性的设计重点在于,对各城市的气温,降水,湿度进行分析,得到不同城市的年均温差、年均降水量,夏季平均相对湿度、7月降水量、7月最低气温与年平均气温,再根据中国气象局发布的《中国气候宜居城市(县)评价技术指南》 [8] ,评估城市的宜居性。

通过分析以上几种数据与城市宜居性的关系,本文拟采用七种可视化图表对气象数据进行呈现:瀑布图、圆环图、密度图、地图、双轴图、桑基图、玫瑰图 [9] 。

5. 实验结果分析

5.1. 可视化视图展示

适用于表达数个特定数值之间的数量变化关系,或者用来直观地呈现出现出影响总体值的关键维度,数据的排列形状(称为浮动列)看似瀑布悬空,从而反映数据在不同时期或不同因素对总体值影响的程度,还可以直观反映出数据的增减变化。如图5可以直观的看出攀枝花市在影响四川省整体气温的占比为最大,年平均气温最高,而康定的年平均气温最低,占整体年平均气温总和的最小。

Figure 5. Waterfall chart of annual average temperature in each city of Sichuan Province

图5. 四川省各市年平均气温瀑布图

通过密度图可以直观的观看出年平均气温和年降水量和年平均湿度的关系,通过下图6可以看出马尔康与康定的年气温和降水量与空气湿度都很优异,是一个气候宜居城市,攀枝花年平均气温高且降水量低,空气湿润度低干燥炎热不是气候宜居城市。

通过看圆环的半径大小可直接判断其在整体的占比大小,如下图7可以直观的看出宜宾市圆弧最大,所以可以判断宜宾在四川省平均湿度中整体最大,空气湿润度较高,半径越小空气湿润度越小。

可以方便快速的让我们知道所列举的城市,直观可视化的看出数据差异,如下图8可以直观的看出雅安市的年降水量一骑绝尘,但那气温较为中规中矩而攀枝花和泸州降水量很低且年平均气温很高不少不太适合居住。

Figure 6. Density diagram of annual average temperature, precipitation, and humidity relationships among cities in Sichuan Province

图6. 四川省各市年平均气温、降水量、湿度关系密度图

Figure 7. Top 9 annual average humidity circles in Sichuan Province

图7. 四川省年平均湿度前九名圆环图

Figure 8. Overview map of annual average temperature and precipitation in each city of Sichuan Province

图8. 四川省各市年平均气温和降水量概况地图

柱形图与条形图的结合直观的看出各城市夏季平均气温和相对湿度的关系,根据图9可以看出康定,马尔康夏季低温的而空气湿润,夏季人体感受会和很舒服但是攀枝花夏季气温高且空气干燥闷热,会让人感觉烦躁难受,中间的宜宾,巴中,成都也还不错空气不会很干燥热近平均值且空气湿润度高于四川省湿度平均值。

Figure 9. Biaxial chart of the relationship between summer average relative humidity and average temperature in various cities in Sichuan Province

图9. 四川省各市夏季平均相对湿度与平均气温的关系双轴图

图10,线条越粗代表流量越大,也就是降水量最大,可以很明显看出全年降水量最大的是雅安市。攀枝花最少。年降水量在800~1200的是最宜居的,所以在降水角度来看泸州,德阳,遂宁,乐山,眉山,资阳,马尔康,康定,西昌是宜居的。

Figure 10. Sangji map of annual average precipitation in each city of Sichuan Province

图10. 四川省各市年平均降水量桑基图

图11,玫瑰花瓣越长代表流量越大,即气温越高。最高为攀枝花,最低为康定。

Figure 11. Rose pie chart of annual average temperature in various cities in Sichuan Province

图11. 四川省各市年平均气温玫瑰饼图

年平均气温16~20是比较宜居的,因此从这方面来看,四川各省除了攀枝花都是较为宜居的,通常16年平均气温在16度是最宜居,因此相比来看,巴中市是最宜居的。

5.2. 仪表盘设计与展示

仪表盘的功能是将多个视图发布到一个仪表盘上,可以同时检测和分析各种数据。仪表盘不仅仅具有展示功能,它还是一个圈交互的应用程序。Tableau的灵活性可以创建基于多个Tab页的应用程序,有各种钻取、过滤以及发现数据的方式 [10] 。

仪表盘有3种类型,分别为:操作型Dashboard、分析型Dashboard、平台型Dashboard。本文拟采用分析型和操作型仪表盘,向用户展示关键的数据信息。

操作型仪表盘进行交互,用户点击上方选项卡,可跳转到相应的图表。

6. 结束语

随着时代进步,科技经济发展现阶段越来越多的人开始追求舒适的生活的,气候宜居也成为对一个城市宜居度的考量之中,我们在国家统计局找到的有关于资源与环境的30个样本,共20组变量进行分析,从而得出康定、马尔康综合各项指标取得四川省气候宜居城市TOP,与四川气象局发布的2022年四川省气候宜居城市结果一致。

在当代,宜居性很大程度上也决定着城市发展的上限:只要一个城市不断提升其宜居程度,创造更好的生活环境,那就能源源不断地吸引人才流入,壮大自身;反之,那些生活居住条件恶劣的城市,结果可能堕入更难改善的恶性循环。

以上实验,我们通过Tableau将复杂、种类繁多的气象数据提炼成一张张一目了然的可视化图,便于研究人员作进一步研究,根据目前现有的《中国气候宜居城市(县)评价技术指南》,通过对城市的气温、降水、湿度等一系列数据进行比对分析的方法,初步建立了城市宜居度评价体系。目前对于城市宜居度的研究仍处于初步阶段,缺乏对城市生态系统规划和建设的建议和指导,我们将继续优化可视化研究和评价体系,做出进一步的提升。

基金项目

成都信息工程大学本科教学工程项目(JYJG202345)。

参考文献

参考文献

[1] 人民日报. 打造宜居韧性智慧城市[J\OL].
https://www.gov.cn/xinwen/2022-12/19/content_5732633.htm, 2022-12-19.
[2] 张澄铖. 气象信息可视化技术现状及发展趋势[J]. 中国科技期刊数据库科研, 2016(9): 118-118.
[3] 喜乐君. 数据可视化分析: Tableau原理与实践[M]. 北京: 电子工业出版社, 2020.
[4] Tableau 简介[EB/OL].
https://www.tableau.com/zh-cn/why-tableau/what-is-tableau, 2023-5-10.
[5] 任妮, 吴琼, 栗荟荃. 数据可视化技术的分析与研究[J]. 电子技术与软件工程, 2022(16): 180-183.
[6] 王露, 杨晶晶, 黄铭. 基于R语言和Tableau的气象数据可视化分析[J]. 计算机与网络, 2017, 43(24): 69-71.
[7] 张元忠. “这是一次打造城市名片的过程” [N]. 四川日报, 2008-03-31(A02).
[8] 中国气象局. 中国气候宜居城市(县)评价技术指南[J\OL]. https://cma-nci.com/, 2023-1-31.
[9] 朱琳, 赖泳孜, 刘欢, 等. 基于Tableau的心脏病的预测与预防的数据可视化交互系统[J]. 计算机科学与应用, 2022, 12(8): 1922-1931.
[10] 张海鸥. Tableau在移动网络优化中的应用[J]. 吉林省经济管理干部学院学报, 2012, 26(4): 68-70.