1. 引言
地理实体作为实景三维的基础单元,为实景三维应用提供了详细的基础信息与专题信息。当前,对存量测绘成果的实体化改造是一种能够以较低成本在短期内提供可用产品的重要途径,因此诸多学者提出了相应的技术方案,刘敏等着重对数据转换、语义构建、质量检查三个方面进行了研究,提出1:10000地形图数据的实体改造方案[1];林蔚凯综合考虑管理、符号化、粒度等因素,结合倾斜模型数据提出了1:500 DLG实体化改造技术方案[2];林利东等结合人口、法人、经济数据,面向管理需求提出了以建筑物为核心的实体化改造技术[3];刘昶等提出了针对省级基础地理实体的存量数据实体化改造作业技术方案[4];张向军等提出了一种针对地理实体的扩展编码规则[5];刘松梁等结合1:500 DLG、DOM、国土变更等数据,提出了面向自然资源管理需求的地理实体改造方案[6]。目前实体化改造的研究主要集中在特定尺度或目标的存量数据,同时存在数据分层分类繁杂、作业效率低、返工率高、应用尺度小等问题[7] [8],本文在对现有技术方案进行深入研究的基础上,从宏观角度实施作业流程方案设计与改进,对分层分类、模态重构、数据编码等关键技术进行研究,同时结合自动化作业的应用需求,提出了一种可用于省级框架数据与城市级数据实体化改造的技术方案。
2. 实体化改造技术
存量数据的改造是通过数据抽取、转换、整合、编辑等作业流程转换为实体数据,涉及到了数据分层分类、数据编码、数据重构等关键技术[3],作业流程的设计需要考虑程序自动化的嵌入结点、作业过程中返工率的控制等问题。为构建科学合理的存量数据实体化改造生产技术工艺,在重新设计生产技术流程的同时开展相应关键技术的研究。
2.1. 作业流程方案改进
如图1所示。存量数据改造的主要生产阶段包括数据模板生成、数据属性挂接、要素抽取、语义映射、人工交互辅助编辑、质量检查、关系构建、数据入库等[4]。为避免在生产过程中出现因复工带来的工作量激增问题,在工序安排时采用生产与入库双标准作业流程,通过GUID编码关联同一实体不同模态,在质检前再进行多模态数据的属性挂接,经质检无误后对数据进行分析生成完整的关系数据,转换为入库标准。利用GUID唯一编码关联多模态实体的方案可减少作业过程中对同一实体多种模态信息的重复修改,减少大量重复工作的同时有利于实现全工序自动化生产工具接入,有效提升作业效率。
Figure 1. Workflow design diagram for existing data transformation
图1. 存量数据改造作业流程设计图
2.2. 数据分层分类技术改进
目前使用的地理实体数据将图元划分为根图元、构建图元与主体图元三类共计274个图层,在数据生产过程中要素分层碎片化严重,影响了数据生产、管理与应用的效率与直观性[5]。从生产效率的角度出发,对数据库分层分类技术进行改进,以应用需求为导向将地理实体数据库重新划分为自然、人工、管理3个数据集共计95个图层(新旧数据集对比见图2),自然地理实体数据集包括山体、水体、农林用地与其他土地等自然要素,人工地理实体数据集包括水利、交通设施、建(构)筑物、管线、院落等人工设施要素,管理地理实体数据集包括行政区划、地名地址、城镇开发边界等管理要素。如图2所示,地理实体层以“ENTITY_地理实体所在数据集”命名,如“ENTITY_ZR”表示自然地理实体;图元层一般以图元类型、地理实体所在一类名称简称以及图元几何类型代码命名,如SHUT_L。新的数据分层分类成果更加直观,实现了对碎片化数据的有效整合。
Figure 2. Workflow design diagram for existing data transformation
图2. 存量数据改造作业流程设计图
2.3. 多模态数据重构生成技术改进
存量数据中的要素在不同比例尺下可以呈现点、线、面三种模态,同时不同模态又包含了差异化的属性信息,在实体化改造时对语义信息的处理涉及到了不同模态、不同数据源、不同数据库的属性分析与信息综合,作业员在频繁的数据切换及属性处理时易导致属性信息缺失或错误,同时也严重影响了作业效率。研究以多模态数据自动重构为目标,通过对要素不同模态的几何特征、空间特征及分类属性信息进行分析匹配后对同一要素不同模态赋予相同的GUID编码,通过GUID编码将要素的不同模态串联,在转换入库标准时利用GUID进行模态关联与图属分离,减少作业过程中要素的不同模态数据重复编辑的现象。如图3、图4所示,以河流为例,同一河流在几何层面上线图元是面图元的中心线,线要素连续性较好,面要素被涵洞、桥梁等截断,但统一GUID编码后即可通过相同的GUID编码识别同一要素,数据处理时只需要处理好线要素属性,通过GUID则可自动将属性挂接到面层和点层,不再需要多次编辑。
Figure 3. Geometric structure diagram of river line and surface elements
图3. 河流线面图元几何结构图
Figure 4. GUID encoding diagram for the same river
图4. 相同河流GUID编码图
2.4. 基础地理实体编码技术改进
为有效提高基础地理实体数据的组织、处理、分析、传递和运行效率,实现基础地理实体的规范化、标准化管理,满足对地理实体的全生命周期管理、按需组装、检索查询以及与各类社会经济人文信息关联等需求,本文对地理实体编码技术进行了改进,构造了空间身份编码、公共标识码、行业应用码三大编码,通过编码即可获取必要的实体信息。
空间身份编码采用“专有标识域 + 标准域”两段划分的编码范式,对基础地理实体的编码结构和内容进行规范。其中,“专有标识域”由2位根标识符码、4位基础地理实体专用码组成,用以基于MA国际标识体系进行基础地理实体的专有标识;“标准域”由44位位置码(高度不明确时18位填充“X”)、6位分类代码(三级分类)、4位顺序码组成,用以保证区分基础地理实体在空间中的唯一性(如表1)。
Table 1. Composition of spatial identity codes
表1. 空间身份编码组成表
专有标识域 |
标准域 |
位置码 |
分类码 |
顺序码 |
MA1001 |
26位 + 18位 |
6位 |
4位 |
地理实体公共标识码由“行政区划码 + 位置码 + 时间码 + 分类码 + 顺序码”组成(如表2),是湖南省地方基础地理实体公共标识编码,与国家基础地理实体空间身份码一一对应,便于共享使用。通过记录基础地理实体空间身份编码和公共标识码的对应关系,保留了与国家标准编码的对应关系。同时,最高采用十一级网格剖分,赤道附近网格为61.84 m × 61.84 m,方便与其他业务管理交换与共享。
Table 2. Composition of common identification codes
表2. 公共标识码组成
公共标识码 |
行政区划码 |
位置码 |
时间码 |
分类码 |
顺序码 |
6位 |
16位 |
8位 |
8位 |
4位 |
Table 3. Composition of industry application codes
表3. 行业应用码组成
行政区划码 |
业务分类代码 |
业务编码 |
3位 |
2位 |
不定长码 |
行业应用码由“行业代码 + 业务分类代码 + 业务编码”组成(如表3),用来注册地理实体在相应行业系统中记录的属性项,以便与基础地理实体建立关联关系。其中,行业代码为《国民经济行业分类》(GB/T4754-2017)中规定的行业门类和大类码。通过记录地理实体通用码和行业应用码的对应关系,使得基于地理实体能够跨行业检索数据项,实现信息联动更新与共享。
3. 实验分析
本文结合实景三维郴州系统应用需求,以湖南省郴州试点存量数据为研究对象,郴州市位于湖南南部,地处南岭山脉与罗霄山脉交错、长江水系与珠江水系分流的地带,地势自东南向西北方向倾斜,全市下辖2个区、8个县,代管1个县级市,总面积19387平方千米。 在实验过程中,原始数据使用郴州市基础测绘数据为主要数据源,作业流程图(图1)中人工编辑以外的部分研发已有地理信息数据的自动化转换、拓扑关系处理、实体构面、连通性处理、中心线提取、地理实体间关系构建等相应的工具软件以实现自动化。实验过程中,除少量用于对比测试的数据外,所有数据均按照改进后的方案进行实体化改造。实验成果为郴州市城市级基础地理实体数据库、地形级基础地理实体数据库、湖南省框架实体数据库(郴州部分段改造),数据库要素统计结果(如图5)中建(构)筑物与管线及设施两类要素占据数据的主要部分,与现实情况相符(或对原始数据进行统计对比,然后在这里说明一下)生成的部分实体如图6。
Figure 5. Statistical diagram of various elements in chenzhou city
图5. 郴州市各类要素统计图
Figure 6. Display diagram of selected elements in chenzhou city
图6. 郴州市部分要素展示图
在实验过程中,小部分数据按照现有文献[1]-[8]所述方案进行实体化改造,用于对比测试。实验发现,改进后案相比于现有方案具有以下优点:
(1) 重新设计后的作业流程更加有利于程序自动化的介入与实现,有效减少了改造过程中人工作业的比例,从而实现了整个实体化改造作业的提升。
(2) 采用层级更少的分层技术,减少了人工编辑作业过程中的多图层交替编辑引发的错误,提高成果准确性的同时也加快了作业速度。
(3) 新的图元分类体系相比于常规的根图元、主体图元、构建图元分类体系,减少了基础测绘成果要素进行图元转换尤其是根图元转换与重构时的工作量。
(4) 对于交通、水系等线状实体,当存在多个实体共用几何图元的情况时,采用本方案的多模态数据重构生成技术实现了对几何图元的高效利用,解决了相同几何图元不同实体要素重复表达的问题。
4. 结论与展望
本研究构建了现有地理信息数据与地理实体数据之间的通用转换图谱,并制定了一套已有地理信息数据转换为基础地理实体的通用性工艺流程,可同步应用于省级地理实体框架数据生产、城市级地理实体数据生产与地形级地理实体数据生产。改进后技术方案能够以较高的效率快速地对存量数据进行实体化改造,有效挖掘存量数据的深层价值。未来工作将在现有成果的基础上,探索地理实体数据快速更新的方法,拓宽新型基础测绘数据更新的渠道,减小更新周期,进一步提升地理信息服务的效率和质量,为社会经济发展提供高效优质的地理信息服务。
基金项目
湖南省自然科学基金(2023JJ60569)项目经费资助。