1. 引言
宅基地作为农村土地资源的重要组成部分,其基础信息数据库的构建是推动农村土地制度改革、实现乡村振兴战略的关键基础工作[1]。随着乡村振兴战略的深入推进,准确掌握宅基地的数量、位置、权属等信息,对于优化农村土地资源配置、保障农民合法权益、促进农村经济发展具有重要意义[2]。贵溪市作为典型的农业大市,农村宅基地分布广泛、情况复杂,传统的宅基地数据库构建方法在面对海量、多源数据时,暴露出效率低下、精度不足、成本高昂等问题,难以满足新时代宅基地管理的需求。
ArcGIS作为全球领先的地理信息系统平台,其丰富的工具箱功能为地理空间数据处理与分析提供了强大支持。国内外众多学者对ArcGIS在地理信息领域的应用展开了广泛研究[3]。在自然资源调查方面,利用ArcGIS实现了森林资源数据的高效管理与分析[2];在城市规划领域,借助ArcGIS进行城市空间布局优化研究[3]。在宅基地数据库构建相关研究中,现有方法主要分为以下几类:
传统手工录入与简单软件处理:早期研究多采用人工录入数据至Excel等表格软件,再辅以AutoCAD等工具进行简单图形绘制与编辑[4]。这种方式虽操作门槛低,但在处理贵溪市12万宗宅基地数据时,人工录入耗时长达数月,且因人为因素导致数据错误率高达18%,难以满足大规模、高精度数据处理需求。
基础GIS软件应用:部分研究尝试使用基础GIS软件进行宅基地数据管理,如利用MapInfo进行数据存储与简单查询[5]。但在处理多源异构数据整合时,由于软件功能局限,对于CAD图纸、无人机影像等数据的兼容性差,数据转换过程中信息丢失严重,无法有效构建完整的宅基地数据库。
早期ArcGIS应用探索:已有研究利用ArcGIS的部分功能进行宅基地数据处理,但多集中于单一环节,如仅使用ArcGIS进行空间数据的可视化展示,未充分挖掘其在数据预处理、属性自动化赋值等关键环节的潜力,导致整体数据库构建效率提升有限[6]。
上述现有方法在多源数据整合、复杂空间拓扑处理以及属性自动化赋值等关键环节均存在技术瓶颈,难以满足实际工作中对数据准确性、完整性和时效性的要求。本文以贵溪市农村宅基地调查为案例,深入探讨利用ArcGIS工具箱构建宅基地基础信息数据库的技术路线,旨在解决传统方法存在的问题,提高宅基地数据库构建的效率和精度,为农村宅基地管理提供科学、有效的技术手段,具有重要的现实意义和应用价值。
2. 贵溪市宅基地基础信息调查工作概况
2.1. 区域概况与调查目标
贵溪市总面积2480 km2,辖18个乡镇,农村宅基地约12万宗,主要分布于山地与平原过渡地带。该区域地形地貌复杂,宅基地分布零散,权属关系多样,历史遗留问题较多,给宅基地调查工作带来巨大挑战。本次调查以第三次国土调查成果为基底,融合不动产登记、农村地籍调查等多源数据,目标是建立覆盖全市的宅基地基础信息空间数据库,实现宗地权属、房屋建筑、附属设施等信息的数字化管理,为宅基地确权登记、闲置资源盘活提供数据支撑,助力贵溪市农村土地资源的科学管理与合理利用[1]。
2.2. 传统方法面临的挑战
在贵溪市宅基地调查工作中,传统方法面临诸多严峻挑战。数据来源广泛且格式多样,包括CAD图纸(2000坐标系)、无人机影像(WGS84坐标系)、Excel台账(属性逻辑冲突率约15%),人工进行数据格式转换和坐标转换不仅耗时漫长,而且误差率极高,严重影响数据的准确性和一致性。手工录入和校验数据的方式效率极低,难以满足大规模数据处理的需求。经统计,在矢量拓扑检查中发现,重叠宗地占比达8.2%,悬挂节点率高达12%,这使得数据质量难以保证,后续的空间分析和管理工作受到严重阻碍。
宅基地调查涉及26个空间要素层、17个属性字段,需手动进行关联,如宗地代码规则为“乡代码 + 村代码 + 顺序号”,人工编号错误率达5.3%,面积量算工作耗时占总工期40%以上,不仅耗费大量人力和时间成本,还容易出现逻辑错误。在成果输出方面,图件制作依赖手动排版,宅基地分布图生成效率仅为2幅/天,且坐标注记、比例尺等要素不符合《农村宅基地数据库标准》要求,无法满足实际工作需求。
3. 基于ArcGIS工具箱的数据库构建技术路线
3.1. 技术框架设计
Figure 1. Technical framework diagram
图1. 技术框架图
以ArcGIS Desktop为核心平台,构建“数据预处理–空间分析建模–属性自动化赋值–质量管控–成果输出”五阶段技术链(见图1)。ArcToolbox工具集具备强大的数据处理能力,可实现格式转换、坐标变换等基础处理操作;ModelBuilder能够方便地构建批处理模型,提高数据处理效率;Python脚本开发则可针对复杂逻辑处理问题进行定制化开发。通过三者的有机结合,最终形成符合标准的宅基地基础信息数据库成果,为宅基地管理工作提供可靠的数据支持[3]。
3.2. 数据预处理技术
3.2.1. 多源数据标准化
在数据格式转换方面,使用Feature Class To Feature Class工具将CAD数据转换为GDB要素类,该工具能够有效保留CAD数据中的几何信息和部分属性信息;利用Excel To Table工具导入台账数据,将其统一存储于“宅基地.gdb”数据库,实现多源数据的集中管理[3]。
针对无人机影像(WGS84)与国土数据(CGCS2000)的坐标系统差异,采用Project工具进行坐标变换。在变换过程中,通过精确设置参数和控制点,将平面精度控制在±0.1 m以内,确保不同来源数据在空间位置上的一致性[3]。
为提高数据质量,通过Delete Identical工具剔除重复宗地,避免数据冗余;编写Attribute Clean脚本批量修复逻辑错误,如面积 ≤ 0的记录等。经过处理,数据完整性从82%大幅提升至98.7%,为后续的数据处理和分析奠定了坚实基础。
3.2.2. 影像信息提取
利用ArcGIS Image Server对0.2 m分辨率无人机影像进行处理。基于地面控制点(GCP),使用Ortho Rectification工具生成DOM,通过严格的误差控制,使平面误差 ≤ 0.5像元,确保影像的几何精度。借助ArcScan模块的自动矢量化功能,设置线要素捕捉阈值为2像素,生成宅基地初始边界。随后进行人工修正,有效降低误差率,从最初的15%降至3%,实现宅基地边界的准确提取[3]。
3.3. 空间建模与数据库结构设计
3.3.1. 分层体系设计
参照《农村宅基地数据库标准》,构建三级分层体系。基础层包含行政区划图层和地形地貌图层,行政区划图层的核心要素为乡镇边界、村界,用于提供空间定位基准,界定管理范围;地形地貌图层的核心要素包括等高线、高程点,支持地形分析,如坡度、高程建模等。业务层涵盖宅基地宗地图层、房屋建筑图层和界址点线图层,宅基地宗地图层的核心要素有宗地代码、权利人、面积等,主要用于权属管理;房屋建筑图层的核心要素包括建筑结构、层数、建筑面积等,为空间分析提供数据支持;界址点线图层的核心要素为界址点坐标、界址线走向,是确权的重要依据。专题层包含闲置宅基地图层和违法用地图层,闲置宅基地图层的核心要素有闲置状态、闲置时长,有助于识别可利用土地;违法用地图层的核心要素包括违法类型、整改状态,为执法监管提供数据保障。
3.3.2. 拓扑规则构建
在ArcCatalog中建立拓扑数据集,并定义严格的拓扑规则。对于宗地层,规定不能有重叠要素且面积必须大于0;界址点层要求必须位于界址线上,且坐标精度 ≥ 0.01 m;宗地与房屋层则规定房屋必须完全包含于宗地内。通过Topology Checker工具进行批量检测,有效降低拓扑错误率,从12%降至0.8%,确保数据库空间数据的准确性和一致性。
3.4. 属性自动化处理技术
3.4.1. 批量赋值模型构建
针对宗地代码、面积等字段,利用ModelBuilder构建自动化工作流(见图2)。在宗地代码生成方面,通过Calculate Field工具调用Python表达式“{} {:04d}”. format (!乡代码!,!顺序号!),实现代码自动生成。该表达式根据预设的规则,将乡代码和顺序号进行组合,并对顺序号进行格式化处理,确保生成的宗地代码格式统一、准确,效率提升90%。在面积量算上,使用Calculate Geometry Attributes工具批量计算椭球面积,该工具能够利用空间数据的几何特性,快速、准确地计算出宗地面积,精度达±0.1 m2,耗时从人工处理的20天大幅缩短至2小时。
Figure 2. Flowchart of the attribute assignment model
图2. 属性赋值模型流程图
3.4.2. 脚本开发应用
Figure 3. The script code for ownership conflict detection and automatic generation of graphics
图3. 权属冲突检测和图件自动化生成脚本代码
权属冲突检测脚本:权属冲突检测脚本的主要功能是通过ArcPy遍历宗地属性表,检测“一户多宅”情况。首先,设置工作环境,指定地理数据库路径、宗地要素类名称、户主标识字段和宗地唯一标识字段等参数。然后,创建字典owner_dict用于存储户主与宗地的关系,使用SearchCursor遍历宗地属性表,将每个户主对应的宗地ID添加到字典中。接着,检测字典中每个户主对应的宗地数量,若数量大于1,则判定为“一户多宅”情况,并将相关信息记录到conflicts列表中。最后,将冲突结果输出到CSV文件,并可选择在地图中高亮显示冲突宗地,以便工作人员直观查看。该脚本的实现,有效提高了权属冲突检测的效率和准确性,避免了人工排查的疏漏。
图件自动化生成:利用Data-Driven Pages功能,按行政村批量输出宅基地分布图。通过编写脚本,设置数据驱动页面的相关参数,如页面名称字段、图层范围等,实现自动化生成。该脚本的应用,使宅基地分布图的生成效率从2幅/天大幅提升至50幅/天,极大提高了成果输出效率,满足了实际工作需求。核心代码见图3。
3.5. 质量检查与成果输出
3.5.1. 数据质量检查
建立多层次的数据质量检查体系。在空间精度检查方面,通过与GNSS实测数据对比,对宅基地边界线的平面位置精度和高程精度进行严格检查,确保空间数据的准确性。属性完整性检查利用ArcGIS的查询功能(Select Layer by Attribute),检索属性字段为空或不符合逻辑的记录,并及时进行补录和修正,保证属性数据的完整性和准确性。拓扑正确性检查则运行拓扑检查工具,查找并处理重叠、缝隙、悬挂节点等拓扑错误,确保数据库空间数据的拓扑一致性[3]。
3.5.2. 成果输出与汇交
利用ArcGIS的布局视图(Layout View)和数据驱动页面(Data-Driven Pages)功能,自动生成标准格式的调查成果图件,如宅基地分布图等。通过导出工具将数据库成果转换为符合要求的格式(如VCT、MDB等),实现与上级农业农村管理部门的数据汇交[3]。
4. 关键技术问题与解决方案
4.1. 数据转换问题
CAD数据转换失真问题是宅基地调查数据处理中的常见难题。CAD宅基地图纸(如DWG格式)转为GIS格式时,属性编码(如CASS地物编码)容易丢失,同时会产生空间拓扑错误[4]。为解决该问题,采用ArcToolbox→转换工具→CAD转地理数据库,并勾选“保留扩展属性”选项,最大程度保留CAD数据中的属性信息。此外,借助FME工具自定义字段映射规则,对属性编码进行准确映射和转换,确保地物编码完整迁移,有效解决数据转换失真问题。
4.2. 数据模型设计问题
在数据模型设计过程中,空间拓扑错误频发,如宗地边界重叠、缝隙等问题,会导致面积计算失真,影响数据库的准确性和可靠性[3]。针对此问题,运行拓扑检查工具(Topology Checker),添加“不能重叠”“不能有缝隙”等严格的拓扑规则,对空间数据进行全面检查。同时,使用修复几何工具(Repair Geometry)自动校正存在的几何错误,有效降低拓扑错误率,保证数据模型的准确性和完整性。
4.3. 空间分析关键技术
(1) 宗地四至填充问题:人工填写宗地四至信息效率低且容易出错。开发Python脚本工具,基于宗地中心点生成缓冲区,利用近邻分析(Near)识别相邻宗地;通过计算方位角判定方向(0˚~45˚为北,45˚~135˚为东等);当同一方向存在多个宗地时,按最小距离优选唯一邻宗,实现宗地四至信息的自动填充,提高工作效率和准确性。
(2) 一户多宅检测问题:使用汇总统计数据工具(Summary Statistics),按“权利人”字段统计宗地数量;筛选计数 > 1的记录,导出为冲突清单,快速定位同一权利人的多个宗地,有效解决权属冲突检测问题。
4.4. 数据库质量管控体系
建立“三检一验”制度:
自检:作业员使用Validation Rules工具进行属性逻辑校验,如“建筑面积 ≤ 宗地面积”。
互检:通过Compare Datasets工具对比相邻调查单元数据一致性,误差率控制在1%以内。
专检:质检部门利用Quality Checker插件进行全库拓扑检查,生成质检报告(见图4)。
验收:邀请省级专家通过Database Validation Tool进行成果核查,通过率达99.2%。
Figure 4. Example of the quality inspection report
图4. 质检报告示例
5. 应用效果与效益分析
5.1. 效率提升对比
通过全面应用ArcGIS工具箱和自动化处理技术,贵溪市宅基地调查各项工作效率均得到显著提升。所有关键任务在传统方法与ArcGIS方法下的处理时间对比见表1。
Table 1. A comparison of processing times for all critical tasks under traditional methods and ArcGIS methods
表1. 所有关键任务在传统方法与ArcGIS方法下的处理时间对比
任务类型 |
传统方法耗时 |
ArcGIS方法耗时 |
效率提升 |
数据整合 |
20天 |
3天 |
85% |
矢量拓扑检查与修正 |
15天 |
1天 |
93.30% |
属性关联与赋值 |
25天 |
2天 |
92% |
面积量算 |
20天 |
2小时 |
99.60% |
图件制作 |
30天 |
6天 |
80% |
数据库构建全流程 |
110天 |
14天 |
87.30% |
从表中数据可以清晰看出,在数据整合环节,传统方法需耗费20天,而ArcGIS方法仅用3天,效率提升85%;矢量拓扑检查与修正方面,ArcGIS方法将原本15天的工作压缩至1天,效率提升高达93.3%。尤其在面积量算任务中,传统人工处理耗时20天,ArcGIS自动化处理仅需2小时,效率提升幅度达到惊人的99.6%。整体数据库构建全流程,ArcGIS方法将工期从110天大幅缩短至14天,效率提升87.3%,极大地提高了工作效率,缩短了项目周期。
5.2. 精度对比分析
为全面评估ArcGIS方法在精度提升方面的效果,选取贵溪市5个乡镇共1000宗宅基地作为样本,对比传统方法与ArcGIS方法在空间位置精度、属性数据准确性和拓扑一致性三个维度的差异,并进行详细的统计分析,结果见表2。
Table 2. Precision comparison and analysis
表2. 精度对比分析
评估维度 |
传统方法误差率 |
ArcGIS方法误差率 |
误差降低幅度 |
空间位置精度(平面) |
5.20% |
0.80% |
84.60% |
空间位置精度(高程) |
6.10% |
1.20% |
80.30% |
属性数据准确性 |
12.30% |
1.50% |
87.80% |
拓扑一致性 |
10.50% |
0.50% |
95.20% |
在空间位置精度上,传统方法平面误差率为5.2%,高程误差率为6.1%,而ArcGIS方法凭借精准的坐标转换和影像处理技术,将平面误差率降至0.8%,高程误差率降至1.2%,误差降低幅度分别达到84.6%和80.3%。属性数据准确性方面,传统人工录入导致误差率高达12.3%,ArcGIS的自动化赋值和校验机制使误差率大幅下降至1.5%,误差降低幅度达87.8%。在拓扑一致性评估中,ArcGIS方法的优势更为明显,将原本10.5%的错误率降至0.5%,误差降低幅度达到95.2%,确保了数据库空间数据的高质量。
5.3. 经济效益
项目累计节约人工成本约180万元,其中数据处理环节节省120万元,成果整改环节节省60万元。同时,数据库为闲置宅基地复垦提供精准数据,预计可释放建设用地指标500亩,潜在经济价值超2亿元[1]。
5.4. 社会效益
基于ArcGIS工具箱构建的宅基地基础信息数据库,为贵溪市农村宅基地管理带来了显著的社会效益。数据库的建成使得宅基地权属信息更加清晰透明,有效减少了因权属不清引发的纠纷,维护了农村社会的和谐稳定。同时,精准的宅基地数据为乡村规划、土地整治等工作提供了科学依据,助力乡村振兴战略的实施,促进农村地区的可持续发展[1]。此外,该数据库还为后续的宅基地流转、闲置资源盘活等工作奠定了坚实基础,有助于提高农村土地资源的利用效率,增加农民收入[1]。
6. 结论
本文以贵溪市农村宅基地调查为案例,深入研究了基于ArcGIS工具箱构建宅基地基础信息数据库的技术路线。通过详细阐述数据预处理、空间分析、属性自动化赋值、质量管控和成果输出等关键环节,展示了该方法在效率提升、精度提高和经济效益方面的显著优势。实践证明,基于ArcGIS工具箱的技术方案能够有效解决传统宅基地数据库构建中存在的问题,为农村宅基地管理提供了高效、准确的技术支持。
然而,研究仍存在一些不足之处。在数据处理方面,对于更复杂的历史遗留数据问题,处理方法还需进一步优化;在脚本开发方面,部分功能的通用性和扩展性有待提高。未来研究将针对这些问题展开深入探索,进一步完善基于ArcGIS的宅基地数据库构建技术,同时加强与人工智能、大数据等技术的融合,提高宅基地管理的智能化水平,为农村土地制度改革和乡村振兴提供更有力的技术保障[1] [2]。
NOTES
*第一作者。