1. 引言
21世纪初,中国地质调查局在全国范围内启动并大规模实施了多目标区域地球化学调查计划(亦称土地质量地球化学调查计划) [1]。历经20余年,该计划已完成1:25万土地质量地球化学调查约255万平方公里,1:50,000调查约28万平方公里,在土壤地球化学质量研究方面取得了丰硕成果[1]-[3]。然而,受土壤地球化学元素空间变异性[4]-[6]、评价技术方法局限性[7]-[11]以及土壤环境质量标准变化等因素影响,土壤地球化学质量评价结果仍难以精准落实到土地利用图斑,限制了成果的大规模应用。
为解决上述问题,本研究以湖南省临澧县为研究区,通过优选插值方法,旨在筛选出丘陵区和平原区土壤地球化学质量评价的最佳采样尺度,以期降低工作成本,促进调查成果的推广与应用落地。
2. 研究区域与研究方法
临澧县地处武陵山余脉与洞庭湖盆地过渡地带,地势总体西高东低,由西部山区向东部的洞庭湖盆地倾斜,地貌以微丘、平原为主,间有山岳。出露地层涵盖蓟县系至第四系。该县属中亚热带向北亚热带过渡的湿润季风气候区。受多种成土母质、气候及地形地貌综合影响,形成了以红壤和水稻土为主的五类土壤。
本研究在临澧县南部丘陵区和北部平原区各选取面积为6 km²的矩形区域,开展1:10,000与1:50,000比例尺调查的对比研究。
平原区:位于刻木山乡–新安镇–合口镇交界处,属澧水、道水冲湖积平原堆积地貌。地质背景为全新世湖冲积层,岩性上部为灰褐、黄褐色砂质粘土和灰黑色淤泥质粘土,下部为灰黑色砂卵石层。土壤类型以水稻土为主,次为潮土和红壤,含少量红色石灰土。土地利用以水田为主,旱地极少。
丘陵区:位于烽火乡,属剥蚀构造地貌丘陵区。地质背景复杂,主要出露震旦纪金家洞组(灰色硅质页岩、硅质岩夹灰绿色薄层状页岩、条带状泥岩)和留茶坡组(灰–灰黑色薄–中层硅质岩夹硅质页岩、碳质硅质板状页岩),以及南华纪长安组(块状含砾砂岩、含砾泥质砂岩夹板岩、凝灰质砂岩)、富禄组、大塘坡组和南沱组(灰黄色粗至粉砂质与泥质相间的条带状板岩、块状细粒长石砂岩、块状含砾石英砂岩、灰岩及页岩)。土壤类型主要为水稻土和红壤,含极少量潮土和红色石灰土。土地利用主要为林地、水田和旱地,含少量果园。
3. 材料与方法
所有样品采集、加工均遵循《土地质量地球化学评价规范》(DZ/T 0295-2016),在湖南省临澧县土地质量调查工作过程中完成。样品分析由湖南省地质调查院测试中心承担,具体方法如下:土壤pH值采用电极法测定;Mo、Mn、Zn、Cu、Cd、Pb、Cr、Ni、V采用ICP-MS和ICP-OES测定;As、Hg、Se采用AFS测定;N采用凯氏定氮法测定;碱解氮、有机质、阳离子交换量采用容量法测定;有效磷、速效钾采用ICP-OES测定。所有分析均通过空白试验、标准物质测定和平行样测定进行严格质量控制。
研究内容主要包括:
插值方法优选:以5万比例尺调查的Cd数据为例,利用ArcGIS软件的空间分析功能,分别在丘陵区和平原区,应用确定性插值法中的径向基函数法(RBF)和地统计法中的普通克里金法(Ordinary Kriging)对实测数据进行插值及交叉验证。
采样尺度优选:对丘陵区和平原区两种不同工作尺度(指1:10,000和1:50,000尺度数据)的测试数据进行插值(采用优选出的方法)和交叉验证,明确两地貌区的合理土壤采样尺度。
结果判定依据:《土地质量地球化学评价规范》(DZ/T 0295-2016),遵循镉(Cd)相对误差最小原则:1) 计算不同尺度下土壤样品Cd实测值与插值预测值的相对误差(RE = |预测值 − 实测值|/实测值 × 100%),统计RE ≤ 30%的样本比例;2) 比较不同调查尺度样品的RE统计结果,若RE ≤ 30%的样本比例 ≥ 85%,则判定结果符合规范要求,并建议采用成本最低的调查尺度;3) 若RE ≤ 30%的样本比例 < 85%,则建议采用该比例最大的调查尺度。此外,为更全面评估插值精度,同时计算了均方根误差(Root Mean Square Error, RMSE)和平均绝对误差(Mean Absolute Error, MAE)。RMSE对较大误差更为敏感,MAE则反映平均误差水平。
4. 结果
4.1. 数据特征统计
表1展示了研究区实测数据的简单统计特征。从表中可以看出,平原区样本的平均Cd含量是丘陵区样本的两倍以上。同时,就数据离散程度来说,1万比例尺的平原区样本要低于丘陵区,5万比例尺的平原区样本要高于丘陵区,同地貌区1:10,000尺度变异系数高于1:50,000尺度。这一数据分布特征在图1的箱型图上展示得非常清楚。
4.2. 插值方法设置
径向基函数法(RBF):选用能更好反映细节的规则样条函数,圆形搜索半径设定为2.5倍采样点距。普通克里金法:对数据进行正态分布转换后,采用半变异函数模型拟合。
4.3. 插值结果
平原区与丘陵区不同尺度、不同插值方法的交叉验证精度评价结果分别见表2和表3。
Table 1. Summary table of measured data for the study area
表1. 研究区实测数据统计简表
数据尺度 |
1万尺度 |
5万尺度 |
研究区 |
平原区 |
丘陵区 |
平原区 |
丘陵区 |
样品总数(个) |
198 |
195 |
54 |
54 |
最小值 |
0.144 |
0.093 |
0.326 |
0.153 |
最大值 |
0.820 |
0.659 |
0.820 |
0.318 |
平均值(mg/kg) |
0.599 |
0.234 |
0.599 |
0.238 |
标准偏差(mg/kg) |
0.115 |
0.052 |
0.109 |
0.035 |
变异系数(%) |
19.20 |
22.22 |
18.20 |
14.70 |
Figure 1. Box plot of measured data in the study area
图1. 研究区实测数据箱型图
Table 2. Cross-validation accuracy assessment results of different interpolation methods at various scales in the plain area
表2. 平原区不同尺度不同插值方法交叉验证精度评价结果
数据尺度 |
1万尺度 |
5万尺度 |
插值方法 |
径向基函数 |
普通克里金 |
径向基函数 |
普通克里金 |
样品总数(个) |
198 |
198 |
54 |
54 |
RMSE (mg/kg) |
0.093 |
0.094 |
0.100 |
0.103 |
MAE (mg/kg) |
0.070 |
0.073 |
0.081 |
0.081 |
RE ≤ 30%数量 |
185 |
183 |
50 |
50 |
RE ≤ 30%比例 |
93.43% |
92.42% |
92.59% |
92.59% |
Table 3. Cross-validation accuracy assessment results of different interpolation methods at various scales in the hilly area
表3. 丘陵区不同尺度不同插值方法交叉验证精度评价结果
数据尺度 |
1万尺度 |
5万尺度 |
插值方法 |
径向基函数 |
普通克里金 |
径向基函数 |
普通克里金 |
样品总数(个) |
195 |
195 |
54 |
54 |
RMSE (mg/kg) |
0.055 |
0.054 |
0.038 |
0.036 |
MAE (mg/kg) |
0.038 |
0.037 |
0.032 |
0.030 |
RE≤ 30%数量 |
165 |
169 |
50 |
50 |
RE ≤ 30%比例 |
84.62% |
86.67% |
92.59% |
92.59% |
5. 讨论
5.1. 采样尺度与地貌类型的交互效应
1) 平原区
平原区Cd含量呈现低波动均质分布(变异系数 ≈ 19%),1:50,000尺度虽导致数据极值范围微缩(表1,最小值从0.144→0.153 mg/kg,最大值稳定于0.820 mg/kg),但空间结构保持稳定(变异系数仅降5%)。这种特性使两种尺度插值精度高度接近:
RE ≤ 30%比例:1:10,000 (92.4%-93.4%) → 1:50,000 (92.6%),差异 < 1%;
绝对误差:RMSE从0.093→0.103 mg/kg (↑10.8%),MAE从0.070→0.081 mg/kg (↑15.7%),但占均值比例仍低(RMSE/均值 = 17.2%)。
我们发现,虽然平原区地形与母质均一,元素空间变异平缓,高密度采样(1:10,000)能捕捉微弱局部变化,但是1:50,000尺度已足够表征区域趋势,其精度损失在规范容差范围内,成本降幅达72.7% (样品数195→54),显著优于精度损失。
2) 丘陵区
丘陵区1:10,000尺度暴露强烈局部变异(CV = 22.2%,最大值0.659 mg/kg达均值2.8倍),这种由微地形或人为干扰导致的“噪声”破坏空间连续性,致使插值精度受限(RE ≤ 30%比例 ≤ 86.7%)。而1:50,000尺度通过增大采样单元,有效过滤由微地形驱动的局部异常(如最大值从0.659→0.318 mg/kg,变异系数降至14.7%)。同时,RE ≤ 30%比例跃升至92.6%,RMSE由0.055降至0.036 mg/kg。误差占均值比例仅12.6%-16.0%,显著低于30%阈值。
我们发现,1:50,000尺度调查在丘陵这种相对复杂地貌中非但无损信息量,反而抑制局部噪声、增强区域信号,同步优化了数据质量与预测精度。同时,1:50,000尺度的成本大大降低(采样点减少72.3%)。
5.2. 插值方法的地貌适配性
1) 平原区
平原区两种方法差异微弱(RE比例差 < 1.1%),但1:10,000尺度下RBF的微弱优势(RMSE = 0.093 vs. 0.094 mg/kg)反映其数学曲面在高密度平稳数据中略优的拟合能力。而1:50,000尺度下方法差异消失,印证简化数据削弱算法特异性需求。
2) 丘陵区
在丘陵区1:10,000高噪数据中,普通克里金法(RE ≤ 30% = 86.7%)优于径向基函数法(84.6%),源于克里金法通过半变异函数显式建模空间结构,而RBF依赖数学光滑性导致过度平滑[12] [13]。并且以克里格插值法为代表的地统计插值法优于确定性插值法已经得到广泛验证[14]-[16]。
5.3. 精度与成本均衡的综合分析
总的来说,本研究结果与简中华等[10]在浙江龙游的发现部分一致,即降低采样密度(如从1:50,000到1:25万)可能导致信息损失。然而,本研究在临澧丘陵区观察到一个关键且反直觉的现象:在满足规范基本精度要求的前提下,1:50,000尺度的插值精度甚至显著优于1:10,000尺度。这与通常“密度越高精度越好”的预期不同,突显了“地形复杂度与元素空间变异性的尺度依赖性”。这一发现深化了关于地形影响空间变异性的认识[4] [17]-[19],明确指出在复杂丘陵区,追求过高采样密度(1:10,000)反而可能因过度解析局部噪声而降低区域尺度插值的整体精度和成本效益。本研究创新性地将地貌条件作为采样尺度决策的核心考量因素,并通过严格的交叉验证给出了针对平原和丘陵区的具体优化建议(1:50,000尺度 + 优先普通克里金法),为未来土地质量地球化学调查工作的设计提供了直接、可操作的依据,有助于在保障成果可用性的同时显著降低调查成本,促进成果转化应用。
5.4. 研究局限性与展望
本研究揭示“采样尺度–地貌复杂度–插值方法”的三角耦合关系,通过系统精度分析,发现复杂区稀疏采样反而提高精度,挑战“密度至上”传统认知。但是,本研究结论基于湖南省临澧县特定平原与丘陵区域的对比分析。尽管研究区地貌类型具有一定代表性,但中国地域广阔,不同气候带、不同地质背景下的土壤地球化学元素空间变异规律可能存在差异。未来研究可进一步选取更多样化的地貌单元和土壤类型区,进行类似尺度和插值方法的验证,以评估本研究结论的普适性,并探索建立不同景观单元下的最优采样尺度体系。
6. 结论
基于上述研究,得出以下结论:
1) 在规范要求的1:50,000工作比例尺下,无论对于平原区还是丘陵区,采用径向基函数法或普通克里金法进行插值,其精度(RE ≤ 30%样本比例 > 85%)均能满足《土地质量地球化学评价规范》(DZ/T 0295-2016)要求。
2) 平原区1:50,000尺度可替代1:10,000尺度,精度损失可控(ΔRE < 1%,RMSE/均值 = 17.2%)且降本72.7%;
3) 丘陵区1:50,000尺度为必需选择,精度提升6%~8%的同时抑制局部噪声(变异系数↓34%)且降本72.3%;
4) 全域统一方案(1:50,000尺度 + 普通克里金法)可解决“精度–成本”悖论,推动土地调查成果规模化落地。
基金项目
本研究由湖南省地质院领军人才计划项目(HNGSTP202320)提供资助。