平原与丘陵区土壤地球化学调查的优化采样尺度:1:50,000尺度验证与克里金插值优选
Optimized Sampling Scale for Soil Geochemical Surveys in Plain and Hilly Areas: Validation of the 1:50,000 Scale and Kriging Interpolation Preference
DOI: 10.12677/ag.2025.157100, PDF, HTML, XML,    科研立项经费支持
作者: 林治家, 胡 航, 宋江涛, 李湘玉:湖南省地质调查所,湖南 长沙
关键词: 土壤地球化学采样尺度空间插值交叉验证Soil Geochemistry Sampling Density Spatial Interpolation Cross-Validation
摘要: 为确定不同地貌条件下满足精度要求的成本最优采样尺度,研究选取湖南省临澧县南部丘陵区和北部平原区各6 km2典型区域,对比分析了1:10,000与1:50,000两种采样尺度数据。基于《土地质量地球化学评价规范》(DZ/T 0295-2016),以镉(Cd)为指示元素,采用径向基函数法(RBF)和普通克里金法(Ordinary Kriging)进行空间插值与交叉验证,并以相对误差(RE= |预测值 − 实测值|/实测值) ≤ 30%的样本比例 ≥ 85%作为精度达标判据。结果表明:1) 1:50,000尺度下两地貌精度均超规范要求(RE ≤ 30%比例 > 92%);2) 平原区尺度缩减未显著降低精度(RE比例降幅 < 1 %);3) 丘陵区1:50,000尺度精度反超1:10,000尺度(RE比例提升6%~8%),揭示稀疏采样在复杂区具“降噪提精”效应;4) 普通克里金法在丘陵区抗噪性更优。综合技术经济性,建议全域采用1:50,000采样尺度 + 普通克里金法,可降本72.3%~72.7%,且保障成果可用性。
Abstract: To identify the cost-optimal sampling scale meeting accuracy requirements under different topographic conditions, this study selected two representative 6 km2 areas—a hilly region in the south and a plain region in the north of Linli County, Hunan Province. Comparative analysis was conducted on data collected at 1:10,000 and 1:50,000 sampling scales. Following the Specification of Land Quality Geochemical Assessment (DZ/T 0295-2016), we selected cadmium (Cd) as the indicator element. Spatial interpolation and cross-validation were performed using Radial Basis Function (RBF) and Ordinary Kriging methods. Accuracy compliance was judged based on the criterion that the proportion of samples with a relative error (RE = |Predicted − Measured|/Measured) ≤ 30% must reach or exceed 85%. Key findings reveal that: 1) The 1:50,000 scale achieves compliance (> 92% RE ≤ 30%) in both terrains; 2) Plain areas tolerate scale reduction with negligible accuracy loss (ΔRE < 1%); 3) Hilly areas exhibit counterintuitive gains at 1:50,000 scale (↑6%~8% RE compliance), indicating noise suppression by sparser sampling; 4) Ordinary Kriging outperforms RBF in complex topography. This cost-optimal protocol (1:50,000 + Kriging) reduces sampling costs by 72.3%-72.7% while meeting accuracy standards (DZ/T 0295-2016).
文章引用:林治家, 胡航, 宋江涛, 李湘玉. 平原与丘陵区土壤地球化学调查的优化采样尺度:1:50,000尺度验证与克里金插值优选[J]. 地球科学前沿, 2025, 15(7): 1083-1089. https://doi.org/10.12677/ag.2025.157100

1. 引言

21世纪初,中国地质调查局在全国范围内启动并大规模实施了多目标区域地球化学调查计划(亦称土地质量地球化学调查计划) [1]。历经20余年,该计划已完成1:25万土地质量地球化学调查约255万平方公里,1:50,000调查约28万平方公里,在土壤地球化学质量研究方面取得了丰硕成果[1]-[3]。然而,受土壤地球化学元素空间变异性[4]-[6]、评价技术方法局限性[7]-[11]以及土壤环境质量标准变化等因素影响,土壤地球化学质量评价结果仍难以精准落实到土地利用图斑,限制了成果的大规模应用。

为解决上述问题,本研究以湖南省临澧县为研究区,通过优选插值方法,旨在筛选出丘陵区和平原区土壤地球化学质量评价的最佳采样尺度,以期降低工作成本,促进调查成果的推广与应用落地。

2. 研究区域与研究方法

临澧县地处武陵山余脉与洞庭湖盆地过渡地带,地势总体西高东低,由西部山区向东部的洞庭湖盆地倾斜,地貌以微丘、平原为主,间有山岳。出露地层涵盖蓟县系至第四系。该县属中亚热带向北亚热带过渡的湿润季风气候区。受多种成土母质、气候及地形地貌综合影响,形成了以红壤和水稻土为主的五类土壤。

本研究在临澧县南部丘陵区和北部平原区各选取面积为6 km²的矩形区域,开展1:10,000与1:50,000比例尺调查的对比研究。

平原区:位于刻木山乡–新安镇–合口镇交界处,属澧水、道水冲湖积平原堆积地貌。地质背景为全新世湖冲积层,岩性上部为灰褐、黄褐色砂质粘土和灰黑色淤泥质粘土,下部为灰黑色砂卵石层。土壤类型以水稻土为主,次为潮土和红壤,含少量红色石灰土。土地利用以水田为主,旱地极少。

丘陵区:位于烽火乡,属剥蚀构造地貌丘陵区。地质背景复杂,主要出露震旦纪金家洞组(灰色硅质页岩、硅质岩夹灰绿色薄层状页岩、条带状泥岩)和留茶坡组(灰–灰黑色薄–中层硅质岩夹硅质页岩、碳质硅质板状页岩),以及南华纪长安组(块状含砾砂岩、含砾泥质砂岩夹板岩、凝灰质砂岩)、富禄组、大塘坡组和南沱组(灰黄色粗至粉砂质与泥质相间的条带状板岩、块状细粒长石砂岩、块状含砾石英砂岩、灰岩及页岩)。土壤类型主要为水稻土和红壤,含极少量潮土和红色石灰土。土地利用主要为林地、水田和旱地,含少量果园。

3. 材料与方法

所有样品采集、加工均遵循《土地质量地球化学评价规范》(DZ/T 0295-2016),在湖南省临澧县土地质量调查工作过程中完成。样品分析由湖南省地质调查院测试中心承担,具体方法如下:土壤pH值采用电极法测定;Mo、Mn、Zn、Cu、Cd、Pb、Cr、Ni、V采用ICP-MS和ICP-OES测定;As、Hg、Se采用AFS测定;N采用凯氏定氮法测定;碱解氮、有机质、阳离子交换量采用容量法测定;有效磷、速效钾采用ICP-OES测定。所有分析均通过空白试验、标准物质测定和平行样测定进行严格质量控制。

研究内容主要包括:

插值方法优选:以5万比例尺调查的Cd数据为例,利用ArcGIS软件的空间分析功能,分别在丘陵区和平原区,应用确定性插值法中的径向基函数法(RBF)和地统计法中的普通克里金法(Ordinary Kriging)对实测数据进行插值及交叉验证。

采样尺度优选:对丘陵区和平原区两种不同工作尺度(指1:10,000和1:50,000尺度数据)的测试数据进行插值(采用优选出的方法)和交叉验证,明确两地貌区的合理土壤采样尺度。

结果判定依据《土地质量地球化学评价规范》(DZ/T 0295-2016),遵循镉(Cd)相对误差最小原则:1) 计算不同尺度下土壤样品Cd实测值与插值预测值的相对误差(RE = |预测值 − 实测值|/实测值 × 100%),统计RE ≤ 30%的样本比例;2) 比较不同调查尺度样品的RE统计结果,若RE ≤ 30%的样本比例 ≥ 85%,则判定结果符合规范要求,并建议采用成本最低的调查尺度;3) 若RE ≤ 30%的样本比例 < 85%,则建议采用该比例最大的调查尺度。此外,为更全面评估插值精度,同时计算了均方根误差(Root Mean Square Error, RMSE)和平均绝对误差(Mean Absolute Error, MAE)。RMSE对较大误差更为敏感,MAE则反映平均误差水平。

4. 结果

4.1. 数据特征统计

表1展示了研究区实测数据的简单统计特征。从表中可以看出,平原区样本的平均Cd含量是丘陵区样本的两倍以上。同时,就数据离散程度来说,1万比例尺的平原区样本要低于丘陵区,5万比例尺的平原区样本要高于丘陵区,同地貌区1:10,000尺度变异系数高于1:50,000尺度。这一数据分布特征在图1的箱型图上展示得非常清楚。

4.2. 插值方法设置

径向基函数法(RBF):选用能更好反映细节的规则样条函数,圆形搜索半径设定为2.5倍采样点距。普通克里金法:对数据进行正态分布转换后,采用半变异函数模型拟合。

4.3. 插值结果

平原区与丘陵区不同尺度、不同插值方法的交叉验证精度评价结果分别见表2表3

Table 1. Summary table of measured data for the study area

1. 研究区实测数据统计简表

数据尺度

1万尺度

5万尺度

研究区

平原区

丘陵区

平原区

丘陵区

样品总数(个)

198

195

54

54

最小值

0.144

0.093

0.326

0.153

最大值

0.820

0.659

0.820

0.318

平均值(mg/kg)

0.599

0.234

0.599

0.238

标准偏差(mg/kg)

0.115

0.052

0.109

0.035

变异系数(%)

19.20

22.22

18.20

14.70

Figure 1. Box plot of measured data in the study area

1. 研究区实测数据箱型图

Table 2. Cross-validation accuracy assessment results of different interpolation methods at various scales in the plain area

2. 平原区不同尺度不同插值方法交叉验证精度评价结果

数据尺度

1万尺度

5万尺度

插值方法

径向基函数

普通克里金

径向基函数

普通克里金

样品总数(个)

198

198

54

54

RMSE (mg/kg)

0.093

0.094

0.100

0.103

MAE (mg/kg)

0.070

0.073

0.081

0.081

RE ≤ 30%数量

185

183

50

50

RE ≤ 30%比例

93.43%

92.42%

92.59%

92.59%

Table 3. Cross-validation accuracy assessment results of different interpolation methods at various scales in the hilly area

3. 丘陵区不同尺度不同插值方法交叉验证精度评价结果

数据尺度

1万尺度

5万尺度

插值方法

径向基函数

普通克里金

径向基函数

普通克里金

样品总数(个)

195

195

54

54

RMSE (mg/kg)

0.055

0.054

0.038

0.036

MAE (mg/kg)

0.038

0.037

0.032

0.030

RE≤ 30%数量

165

169

50

50

RE ≤ 30%比例

84.62%

86.67%

92.59%

92.59%

5. 讨论

5.1. 采样尺度与地貌类型的交互效应

1) 平原区

平原区Cd含量呈现低波动均质分布(变异系数 ≈ 19%),1:50,000尺度虽导致数据极值范围微缩(表1,最小值从0.144→0.153 mg/kg,最大值稳定于0.820 mg/kg),但空间结构保持稳定(变异系数仅降5%)。这种特性使两种尺度插值精度高度接近:

RE ≤ 30%比例:1:10,000 (92.4%-93.4%) → 1:50,000 (92.6%),差异 < 1%;

绝对误差:RMSE从0.093→0.103 mg/kg (↑10.8%),MAE从0.070→0.081 mg/kg (↑15.7%),但占均值比例仍低(RMSE/均值 = 17.2%)。

我们发现,虽然平原区地形与母质均一,元素空间变异平缓,高密度采样(1:10,000)能捕捉微弱局部变化,但是1:50,000尺度已足够表征区域趋势,其精度损失在规范容差范围内,成本降幅达72.7% (样品数195→54),显著优于精度损失。

2) 丘陵区

丘陵区1:10,000尺度暴露强烈局部变异(CV = 22.2%,最大值0.659 mg/kg达均值2.8倍),这种由微地形或人为干扰导致的“噪声”破坏空间连续性,致使插值精度受限(RE ≤ 30%比例 ≤ 86.7%)。而1:50,000尺度通过增大采样单元,有效过滤由微地形驱动的局部异常(如最大值从0.659→0.318 mg/kg,变异系数降至14.7%)。同时,RE ≤ 30%比例跃升至92.6%,RMSE由0.055降至0.036 mg/kg。误差占均值比例仅12.6%-16.0%,显著低于30%阈值。

我们发现,1:50,000尺度调查在丘陵这种相对复杂地貌中非但无损信息量,反而抑制局部噪声、增强区域信号,同步优化了数据质量与预测精度。同时,1:50,000尺度的成本大大降低(采样点减少72.3%)。

5.2. 插值方法的地貌适配性

1) 平原区

平原区两种方法差异微弱(RE比例差 < 1.1%),但1:10,000尺度下RBF的微弱优势(RMSE = 0.093 vs. 0.094 mg/kg)反映其数学曲面在高密度平稳数据中略优的拟合能力。而1:50,000尺度下方法差异消失,印证简化数据削弱算法特异性需求。

2) 丘陵区

在丘陵区1:10,000高噪数据中,普通克里金法(RE ≤ 30% = 86.7%)优于径向基函数法(84.6%),源于克里金法通过半变异函数显式建模空间结构,而RBF依赖数学光滑性导致过度平滑[12] [13]。并且以克里格插值法为代表的地统计插值法优于确定性插值法已经得到广泛验证[14]-[16]

5.3. 精度与成本均衡的综合分析

总的来说,本研究结果与简中华等[10]在浙江龙游的发现部分一致,即降低采样密度(如从1:50,000到1:25万)可能导致信息损失。然而,本研究在临澧丘陵区观察到一个关键且反直觉的现象:在满足规范基本精度要求的前提下,1:50,000尺度的插值精度甚至显著优于1:10,000尺度。这与通常“密度越高精度越好”的预期不同,突显了“地形复杂度与元素空间变异性的尺度依赖性”。这一发现深化了关于地形影响空间变异性的认识[4] [17]-[19],明确指出在复杂丘陵区,追求过高采样密度(1:10,000)反而可能因过度解析局部噪声而降低区域尺度插值的整体精度和成本效益。本研究创新性地将地貌条件作为采样尺度决策的核心考量因素,并通过严格的交叉验证给出了针对平原和丘陵区的具体优化建议(1:50,000尺度 + 优先普通克里金法),为未来土地质量地球化学调查工作的设计提供了直接、可操作的依据,有助于在保障成果可用性的同时显著降低调查成本,促进成果转化应用。

5.4. 研究局限性与展望

本研究揭示“采样尺度–地貌复杂度–插值方法”的三角耦合关系,通过系统精度分析,发现复杂区稀疏采样反而提高精度,挑战“密度至上”传统认知。但是,本研究结论基于湖南省临澧县特定平原与丘陵区域的对比分析。尽管研究区地貌类型具有一定代表性,但中国地域广阔,不同气候带、不同地质背景下的土壤地球化学元素空间变异规律可能存在差异。未来研究可进一步选取更多样化的地貌单元和土壤类型区,进行类似尺度和插值方法的验证,以评估本研究结论的普适性,并探索建立不同景观单元下的最优采样尺度体系。

6. 结论

基于上述研究,得出以下结论:

1) 在规范要求的1:50,000工作比例尺下,无论对于平原区还是丘陵区,采用径向基函数法或普通克里金法进行插值,其精度(RE ≤ 30%样本比例 > 85%)均能满足《土地质量地球化学评价规范》(DZ/T 0295-2016)要求。

2) 平原区1:50,000尺度可替代1:10,000尺度,精度损失可控(ΔRE < 1%,RMSE/均值 = 17.2%)且降本72.7%;

3) 丘陵区1:50,000尺度为必需选择,精度提升6%~8%的同时抑制局部噪声(变异系数↓34%)且降本72.3%;

4) 全域统一方案(1:50,000尺度 + 普通克里金法)可解决“精度–成本”悖论,推动土地调查成果规模化落地。

基金项目

本研究由湖南省地质院领军人才计划项目(HNGSTP202320)提供资助。

参考文献

[1] 李括, 彭敏, 赵传冬, 等. 全国土地质量地球化学调查二十年[J]. 地学前缘, 2019, 26(6): 128-158.
[2] 王学求. 勘查地球化学80年来重大事件回顾[J]. 中国地质, 2013, 40(1): 322-330.
[3] 奚小环, 李敏. 中国区域化探若干基本问题研究: 1999-2009[J]. 中国地质, 2012, 39(2): 267-282.
[4] 刘伟, 郜允兵, 周艳兵, 等. 农田土壤重金属空间变异多尺度分析——以北京顺义土壤Cd为例[J]. 农业环境科学学报, 2019, 38(1): 87-94.
[5] 王玉霞, 杜灵通, 易志远, 等. 宁夏贺兰山东麓葡萄产区土壤有机碳库空间变异及影响因素[J]. 草业学报, 2025, 34(7): 41-53.
[6] 张亚杰, 余力, 曹艳萍, 等. 典型工矿区小流域土壤阳离子交换量空间分布及其影响因素[J]. 水土保持研究, 2025, 32(4): 100-109.
[7] 夏家淇, 骆永明. 我国土壤环境质量研究几个值得探讨的问题[J]. 生态与农村环境学报, 2007, 90(1): 1-6.
[8] 杜艳, 常江, 徐笠. 土壤环境质量评价方法研究进展[J]. 土壤通报, 2010, 41(3): 749-756.
[9] 张焱, 周永章, 姚凌青, 等. 多重分形与地质统计学方法在粤北刘家山地区矿化指示中的应用[J]. 地学前缘, 2012, 19(4): 151-158.
[10] 简中华, 王世纪, 黄春雷, 等. 不同采样密度的土地质量地球化学评估结果对比——以浙江省龙游县为例[J]. 现代地质, 2011, 25(1): 176-181.
[11] 宋召芬, 陈柏达, 张守富, 等. 铜陵市主要农区土壤Cu含量空间插值方法对比[J]. 环境监测管理与技术, 2025, 37(2): 83-87.
[12] 袁峰, 白晓宇, 周涛发, 等. 元素空间分布插值方法的对比研究: 以铜陵地区土壤中的重金属元素为例[J]. 地学前缘, 2008, 71(5): 103-109.
[13] 谢云峰, 陈同斌, 雷梅, 等. 空间插值模型对土壤Cd污染评价结果的影响[J]. 环境科学学报, 2010, 30(4): 847-854.
[14] 龙军, 张黎明, 沈金泉, 等. 复杂地貌类型区耕地土壤有机质空间插值方法研究[J]. 土壤学报, 2014, 51(6): 1270-1281.
[15] 史文娇, 岳天祥, 石晓丽, 等. 土壤连续属性空间插值方法及其精度的研究进展[J]. 自然资源学报, 2012, 27(1): 163-175.
[16] 王坷, 许红卫, 史舟, 等. 土壤钾素空间变异性和空间插值方法的比较研究[J]. 植物营养与肥料学报, 2000(3): 318-322, 344.
[17] 吕悦风, 孙华. 浙北某县域耕地土壤重金属空间分异特征、污染评价及来源分析[J]. 农业环境科学学报, 2019, 38(1): 95-102.
[18] 刘长媛, 韩文昊, 田永任, 等. 鲁中南低山丘陵区土壤理化性质的空间分异及其遥感评估[J]. 山地学报, 2024, 42(4): 442-455.
[19] 赵若言, 王健, 吴雄辉, 等. 顾及空间结构特征的机器学习模型在土壤重金属As含量预测中的应用——以杭州市富阳区为例[J]. 环境科学学报, 2024, 44(11): 288-300.