1. 引言
中药半夏为天南星科植物(Pinellia ternata (Thunb.) Breit)干燥块茎,拥有重要药用和经济价值。半夏在我国中药出口中位居5~10名,排名稳定[1] [2],出口数量多达1400吨,市场潜力大,近年来还逐渐拓展到欧美国家。半夏有祛痰平喘、降逆止呕[3]、抗溃疡的疗效,其中生半夏,姜半夏,法半夏有镇咳作用,同时还具有一定燥湿化痰,抗肿瘤和安神定智的作用[4]。同时半夏野生资源处于灭绝边缘,全国除内蒙古、新疆、青海、西藏尚未发现野生的外,各地广泛分布,常见于海拔2500米以下,草坡、荒地、玉米地、田边或疏林下[5]。
目前,对于市场对半夏需求激增、半夏野生品种濒临灭绝和培育技术过于落后三者之间矛盾的增强[6]。近几年野生半夏地区被破坏[7],野生资源匮乏,大量地区已经开始半夏的规模化种植培育。同时半夏的伪品来源较多,假冒伪劣现象严重,半夏的质量和临床用药安全也受到了严重影响[8]。此外,半夏培养点和品种选择缺乏科学理论指导以致资源浪费。因此,最适栖息地的确定和优先保育区的选择对于促进半夏资源保护与持续发展至关重要。
最大熵(MaxEnt)模型可以适应各种类型的数据分布,不依赖于特定的数据分布,这区别于其他的传统模型[9],同时,最大熵(MaxEnt)模型拥有使用灵活和性能良好的特性[10]。尤其适用于中药材的评估。本实验应用最大熵(MaxEnt)模型来运算半夏全国适生区分布概率。ArcGIS软件提供大量的空间分析工具,具有专业制图和可视化表达的优势。本实验制图均用ArcGIS软件绘制。ArcGIS软件提供准确的环境因子的信息,最大熵(MaxEnt)模型可以利用环境因子来确定物种最佳培育环境因素,二者结合,能够更深入地了解环境因子与物种分布之间的关系,从而更好地评估生态环境对物种生长造成的影响,利于分析出主要的生态保护区块。
为了确保半夏适宜栖息地,本研究运用最大熵(MaxEnt)和ArcGIS软件来预测不同情境下半夏在中国潜在适生区分布范围,探索气候,土壤,地形等因素对半夏分布的影响,为未来在中国的持续利用提供理论基础。
2. 材料与方法
2.1. 半夏分布数据收集与处理
本次实验从中国数字植物标本馆(http://www.cvh.ac.cn/)和NSII-中国国家标本资源平台
(http://www.nsii.org.cn/)中获得半夏标本的分布点信息,在全国范围内共收集到289份记录。去除重复数据和含混信息后,用百度经纬度查询并确定地理坐标信息最终获得半夏的分布样点。此外,利用ArcGIS10.4选择邻域分析来设置以10 km为半径的缓冲区,在20 km的范围内随机保存一个分布点,对其他分布点进行筛选处理并删除数据,最后得到237个有效分布点(图1)。保存为CSV.格式,包括平种名、经度和纬度,作为后续分析的依据。
该图基于自然资源部标准底图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改。
Figure 1. Effective distribution points of Pinellia ternata across the country
图1. 半夏全国有效分布点
2.2. 环境因子的选择与处理
本研究采用的自然环境数据涵盖气候、土壤及地形三大类,气候数值信息均来自于全球气候数据库WordClim (https://www.worldclim.org),共提取19个气候变量[11]。本次实验以1970~2000年期间的气候数据作为研究基准,进一步选取2041~2060年、2081~2100年两个未来时段,基于第六次国际耦合模式比较计划(CMIP6)发布的共享社会经济路径(SSPs)模型[12],获取不同情境下的19个气候因子数据。其中,SSP126 (低强迫情境)和SSP585 (高强迫情境)分别代表未来温室气体排放的乐观与悲观极端情形[13] [14]。此外,本研究从世界土壤数据库(http://www.fao.org/soils-portal/data-hub/en/)和WorldClim网站(https://www.worldclim.org/)采集11个土壤因子及3个地形因子数据。最终,经筛选整合,本研究确定33个独立环境因子(详见表1),作为后续分析的核心数据基础。
Table 1. 19 climate variables
表1. 19个气候变量
Variable |
Description |
Variable |
Description |
bio_1 |
Annual mean temperature |
bio_18 |
Precipitation of warmest quarter |
bio_2 |
Mean diurnal range (mean of monthly (max temp-min temp)) |
bio_19 |
Precipitation of coldest quarter |
bio_3 |
Isothermality ((Bio02/Bio07) * 100) |
awc_class |
Soil available water content |
bio_4 |
Temperature seasonality (standard deviation * 100) |
s_caco3 |
Topsoil calcium Carbonate |
bio_5 |
Max temperature of warmest month |
s_clay |
Substrate-soil clay content |
bio_6 |
Min temperature of coldest month |
s_oc |
Substrate-soil organic carbon |
bio_7 |
Temperature annual range(Bi05-Bi06) |
s_ph_h2o |
Substrate-soil pH |
bio_8 |
Mean temperature of driest quarter |
s_sand |
Sediment content in the subsoil |
bio_9 |
Mean temperature of warmest quarter |
t_caco3 |
Topsoil carbonate or lime content |
bio_10 |
Mean temperature of coldest quarter |
t_clay |
Clay content in the upper soil |
bio_11 |
Annual precipitation |
t_oc |
Topsoil organic carbon |
bio_12 |
Precipitation of wettest month |
t_ph_h2o |
Topsoil pH |
bio_13 |
Precipitation of driest month |
t_sand |
Sand content |
bio_14 |
Precipitation seasonality (coefficient of variation) |
aspect |
Aspect |
bio_15 |
Precipitation of wettest quarter |
elev |
Elevation |
bio_16 |
Precipitation of driest quarter |
slope |
Slope |
bio_17 |
Driest quarterly precipitation |
|
|
为降低环境因子之间的高度相关性和多重共线关系造成模型的模型过适,确保预测结果的精准性,本研究使用SPSS26.0软件对以上环境因子进行Spearman相关性分析[15] [16],最终保留17个环境因子作为半夏的预测模型的基础,包括8个气候因子(bio_2、bio_3、bio_4、bio_5、bio_6、bio_8、bio_14、bio_18),6个土壤因子(s_ph_h2o、s_oc、t_clay、s_sand、t_oc、awc_class)和3个地形因子(aspect、elev、slope)。
2.3. MaxEnt模型与适宜生境划分
本研究使用Maxent3.4.1模型预测半夏在中国范围内的分布。将筛选处理后的自然环境因子和半夏在全国范围内的分布数值信息输入Maxent软件中,在分布数据中随机抽取75%的数值信息作为训练集,剩下25%的数值信息作为测试集做模型预测[17]-[19],设置迭代数为10,000,模型重复10次,利用刀切法对自然环境变量数据进行重检测。计算受试者工作特征曲线(ROC)下面积(AUC)量化Maxent模型预测精确性,AUC的取值范围为[0~10],AUC值越接近1,代表模型预测结果越精确,可信度越好[20]。一般而言,当AUC ≤ 0.6时认为模型预测结果失败;0.6 < AUC ≤ 0.7时,模型预测结果较差;0.7 < AUC ≤ 0.8时,模型的预测结果一般;0.8 < AUC ≤ 0.9时,模型预测结果良好;0.9 < AUC ≤ 1.0时,模型预测结果优秀[21] [22]。
2.4. 半夏适生等级划分
Maxent模型得到半夏研究分布概率(P)后,利用ArcGIS10.4.1软件中重分类(Reclassify)工具,根据分布概率P值将半夏培育适生区分为四个等级(表2)。
Table 2. Division of suitable habitats
表2. 适生区划分
分布概率(P) |
评价等级 |
分布概率(P) |
评价等级 |
Probability distribution |
Evaluation |
Probability distribution |
Evaluation |
P < 0.1 |
非适生区 |
0.1 ≤ P < 0.3 |
低适生区 |
0.3 ≤ P < 0.6 |
中适生区 |
0.6 ≤ P ≤ 1 |
高适生区 |
3. 结果与分析
3.1. 模型预测结果
经10次重复运行测试后,模型ROC曲线的ACU平均训练值达0.909 (图2)。这一结果充分证明该模型具有卓越的预测精度,能够可靠地用于分析半夏的潜在适生区块。
Figure 2. ROC curve
图2. ROC曲线
3.2. 影响半夏生长的环境因子与影响程度
由图3可知,最干燥月降雨量(bio_14)贡献率最高,达到33.8%,其次是最暖季节降水量(bio_18),贡献率为21.5%,最冷月最低温(bio_6)、温度季节性变化方差(bio_4)、坡度(slope)、昼夜温差月均值(bio_2)、坡向(aspect)及昼夜温差及年温差比值(bio_3)的贡献率分别为17.5%、6.1%、4.6%、4.2%、2.9%、2.1%,其余环境变量因子的贡献率均未达到2%,以上结果表明最干燥月降雨量(bio_14)和最温暖季节降水量(bio_18)是影响半夏潜在适生区的重要环境因子,且最干燥月降雨量(bio_14)是决定半夏培育的最关键环境因子。
Figure 3. Importance of dominant environmental factors in the MaxEnt model
图3. MaxEnt模型主导环境因子的重要性
3.3. 当前气候下分布预测
根据《中国植物志》记载,半夏除内蒙古、新疆、青海、西藏尚未发现野生外,全国各地广布,常见于海拔2500米以下,草坡、荒地、玉米地、田边或疏林下[23]。如图4所示,不同颜色区块直观呈现半夏的适生程度:白色区块为不适宜生长区块;绿色表示低适生区,橙色表示中适生区,红色则表示高适生区。数据显示,半夏地理分布集中于20˚N~43˚N纬度带与92˚E~125˚E经度带,该经度内覆盖中适生区与高适生区,其总适生区面积达199.38 × 104 km2,占中国总面积的18.22%,其中高适生区仅占总适生区面积的7.46%。从空间分布特征来看,当前半夏总适生区呈现显著的集聚性,主要覆盖华中、华南及东南地区东部,在华东地区则以零散斑块状分布,与《中国植物志》中半夏自然分布区的描述基本一致。其中,高适生区主要分布在重庆、广西、湖南等地。中适生区围高适生区呈环绕式分布,主要涵盖四川、广西、湖南、江西、湖北,以及四川西部、广东北部地区。低适生区面积为47.178 × 104 km2,占我国总面积的4.91%。不适生区大多位于我国的北方和西部地区,其中在广西、广东、福建等地也有大面积分布。(图5)
该图基于自然资源部标准底图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改。
Figure 4. Distribution map of the current suitable growing areas of Pinellia ternata
图4. 半夏当前适生区分布图
Figure 5. Venn diagram of the distribution of high-fertility areas in various provinces
图5. 高适生区各省分布韦恩图
3.4. 未来气候下的分布预测
本研究共选取4个时期预测半夏在中国的隐性分布,根据MaxEnt模型的运算结果,得到2050s和2090s情境下(SSP126、SSP585)的半夏适宜生境分布图。
在未来的研究预测中,未来半夏的分布范围将呈现多向延展趋势(如图6(a)~(d)所示)。这一现象表明,随着全球气候的持续变化,半夏对环境的适应能力增强。由当前的中南部核心带向华北平原推进约300公里,并在云贵高原西侧形成新的适生斑块;同时沿海岸线向东北延伸,至2090年已覆盖山东丘陵地带。逐渐适应新的环境条件,包括气候、地形等环境因子的变化,并在此基础上拓展其生存范围。
(a):2041~2060 (2050S)平均值,SSP126;(b):2041~2060 (2050S)平均值,SSP585;(c):2081~2100 (2090S)平均值,SSP126;(d):2081~2100 (2090S)平均值,SSP585。该图基于自然资源部标准底图服务网站下载的审图号为GS(2019)1822号的标准地图制作,底图无修改。
Figure 6. Distribution of suitable growing areas of Pinellia ternata under two different growth periods
图6. 两种时期情境下半夏适生区的分布
表3和图7表示,未来半夏适宜生境面积及其生长情况:在SSP126情境中,2050年总适生区面积为225.64 × 104 km2,较当前气候情境上升13.17%,其中高适生区面积、中适生区和低适生区分别上升11.65%、1.52%、3.12%。2090年总适生区面积为223.35 × 104 km2,较当前气候情境上升12.02%,具体表现为高适生区上升了18.26%,低适生区上升了5.56%,中适生区减少6.24%。在SSP585情境下2050年与2090年半夏总适生区面积达到最大,其中2050年总适生区面积为260.66 × 104 km2,较当前气候情境上升30.73%,高适生区上升36.64%,低适生区上升8.00%,中适生区减少5.90%。2090年总适生区面积为260.66 × 104 km2。较当前气候情境上升30.73%,其中低适生区和高适生区分别上升了8.00%和36.64%,中适生区减少5.90%。
Figure 7. Changes in percentage of the area of Pinellia ternata suitable for different scenarios and the area under current climate conditions
图7. 不同情境半夏适生区面积与当前气候面积百分比变化
Table 3. The ratio of the percentage of each suitable habitat area to my country’s land surface area (960 × 104 km2) in different periods
表3. 不同时期各适生区占我国陆地表面积的面积百分比(960 × 104 km2)的比值
时期 |
不适生区 |
低适生区 |
中适生区 |
高适生区 |
面积 (*104 km2) |
百分比 (%) |
面积 (*104 km2) |
百分比 (%) |
面积 (*104 km2) |
百分比 (%) |
面积 (*104 km2) |
百分比 (%) |
Current |
713.44 |
74.32 |
47.18 |
4.91 |
127.80 |
13.31 |
71.58 |
7.46 |
2050S |
SSP126 |
680.94 |
70.93 |
53.42 |
5.56 |
130.83 |
13.63 |
94.81 |
9.88 |
SSP585 |
636.20 |
66.27 |
63.14 |
6.58 |
116.03 |
12.09 |
144.63 |
11.25 |
2090S |
SSP126 |
678.83 |
70.71 |
57.82 |
6.02 |
115.35 |
12.02 |
108.00 |
15.07 |
SSP585 |
636.20 |
66.27 |
63.14 |
6.58 |
116.03 |
12.09 |
144.63 |
15.07 |
4. 讨论
4.1. MaxEnt模型模拟结果的可靠性
在大量物种分布模型中,MaxEnt模型预测准确性与全面适用性的应用效果显著[24] [25]。半夏分布数据越多,模型预测就越精确[26]。本研究将半夏的采样标本信息收集全面,防止因样本问题带来的预测偏差。同时,在线性距离中选择10 km,从而降低采样点的地理偏差。此外,为防止模型的过度拟合,将绝对值大于0.8的相关性系数删除,使得模拟结果更为精确[27]。仅使用地形、气候等因子来预测半夏的适宜生境,研究表明海拔高度、温度和降水是影响半夏分布最重要的环境因子,本研究在此基础上上升了土壤这个环境因子,表现出更高的精度。由于本研究未充分涵盖植物生物学特性、自然生态过程及人类活动等多维影响要素,致使预测结果与现实分布格局存在一定程度的偏离。未来研究可通过精细化调校MaxEnt模型参数体系,系统性整合植物生理生态指标、环境演变动态及社会经济要素,构建多维度耦合分析框架,从而进一步提升模型预测的准确性与普适性。总之,本次研究最终结果经过ROC曲线精度检验,MaxEnt模型AUC高达0.905,说明本次模型效果好、精确度高,为半夏宏观保护策略提供了一定参考价值。
4.2. 影响半夏分布的主要环境因子
在植物生长中,水分和温度可能是非常重要的影响因素,参与信号传导、自身防御及生理调节等代谢途径[28] [29]。本研究显示,最干燥月降雨量(bio_14)、最温暖季节降水量(bio_18)和最寒冷月最低温(bio_6)是半夏潜在分布的主导环境因子。由此可见,半夏的适生区分布受降水量影响尤为显著。其中,影响半夏分布最主要的气候因子是最寒冷月最低温度(bio_6),这与王家禄[30]的研究结果一致。
利用Maxent模型预测出当前半夏总适生区分布比较集中,主要位于我国华中、华南以及东南地区的东部,在华东地区也有少许碎片化趋势分布。目前药用半夏主产区在湖北、甘肃、河南、贵州、江苏等地,总适生区为199.38 × 104 km2,由此可见,半夏资源还存在很大的发展空间,可以根据环境因子的研究情况,在保证温度,降水量,光照的情况下,在我国北部地区选址进行引种试种研究,以满足市场的需求。
5. 结论
该研究为我国半夏资源的综合培育、保育及科学规范利用提供了重要的科学依据。本研究基于MaxEnt模型系统评价了不同气候情境下半夏适宜生境变化。得出以下结论:影响半夏分布的关键环境因子是bio_14、bio_18和bio_6。在我国,半夏的高适生区主要分布在重庆、湖南,中适生区沿着高适生区呈环绕分布。所以我国半夏资源尚存在广阔的发展空间。通过研究环境因子对半夏生长的影响,可以在保障适宜温度、降水量和光照条件的前提下,在我国北部地区积极开展引种试种研究,从而更好地提供经济需求,并促进半夏资源的可持续利用发展。根据适生区研究结果,培育半夏有利于扩大半夏种植规模,降低濒危灭绝的风险和促进物种间的共存性与多样性维持和发展。
本研究仍然存在一些不足,本次模型中没有考虑到极端天气事件,病虫害事件,人类活动和经济发展等非关键环境因子因素。MaxEnt模型具有精确快速的优点,并且保证半夏分布数据的完备性,但是这些非关键环境因子因素带来的预测偏差仍然是我们需要关注以及考虑的因素。因此,在后续研究中,需综合考虑多种因素的影响,运用多种模型方法,从而获得更精确的结果。
NOTES
*共一作者。
#通讯作者。