1. 引言
人口是区域发展的重要要素。人口分布是指在一定时间节点上人口在各地区的分布情况,是人口数据在空间上的表现形式 [1]。研究人口分布,不仅可以了解一定区域人的人口空间特征,还可以分析人口的空间变化趋势,进而为区域制定相关政策、资源合理分配等问题提供科学的参考依据。
人口分布作为人口研究的重要内容,国内外学者对这个问题进行了大量研究,研究内容发可分成三大部分:人口的时空变化、人口分布的影响因素以及对未来人口分布的预测。在时空变化方面,重点研究人口在一定时间范围内的空间特征,描述人口的空间流动情况 [2] [3] [4]。在人口相应时空特征的基础上,部分学者开始研究该特征的影响因素,可分为地理因素和社会经济因素。地理因素包括地表起伏程度、土地利用、水资源等 [5] [6] [7],社会经济要素包括GDP、教育、交通等 [8] [9] [10]。随着技术的快速发展,高铁、飞机等新的交通方式使人们的生活方式产生了巨大的变化,Lizhe Wang和Lajiao Chen对影响京津冀人口分布的因素进行分析,研究发现地理因素对人口分布的影响很低,同时传统的社会经济因素:GDP、技术等因子的影响不大,但新的交通方式,尤其是高铁,成为影响人口分布的主要因素 [8]。以上的研究皆是基于人口的过去和现在信息,确定人口的历史格局和现实情况。人口分布研究可以为未来规划、政策的制定提供科学依据。因此对人口分布的准确预测至关重要。多位学者对人口分布进行了预估,并采取不同模型对人口的增长趋势和空间分布进行拟合 [11] [12] [13]。
我国的人口分布情况,据《中国城市群一体化报告》表明,截止至2015年中国12个城市群占国土面积19.6%,城市群人口占全国63.07% [14]。可见在我国,人口分布有集中于城市群地区的趋势。但是纵观已有研究,目前我国人口分布的研究大多侧重于国家、某个城市群和分省的研究,缺乏对城市群人口分布的研究,对我国主要城市群整体的人口预测研究甚少。苏飞等采用人口分布的结构指数和空间自相关分析,对辽中南城市群人口分布的时空演变特征进行分析 [15]。陈明星等以京津冀城市群为例,基于2015年流动人口卫生计生动态监测调查数据,探讨京津冀城市群流动人口的典型特征和源汇格局 [16]。王露等研究了中国21个城市群地区人口总量从2020~2030年的变化,但研究方法相对单调,仅运用Logistic模型进行拟合和趋势外推得到的结果,未考虑现今对人口分布的影响因素,如交通、教育等 [17]。
在新型城镇化背景下,城市群的发展依赖于区域交通条件的改善。一方面,交通基础设施是人口活动的载体,可以为人口增长提供足够的容纳能力。另一方面,随着交通基础设施的改善,企业物流、信息流的沟通更加顺畅,进一步吸引人口向城市群地区集聚。对于出行者而言,交通基础设施提高了出行的可靠性,能使人们获得更高的出行效用。因此交通基础设施的改善,将会为城市群吸引来更多的人口。
综上所述,本文将考虑城市群的交通配套设施对人口的吸引力,以公路密度、城市道路密度、轨道交通密度构建城市群交通吸引因子,拟合该因子与人口的关系。在城市群内外部交通设施逐年增长完善的情况下,进行城市群人口预测。
2. 研究区域概况
截止至2019年,国务院共批复了11个国家城市群的发展规划,并明确各个城市群的定位以及发展目标。由于哈长城市群对常住人口的统计工作缺失,无法通过插值弥补,因此本文将省去该城市群。另一方面,山东半岛城市群和海西城市群较早进行规划,形成一定的城市群形态,本文将这两个城市群纳入研究范围之内。综上,本文研究的城市群为:京津冀、长三角、珠三角、成渝、长江中游、关中平原、中原、呼包鄂榆、兰西、北部湾、山东半岛以及海西(具体空间范围见表1和图1),共研究12个城市群。

Table 1. Definition of the scope of twelve megaregions
表1. 十二个城市群区域界定
总体来看,12个城市群占地面积221.8万平方公里,截止至2018年共有9.92亿人口。在行政空间尺度,跨域24个省(直辖市、自治区),包括了197个地级市。
考虑到人口数据的收集,本文假定每个城市群的内部基本单位为地级以上城市。个别城市群规划中,对某些地级市下辖的县级市、个别行政区剔除情况,本文将忽略不计。再者,对于部分城市群规划中,城市出现重复的现象,本文按照最新批复的发展规划进行更新。

Figure 1. The scope of twelve megaregions
图1. 十二个城市群空间范围
3. 数据来源与处理
3.1. 收集与处理
本文数据主要有三大来源:中国经济与社会发展统计数据库、各省市统计公报、人口普查数据。数据的时间跨度为2006~2018年。根据研究的内容,主要数据有两大类,常住人口数据和交通基础设施数据。考虑到数据的可获取性,交通数据中,收集了公路里程数据、城市道路长度数据以及轨道交通线路(建成)数据。处理步骤如下:
1) 常住人口数据,首先在中国经济与社会发展统计数据库内,对每个城市群中的城市单元生成常住人口数据报表,对于部分缺失的年份,则逐一查询对应的统计公报以及人口普查报告。经过以上两个步骤,均无法查到的数据,则进行数据插值,得出相应的常住人口数据。
2) 公路里程数据、城市道路长度数据以及轨道交通线路长度数据均来源于中国经济与社会发展统计数据库,首先在该数据库内生成相应数据报表,剔除异常数据,并对部分缺失数据进行插值。
3) 另外,在研究的过程中发现,直接使用城市道路长度数据,会导致部分城市群城市道路密度过高,与已有的研究报告出入较大。因此对城市道路,按照城市规模的大小,将道路分成建成区内道路和非建成区道路。下文的城市道路主要是指建成区内的道路。城市规模的划分,参照2014年11月,国务院印发的《关于调整城市规模划分标准的通知》。具体城市道路划分见表2。
3.2. 数据插值方法
各个地级市对于常住人口数据的统计工作重视程度不一,大城市比如北京、上海、广州等均较早进行常住人口的统计工作,并记入统计公报。但一些小的地级市,如海东市、南平市等对常住人口的统计起步较晚,因此部分数据缺失。为此,本文采用三次样条插值法对常住人口数据补齐,该方法可以平滑地估计各城市人口数量的变化趋势,符合人口变化的基本规律,能够获得良好的人口变化序列(见图2)。对于公路里程、城市道路长度及轨道交通线路长度数据,本文假设交通设施按照一定的速度线性增长,因此本文采用简单的线性插值方法(见图3)。

Table 2. The proportion of roads in built-up areas and non-built-up areas
表2. 建成区与非建成区道路比例划分

Figure 2. Cubic spline interpolation of population data
图2. 三次样条法人口数据插值

Figure 3. Linear interpolation of traffic data
图3. 交通数据线性插值
4. 研究方法
4.1. Logistic模型
人口的增长率主要受现有的人口规模、资源和环境等因素的影响。如今环境已经不是限制人们出行的主要因素,而资源则是人们选择居住和工作地点的重要因素。在新型城镇化的背景下,城市群外部交通便利,有发达的公路交通系统以及近年来快速发展的铁路和航空运输;另一方面,城市群内部为人们的出行提供多种方式,其中有较完善的城市道路和城市轨道交通系统。随着高铁和城际轨道交通的发展,“跨城”生活也成为部分人的选择。城市群内外部交通的便利,加速城市群的资源流动,将会吸引更多人口到城市群区域工作和生活。
因此,本文将以公路、城市道路和城市轨道交通三大要素构建城市群的交通吸引因子。借鉴Logistic模型的思想,当交通吸引因子较低时,该地区对人口的吸引力较弱,人口增长缓慢。当交通吸引因子增加到一个范围时,由于交通的便利性,大量人口被吸引过来,人口快速增加。到后期,交通配套设施能够满足人们的需求时,人口增长进入一个平缓时期,最终该地区的人口会接近人口峰值。模型建立如下:
假设
为第t年的交通吸引因子,令
其中
表示第t年公路路网密度,
表示第t年城市建成区道路路网密度,
表示第t年城市轨道交通线路密度。
、
、
分别表示第t年城市群的公路里程、城市建成区道路长度和城市轨道交通线路长度。S表示城市群的土地面积,B表示城市群建成区面积。
Logistic模型公式如下:
其中Yt为第t年城市群的常住人口数;Xt为交通吸引因子,K、P0、r三个参数分别为人口上限、人口初始值和增长速率,需通过拟合确定。
4.2. Logistic模型参数确定和模型检验
本文收集了2006~2018年的各城市群的常住人口数据、公路里程数据、城市道路数据和城市轨道线路数据。选择2006、2009、2012、2015、2018年的统计数据来进行Logistic曲线进行参数测定,选用2007、2010、2013、2016年的数据进行模型验证。
对于交通吸引因子,本文采用三种要素加权求和的方式进行计算,如下:
其中
、
、
分别为三种要素的权重系数。一般认为外部交通和内部交通权重相等,所以本文令
,
。拟合过程中,令
,
。同时单纯用城市轨道交通线路长度与建成区面积的比值,所得结果过小,加权求和过程中该要素的影响会被另外两个要素覆盖。因此本文对以上公式进行修正,令
,使得所有密度数据均在0~10 km/km2之间。参数确定过程中,主要采用最小MSE准则,模型如下:
yt为历年真实常住人口数据。对于参数求解,本文采用网格优化法,对K和r值进行网格探索,以最小化均方差为目标,找出最优的P0,并计算模型的拟合系数。分别对12个城市群进行参数测定,结果见表3。从表3中可以看出,各个城市群的校正R2均在0.85以上,9个城市群的R2大于0.9,其中北部湾城市群的拟合系数达到0.99。

Table 3. Logistic model parameter results
表3. Logistic模型参数结果
下面,利用拟合出的模型和已知的交通吸引因子,计算2007、2010、2013、2016年的人口数,并检验模型预测的误差。从图4中可以看出,每个城市群的预测相对误差均在5%以内。且平均误差最小为0.46%,所有平均误差均小于3%。可见本模型具有较好的预测效果。
4.3. 人口预测
对于人口预测,本文考虑交通因子的增长速度,假设公路路网密度、城市道路路网密度和城市轨道交通线路密度按照一定的速度
、
线性增长(
)。对不同增长速度的情景,得出高、中、低三个预测方案。高方案认为,交通吸引因子保持从2006~2018年的平均增长率不变。低方案取2006~2018年中,交通吸引因子增长率的最小值。中方案则取高、低方案增长率的平均值。具体如下(见表4):

Figure 4. Relative error and average relative error results
图4. 历年相对误差及平均相对误差结果

Table 4. Traffic attraction factor growth rate table under the three scenarios
表4. 三种方案下交通吸引因子增速表
按照线性增长,可以得到2030、2040年的中、高、低方案中的交通吸引因子,并将其代入logistic模型中,可得到相应的人口预测结果(见表5)。

Table 5. Population prediction results for low, medium and high scenarios
表5. 低、中、高方案人口预测结果
5. 结果分析
一方面,中方案的交通吸引因子各个城市群增速较为均衡,能够反应未来城市群交通基础设施的建设情况。同时,受限于篇幅,本文将集中对中方案的预测结果进行分析。主要从城市群人口变动情况以及城市群人口集聚态势两个维度,定量和定性分析我国城市群人口分布情况。
5.1. 城市群人口变动
5.1.1. 净流入人口分析
根据已有数据和2030、2040年人口预测结果,分析各个城市群人口变动情况。从图5~7中可以看出,在2006~2018,2018~2030,2030~2040三个时期,每个城市群的净流入人口均为正数,表明各个城市群人口呈现增加趋势。但是在这三个时期中,城市群之间人口净流入量的差异较大,主要人口流入的地区也发生了变化。

Figure 5. Net inflow population from 2006 to 2018
图5. 2006~2018年净流入人口
具体看图5中,2006~2018年期间,各城市群净流入人口差异很大,最高的是京津冀城市群,人口净增加2360万人,人口净流入量最低的为兰西城市群,仅98万人。同时,可以看出人口净流入量大于1000万人的城市群为:京津冀、长三角、珠三角以及长江中游城市群。2018~2030年期间,各城市群之间人口净流入量的差异减小,净流入人口最多的中原城市群与净流入人口最少的兰西城市群之间,相差1150万人。同时,人口净流入量大于1000万人的城市群发生了变化,人口增加靠前的为:中原、成渝、长三角及京津冀城市群(见图6)。2030~2040年期间,我国12个城市群人口净流入量进入一个相对均衡的阶段,人口增长在350万~60万之间,进入了一个均衡增长阶段。此时人口流入量居前的城市群主要为京津冀、珠三角、长江中游城市群等,位于我国西北腹地的兰西城市群仍然是人口净流入量最低的城市群(见图7)。

Figure 6. Net inflow population from 2018 to 2030
图6. 2018~2030年净流入人口

Figure 7. Net inflow population from 2030 to 2040
图7. 2030~2040年净流入人口
5.1.2. 人口增减变化分析
为了解城市群地区人口的变化幅度,本文对人口变化进行分级评价(见表6),定量分析人口变化的增减趋势。人口增幅特征反映了城市群内部不同地区的人口增减速度。用对比时间段前期和后期的人口变化幅度和变化量来衡量。

Table 6. Classification of population changes in China’s megaregion
表6. 中国城市群地区人口增减变化分级
经分析,大体上,2006~2018年,我国城市群地区人口均增长,增长幅度略有差异。就空间分布而言,2006~2018年,中国城市群人口显著增长地区主要集中在以北京、上海、广州等大城市为核心的京津冀,长三角和珠三角城市群,这些城市群自2006年以来得益于我国快速的交通设施建设,交通吸引因子居于12个城市群之首,因此人口增长显著,其中珠三角人口增幅是全国平均人口增幅的5倍以上,京津冀4倍,长三角接近2倍。其次为长江中游城市群,位于华中地区,拥有我国多个交通枢纽,在2006~2018年间,人口也呈现显著增长的趋势。其余地区,增长速度缓慢。其中中原城市群、兰西城市群以及呼包鄂榆城市群的人口增长速度低于全国平均人口的增长速度(见图8)。

Figure 8. 2006~2018 distribution of population changes
图8. 2006~2018年城市群人口增减分布
预测结果表明,2030年较2018年相比,我国城市群主要增长地区出现了转移。人口显著增长地区集中在我国的中部和西南部城市群,集中在内陆地区。前10年增长速度较慢的成渝、关中及中原城市群,人口增长幅度增大,其中成渝城市群人口增速是全国平均人口增速的4倍左右。京津冀城市群和珠三角城市群仍然保持显著增长的趋势。其余城市群在2018~2030年之间,人口增幅均稍高于全国平均人口增幅(见图9)。2030~2040年之间,全国大部分城市群人口增幅较为稳定,均1~2倍于全国平均人口增幅。仅兰西和呼包鄂榆城市群人口表现显著增长,增长速度大于全国人口增长速度的2倍以上,但其原因是这两个城市群人口基数小,当全国城市群净流入人口较均衡时,会表现出这两个城市群人口增幅显著的特点(见图10)。

Figure 9. 2018~2030 distribution of population changes
图9. 2018~2030年城市群人口增减分布

Figure 10. 2030~2040 distribution of population changes
图10. 2030~2040年城市群人口增减分布
5.2. 城市群人口集聚度分析
人口集聚度是某一地区的人口密度与全国平均人口密度的比值。该指标可反映城市群不同时期内部的人口集聚情况。人口集聚度计算公式如下:
其中,
是i城市群的人口集聚度;Pi是i城市群的人口数量(人);Ai是i城市群的土地面积(km2);Pn是全国总人口数量(人),An是全国土地面积(km2)。人口集聚度若大于1,说明该地区人口相对人口集聚程度高于全国平均人口集聚程度;若随着时间的延续,人口集聚度持续增大,则说明该地区人口持续集聚,人口分布更加集中。
预测结果表明,2030年中国12个城市群人口集聚度将比2006年大幅度提高,较2018年增幅有所减缓(见图11~14)。2030年,城市群地区的总人口将达到10.68亿人,占全国总人口的73.66%,超过3/5;城市群人口总密度为481.53人/km2,为同期全国人口密度的3.19倍,较2018年提高7.59% (见附表1)。其中人口集聚度水平最高的城市群主要位于东南沿海地区,人口密度均4~8倍于全国平均水平,最高的为珠三角城市群,达到8.25。其次为中部城市群,包括京津冀,成渝等,人口密度大于全国人口密度的3倍。人口集聚度较低的城市群主要位于西北腹地,包括兰西城市群和呼包鄂榆城市群,其人口密度低于全国的平均水平。

Figure 11. 2006 population agglomeration index
图11. 2006年中国城市群人口集聚情况
2040年,中国12个城市群人口总量达到10.92亿人,占同期全国总人口的81.52%,较2018年提高10.08%;人口密度为492.85人/km2,是2018年的1.1倍,人口集聚度也有提高。具体人口集聚情况见图11~14。

Figure 12. 2018 population agglomeration index
图12. 2018年中国城市群人口集聚情况

Figure 13. 2006 population agglomeration index
图13. 2006年中国城市群人口集聚情况

Figure 14. 2018 population agglomeration index
图14. 2018年中国城市群人口集聚情况
6. 结论与展望
本文考虑了交通基础设施对人口的吸引力,通过将交通吸引因子引入Logistic模型,并采用网格优化以及最小均方差法获得最优的模型参数。利用该模型,对中国城市群2030、2040年人口进行预测。在预测的基础上,定量分析我国城市群人口增减变化趋势以及集聚态势。主要结论有以下4点:1) 在2030年、2040年我国城市群人口将呈现增长趋势。从人口净流入量的角度,人口净流入较高的地区集中在东部沿海城市群,以及中原和成渝城市群。从增长幅度来看,2030年人口显著增长区域由京津冀,珠三角,长三角等发展较为成熟的城市群,转向关中,中原,成渝等位于我国中部和西南地区的城市群。这些城市群主要受益于我国日益完善的公路网络建设,以及城市群内部的道路和轨道线路建设,给人们的生活带来极大的便利,也吸引更多的人迁往这些城市群地区。2) 在人口集聚方面,人口集聚度水平最高的城市群主要位于东南沿海地区,人口密度均4~8倍于全国平均水平,最高的为珠三角城市群,达到8.16。其次为中部城市群,包括京津冀,成渝等,人口密度为全国平均人口密度的3倍左右。3) 海西城市群位于珠三角和长三角两大城市群之间,其交通设施密度较低,人口增长幅度和人口集聚度水平皆低于其他城市群。在未来的城市群建设中,应给予关注。4) 最新提出的呼包鄂榆、兰西城市群位于西北腹地,自然环境相对脆弱,交通设施密度很低,应结合相应的城市群发展规划,进行合理建设。
同时,若考虑到经济吸引力,国家政策的影响,特别是生态脆弱地区的保护政策,重点开发区规划和国家主体功能区规划等影响,Logistic模型对这些区域的人口预测可能会出现一定的误差。今后,将考虑更多的外部因素,构造更为复杂精细的模型,获取更为可靠的预测分析结果。