1. 引言
人口结构是影响城市发展进程的关键因素,也在相当程度上反映地区的经济发展水平[1]。本文以江西省为研究对象,综合运用可视化分析与统计方法,对人口结构特征及其演变趋势展开多维度探讨。现有研究多聚焦于东部沿海或全国层面,对江西这一典型中部农业大省的人口结构演变机制缺乏系统探讨。现有文献中,黄昱从社会、自然与地域的维度刻画了福建省的人口特征,李国武等人基于社会需求理论分析了区域人口变迁,但针对江西的研究多停留在描述性统计层面,缺乏理论框架的深入解析。本研究以人口转型理论为核心分析框架,结合第七次江西省人口普查数据,系统探讨该省人口结构的动态演变及其与经济社会发展的互动机制。人口转型理论指出,人口再生产模式会从“高出生率–高死亡率”向“低出生率–低死亡率”转变,这一过程受工业化、城镇化、女性教育水平提升等多因素驱动。江西作为劳动力输出大省和快速城镇化地区,其人口结构变化既符合理论的一般规律,又由于区域的特殊性,例如青壮年人口外流呈现独特表现。
本研究基于第七次江西省人口普查数据,系统分析该省人口在年龄、性别、受教育程度及就业等方面的结构特征,以揭示人口构成现状及其与行业发展的关联。首先,通过可视化方法对人口数量、性别分布、教育水平与就业状况进行初步描述;进而,结合不同年龄段人口的行业分布数据,剖析年龄结构变动对劳动力市场供需的影响趋势,为产业结构优化以及政府与企业层面的劳动力资源规划提供依据,助力经济可持续发展。此外,针对江西省内区域发展不平衡的现实,研究进一步依据各城市行业就业、教育水平与年龄结构等关键指标进行聚类分析,识别不同类别城市的人口结构差异,通过聚类分析识别南昌、赣州和萍乡三类城市的差异化政策需求,为中部省份提供可借鉴的施策案例以及促进区域协调发展、优化资源配置和缩小地区差距提供参考。
2. 文献综述
2.1. 国内研究现状
人口是国家发展的基础性要素,始终受到政府与学界的广泛关注。在人口结构研究方面,国内学者已从多角度展开深入探讨:李国武等基于社会需求理论,运用回归分析方法解析区域人口结构变迁及其对社会发展的影响[2];黄昱将人口结构划分为自然、社会与地域三个维度,系统描述了福建省人口结构的现状与动态特征[3]。亦有学者分别从性别结构、年龄结构[4]、城乡消费结构[5]、产业结构[6]及文化结构[7]等视角,剖析人口因素对社会发展的作用机制;还有研究从技术创新的角度探讨人口老龄化对经济发展的影响[8]。在研究方法上,程风雨等利用时间序列熵值法,分析了性别结构、城镇化水平、人口文化素质与年龄结构对经济可持续发展的影响[9],但未结合转型理论解释区域差异;高腾飞等通过高斯混合模型估计,揭示了教育水平、性别比与城镇化率对消费支出的作用[10];杜晓宇则借助协整检验与VAR模型的脉冲响应分析,指出城镇化进程有助于促进城镇就业总量增长与产业结构优化[11],不过在江西等地的结构性矛盾方面缺少关注。江西作为“中部塌陷”典型,其人口转型如何受劳动力外流与回流影响?现有研究尚未结合人口转型理论,分析其“低生育率–高老龄化”与东部地区的异同。
2.2. 国外研究现状
在经济社会影响方面,Gazi Hassan等人基于人口性别结构,分析了男女健康水平对经济发展的影响[12],但未覆盖发展中国家的农村地区;另有研究通过建立世代交叠模型,发现教育结构与人口年龄结构的变化会通过影响消费、劳动力供给与资本积累等途径,推动西欧经济发展。这个模型解释了老龄化对西欧的影响,不过需要适合江西的半城镇化特征。在研究方法上,国外学者亦采用多种量化模型,如运用马尔可夫链评估老年人健康状态转移概率[13],但难以捕捉江西人口迁移的非线性效应。采用多元回归与Logistic回归预测中国老年人的长期护理需求,以及利用半参数模型分析人口迁移中的非线性关系[14]。后者不仅能捕捉单一因素的非线性效应[15],也具备对复杂数据结构的灵活拟合能力。现有理论多基于发达国家经验,对江西这类“转型中”地区的人口政策适配性研究不足。
3. 相关概念与数据
3.1. 相关概念
人口结构是指一个国家或地区在规定的时间点上,其人口在年龄、性别、教育水平、就业等方面的分布情况。它是社会经济研究中的一个重要概念,对社会经济的发展、政府制定政策以及预测未来趋势都具有重要意义。人口结构包含性别结构、年龄结构、教育结构、就业情况等。其中性别结构是指人口中男性和女性的比例,如果一个地区男女性别比例失衡,可能会出现结婚生育问题,从而导致社会不稳定;年龄结构是指不同年龄段的分布情况,一般分为0~14岁、15~64岁和65岁及以上,年龄结构的变化对劳动力市场、消费市场、社会保障体系会产生深远影响;教育结构是指人口在不同教育水平的分布情况,教育结构的变化可以反映当代社会对教育的重视程度和人力资本的积累情况,受教育程度高的人口比例增加,通常代表整体社会的素质提高,进而促进增加社会科技创新水平;就业结构则是指人口在不同行业领域的分布情况,随着产业结构的变化和经济的发展,就业结构也会随之变化,并且其变化在一定程度上会影响劳动力市场的供需关系。
3.2. 数据来源
本文所研究的全部数据均来源于江西统计局中第七次人口普查的统计数据以及前六次人口普查数据、《江西省人口普查年鉴2020》《江西统计年鉴》。
4. 江西省基本人口数据分析
4.1. 人口数量分布
从图1可以看到江西省的人口主要集中在赣州市、南昌市以及上饶市,其中赣州市的人口数量排名第一,这可能与该城市拥有相对较高的人口密度和较大的地域面积有关。而新余市和鹰潭市的人口数量相对江西省的其他城市较少,这可能与两座城市的地理位置没有那么便利、经济发展水平较落后、所能提供给人们的就业机会较少从而难以吸引人们定居下来有关联。
Figure 1. Population distribution in Jiangxi Province
图1. 江西省人口数量分布情况
4.2. 性别分布
性别分布对于一个城市的消费市场、劳动力供需以及公共服务的供给都具有重要影响。图2体现出江西省各城市的性别分布。都呈现出一个特点,即男性人口的数量要多于女性人口的数量。南昌市和赣州市这两座城市的产业结构以服务业和工业为主,对于男性劳动力的需求相对较大,从而吸引了大量男性劳动力,同时也与不同性别的出生人数以及人口流动相关,导致男女比例不是很均衡。
Figure 2. Bar chart showing the distribution of genders in Jiangxi Province
图2. 江西省性别分布柱状图
4.3. 性别分布
教育水平不仅仅会影响其个人的发展,对于该城市的经济发展、就业结构以及文化发展都会产生深远作用。从图3可以发现南昌市的教育水平为本科和硕士的人数远多于其他城市。萍乡市未上过学的人
Figure 3. Column chart showing the proportion of students with different educational levels in various cities in Jiangxi Province
图3. 江西省各城市不同教育水平占比柱状图
数是所有城市中最少的,这可能得益于该市将教育摆在优先发展的地位,加大教育的投入,提高整体市民的文化素质。整体来看江西省的居民教育水平集中在小学和初中,硕士学历以上的人数占比很少。这可能由于江西省经济发展水平相较于沿海地区不是很发达,高等教育资源受到限制、教育资源分配的不均衡以及传统观念等多种因素造成的结果,因此江西省在未来需要加大对教育的投入,提高教育质量,优化教育资源分配,提高整体市民的文化水平。
4.4. 各行业就业人数
图4体现了不同年龄段在各行业就业分布的情况,首先农林牧渔业、制造业和批发零售业的就业人数比较多,这是因为江西省是农业大省,农业基础雄厚,制造业是其支柱产业之一,这些行业在全省经济发展中占据重要地位,具有较强的就业吸纳能力。其中50~54岁年龄段的人群成为农林牧渔业的主力军,表明该行业更青睐具有一定的相关行业经验的劳动者。而制造业和批发零售业就业人群最多的是30~34岁的中年人群,表明这些行业对劳动者的体力以及经验要求比较高,中年劳动力是比较合适的。
Figure 4. Line chart showing the number of employees at different age groups in various industries in Jiangxi Province
图4. 江西省不同年龄段在各行业就业人数折线图
4.5. 不同性别婚姻状况
从图5可以看到江西省男性未婚的比例相对于女性要大一些,主要的原因可能与男女比例失衡,即男性适婚人数比女性适婚人数多、彩礼和婚姻成本、经济与社会因素等多方面因素有关。
Figure 5. Bar chart showing the proportion of men and women in various marital statuses
图5. 男女婚姻状况占比柱状图
4.6. 人口自然增长率、出生率及死亡率
由图6所示,总体来看,2010~2020这十年期间,江西省人口自然增长率变化趋势与中国人口自然增长率变化趋势相似,均呈现下降趋势且江西省人口自然增长率均高于中国人口自然增长率。江西省死亡率保持稳定且低于中国死亡率;出生率高于中国的出生率,整体呈现下降趋势。就人口自然增长率而言,2010~2017年江西省人口自然增长率的波动范围在6.91~7.71内,2018年后人口自然增长率进一步下降,在2020年降到0.25接近零增长。出生率下降、人口老龄化都是导致人口增长缓慢的因素。
Figure 6. Line chart comparing population growth rate, mortality rate, and birth rate between Jiangxi Province and China from 2010 to 2020
图6. 2010~2020江西省与中国就人口增长率、死亡率、出生率对比折线图
4.7. 就业人数趋势分析
由图7所示,受到产业结构调整,部分传统产业例如农业和制造业就业机会减少、人口自然增长率降低、就业观念改变等影响,2010~2020年江西省的就业人数总体呈现下降趋势。
Figure 7. Line chart showing the trend of employment numbers in Jiangxi Province from 2010 to 2020
图7. 2010~2020江西省就业人数情况折线图
4.8. 人口抚养比变化趋势
从图8可以看到,这十年期间江西省少儿抚养比呈现出上升趋势,从21.52%上升到33.19%,且高于全国平均水平,表明劳动力人口的相对减少和少儿人口数量占比的增多。江西省老年抚养比和全国老年抚养比均呈现增长趋势,江西省总抚养比呈现增长趋势与全国总抚养比的变化趋势保持一致,且江西省总抚养比均高于全国总抚养比,反映了该省份劳动力资源的减少,劳动力市场面临严峻挑战,人口老龄化程度加深,对于劳动年龄的人口需要承担的社会养老压力加重。
Figure 8. Line chart comparing the population dependency ratio in Jiangxi Province from 2010 to 2020 with that of China
图8. 2010~2020江西省人口抚养比与中国对比折线图
5. 聚类分析
基于表1中2020年各城市的指标数据,利用K均值聚类分析方法对江西省各个城市的人口结构进行聚类,根据不同类别的人口结构特点提供一些合理、可参考的发展建议。
Table 1. Clustering analysis indicators table
表1. 聚类分析指标表
 
  
    各城市的指标类别  | 
  
  
    城镇人均收入  | 
    农、林、牧、渔业  | 
  
  
    0~14岁人口占比  | 
    电力、热力、燃气及水生产和供应业  | 
  
  
    15~64岁人口占比  | 
    建筑业  | 
  
  
    65岁及以上人口  | 
    批发和零售业  | 
  
  
    大学本科以上  | 
    交通运输、仓储和邮政业  | 
  
  
    已婚  | 
    住宿和餐饮业  | 
  
  
    未婚  | 
    信息传输、软件和信息技术服务业  | 
  
  
    离婚  | 
    金融业  | 
  
  
    就业人数  | 
    房地产业  | 
  
  
    采矿业  | 
    租赁和商务服务业  | 
  
  
    制造业  | 
    科学研究和技术服务业  | 
  
  
    水利、环境和公共设施管理业  | 
    居民服务、修理和其他服务业  | 
  
  
    卫生和社会工作  | 
    教育  | 
  
  
    文化、体育和娱乐业  | 
    公共管理、社会保障和社会组织  | 
  
 K均值聚类分析方法的核心思想是以空间中K个点为中心进行聚类,把距离某个中心最近的对象归类到其中,通过不断迭代的方法,依次更新各聚类中心的值,直到得到最好的聚类结果结束。
聚类分析的第一步,假设有m个样本,需要手动输入最终聚类的类别的数量(即K值),随后系统会随机选取K个数据点作为初始的聚类中心,这里定义初始聚类中心点的集合为:
	
	(1)
然后再通过计算每个样本与各聚类中心间的欧式距离:
	
	(2)
将样本归入最近的聚类中心,形成初步的类别:
	
	(3)
后续根据各类别中的所有样本的平均位置,各类别的中心位置也会随之变化,
是各类别的样本数量:
	
	(4)
通过不断的迭代,各类别的聚类中心也会不断改变,直至达到预设的迭代次数或者连续两次迭代的聚类中心变化很小,迭代结束,得到最终聚类结果:
	
	(5)
按照表1中的指标进行聚类,本文采用肘部方法,通过比较不同K值的聚类内部距离之和来找到最合适的聚类类别数量,如图9所示:
Figure 9. Clustering number diagram
图9. 聚类个数图
由图9聚类个数图可以观察到,随着聚类个数的增加,距离平方和随之减少,误差平方和变小,坡度从聚类个数为3的点开始逐渐趋于平缓,后面增加聚类个数误差平方和也没有显著的变化,通常认为这个点是聚类类别个数最优的选择。所以本文选择聚类类别个数为3进行K均值聚类分析。表2是聚类中心指标表由14个聚类中心指标构成。
Table 2. Clustering center indicators table
表2. 聚类中心指标表
 
  
    聚类中心指标  | 
  
  
    X1:城镇人均收入  | 
    X8:居民服务、修理和其他服务业  | 
  
  
    X2:0~14岁人口占比  | 
    X9:水利、环境和公共设施管理业  | 
  
  
    X3:15~64岁人口占比  | 
    X10:科学研究和技术服务业  | 
  
  
    X4:公共管理、社会保障和社会组织  | 
    X11:租赁和商务服务业  | 
  
  
    X5:文化、体育和娱乐业  | 
    X12:房地产业  | 
  
  
    X6:卫生和社会工作  | 
    X13:金融业  | 
  
  
    X7:教育  | 
    X14:信息传输、软件和信息技术服务业  | 
  
 Table 3. Clustering center value table
表3. 聚类中心值表
 
  
    聚类种类  | 
    X1  | 
    X2  | 
    X3  | 
    X4  | 
    X5  | 
    X6  | 
    X7  | 
    X8  | 
    X9  | 
    X10  | 
    X11  | 
    X12  | 
    X13  | 
    X14  | 
  
  
    1  | 
    38,333  | 
    127.02  | 
    358.943  | 
    9523.7  | 
    1196  | 
    4441.2  | 
    10,471  | 
    10054.3  | 
    1644.3  | 
    2206.5  | 
    7056.8  | 
    3583.3  | 
    2399.1  | 
    2844.2  | 
  
  
    2  | 
    46,796  | 
    109.09  | 
    450.45  | 
    13,188  | 
    2934  | 
    6527  | 
    16,492  | 
    10394  | 
    2589  | 
    5274  | 
    12,280  | 
    8331  | 
    5658  | 
    6292  | 
  
  
    3  | 
    41,068  | 
    30.252  | 
    96.352  | 
    3041.5  | 
    444.3  | 
    1308.5  | 
    3059.8  | 
    4487.5  | 
    517  | 
    745.5  | 
    2384.5  | 
    1036.8  | 
    789.3  | 
    805.8  | 
  
 由表3可以得到每个聚类类别各指标的中心值,可以得到三个类别的特征:
在聚类1中的城市,如赣州市、九江市,特征表现为相对较低的人均收入,少儿人口数量适中,而15~64岁人口占比较高,具有较为稳定的劳动力结构。在行业分布上,公共管理、社会保障和社会组织,以及卫生、教育和社会工作等行业中心值较高,表明这些城市可能拥有较为完善的社会服务体系,对于卫生、教育资源的投入相对较高。然而,金融业,科学研究和技术服务业以及信息技术服务业和信息传输、软件的中心值相对比较低,说明该类别的城市在这些行业领域的发展有提升空间。
在聚类2的城市有南昌市,则展现出较高的人均收入,少年人口占比相对较低,15~64岁人口占比极高,反映出更为成熟的人口结构和较高的经济发展水平。居民的教育水平普遍较高,另外各行业的中心值普遍都比较高,尤其是金融业、科学研究和技术服务业、信息传输、信息技术服务业和软件等高端服务业,表现出该类别的城市具有较强的经济发展活力。
聚类3城市有萍乡市、新余市,其特点表现为人均收入适中,少儿人口占比极低,15~64岁人口占比也相对较低,说明该类别聚类的城市可能面临着人口老龄化的挑战。大部分行业的中心值均比较低,尤其是高端服务业的中心值普遍比较低,表明这些城市在产业结构优化和转型升级方面面临着较大压力。
6. 影响人口年龄结构的因素
主成分分析方法的核心思想是通过线性变换把原始高维度的数据投影到低维空间,同时又可以保留数据中的主要信息,它是一种常用的降维方法。在主成分分析之前,需要先将分析的数据标准化,使得每个指标的均值为0,方差为1,其中
为均值,
为方差,定义的公式为:
	
	(6)
将数据标准化处理好后,计算各变量间的相关性:
	
	(7)
将得到的协方差矩阵进行特征值分解,并选择累计解释方差达到80%以上的主成分,最后利用投影矩阵T对原始数据X进行数据降维:
	
	(8)
本文想探究影响江西省人口年龄结构的因素,结合江西省的实际情况和阅读的文献,选取出生率、死亡率、城镇化率、居民人均收入以及就业人数这几个指标作为主成分分析的变量,利用江西省2013~2020年统计年鉴的数据采用SPSS软件进行分析。
从表4可以发现,前两个主成分的特征值的累计方差解释率达到了99.393%,基本上保留了原始变量大部分的信息,因此这里取前两个主成分来分析江西省的人口年龄结构。
Table 4. Table total analysis of variance of principal components
表4. 主成分总方差分析表
 
  
    成分  | 
    特征根  | 
    方差解释率(%)  | 
    累计方差解释率(%)  | 
  
  
    1  | 
    3.622  | 
    72.44  | 
    72.44  | 
  
  
    2  | 
    1.348  | 
    26.953  | 
    99.393  | 
  
  
    3  | 
    0.026  | 
    0.524  | 
    99.917  | 
  
  
    4  | 
    0.004  | 
    0.083  | 
    99.999  | 
  
  
    5  | 
     | 
    0.001  | 
    100  | 
  
 Table 5. Factor loadings coefficient table
表5. 因子载荷系数表
 
  
     | 
    主成分1  | 
    主成分2  | 
    共同度(公因子方差)  | 
  
  
    出生率  | 
    −0.842  | 
    −0.528  | 
    0.988  | 
  
  
    城镇化率  | 
    0.967  | 
    −0.241  | 
    0.993  | 
  
  
    死亡率  | 
    0.424  | 
    0.902  | 
    0.994  | 
  
  
    居民人均可支配收入  | 
    0.942  | 
    −0.335  | 
    0.999  | 
  
  
    就业人数  | 
    −0.954  | 
    0.292  | 
    0.996  | 
  
 通过表5因子载荷系数表可以得出,成分1中,居民人均可支配收入和城镇化率呈现正相关载荷,并对人口年龄结构具有高度影响,说明这两个变量在成分1上具有相似的变化趋势,居民人均可支配收入和城镇化率的提高,年轻的劳动力向城市转移,体现了江西省社会进步和经济发展的特点。然而,就业人数和出生率这两个变量在成分1上呈现负相关载荷,可能在经济比较发达的城市或者地区,随着生活水平的提升,人口出生率的降低导致就业放缓。
成分2则呈现出不同的变量相关关系,其中死亡率这一变量是成分2的主要贡献者,具有显著的正载荷,反映了人口结构老龄化或健康状况的变化趋势,对人口老龄化具有较大影响。居民人均可支配收入和出生率呈现为负载荷,表明经济状况和人口变化之间存在一种反向平衡机制,如经济压力可能间接影响生育决策,而人口结构的变化又可能反过来影响经济的发展速度以及质量。
7. 结论与建议
本文通过对江西省整体及各地市人口结构的系统分析,得出以下主要结论与建议:
(一) 主要结论
1) 人口分布不均衡:全省人口总量处于全国中等水平,空间分布高度集中,赣州、南昌和上饶三市人口规模居前,而新余、鹰潭等地人口相对偏少。
2) 性别结构差异明显:各城市男性人口均多于女性,其中南昌、赣州男女数量差距较大,萍乡市性别比例接近1:1。
3) 教育水平整体偏低,区域与性别差异突出:全省居民学历以小学和初中为主,高学历人群占比低。南昌市本科及以上学历人口显著多于其他城市。各城市男性平均受教育程度普遍高于女性。
4) 就业结构呈现行业与年龄分化:农林牧渔业、制造业和批发零售业为就业主体。其中,农林牧渔业以50~54岁人群为主,制造业和批发零售业则以30~34岁人群居多。
5) 婚姻状况显示性别与地域特征:全省未婚男性多于女性,南昌市男女未婚比例均为最高。
6) 人口自然增长趋缓:2010~2020年间,江西省人口自然增长率持续下降,但仍高于全国平均水平;死亡率保持稳定且低于全国;出生率整体呈下降趋势。
7) 人口抚养压力增大:同期少儿抚养比上升并高于全国,老年抚养比持续增长,总抚养比亦呈上升趋势且高于全国水平。
8) 城市人口结构聚类呈现三类发展梯度:1、南昌类城市:人均收入高,劳动力资源丰富,人口结构成熟,经济活力强,高端服务业发达。2、赣州、九江类城市:人均收入中等,劳动力结构稳定,公共服务较为完善,但在金融、科研等技术密集型行业有较大提升空间。3、萍乡、新余类城市:人均收入偏低,少儿及劳动年龄人口占比低,老龄化压力大,产业转型与升级任务艰巨。
9) 人口年龄结构受多重因素影响:居民人均可支配收入与城镇化率对年龄结构具有显著影响,反映年轻劳动力向城市集聚的趋势;死亡率变化对人口老龄化进程也具有重要影响。
(二) 政策建议
1) 优化人口布局,增强中小城市吸引力:推动资源共享与企业合作,加强人口较少城市的产业培育与基础设施建设,提升就业机会和城市形象,促进人口合理流动。
2) 促进教育公平,缩小性别与区域差距:加大对经济落后地区和农村的教育投入,改善师资与设施;倡导性别平等,鼓励女性接受高等教育并提供相应支持。
3) 推动就业结构适配与人才素质提升:结合各行业就业人口的年龄特征,制定差异化的人才培养与技能提升计划,增强劳动力市场匹配度。
4) 完善生育支持体系,强化人口长期规划:出台鼓励生育政策,延长产假、提供生育与教育补贴,完善儿童医疗体系,加强健康婚育观念宣传,以提升生育意愿。
5) 积极应对老龄化,增强区域人口活力:在老龄化突出地区完善养老服务体系与基层医疗服务,通过教育、住房等优惠政策吸引年轻人口流入,缓解老龄化压力。
6) 因地制宜推动产业升级与经济转型:支持九江等城市重点发展金融、科技服务等高端产业;推动萍乡、新余等城市加快产业结构优化与转型升级。
7) 强化跨部门协同,提升综合治理能力:加强政府各部门在人口政策方面的协调联动,共同应对人口结构变化带来的挑战,促进经济社会可持续发展。
8) 统筹城乡发展,缓解年龄结构失衡:协同推进城镇化与乡村振兴,改善农村基础设施与公共服务,着力提高居民收入,缩小城乡差距,促进人口年龄结构均衡演变。