1. 绪论
1.1. 选题的背景及意义
长沙市是华中地区的中心城市。2020年面对新冠肺炎疫情的严重冲击和错综复杂的国内外宏观经济环境,长沙市认真贯彻党的十九届五中全会精神和习近平总书记考察湖南重要讲话精神,扎实做好“六稳”“六保”工作,全市经济社会发展呈现稳中有进、稳中向好的态势,实现地区生产总值12142.52亿元,比上年增长3.2%,是中部第二个、中西部第四个GDP突破万亿大关的城市。其经济发展处于全省以及全国前列,铸就发展里程碑。分产业看,第一产业增值423.46亿元,比上年增长4.0%;第二产业增值4739.27亿元,增长5.0%;第三产业增加6979.79亿元,增长3.3%,产业对GDP增长的贡献率分别为2.7%、50.7%和46.6%。经济总量的壮大惠及广大居民,人民获得感不断增强。收入增速加快,长沙市全年居民人均可支配收入达57,971元,比上年增长5.0%;价格水平稳定,全市居民消费价格指数比上年上涨1.8%;就业稳定增长,全市新增城镇就业13.83万人,城镇登记失业率控制在3.5%以内;民生支出增多,全市财政支出中用于教育、医疗卫生、社会保障和就业、公共交通等民生方面的支出达1480.24亿元,比上年增长3.8%。以上数据来源于2020年长沙市国民经济和社会发展统计公报。
随着我国经济全面发展,长沙市县域(包含长沙县、望城区、宁乡市、浏阳市,下同)经济以全面建成小康社会为总揽,加速转型创新,县域经济实现平稳较快增长,主要经济指标增速均高于全省。“十三五”规划期间,城区经济发展受到重视,深入了解城区经济发展,可以因地制宜,制定相关策略推动当地经济发展,提高居民幸福水平。因此本文选取2020年长沙市城区经济发展的相关指标,采用多元统计方法对长沙市城区经济发展指标进行分析并得到综合评价,从而为长沙市经济发展提供建议,其他城市也能由此借鉴。
1.2. 研究问题与目标
查找资料发现有很多反映经济发展的指标,并且大多存在相关性。这使得研究过程中会出现信息重叠的情况,误导分析结果的正确性。因此,有必要缩小这些指标的维度。本文的目的是在这些指标变量的基础上,通过研究长沙市经济发展,运用多元统计分析方法,发现长沙各城区经济发展的差异性,为长沙市经济发展提供最优的政策结论和建议。
1.3. 研究思路
本文对长沙市城区经济发展进行研究,选取8个对城区经济发展影响较大的指标,通过SPSS软件结合主成分分析和因子分析,同时引入聚类分析。先对原始数据进行检验,接着采用spearman相关系数检验法对主成分分析和因子分析结果进行检验,进行组合评价。在前两者的基础上进行聚类分析对长沙市9个城区分类,找出长沙市各城区经济发展之间的差异性,由综合得分给出综合排名。为了克服单一方法的不足,本文综合了四种多元统计方法,最后对四种方法进行总结评价,构建一个较为全面的综合评价体系。
2. 文献综述
城区经济发展是统计学研究中的重要课题之一,作者阅读了大量的参考文献,发现之前的文献一般以宏观区域为主,大多只精确到省份,旨在解决国家宏观经济问题,而具体研究地级市区域经济发展的案例很少。
文乐(2016)研究武汉市城区经济发展,综合了四种多元统计方法从四个方面进行分析,最后对结果进行综合评价 [1];莫行健(2018)研究浙江省11个市的经济发展差异,由主成分分析和因子分析计算出各市的经济发展得分并对其排序,依据排序对浙江省各市分别提供针对性政策建议 [2];任冬雪、李毛毛(2016)选择山东省七个港口城市,通过主成分分析对七个城市2013年的经济发展水平进行研究并给出建议 [3];刁节文、熊巧丽(2012)通过运用系统聚类分析和主成分分析方法,综合评价成都市9个城区的经济发展水平 [4];樊偲(2017)基于SPSS中的因子分析法研究长江经济带五个沿江城市区域经济发展,构建城市评价模型 [5];欧阳敏(2015)通过对怀化市鹤城区经济发展体制存在的问题进行全面分析,评价市辖区经济发展面临的新形势 [6];贾劲松(2017)运用因子分析综合评价长江经济带各省市新型城镇化的发展水平,并在此基础上运用聚类分析对各省市的新型城镇化水平进行科学划分,从而精确了解长江经济带各省份的新型城镇化发展水平 [7];解素雯(2016)比较常规加权平均法,证明了在综合评价中组合模型的可行性 [8];祁洪全(2001)建立了应用因子分析和主成分分析进行综合评价的数学模型,并对实际问题进行了综合评价 [9];卢胜(2006)研究城区经营,探究城区经营的差异性和基本理论 [10]。就目前对区域经济的研究来看,前人只针对全国或者某个省的经济结构进行研究,并没有进一步细化研究某个城市城区的经济发展,因此,本文结合主成分分析、因子分析和聚类分析 [11],通过研究长沙市城区经济发展差异化,对不同城区给出不同的政策建议,促进长沙市城区经济平衡发展。
3. 研究原理
3.1. 主成分分析
3.1.1. 基本思想
主成分分析也称主分量分析。主成分分析是利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维的作用。
3.1.2. 主成分分析的数学模型
设对某一事物的研究涉及p个指标,分别用X1, X2, X3, ∙∙∙, XP表示,这p个指标构成对的p维随机向量维X = (X1, X2, X3, ∙∙∙, XP),设随机向量X的均值为μ,协方差矩阵为S。对X进行线性变换,形成新的综合变量,用Y表示,则新的综合变量表达式为:
(1)
综合变量表达式(1)的变量系数μij的计算公式为:
(2)
式(2)中,aij为成分矩阵中第i行第j列的元素,λj为第j个特征值。
接下来,利用主成分做线性组合,并以每个主成分的方差贡献率αp作为权数构造一个综合评价函数,即表达式为:
(3)
最后根据公式(3)算出来的Y值进行大小排序,得到综合评价值。
3.2. 因子分析
3.2.1. 基本思想
因子分析是通过研究原始变量内部相关的依赖关系,分析这些原始变量的基本结构,使得每个变量可以用少数几个不可观测的公因子变量来表示。
3.2.2. 因子分析的数学模型
因子分析的数学表达式为X = AF + ε,即
(4)
表达式(4)向量X = (X1, X2, X3, ∙∙∙, XP)是可观测随机变量,称之原始观测变量。F = (F1, F2, ∙∙∙, Fm)是X的公共因子,是均值为0、方差为1的相互独立的不可观测向量。
3.3. 聚类分析
聚类分析中认为研究的指标之间存在程度不同的相似性。结合欧氏距离作为相似性度量标准,再采用组间平均连锁距离法进行系统聚类分析。其中,欧氏距离的计算公式为:
(5)
系统聚类的一般步骤:
1) 计算n个样品两两间的距离{dij},记作D = {dij};
2) 构造n个类,每个类只包含一个样品;
3) 合并距离最近的两类为一新类;
4) 计算新类与当前各类的距离;
5) 重复步骤(4)直到类的个数等于1;
6) 绘制聚类图,决定分类个数和类。
4. 实证分析
4.1. 指标的选取
本文结合生产力水平、工业水平、人民生活水平等来指标选取,在参考了大量相关文献的基础上,拟研究2020年长沙市9个城区的经济发展差异,选取了8项能大致反映城区经济发展差异的经济指标,数据见附表,来源于《2018年湖南省统计年鉴》。指标的具体符号表示如表1所示。

Table 1. The symbol representation and concrete meaning of index
表1. 指标的符号表示与具体意义
4.2. 长沙城区经济发展的主成分分析
将数据导入SPSS软件,首先对原始数据进行标准化(见附表),得到相关系数矩阵,标准化指标用
表示,具体结果见表2。

Table 2. Correlation coefficient of Changsha urban economic development index
表2. 长沙城区经济发展指标的相关系数
从表2中可以看出大部分变量的相关系数都大于0.3,判定8个变量间存在较强的相关性,即主成分分析有效。下一步计算表2中矩阵的起始特征值方差贡献率以及累计方差贡献率,见表3所示。

Table 3. The total variance of Changsha urban economic development indicators
表3. 长沙城区经济发展指标解释的总方差
由表3的起始特征值可知,前两个特征值大于1,并且前两个特征值的累计方差贡献率达到80.73%,可以为选取F1第一主成分,F2为第二主成分,且这两个主成分的方差和占全部方差的80.73%,即基本上保留了原来指标的信息,这样由原来的8个指标转换为两个新指标,起到了降维的作用。

Table 4. Changsha economic development index main component
表4. 长沙经济发展指标主成分
表4为成分矩阵,可以看作主成分与标准化原始变量之间的相关系数矩阵。将表4中第i列的每个元素分别除以第i个特征根的平方根,由此可以计算出各主成分得分系数。

Table 5. Changsha economic development index principal component score coefficient
表5. 长沙经济发展指标主成分得分系数
由表5得到前两个主成分F1、F2的线性组合为:
(6)
(7)
将标准化后的原始数据X1, X2, …, X9代入主成分得分表达式,可以每个城区的经济发展主成分得分,最后给出综合得分公式。
(8)
根据式(8)计算出的综合得分进行排名,见表6。

Table 6. Changsha economic development index principal component score and comprehensive ranking
表6. 长沙经济发展指标主成分得分及综合排名
从表6中综合得分排名来看,芙蓉区第一主成分排名最高,但由于第二主成分居中,所以综合排名雨花区经济发展位居第一。
4.3. 长沙市城区经济发展的因子分析
将长沙市城区经济原始数据标准化,得到标准化数据(见附表)和相关系数矩阵(见表2),表7为KMO检验和Bartlett球形检验结果。

Table 7. KMO and Bartlett tests
表7. KMO和Bartlett检验
KMO检验用于检验变量之间的偏相关性,计算偏相关时由于控制了其他因素的影响,所以会比简单的相关系数小,表7中KMO取值0.646尚可接受。Bartlett球形检验统计量Sig < 0.05,可以认定各变量之间存在着显著的相关性。

Table 8. Changsha economic development index common factor variance
表8. 长沙经济发展指标公因子方差
表8中全社会固定资产投资的共同度为0.805,可以理解为两个公因子能够解释全社会固定资产投资的方差的80.5%。可以看到,各个指标提取度大多在70%以上,说明各个变量包含的信息较多,提取的公因子结果比较理想。

Table 9. Changsha economic development index variance explanation table
表9. 长沙经济发展指标方差解释表
表9表示每个公共因子所解释的方差贡献率及累积和。观察起始特征值累加一列,可以看出前两个公因子就解释的累计方差贡献率达到了80%以上,说明提取这两个公因子就能比较好的解释原所有变量所包含的信息。
为了更加明确各因子经济含义,对因子载荷矩阵进行正交旋转,得到正交因子旋转矩阵。

Table 10. Changsha economic development index orthogonal factor rotation
表10. 长沙经济发展指标正交因子旋转
通过表10因子旋转,容易看出第一个主因子包含全社会固定资产投资、社会消费品零售额以及城镇居民可支配收入的信息较多,能更好的解释这三项指标,该主因子大致反映了经济发展的总量,于是将其命名为综合经济实力因子。第二主因子包含年末从业人员数、分地区生产总值、分地区公共财政收入、城镇居民人均消费支出以及工业总产值的信息较多,这类指标主要反映地区的工业产值,将第二公因子将其命名为工业水平发展因子。表11为因子得分系数。
由
计算因子得分,其中
,输出长沙市城区经济发展差异的综合评价公式为:
(9)
根据公式计算出综合得分并对各城区进行排名,得到结果见表12。

Table 12. Changsha economic development index main factor score and comprehensive score table
表12. 长沙经济发展指标主因子得分及综合得分表
表12中不仅有综合排名,还可以根据各主因子得分看出各城区经济实力、工业水平发展。从公因子得分为正,表示该城区经济发展位于长沙市城区经济发展平均水平之上;若得分为负,则表示该城区经济发展位于长沙市城区经济发展水平之上。由表可以看出,有5个城区的综合得分高于平均水平,依次为雨花区、芙蓉区、天心区、开福区、岳麓区,此处需要解释的是长沙县是长沙市工业重点区,全县“一区七园”,2020工程机械、汽车及零部件、电子信息三大支柱行业实现规模工业总产值2013.2亿元,工业发展迅猛,因此它在第二主因子排名上远超其他区县。得分处于平均水平之下的依次是长沙县、浏阳市、望城区、宁乡市。
4.4. 相关性分析聚类分析
为了验证这主成分分析和因子分析的结果是否一致,接下来对这两种方法进行spearman相关性检验,得到结果见表13。

Table 13. Correlation coefficient between principal component ranking and factor analysis ranking
表13. 主成分排名与因子分析排名相关系数
由表13可以看出,相关系数为1.0,说明两者相关性很强且为正相关,同时Sig值为0,通过显著性检验,所以判定主成分分析和因子分析的排名是一致的。
对这两种结果选取一种折中的方式进行组合,即选取两个分析结果最终得分的算术平均值作为最后综合得分,计算出长沙市各城区经济发展的综合排名见表14。

Table 14. Changsha economic development index comprehensive score and ranking
表14. 长沙经济发展指标综合得分及排名
由表14可以看出排名靠前的分别是雨花区、芙蓉区、天心区、开福区、岳麓区,这5个城区都属于老牌商业城区,排名靠后的依次是长沙县、浏阳市、望城区、宁乡市,而这4个城区都属于远郊城区。文中计算出的结果也与实际情况大致相吻合。
根据各项数值,对长沙市9个城区进行系统聚类,得到聚类过程的系统树状图见图1。
我们将城区分为三类:芙蓉区、天心区和雨花区归为一类,开福区、岳麓区和长沙县归为一类,望城区、浏阳市和宁乡市归为一类。发现不同城区在经济发展结构上存在明显差异。
5. 结论
综合以上多元统计的结果,本文得到如下结论:
1) 芙蓉区、天心区和雨花区是属于城区经济发展发达地区。其中,芙蓉区、天心区作为长沙市的老城区,具有人口密集、消费水平高的特点,建设了大量的商贸中心,这些城区生产总值较高,居民收入通常比其他城区高,相应的可支配收入也高于其他城区。虽然较为繁华,但是工业化水平还需加强。而岳麓区作为新兴城区,由于大力发展高新产业园,工业总产值相对其他城区较高,带动城区经济发展。
2) 开福区、岳麓区和长沙县是城区经济发展一般地区。近年来注重工业化发展,工业总产值超过几个老牌中心城区,社会固定资产投资较高,说明政府正积极投资建设,但在社会购买力方面与发达城区差距较大。
3) 望城区、浏阳市和宁乡市是经济发达较落后区。三个城区的综合得分均为负值,与前两类城区的经济发展还有差异,其社会消费品零售额、地区总产值等指标均靠后,因此,这三个城区在综合排名中靠后。