基于多元回归分析探究税收的影响因素
Based on Multiple Regression Analysis to Explore the Influence Factors of Tax
DOI: 10.12677/SA.2023.123062, PDF, HTML, XML,   
作者: 杨冬敏:曲阜师范大学统计与数据科学学院,山东 曲阜
关键词: 税收多元回归相关性显著性预测Tax Multiple Regression Correlation Significance To Predict
摘要: 税收是国家(政府)公共财政中最重要的一项收入,也是国家(政府)公共财政的重要收入来源。本文运用SPSS及R软件,对1996~2022年度(所选资料来源于《中华人民共和国统计年鉴》)的有关统计资料进行分析,并运用普通最小二乘方法,通过对影响税收的各因素的共线性、异方差及自相关等特征的研究,构建出我国税收收入的多元线性回归模型。通过建立的模型,得出了影响税收增长的重要因子,从而为税收收入的预测奠定了基础。
Abstract: Tax is the most important income of the state (government) public finance, and also the important source of income of the state (government) public finance. In this paper, SPSS and R software are used to analyze the relevant statistical data from 1996 to 2022 (the selected data is from the Statistical Yearbook of the People’s Republic of China), and the ordinary least squares method is used to study the collinearity, heteroscedasticity and autocorrelation of various factors affecting tax revenue. Construct multiple linear regression model of tax revenue. Through the established model, the important factors affecting the growth of tax revenue are obtained, thus laying the foundation for the forecast of tax revenue.
文章引用:杨冬敏. 基于多元回归分析探究税收的影响因素[J]. 统计学与应用, 2023, 12(3): 583-593. https://doi.org/10.12677/SA.2023.123062

1. 绪论

从21世纪以来,中国在科技与互联网产业飞速发展的基础上,经济的发展迫在眉睫,新形势下的经济发展是经济稳定与和谐发展的结果。《税收结构是否影响经济增长——基于中国四个经济区域实证分析》 [1] 一文中所述,税收在宏观调控中发挥着重要作用,它不仅是支持公共产品供给的主要资金来源,而且对社会资源配置和缩小收入差距起到了促进作用,实施有效的税收体制已成为社会规划者保持经济可持续增长的重要手段。根据《论税收对产业结构调整的影响》 [2] 一文所述,税收政策对于我国的产业结构具有较大的影响,它不仅能够调节国家的消费过程,也能调节国家的生产和分配过程。它是一个国家政府赖以生存的经济基础。《税收影响因素分析及建议》 [3] 一文提出,国内生产总值(GDP)、财政支出、商品零售价格指数和固定资产投资额对中国税收收入的具有显著影响。《我国税收收入影响因素分析》 [4] 一文中,指出国内生产总值、财政支出和社会消费品零售总额对税收收入的影响较大,对于提高我国税收入、促进经济平稳增长有着指导意义。

因此,对影响税收的主要因素进行分析,并对国家的税收进行预测,这对国家进行宏观经济调控,调整国民收入的再分配,指导资源的优化配置,推动国家的经济增长和产业发展具有重要的实际意义。随着研究的深入,学者们将更多的影响税收的因素纳入计量模型中量化分析其对税收收入的影响及其程度,然而,经济指标选取的增多,会引起多重共线性问题,因此学者们采取了岭回归、主成分分析等方法解决该问题。左雨婷等以2001~2018年安徽省的相关数据,通过构建立岭回归模型研究了三大产业增加值、财政支出、固定资产投资总额和社会消费品零售总额分别对安徽省税收收入的影响,提出优化产业结构、注重税收改革效率及推动居民消费升级的政策建议 [5] ;高天惠等在定性分析影响安徽省税收收入的因素的基础上,运用主成分分析方法降维,得到影响税收的重要因素,并据此给出了相关的政策建议 [6] ;邓光青选择因子分析的方法发现经济发展因子和货币政策因子对税收收入有着正向的相关性,认为政府应放宽政策,增加政府购买 [7] 。本文采用多元线性回归方法,消除多重共线性、异方差性及序列自相关性等问题,对影响税收增长的主要因素进行了研究。

2. 影响因素及数据来源

影响税收的因素有社会经济发展水平、国家的宏观经济政策、税收征收管理能力等。通过查阅《中华人民共和国统计年鉴》收集到1996~2022年度的相关统计资料,包括税收收入、国内生产总值、国民生产总值、财务开支、消费品零售额、全部固定资产总投资、货币供应量、进口和出口总值等相关数据。利用相关数据分析影响税收增长的因素,构建税收收入回归模型,对我国税收收入进行预测和控制。

3. 构建理论模型并进行相关性分析

为了对影响税收收入的主要影响因素进行分析,以税收收入y (亿元)为被解释变量,将国内生产总值x1 (亿元),国民生产总值x2 (亿元),财务开支x3 (亿元),消费品零售额x4 (亿元),全部固定资产总投资x5 (亿元),货币供应量x6 (亿元),进口和出口总值x7 (亿元)等可能与之有关的经济因素当作解释变量,建立了多元线性回归理论模型。模型为:

y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + β 7 x 7 + ε

其中: β 0 为常数; β i ( i = 1 , 2 , 3 , 4 , 5 , 6 , 7 ) 为影响因素的相关系数。做相关性分析,结果如图1所示。

Figure 1. Heat map of correlation results of each index

图1. 各指标相关性结果热力图

从相关阵可以看出y与七个自变量的相关系数都在0.9以上,说明所选自变量是与因变量高度相关的,用y与自变量做多元线性回归是合适的。

4. 回归分析及拟合优度诊断

利用R软件对原始数据做回归分析,输出结果表1所示。

Table 1. Statistical table of fitting effect of each variable

表1. 各变量拟合效果统计表

通过结果可知,拟合优度 R 2 = 0.9995 ,修正的可决定系数为0.9993,二者皆接近于1;F检验的 F = 5444 > F 0.05 ( 7 , 19 ) = 2.54 P < 2.2 e 16 < 0.05 ,说明模型整体高度显著。

从而通过R软件利用最小二乘法得到模型参数的估计值,得到初步经验回归方程为:

y = 30.77739 + 0.38146 x 1 0.17567 x 2 + 0.55509 x 3 0.42483 x 4 + 0.06265 x 5 0.05819 x 6 + 0.01627 x 7

虽然自变量x1,x2,x3,x4,x5,x6,x7整体上对y有显著影响,但有的自变量对y的显著性较差。其中x7消费品零售额的P值 = 0.537916最大,不显著。x2的P值为0.381034,也不显著。x1,x5的P值分别为0.068169,0.055440,只是弱显著。

同时,x2、x4和x6系数的符号与预期相反,且每个自变量的显著性和这些自变量与因变量 两两之间的相关系数并不一致,产生这个问题的原因可能是自变量之间存在共线性。由相关系数阵中各解释变量之间相关性值都接近于1可以进一步看出,x2、x4和x6之间的确存在严重的相关性。研究进一步利用逐步回归的方法来解决变量间的多重共线性问题。

5. 多重共线性修正

分别对y和x1,x2,x3,x4,x5,x6,x7间的关系进行一元线性回归拟合,得到7个一元线性回归模型。

y = β 0 + β 1 x + ε

通过对数据进行拟合,每个模型的参数估计值拟合结果如表2所示。可以看出变量x1的R2值最高,具有最佳的拟合效果。表明国内生产总值(x1)在税收收入中起主要作用。各解释变量的一元回归模型拟合优度的大小顺序为:x1、x2、x3、x4、x6、x5、x7

Table 2. Unitary linear regression fitting effect statistical table

表2. 一元线性回归拟合效果统计表

然后,利用SPSS软件以x1为基础依次加入其他解释变量进行逐步回归,回归结果如表3表4所示:

Table 3. Statistical table of stepwise regression effect

表3. 逐步回归效果统计表

Table 4. Stepwise regression coefficient effect statistics table

表4. 逐步回归系数效果统计表

1) 在x1基础上,引入拟合优度位于第五位的x6,得到最小二乘回归结果,回归方程为:

y = 5351.765 + 0.229 x 1 0.67 x 6

R 2 = 0.998 ,修正的可决系数为0.997, F=5184.24,DW=0.297。

2) 第二步再引入拟合优度位于第三位的x3,得到最小二乘回归结果,回归方程为:

y = 3922.894 + 0.197 x 1 0.083 x 6 + 0.165 x 3

R 2 = 0.998 ,修正的可决系数为0.998,F=3399.74,DW=0.356。

3) 第三步再引入拟合优度位于第四位的x4,得到最小二乘回归结果,回归方程为:

y = 832.678 + 0.213 x 1 0.084 x 6 + 0.725 x 3 0.369 x 4

R 2 = 0.999 ,修正的可决系数为0.999, F=8899.592,DW =2.043。

从此模型中可以看出,国内生产总值(x1)、货币供应量(x6)、财务开支(x3)和消费品零售额对税收收入(x4)有显著影响。

6. 异方差性

6.1. 残差图分析

通过构建国内生产总值(x1)与税收收入y之间对应关系的散点图(见图2)、财务开支(x3)与税收收入y之间对应关系的散点图(见图3)、消费品零售额(x4)与税收收入y之间对应关系的散点图(见图4)、货币供应量(x6)与税收收入y之间对应关系的散点图(见图5)来研究税收与相关主变量的异方差性。从中可以看出,随着x1、x6、x3和x4的增加,各项税收也不断增加,但是离散程度也逐步扩大,表明变量之间可能存在增量异方差性。

Figure 2. Scatter plot of the relationship between gross productand tax revenue

图2. 生产总值(x1)与税收收入y之间对应关系的散点图

Figure 3. Scatter plot of the relationship between financial expenditure and tax revenue

图3. 财务开支(x3)与税收收入y之间对应关系的散点图

Figure 4. Satter plot of the relationship between retail sales of consumer goods and tax revenue

图4. 消费品零售额(x4)与税收收入y之间对应关系的散点图

进一步以标准化残差 Z R E i 为纵坐标,以因变量y为横坐标画散点图(见图6),标准化残差值随y值的增大而增大,具有明显的规律,因而可认为模型的随机误差项 ε i 的方差是非齐性的,存在异方差性。

Figure 5. Scatter plot of the relationship between money supply and tax revenue

图5. 货币供应量(x6)与税收收入y之间对应关系的散点图

Figure 6. Interpreted variables and standardized residual scatter plots

图6. 被解释变量和标准化残差散点图

6.2. 异方差修正——加权最小二乘估计

利用SPSS软件分别计算解释变量x1、x6、x3和x4与普通残差的等级相关系数如表5所示,由结果可知x6与普通残差的等级相关系数为0.723最大,所以选取x6构造权函数。

Table 5. Coefficient of correlation between explanatory variables and ordinary residuals

表5. 解释变量与普通残差的等级相关系数

用Weight Estimate估计幂指数m,对数似然值如表6所示,取对数似然值最大的m为2。

Table 6. Logarithmic likelihood values of different powers

表6. 不同幂指数的对数似然值

加权最小二乘法修正结果1如表7和加权最小二乘法修正结果2见表8所示,可以看出在给定显著水平 α = 0.0 5 时,x1、x6、x3和x4的系数检验统计量t的p值都远小于0.05,则拒绝原假设,认为x1、x6、x3和x4对y的影响是显著的;拟合优度也发生了变化,从原来的 R 2 = 0.9995 ,修正的可决系数0.9993变为拟合优度 R 2 = 0.999973 ,修正的可决系数为0.999968,说明模型更加显著。从而消除共线性和异方差性之后,可得经验回归方程:

y = 466.6158 + 0.207991 x 1 + 0.781413 x 3 0.233524 x 4 0.402295 x 6

Table 7. Modified result 1 by weighted least square method

表7. 加权最小二乘法修正结果1

Table 8. Modified result 2 by weighted least square method

表8. 加权最小二乘法修正结果2

7. 序列自相关性

7.1. 自相关性分析——DW检验

根据表8估计的结果得DW = 0.469998,查DW表。因为样本量n为27,解释变量为x1、x6、x3和x4,所以k为4,得下限临界值 d L = 1.16 ,上限临界值 d U 为1.65。又因为统计量 0 < 0.469998 = DW < d L ,说明残差项存在正自相关。

7.2. 自相关性修正——一阶差分法

首先计算差分 Δ y t = y t y t 1 Δ x i t = x i t x i ( t 1 ) , ( i = 1 , 3 , 4 , 6 ) ,用 Δ y t Δ x i t ( i = 1 , 3 , 4 , 6 ) 做过原点的最小二乘回归,来消除自相关,利用SPSS软件得到修正结果如表9表10所示,DW值从0.469998上升到1.44634,即 d L < 1.44634 = DW < d U ,消除了序列的自相关性。从而,最终得到消除了多重共线性、异方差性和自相关性的经验回归方程:

y = 6426.857 + 0.261690 x 1 + 0.23927 x 3 0.233524 x 4 0.051258 x 6

R 2 = 0.999682 ,修正的可决系数为0.999603,F = 12584.13,DW = 1.44634。

Table 9. Autocorrelation correction result 1

表9. 自相关性修正结果1

Table 10. Autocorrelation correction result 2

表10. 自相关性修正结果2

8. 结论

修正后的经验回归模型为:

y = 6426.857 + 0.261690 x 1 + 0.23927 x 3 0.233524 x 4 0.051258 x 6

该模型最终修正了多重共线性、异方差性及序列自相关性等问题,提升了模型的精确度,并且使得模型作为一个整体,显着性提高,拟合度增强。

由此可得,假设在其他变量不变的情况下,国内生产总值每增长1亿元,税收收入会增长0.261690亿元;假设在其他变量不变的情况下,当财务开支增长1亿元,税收收入增加0.23927亿元;假设在其他变量不变的情况下,当消费品零售额增加1亿元,税收收入减少0.233524亿元;假设在其他变量不变的情况下,货币供应量增长1亿元,税收收入减少0.051258亿元。

通过上述的模型可以发现:一方面,国内生产总值、货币供应量、财务开支和消费品零售总额对税收有明显的影响。另一方面,国民生产总值、全部固定资产总投资和进出口总值对税收收入的影响不够明显,但是这并不能表明这3个因素对税收总量没有影响,因为国民生产总值、全部固定资产总投资和进口和出口总值可以通过对国内生产总值、货币供应量、财务开支和消费品零售额的影响来对税收收入产生间接影响。

9. 建议

针对上述影响因素的分析,提出以下建议。

9.1. 优化产业结构

通过上述分析可知,税收与国内生产总值有着密切的关系,所以需要持续稳定地推进生产力发展,对产业结构进行调整优化,持续提升我国的经济发展水平和质量,为税收收入创造一个良好的发展环境。

9.2. 调节财政开支结构

由于税收的规模很大程度上受财政支出的制约,因此,政府要保持税收和财政支出之间的平衡和协调,积极调整和优化财政收支结构,使资源得到合理分配,如增加科技、民生等重点领域的支出、压缩一般支出,从严控制机关和事业单位的支出,强化绩效管理,使财政收支结构得到优化,实现税收的稳定增长。

9.3. 推动居民消费升级

消费对经济增长起到了支撑作用,推动居民消费升级,可以使消费对经济的作用更加明显。税收收入的增加是与经济发展密不可分的,通过提高居民消费水平来实现税收收入的稳定增长。伴随着时代的发展,人们对生活质量的要求也在不断提高,消费的方式以及产品的需求种类都发生了很大的变化。为此,企业应该积极开发出高质量、低成本、高效率、高效率的产品,以适应新的消费需要。

9.4. 调整、改革、完善税制

我国应在税制调整、税制改革和税制完善三个方面进行整合,并将三者有机地结合在一起,充分地发挥各自的功能。税收的增减都有可能与税收的调整和改进有关,因此,如果我们能更多地从完善税收制度的角度来考虑问题,就能在保证税收收入稳定的前提下,实现税收制度的科学化和合理化。

参考文献

参考文献

[1] 张霜. 税收结构是否影响经济增长——基于中国四个经济区域实证分析[C]//新兴经济体研究会, 中国国际文化交流中心, 广东工业大学. 开放合作命运与共论文集(上). 2020: 23.
[2] 石镇国. 论税收对产业结构调整的影响[J]. 现代经济信息, 2019(8): 309.
[3] 张松. 税收影响因素分析及建议[J]. 河北农机, 2019, 249(3): 110-111.
[4] 方红丽. 我国税收收入影响因素分析[J]. 经济研究导刊, 2022, 501(7): 120-122+147.
[5] 左雨婷, 武丽. 安徽省税收收入影响因素研究——基于2001-2018年数据的实证分析[J]. 赤峰学院学报: 自然科学版, 2020, 36(5): 66-71.
[6] 高天惠, 张玉静, 朱家明, 崔文凯. 基于主成分分析对安徽省税收收入影响因素的实证研究[J]. 哈尔滨师范大学自然科学学报, 2020(5): 12-17.
[7] 邓光青. 税收收入的影响因素研究——基于SPSS软件[J]. 纳税, 2020(24): 3-5+62.