部分线性变系数空间自回归固定效应面板数据模型的估计
Estimation of Partially linear Varying Coefficient Spatial Autoregressive Panel Data Models with Fixed Effects
摘要: 为了提高线性空间自回归面板数据模型的适用性和灵活度,提出了一类固定效应部分线性变系数空间自回归面板数据模型。基于局部线性技术,利用Profile似然方法构造了模型中未知空间滞后参数、回归系数以及非参数系数函数的估计。利用数值模拟考察了所提估计方法在有限样本下的表现。
Abstract: In order to increase the model adaptability and flexibility of the standard linear spatial autoregressive panel data models, a fixed effects partially linear varying coefficient spatial autoregressive panel data model is proposed. A Profile maximum likelihood approach based on the local-linear method is introduced to estimate the unknown spatial lag parameter, regression coefficients and nonparametric coefficient functions. Some simulations are conducted to examine the performance of the proposed procedures with finite sample.
文章引用:翟树芬, 王韶郡, 杨心怡. 部分线性变系数空间自回归固定效应面板数据模型的估计[J]. 统计学与应用, 2022, 11(2): 216-224. https://doi.org/10.12677/SA.2022.112023

1. 引言

近年来,空间面板数据模型得到了统计学家和计量经济学家的重视,在理论上得到了深入的研究,并被广泛地应用到各类实际问题分析中,详细介绍可参考综述文章Elhorst (2003) [1] 和Anselin (2008) [2],著作Elhorst (2014) [3] 系统介绍了空间面板数据模型的设定、估计和检验问题。然而,上述文献大都假定了因变量与自变量的关系为参数结构特别是线性形式上。众所周知,数据分析中模型形式的错误设定会导致后面推断结果偏离实际情况。为了更好地探求因变量与自变量之间蕴含的复杂关系,提高模型的灵活性,多种非参数和半参数建模方法在近二十年来相继被提出,并被应用到各类复杂数据分析中。自然,利用半参数建模方法分析空间面板数据得到了关注,最近多类半参数空间面板数据模型被提出和研究。基于部分线性模型形式,Hu等(2014) [4] 提出了一类部分线性空间误差自回归固定效应面板数据模型,Zhang和Yang (2015) [5] 则构造了部分线性空间滞后回归固定效应面板数据模型。Bai等(2015) [6] 研究了一类部分线性变系数空间误差自回归面板数据模型,Zhang和Shen (2015) [7] 则提出了部分线性变系数空间滞后随机效应面板数据模型。上面几篇文献都是基于级数(样条)方法构造了模型的估计。

在众多的半参数模型中,部分线性变系数模型作为部分线性模型和变系数模型的推广得到了广泛的研究,其中Zhang和Shen (2015) [7] 基于这一建模方法提出了部分线性变系数空间滞后随机效应面板数据模型,并且基于样条方法和工具变量估计方法给出了模型中未知参数分量和非参数分量的估计。不同于Zhang和Shen (2015) [7] 所设定的随机效应模型,本文考虑如下的部分线性变系数空间自回归面板数据固定效应模型

y i t = ρ j = 1 n w i j y j t + α i + v i t T θ ( u i t ) + x i t T β + ε i t , i = 1 , 2 , , n ; t = 1 , 2 , , T (1)

其中 y i t 是第i个空间观测单元在时刻的因变量观测值, u i t 和是对应的自变量观测值,也为对应的自变量观测值,不失一般性,我们假设其为一维。 W n = ( w i j ) , 1 i , j n n × n 的空间权重矩阵, β = ( β 1 , β 2 , , β p ) T ρ 为未知参数, θ ( ) = ( θ 1 ( ) , θ 2 ( ) , , θ q ( ) ) T 是q维未知函数。误差 ε i t 相互独立,有 E ( ε i t ) = 0 , V a r ( ε i t ) = σ 2 ,且与自变量无关。固定效应 α i 描述个体之间的差异性,为了模型可被识别,对固定效应附加如下条件

i = 1 n α i = 0

显然,模型(1)包含几类常见的模型。如果 ρ = 0 ,那么模型变化一个没有考虑空间效应的部分线性变系数固定效应面板数据模型。如果 θ ( ) = 0 ,那么模型则为空间自回归固定效应面板数据模型,相关研究可参考Lee和Yu (2010) [8] 和Debarsy和Ertur (2010) [9]。如果对于每个观测单元只观察一次,即 T = 1 ,模型则变为Su和Jin (2010) [10] 针对截面数据提出的部分线性空间自回归模型。

对于模型(1),我们重点研究其估计问题,不同于Zhang和Shen (2015) [7] 采用的工具变量方法,本文采用Su和Jin (2010) [10] 中的Profile极大似然估计方法。

2. 模型的Profile极大似然估计

为了方便叙述,我们定义

Y = [ y 11 y 12 y n T ] X = [ x 11 T x 12 T x n T T ] M = [ v 11 T θ ( u 11 ) v 12 T θ ( u 12 ) v n T T θ ( u n T ) ] ε = [ ε 11 ε 12 ε n T ]

因此模型(1)可以写为

Y = ρ ( I T W n ) Y + Z γ + X β + M + ε (2)

其中, Z = ( z 11 , z 12 , , z n T ) T = ( I n 1 T ) ( 1 n 1 I n 1 ) T , γ = ( α 2 , , α n ) T I s 为维数为s的单位阵, 1 k 为元素全为1的k维列向量。

假设 ε ~ ( 0 , σ 2 I n T ) ,定义 ϕ = ( β T , γ T ρ , σ 2 ) A ( ρ ) = I n T ρ ( I T W n ) Y ¯ = Y ρ ( I T W n ) Y = A ( ρ ) Y ,那么模型(2)的对数似然函数为:

ln L ( ϕ , θ ( ) ) = n T 2 ln ( 2 π ) n T 2 ln ( σ 2 ) + ln | A ( ρ ) | 1 2 σ 2 ( Y ¯ Z γ X β M ) T ( Y ¯ Z γ X β M ) (3)

显然,上述对数似然函数中含有未知的非参数函数,因此无法直接求出未知参数的极大似然估计。接下来,将使用Profile似然方法来估计其中参数 ϕ 和未知非参数函数 θ ( ) 。如果参数 β , γ ρ 是已知的,那么模型(1)可以为

y i t * = v i t T θ ( u i t ) + ε i t , i = 1 , 2 , , n ; t = 1 , 2 , , T (4)

其中 y i t * = y i t α i ρ j = 1 n w i j y j t x i t T β 。显然,模型(4)是一个标准的变系数模型。下面将采用局部线性方法

对模型(4)进行估计。假设 { θ j ( ) , j = 1 , 2 , , q } 存在连续二阶导数。那么,对u小邻域内的 u 0 ,由Taylor展开可得

θ j ( u ) θ j ( u 0 ) + θ j ( u 0 ) ( u u 0 ) , j = 1 , 2 , , q

其中 θ j ( u ) = θ j ( u ) / u

由局部加权最小二乘方法, { ( θ j ( u 0 ) , θ j ( u 0 ) ) , j = 1 , 2 , , q } 的估计可通过使得

i = 1 n t = 1 T [ y i t * j = 1 q { θ j ( u 0 ) + θ j ( u 0 ) ( u i t u 0 ) v i t j } ] 2 K h ( u i t u 0 ) (5)

达到最小而得到,其中,K是核函数,h是窗宽,且 K h ( ) = K ( / h ) / h

D z 0 = [ v 11 T ( u 11 u 0 ) v 11 T v 12 T ( u 12 u 0 ) v 12 T v n T T ( u n T u 0 ) v n T T ] S = [ ( v 11 T 0 ) { D u 11 T K u 11 D u 11 } 1 D u 11 T K u 11 ( v 1 2 T 0 ) { D u 1 2 T K u 1 2 D u 12 } 1 D u 1 2 T K u 1 2 ( v n T T 0 ) { D u n T T K u n T D u n T } 1 D u n T T K u n T ]

则基于(5)可得

[ θ ¯ 1 ( u 0 ) , , θ ¯ q ( u 0 ) , θ ¯ 1 ( u 0 ) , , θ ¯ q ( u 0 ) ] T = { D u 0 T K u 0 D u 0 } 1 D u 0 T K u 0 ( Y ¯ Z γ X β ) (6)

u 11 , u 12 , , u n T 代替 u 0 ,可得 θ ( u i t ) 的估计,从而可定义M的估计为

M ¯ = [ v 11 T θ ¯ ( u 11 ) , v 12 T θ ¯ ( u 12 ) , , v n T T θ ¯ ( u n T ) ] T = S ( Y ¯ Z γ X β ) (7)

M ¯ 代替(3)中的M,令 H = ( Z X ) φ = ( γ T β T ) ,可得如下Profile对数似然函数

log L ( φ ) = n T 2 ln ( 2 π ) n T 2 ln ( σ 2 ) + ln | A ( ρ ) | 1 2 σ 2 ( Y ¯ Z γ X β M ¯ ) T ( Y ¯ Z γ X β M ¯ ) = n T 2 ln ( 2 π ) n T 2 ln ( σ 2 ) + ln | A ( ρ ) | 1 2 σ 2 [ ( I n T S ) ( Y ¯ Z γ X β ) ] T [ ( I n T S ) ( Y ¯ Z γ X β ) ] = n T 2 ln ( 2 π ) n T 2 ln ( σ 2 ) + ln | A ( ρ ) | 1 2 σ 2 [ ( I n T S ) ( Y ¯ H φ ) ] T [ ( I n T S ) ( Y ¯ H φ ) ] (8)

给定 ρ ,使 log L ( ϕ ) φ , σ 2 分别求偏导,得到如下方程组

{ log L ( ϕ ) φ = 0 V T ( I n T S ) T ( I n T S ) H φ = H T ( I n T S ) T ( I n T S ) Y ¯ log L ( ϕ ) σ 2 = 0 n σ 2 = [ ( I n T S ) ( Y ¯ H φ ) ] T [ ( I n T S ) ( Y ¯ H φ ) ]

解得上述方程组,得 φ 的Profile极大似然估计为

φ ^ ( ρ ) = [ H T ( I n T S ) T ( I n T S ) V ] 1 H T ( I n T S ) T ( I n T S ) Y ¯ (9)

同时可得到的Profile极大似然估计为

σ ^ 2 ( ρ ) = 1 n T { ( I n T S ) [ Y ¯ H φ ^ ( ρ ) ] } T { ( I n T S ) [ Y ¯ H φ ^ ( ρ ) ] } = 1 n T Y ¯ T ( I n T S ) T D ( I n T S ) Y ¯ (10)

其中 D = I n T ( I n T S ) H [ H T ( I n T S ) T ( I n T S ) H ] 1 H T ( I n T S ) T 。进一步,关于 ρ 的极大似然函数为

log L ( ρ ) = n T 2 [ log ( 2 π ) + 1 ] n T 2 log [ σ ^ 2 ( ρ ) ] + log | A ( ρ ) | (11)

利用优化算法通过使 log L ( ρ ) 最大化,得到 ρ 的估计 ρ ^ 。从而,得到 φ σ 2 的最终估计,即 φ ^ = φ ^ ( ρ ^ ) σ ^ 2 = σ ^ 2 ( ρ ^ ) 。因此,得到 β γ 的最终估计,分别为:

β ^ = [ X T ( I n T S ) T P ( I n T S ) X ] 1 X T ( I n T S ) T P ( I n T S ) [ I n T ρ ^ ( I T W n ) ] Y (12)

γ ^ = ( α ^ 2 , , α ^ n ) = [ Z T ( I n T S ) T ( I n T S ) Z ] 1 Z T ( I n T S ) T ( I n T S ) [ Y X β ^ ] (13)

其中 P = I n T Z * ( Z * T Z * ) 1 Z * T Z * = ( I n T S ) Z α 1 的估计为 i = 2 n α i

最后,将 β ^ , γ ^ , ρ ^ 代入(6),我们可以得到 θ ( u 0 ) 的最终估计为

θ ^ ( u 0 ) = ( I q 0 ) { D u 0 T K u 0 D u 0 } 1 D u 0 T K u 0 [ Y ρ ^ ( I T W n ) Y Z γ ^ X β ^ ] (14)

其中 I q 为维数为q的单位阵, 0 q q × q 的零矩阵。最后得到残差向量的估计为

ε ^ = Y ρ ^ ( I T W n ) Y Z γ ^ X β ^ M ^ (15)

其中 M ^ = [ v 11 T θ ^ ( u 11 ) , v 12 T θ ^ ( u 12 ) , , v n T T θ ^ ( u n T ) ] T = S ( Y ¯ Z γ X β )

3. 数值模拟

假定研究区域是边长为 m 1 个距离单位的正方形,n个空间观测单元正好在 m × m 个格子点上,权重矩阵W设定为rook矩阵和queen矩阵两种形式。考虑如下部分线性空间自回归面板数据模型

y i t = ρ j = 1 n w i j y j t + α i + v i t θ ( u i t ) + x i t T β + ε i t , i = 1 , 2 , , n ; t = 1 , 2 , , T

假设 x i t ~ N ( 1 , 1 ) v i t ~ U ( 2 , 2 ) u i t ~ U ( 0 , 1 ) θ ( u i t ) = 2 cos ( 2 π u i ) + 1 β = 2 ,固定效应 α i ~ U ( 0 , 1 ) , i = 2 , , n 。上一节模型估计过程中假定了误差服从正态分布,但这只是为了写出似然函数,为了考察误差分布对模型估计效果的影响,设定如下三种形式的模型误差,都满足均值为0,方差为0.25。

1) ε i t ~ U ( 0 , 0.5 2 ) ; 2) ε i t ~ U ( 3 / 2 , 3 / 2 ) ; 3) ε i t ~ ( 1 8 χ 8 2 1 ) ,计算过程中选择高斯核函数 K ( z ) = 1 2 π exp ( z 2 2 ) ,平滑指数取 s u ( n T ) 1 / 5 ,其中 s u u 11 , u 12 , , u n T 的标准差。

样本量分别取 n = 64 , 100 ,令时间维度 T = 3 ρ = ( ± 0.9 , ± 0.5 , ± 0.1 , 0 ) ,针对每种设定,模拟重复500次,每次都利用前面介绍的估计方法给出参数分量和非参数分量的估计。对于参数分量 ρ , β ,以“MEAN”和“SD”分别表示其500次估计值的均值和标准差。运用Matlab软件, ρ , β 的模拟结果见表1表2

Table 1. Estimation of ρ , β under sample size n = 64 of system resulting data of standard experiment

表1. 标准试验系统结果数据样本量n = 64下 ρ , β 的估计

Table 2. Estimation of ρ , β under sample size n = 100 of system resulting data of standard experiment

表2. 标准试验系统结果数据样本量n = 100下 ρ , β 的估计

对于非参数系数函数 θ ( ) ,利用如下的根均方误差(RASE)考察其表现,

RASE ( θ ) = { 1 500 n T l = 1 500 i = 1 n T = 1 T [ θ ^ l ( u i t ) θ ( u i t ) ] 2 } 1 / 2 ,

其中 θ ^ l ( u i t ) , l = 1 , 2 , , 500 θ ( u i t ) 在第次重复时的估计值。模拟结果见表3表4

Table 3. RASE of coefficient function estimation when n = 64

表3. n = 64时系数函数估计的RASE

Table 4. RASE of coefficient function estimation when n = 100

表4. n = 100时系数函数估计的RASE

从模拟结果可以看出,第一,对于参数分量,估计值的均值非常接近真实值,而且随着样本量增加,Mean更靠近对应的真实值,SD变小。模型误差和空间权重矩阵W的设定对估计结果影响不大。第二,对于非参数系数函数的估计,RASE值针对不同的误差分布和W的设定变化不大,随着样本量的增加,RASE值总体上在变小。总之,本文所提方法对于参数分量和非参数分量的估计在有限样本下表现良好。

4. 总结

本文在传统的空间面板数据模型基础上提出了一类固定效应部分线性变系数空间自回归面板数据模型,并且给出了模型的估计。由于模型本身的复杂性,本文没有研究所提估计量的渐近性质,而是利用数值模拟考察了所提估计量在有限样本情况下的表现,模拟结果表明所提估计方法有效。此外,论文重点研究了模型的估计,关于空间效应的检验没有涉及。这些问题将作为我们后续研究的目标。

基金项目

国家社科基金项目(21BTJ005)。

参考文献

[1] Elhorst, J.P. (2003) Specification and Estimation of Spatial Panel Data Models. International Regional Science Review, 26, 223-243.
https://doi.org/10.1177/0160017603253791
[2] Anselin, L., Le Gallo, J. and Jayet, H. (2008) Spatial Panel Econometrics. In: Mátyás, L. and Sevestre, P., Eds., The Econometrics of Panel Data. Advanced Studies in Theoretical and Applied Econometrics, Vol. 46, Springer, Berlin, Heidelberg, 627-662.
https://doi.org/10.1007/978-3-540-75892-1_19
[3] Elhorst, J.P. (2014) Spatial Econometrics: From Cross-Sectional Data to Spatial Panels. Physica-Verlag HD.
https://doi.org/10.1007/978-3-642-40340-8
[4] Hu, J.H., Liu, F.X. and You, J.H. (2014) Panel Data Partially Linear Model with Fixed Effects, Spatial Autoregressive Error Components and Unspecified Intertemporal Correlation. Journal of Multivariate Analysis, 130, 64-89.
https://doi.org/10.1016/j.jmva.2014.05.002
[5] Zhang, Y.Q. and Yang G.R. (2015) Estimation of Partially Specified Spatial Panel Data Models with Random-Effects. Acta Mathematica Sinica, 31, 456-478.
https://doi.org/10.1007/s10114-015-3569-1
[6] Bai, Y., Hu, J.H. and You, J.H. (2015) Panel Data Partially Linear Varying-Coefficient Model with Both Spatially and Time-Wise Correlated Errors. Statistica Sinica, 25, 275-294.
https://doi.org/10.5705/ss.2013.190w
[7] Zhang, Y.Q. and Shen, D.M. (2015) Estimation of Semi-Parametric Varying-Coefficient Spatial Panel Data Models with Random-Effects. Journal of Statistical Planning and Inference, 159, 64-80.
https://doi.org/10.1016/j.jspi.2014.11.001
[8] Lee, L.F. and Yu, J. (2010) Estimation of Spatial Autoregressive Panel Data Models with Fixed Effects. Journal of Econometrics, 154, 165-185.
https://doi.org/10.1016/j.jeconom.2009.08.001
[9] Debarsy, N. and Ertur, C. (2010) Testing for Spatial Autocorrelation in a Fixed Effects Panel Data Model. Regional Science & Urban Economics, 40, 453-470.
https://doi.org/10.1016/j.regsciurbeco.2010.06.001
[10] Su, L.J. and Jin, S.N. (2010) Profile Quasi-Maximum Likelihood Estimation of Partially Linear Spatial Autoregressive Models. Journal of Econometrics, 157, 18-33.
https://doi.org/10.1016/j.jeconom.2009.10.033