非参数动态空间随机前沿模型的贝叶斯估计
Bayesian Estimation of Nonparametric Dynamic Spatial Stochastic Frontier Models
DOI: 10.12677/PM.2023.134110, PDF, HTML, XML, 下载: 207  浏览: 321 
作者: 罗林媚:南宁师范大学数学与统计学院,广西 南宁
关键词: 非参数模型空间随机前沿模型多元B样条贝叶斯估计Non Parametric Model Spatial Random Frontier Model Multivariate B-Splines Bayesian Estimation
摘要: 空间随机前沿模型忽视了经济变量之间存在的非线性关系,限制了其使用范围。本文构建非参数动态空间随机前沿模型,利用贝叶斯方法估计该模型。数值模拟表明,多元B样条具有良好的拟合能力,模型的估计精度随样本量的增加而提高,无效率项方差的偏差表现不稳定。
Abstract: The spatial stochastic frontier model ignores the nonlinear relationship between economic varia-bles, which limits its scope of use. This article constructs a non parametric dynamic spatial sto-chastic frontier model and uses Bayesian methods to estimate the model. Numerical simulation shows that multivariate B-splines have good fitting ability, and the estimation accuracy of the model increases with the increase of sample size. The deviation of the variance of the invalidity term is unstable.
文章引用:罗林媚. 非参数动态空间随机前沿模型的贝叶斯估计[J]. 理论数学, 2023, 13(4): 1049-1055. https://doi.org/10.12677/PM.2023.134110

1. 引言

随机前沿分析法是测算技术效率的一种参数模型,该模型在实证方面有着广泛使用,主要应用于农业、工业、金融行业等产业的技术效率测算,技术效率反映了决策单元对现有资源有效利用的能力。随机前沿模型为各行各业调整投入决策,实现产出最大化提供科学依据。

Aigner等 [1] 首先提出随机前沿分析法,自该方法被提出,学术界在该模型的构建与估计方面有着丰富的研究成果,已有学者对面板随机前沿模型进行梳理,如边文龙和王向楠 [2] 从效率是否时变的角度总结了面板数据随机前沿模型的研究结果;王韧和李志伟 [3] 从误差分布、时变特征和模型形式等方面梳理面板随机前沿模型的历史演变和发展。目前,空间随机前沿模型是随机前沿模型中的研究热点,许多学者对空间随机前沿模型的构建与估计做研究,如于倩倩等 [4] 构建了地理加权随机前沿模型;Simwaka [5] 提出考虑误差项空间相关性与时间相关性的空间面板随机前沿模型;林显佳 [6] 构建了考虑空间滞后因变量和空间误差自相关的三种不同形式的空间随机前沿模型,包含截面模型和面板模型,且每个模型均有三个不同无效率项分布假设;蒋青嬗等 [7] 构建了考虑个体固定效应的真实固定效应空间随机前沿模型;Tsukamoto [8] 构建了空间自回归面板随机前沿模型;蒋青嬗和李毅君 [9] 从技术效率时变和非时变两个层面分别构建空间门限随机前沿模型;任燕燕等 [10] 提出动态面板数据空间随机前沿模型并使用广义矩估计方法解决模型的内生性,但假设无效率不随时间变化,在研究对象的时间跨度较长时,该假设不符合实际情况。总的来说,关于随机前沿模型的文献不计其数,但少有文献研究生产函数错误假设的问题,即生产函数不含非线性函数,默认了各经济变量之间的关系是线性的,然而,现实生活中各经济变量之间不仅存在线性关系也存在大量的非线性关系,生产函数形式设定不正确将导致技术效率估计有偏不一致。

在生产函数错误假设问题的研究中,学者们认为应当放宽生产函数的假设形式,考虑利用非参数估计方法来解决此类问题,如Kumbhakar等 [11] 认为随机前沿模型的形式或者单边误差的分布假设是错误的,提出了基于局部极大似然技术的处理非参数随机前沿模型的新方法;Assaf等 [12] 认为生产函数不一定代表真正的前沿技术,构建非参数随机前沿模型并使用张量积傅里叶基拟合未知生产函数,但Kumbhakar等 [11] 和Assaf等 [12] 的非参数随机前沿模型不考虑空间效应,模型中的所有决策单元相互独立,这违背了地理学第一定律,将导致技术效率的测度结果存在较大偏误。蒋青嬗等 [13] [14] 构建一个同时包含随机前沿模型和回归模型的半参数空间零无效率随机前沿模型,模型引入空间效应和非参数模型,即生产函数由线性部分和非线性部分共同组成,然而非参数模型只允许有一个输入变量。

综上所述,虽有许多文献各自弥补了模型的一个不足之处,但少有在空间随机前沿模型中考虑生产函数形式错误假设的问题研究,当研究的问题存在前后相互关联的关系且研究内容的时间跨度较长时,静态模型不能很好地进行客观拟合分析,非时变无效率项也不能反应实际情况,因此,研究具有时变效率的非参数动态随机前沿模型具有实际意义。相比于极大似然估计法,贝叶斯估计方法在函数推导方面较为简便,且因复合误差项的非对称性,模型采用贝叶斯估计的效果比最小二乘法的好。鉴于此,本文构建非参数动态空间随机前沿模型,允许无效率项时变,通过多元B样条逼近未知生产函数,利用贝叶斯估计实现模型估计。本文首先介绍了非参数动态空间随机前沿模型的一般形式及其相关假设,其次给出了模型的条件后验分布、参数抽样过程和模型估计精度评估方法,最后对模型进行数值模拟。

2. 基本模型及假设

模型的一般形式设计如下:

Y i t = λ 1 i = 1 N w i i Y i t + λ 2 i = 1 N w i i Y i , t 1 + γ Y i , t 1 + F ( x i t , β ) + v i t u i t (1)

其中, i = 1 , , N t = 1 , , T Y i t 为t时刻第i个生产单元的产出指标; F ( x i t , β ) 是一个未知函数, w i i 是空间权重矩阵元素,表示生产单元i和生产单元 i 的空间相关关系, x i t = [ x 1 , i t , , x j , i t , , x K , i t ] 表示为t时刻第i个生产单元的K个投入指标,式(1)中假设 v i t ~ i . i . d . N ( 0 , σ v 2 ) u i t ~ i . i . d . N + ( 0 , σ u 2 ) ,且用如下线性组合估计未知函数:

F ( n r , β ) = β 0 + k = 1 n r B k ( x i t ) β k = B ( x i t ) β (2)

B k ( x i t ) = j = 1 K B ¯ k , j ( x j , i t ) (3)

其中, n r = 1 + q + r s n r [ 1 , ) s = 1 , , S r s 为某一可能组合的样条张量积的节点数,S表示K个投入指标所有可能组合的数量。 B ( x i t ) = [ 1 , B 1 ( x i t ) , , B k ( x i t ) , , B n r ( x i t ) ] 为多元B样条基向量, B ¯ k , j ( x j , i t ) 为q阶B样条函数。系数向量 β = [ β 0 , β 1 , , β k , , β n r ] 服从多元正态分布,即 β ~ N ( μ , σ v 2 τ Λ ) ,Λ为正定矩阵。

式(1)可以用矩阵形式如下:

Y t = λ 1 w Y t + λ 2 w Y t 1 + γ Y t 1 + B ( x t ) β + v t u t (4)

其中, Y t = [ Y 1 t Y N t ] Y t 1 = [ Y 1 , t 1 Y N , t 1 ] v t = [ v 1 t v N t ] u t = [ u 1 t u N t ] 均为N维向量,w为 N × N 阶的空间距离矩阵, B ( x t ) N × ( n + 1 ) 的样条基矩阵,具体如下:

B ( x t ) = [ B ( x 1 t ) B ( x i t ) B ( x N t ) ] N × 1 = [ 1 1 1 B 1 ( x 1 t ) B k ( x 1 t ) B n ( x 1 t ) B 1 ( x i t ) B k ( x i t ) B n ( x i t ) B 1 ( x N t ) B k ( x N t ) B n ( x N t ) ] N × ( n + 1 ) (5)

若令 A ( λ 1 ) = I N λ 1 w C ( λ 2 , γ ) = λ 2 w + γ I N I N 为N阶单位矩阵,则式(4)转变为如下式(6):

A ( λ 1 ) Y t C ( λ 2 , γ ) Y t 1 B ( x t ) β + u t = v t (6)

其中, u t ~ N + ( 0 , σ u 2 I N ) v t ~ N ( 0 , σ v 2 I N )

3. 模型的贝叶斯估计

3.1. 参数的先验分布假设

将无效率项视为未知参数,模型的未知参数为 θ = ( λ 1 , λ 2 , γ , f ( n r , β ) , σ v 2 , σ u 2 , u t ) ,对样条基系数 β 的分布假设参考了Yoo等 [15] 的处理方式,节点个数 r s 服从泊松分布,其他未知参数参考蒋青嬗等 [7] 、任燕燕等 [10] 文章中关于模型参数的分布假设,本文对所有未知参数的假设如下:

γ ~ U ( 1 , 1 ) β ~ N ( μ , σ v 2 τ Λ ) λ 1 ~ U ( 1 λ min , 1 λ max ) λ 2 ~ U ( 1 λ min , 1 λ max )

σ v 2 ~ I G ( a v 2 , b v 2 ) σ u 2 ~ I G ( a u 2 , b u 2 ) r s ~ P ( λ s )

其中, λ min λ max 分别是空间权重矩阵 w 的最小和最大特征值。

3.2. 条件后验分布

由复合误差项的分布假设和式(6),可得到随机误差项 v t 的概率密度函数如下:

p ( v t ) = ( 2 π σ v 2 ) N 2 | A ( λ 1 ) | exp { v t v t 2 σ v 2 } (7)

Y t u t 的联合密度函数:

f ( Y t , u t ) ( σ v 2 ) N T 2 ( σ u 2 ) N T 2 | A ( λ 1 ) | exp { t = 1 T v t v t 2 σ v 2 t = 1 T u t u t 2 σ u 2 } (8)

由联合分布函数和先验分布可得到联合后验分布,从联合后验分布中推导出各参数后验分布,简记 A = A ( λ 1 ) C = C ( λ 2 , γ ) ,各参数将分别从以下对应的分布函数中抽样:

π ( u t | θ ( u t ) , Y t ) ~ N + ( u ^ , Ω ) (9)

π ( β | θ ( β ) , Y t ) ~ N ( β ^ , σ v 2 Σ ) (10)

π ( σ u 2 | θ ( σ u 2 ) , Y t ) ~ I G ( N T + a u 2 , b u + i = 1 T u t u t 2 ) (11)

π ( σ v 2 | θ ( σ v 2 ) , Y t ) ~ I G ( N T + a v 2 , t = 1 T v t v t + b v 2 ) (12)

π ( γ | θ ( γ ) , Y t ) ~ N ( t = 1 T ( A Y t B ( x t ) β + u t λ 2 w Y t 1 ) Y t 1 t = 1 T Y t 1 Y t 1 , σ v 2 t = 1 T Y t 1 Y t 1 ) (13)

π ( λ 2 | θ ( λ 2 ) , Y t ) ~ N ( t = 1 T ( A Y t B ( x t ) β + u t γ Y t 1 ) ( w Y t 1 ) t = 1 T ( w Y t 1 ) ( w Y t 1 ) , σ v 2 t = 1 T ( w Y t 1 ) ( w Y t 1 ) ) (14)

π ( λ 1 | θ ( λ 1 ) , Y t ) | I N λ 1 w | exp { t = 1 T ( w Y t ) w Y t 2 σ v 2 λ 1 2 + t = 1 T v t w Y t σ v 2 λ 1 } (15)

π ( r | θ ( n ) , Y t ) s S λ r s r s ! exp { t = 1 T ( A Y t C Y t 1 + u t ) B ( x t ) β σ v 2 t = 1 T ( B ( x t ) β ) B ( x t ) β 2 σ v 2 } (16)

其中, u ^ = σ u 2 ε t / σ v 2 σ u 2 Ω = ( σ v 2 σ u 2 / ( σ u 2 + σ v 2 ) ) I β ^ = Σ [ B ( x t ) ( A Y t C Y t 1 + u t ) + ( τ Λ ) 1 μ ] Σ = [ B ( x t ) B ( x t ) + ( τ Λ ) 1 ] 1

3.3. 参数抽样

从以上所得到的参数条件后验分布可知,参数 ( λ 2 , γ , β , σ v 2 , σ u 2 , u t ) 的抽样可通过Gibbs抽样来完成,参数 n r λ 1 可通过MH方法进行抽样。对参数 θ = ( λ 1 , λ 2 , γ , f ( n r , β ) , σ v 2 , σ u 2 , u t ) 的抽样过程可整理为以下5个步骤:

1) 对所有参数赋予初值,记为 θ 0 = ( λ 1 0 , λ 2 0 , γ 0 , β 0 , n r 0 , ( σ v 2 ) 0 , ( σ u 2 ) 0 , u t 0 )

2) 给定参数的初值 θ 0 = ( λ 1 0 , λ 2 0 , γ 0 , β 0 , ( σ v 2 ) 0 , ( σ u 2 ) 0 , u t 0 ) ,通过MH算法来更新参数 n r ,记更新后的值为 n r 1

3) 给定参数 ( n r 1 , ( σ v 2 ) 0 , ( σ u 2 ) 0 , λ 1 0 , λ 2 0 , γ 0 , u t 0 ) 的值,通过Gibbs算法来更新参数 β ,记更新后的值为 β 1 ,根据 n r 1 β 1 即可获得 f 1 ( n r , β )

4) 给定参数 ( n r 1 , β 1 , ( σ v 2 ) 0 , ( σ u 2 ) 0 , λ 2 0 , γ 0 , u t 0 ) 的值,通过MH算法来更新参数 λ 1 ,记更新后的值为 λ 1 1

5) 给定参数 ( n r 1 , β 1 , λ 1 1 , γ 0 , ( σ u 2 ) 0 , ( σ v 2 ) 0 , u t 0 ) 的值,通过Gibbs算法来更新参数 λ 2 ,记更新后的值为 λ 2 1 ;同理更新 ( γ , σ u 2 , σ v 2 , u t ) ,更新后的值记为 ( γ 1 , ( σ u 2 ) 1 , ( σ v 2 ) 1 , u t 1 ) 这样便完成了从初始状态 θ 0 = ( λ 1 0 , λ 2 0 , γ 0 , β 0 , n r 0 , ( σ v 2 ) 0 , ( σ u 2 ) 0 , u t 0 ) 转移到下一个状态 θ 1 = ( n r 1 , β 1 , γ 1 , λ 2 1 , λ 1 1 , ( σ u 2 ) 1 , ( σ v 2 ) 1 , u t 1 ) ,然后再以 θ 1 代替初值,重复进行步骤1至步骤5直到收敛,最后用后验样本均值来估计所有参数。

从M次迭代中取最后的M/3个观测值数据,计算各参数 ( λ 1 , λ 2 , γ , σ v 2 , σ u 2 ) 的平均值作为参数估计值,计算 f ( n r , β ) 的均值作为非参数模型估计值。

3.4. 数值模拟评估方法

考察参数 ( λ 1 , λ 2 , γ , σ v 2 , σ u 2 ) 的标准差、偏差、均方误差和平均绝对误差。考察非参数模型 f ( n r , β ) 的均方误差、平均绝对误差和拟合优度。同时,为观察非参数模型估计值与真实值的数据分布情况,给出对应的核密度曲线图。标准差、偏差、均方误差、平均绝对误差越小,模型估计精度越高,非参数模型估计值与真实值之间的核密度曲线越贴近则估计精度越高。

4. 数值模拟

对所建模型进行数值模拟。设计2组模拟:

1) 模拟一:

样本量为 { T N = 100 } ,被解释变量数量为1,解释变量数量为2,数值均由均匀分布 U ( 0 , 1 ) 产生。对于非参数模型,阶数 q = 2 ,系数 β 的先验分布中超参数 τ = 10 4 μ = 0 。误差的后验分布超参数 a v = a u = 8 b u = b v = 2 。空间权重矩阵为对角线上为零的0-1对称矩阵,矩阵大小为 N × N ,为减少区域间的外生影响对空间权重矩阵标准化。假设模型中生产函数形式如下:

F 1 ( x t , β ) = 2 ln ( x 1 , t ) + 2 ln ( x 2 , t ) + 0.3 ln ( x 1 , t ) ln ( x 2 , t ) + 0.3 ln 2 ( x 2 , t ) + 0.2 ln 2 ( x 2 , t ) (17)

2) 模拟二:

样本量为 { T N = 200 } ,其他设定与模拟一相同。

两组模拟分别产生符合上述假设的数据用于数值模拟,模拟迭代1000次,取最后1000/3个观测值的平均值作为参数估计。非参数动态空间随机前沿模型的估计精度结果详见表1

表1所示:模型的估计量精度较高,总体上模型的估计精度随样本量的增加而提高,但参数 σ u 2 的偏差表现不稳定。当样本量为200时,参数 σ u 2 的偏差和均方误差均高于样本量为100时的,但参数 σ u 2 的标准差和平均绝对误差比样本量为100时的低,表明 σ u 2 估计量的偏差表现不稳定。当样本量为200时,其余参数 { λ 1 , λ 2 , γ , σ v 2 } 的标准差、偏差、均方误差和平均绝对误差均比样本量为100时的低,非参数模型 f ( n r , β ) 的均方误差和平均绝对误差均比样本量为100时的低,其拟合优度比样本量为100时的高,表明参数 { λ 1 , λ 2 , γ , f ( n r , β ) , σ v 2 } 的估计精度随样本量增加而提升。

从核密度曲线图上看,多元B样条具有良好的拟合能力。以下展示两组数值模拟中非参数模型 f ( n r , β ) 的核密度曲线图。图1(a)和图1(b)分别展示了模拟一和模拟二中非参数模型的核密度曲线图,其中, p r e _ f 为非参数模型, t u r e _ f 为真实生产函数,核密度曲线越靠近则估计精度越高。

Table 1. Estimation accuracy results of nonparametric dynamic space stochastic frontier model

表1. 非参数动态空间随机前沿模型的估计精度结果

注:结果展示将标准差、偏差、均方误差、平均绝对误差和拟合优度五个指标依次上下排列。

Figure 1. Kernel density estimation plots of non-parametric models in Simulation 1 and Simulation 2

图1. 模拟一和模拟二的中非参数模型的核密度估计图

5. 总结

本文构建一个非参数动态空间随机前沿模型,利用多元B样条逼近未知生产函数,运用贝叶斯方法对该模型进行估计,数值模拟表明:多元B样条具有良好的拟合能力,模型的估计精度随样本量的增加而提高,无效率项方差的偏差表现不稳定。非参数动态空间随机前沿模型放松了生产函数为线性关系的假设条件,拓宽了随机前沿模型的使用范围。

参考文献

[1] Aigner, D., Lovell, C. and Schmidt, P. (1977) Formulation and Estimation of Stochastic Frontier Production Function Models. Journal of Econometrics, 6, 21-37.
https://doi.org/10.1016/0304-4076(77)90052-5
[2] 边文龙, 王向楠. 面板数据随机前沿分析的研究综述[J]. 统计研究, 2016, 33(6): 13-20.
[3] 王韧, 李志伟. 面板数据随机前沿分析及其应用[J]. 统计与决策, 2021, 37(19): 25-29.
[4] 于倩倩, 魏传华, 王森. 地理加权随机前沿模型及其估计[J]. 统计与决策, 2011(22): 23-25.
[5] Simwaka, K. (2012) Maximum Likelihood Estimation of a Stochastic Frontier Model with Residual Covariance. MPRA Paper.
[6] 林佳显. 空间随机前沿模型及技术效率和生产率估计研究[D]: [博士学位论文]. 广州: 华南理工大学, 2014.
[7] 蒋青嬗, 韩兆洲, 吴栩. 真实固定效应空间随机前沿模型的贝叶斯估计[J]. 统计研究, 2018, 35(11): 105-115.
[8] Tsukamoto, T. (2019) A Spatial Autoregressive Stochastic Frontier Model for Panel Data Incorporating a Model of Technical Inefficiency. Japan and the World Economy, 50, 66-77.
https://doi.org/10.1016/j.japwor.2018.11.003
[9] 蒋青嬗, 李毅君. 空间门限随机前沿模型的构建与估计[J]. 统计与信息论坛, 2019, 34(4): 25-31.
[10] 任燕燕, 吕洪渠, 王娜. 动态面板空间随机前沿模型的参数估计及应用[J]. 统计研究, 2019, 36(11): 113-124.
[11] Kumbhakar, S.C., Park, B.U., Simar, L., et al. (2007) Nonparametric Stochastic Frontiers: A Local Maximum Likelihood Approach. Journal of Econometrics, 137, 1-27.
https://doi.org/10.1016/j.jeconom.2006.03.006
[12] Assaf, A.G., Tsionas, M., Kock, F. and Josiassen, A. (2021) A Bayesian Non-Parametric Stochastic Frontier Model. Annals of Tourism Research, 87, Article ID: 103116.
https://doi.org/10.1016/j.annals.2020.103116
[13] 蒋青嬗, 韩兆洲. 半参数空间ZISF的估计及反馈分类[J]. 统计研究, 2017, 34(10): 98-109.
[14] 蒋青嬗, 黄灿, 李毅君. 半参数空间ZISF的估计、分类与蒙特卡罗模拟[J]. 中国管理科学, 2019, 27(3): 20-29.
[15] Yoo, W.W. and Ghosal, S. (2014) Supremum Norm Posterior Contraction and Credible Sets for Nonparametric Multivariate Regression. The Annals of Statistics, 44, 1069-1102.
https://doi.org/10.1214/15-AOS1398