ETW  >> Vol. 8 No. 1 (March 2018)

    应用Logistic Regression分析住房抵押贷款风险管理因素分析之研究
    An Empirical Study on the Logistic Regression of Mortgage Loan Risk Factors

  • 全文下载: PDF(478KB) HTML   XML   PP.1-10   DOI: 10.12677/ETW.2018.81001  
  • 下载量: 492  浏览量: 1,014  

作者:  

吴政仲:宿迁学院,江苏 宿迁;
蔡雅茹:正修科技大学,台湾 高雄;
阳梦麟:长沙商貿旅游职业技術学院,湖南 长沙

关键词:
罗吉斯回归住房抵押贷款风险管理Logistic Regression Residential Mortgage Loan Risk Management

摘要:

商业银行的消费性贷款中,承做住房抵押贷款业务一直是相当重要的业务。实务上会影响借款人风险行为的因素相当多,因此金融机构承做房屋贷款业务时,其所面临贷款者的可能违约决策而言,是一种不确定性的概念。本研究借由数据之分析,以找出影响借款人对于房贷行为违约的可解释因素,同时与先前国内外学者所做相关研究进行比较。以提出影响住房抵押贷款行为中普遍主要影响风险因素。而这些因素事实上也是金融机构在承做相关房贷业务时所需要考察的风险因子,以提供其授信决策之参考。

Commercial bank consumer loan for housing mortgage loan business has been the important factor of business. Practically, plenty of reasons can influence browsers’ behaviors. Therefore, there is an uncertain concept that financial institutions that do housing loan may face browsers’ default. Data analysis, to find out the influence of the borrower for the mortgage default behav-ior can be explained with the previous factors, and at the same time, the domestic and foreign scholars do research. The study proposes main and general risky factors which affect behaviors of mortgage loan. These factors are in fact related financial institutions for mortgage business in the need of risk in order to provide the reference factor for credit decision.

1. 研究背景与动机

由于与借款人有关的微观变量和借款人无力抗拒的宏观变量影响了抵押贷款的违约风险,因此这二者常被作为研究抵押贷款违约的影响因素。总结国内专家关于抵押贷款违约风险影响因素的相关研究,可知微观层面对违约影响的研究更多,主要体现在借款人、贷款和抵押品特征变量对违约风险的影响。上述变量只受借款人个人的特性所影响,不受时间影响。借款人无力抗拒的宏观变量通常有经济周期变量、国家政策、市场供求变化。该变量不随借款人的个人特征改变,只随时间变化,借款人是被动的,不能自行改变,然而这些变量却极大程度上影响了违约率。而同一周期、不同区域因为各自经济发展特点的差异性,个人抵押贷款违约风险因素也存在显着差异。

银行开展个人住房抵押贷款业务的过程中,受房地产价格波动、利率变动、借款人收入变化以及银行内部管理等因素的影响,会面临不同类型的风险,包括信用风险、流动性风险、利率风险、法律风险和操作风险等。其中,信用风险也称作违约风险,是指因借款人还款能力下降和还款意愿不强而发生贷款本息拖欠,导致银行贷款损失的风险。它是银行开展个人住房抵押贷款业务过程中面临的最主要和最基本的风险。因此,本文通过理论及实证研究分析,揭示违约贷款发生的规律和影响违约风险的主要因素,在此基础上选择合适的计量工具进行风险控制,为住房抵押贷款的违约风险提供一些基础信息,同时也想通过抛砖引玉,为商业银行规避个人住房抵押贷款面临的违约风险提供进一步的量化研究的信息。

2. 文献综述

(一) 抵押贷款违约与提前偿还风险研究

吴双全和刘水林(1998) [1] 巧认为理性违约指借款人虽有能力履约,但在对履约与违约进行充分权衡分析后,如果违约叱履约更能实现借款人收益最大化时,借款人通过理性思考后可能做出的一种违约选择。理性违约是一种主动的违约行为,与借款人的实际支付能力无关。

刘廷祥等(2006) [2] 将违约风险的成因归纳为信用风险、市场风险和管理风险三类,并分别予以分析。白蔚萌(2005) [3] 提出责任风险的重要性,认为担保人和汽车经销商的责任是影响借款人违约风险的重要因素。财产风险、人员风险也是主要因素。吴政仲(2010) [4] 藉由以Heckman两阶段回归模型与Tobit回归模型估计,其次根据相关文献采用一般线性模式中的卜瓦松回归模式与负二项回归模式统计量之检定结果,得出与所搜集文献所整理有关考虑之借款者个人属性因素、借款契约条件内容相近。然数据具有过度分散问题,所以利用卜瓦松回归(poisson regression model)与负二项回归模式(negative binomial regression model)来预测结果,且所估计之参数具有一致、渐进有效及渐进常态之特性,偏误也会随着样本的增加而减少。其结果在违约风险得知贷款剩余期数、贷款年限、初贷金额、现欠余额与财务状况自变项是有意义的违约次数预测因子。宽限付款期限、贷款成数、年龄和性别皆是没有意义的。结论可知贷款剩馀期数、贷款年限、初贷金额、现欠余额与财务状况能有较准确预估借款人违约次数的变数。

裴国晶(2014) [5] 基于主层次分析法,分析来自借款人自身风险的各个因素的作用强度,建立影响借款人还款因素的信用模型。余晓雷(2016) [6] 以个人住房抵巧贷款违约风险影响因素为研究对象,基于房地产经历了高速发展、调整、化谷、复苏相对完整周期的背景下,试图再次识别不同区域影响我国个人住房抵押贷款违约风险的主要因素,使数据更完整、结论更可靠,为信用风险量化研究提供一定的基础,特别是为个人住房抵押贷款方面的违约风险进一步提供一定的研究成果。

Schwartz and Torous (1989) [7] 以重新借款利率、借款余额为解释变数,利用比例存活模型与最大概似的方法(method of maximum likelihood),评估影响抵押借款人提前清偿之决定因素,经实证结果:当重新借款利率低于抵押借款的利率时,提前清偿之条件机率(condition probability of prepayment) 显着增加。借款余额之高低显着的影响提前清偿之条件机率。当借款余额减少时,该机率亦减少;反之,则否。当重新借款利率与抵押借款的契约利率比较结果,足够低时,提前清偿显着的加快。提前清偿之条件机率随抵押借款的年数之增加而递增,至第6.265年时,达到最高峰提前清偿之比率达到最高峰。之后,则随着借款年数的增加而递减。

陈勇(2011) [8] 应用蒙特卡洛方法和有限差分法对提前偿还期权和违纷期权进行双因子定价分析,研究表明FRM隐含的提前偿还和违约风险的价值约为贷款息额的6.75%;当LVT比率增加时,违约风险增加;市场利李和房价波动增加时,住房抵押贷款的期权风险上升。风险期权理论前提假设源于经济理论中的经济人假说,期权理论认为每个借款人都是一个理性的决策者,其目标是追求一定约束条件下的个人效用最大化,即在完善的资本市场上,仅仅通过比较抵押贷款债务额与房价、合同利率与现行利率,借款人即可做出违约与否的决定。风险期权理论模型的假设前提过严,影响了其可靠性。

(二) 住房抵押贷款风险特征研究

Hall (1985) [9] 以市场利率、提前偿还的罚金等为解释变数,利用两阶段选择权评价模型(two-state option-pricing model)评估抵押借款人之提前偿还选择权,结果显示:市场利率会影响提前偿还选择的评价,尤其是期望未来利率的变动,而现行利率只有一些影响,增加提前清偿的罚金,会降低借款人提前偿还的选择。

Giliberto and Thibodeau (1989) [10] 利用MIT/Harvard joint Center for Housing Research Consumer Mail Panel的资料,以利率、收入、家庭规模、年龄、区域别、婚姻状况为解释变数,利用借款人的买回选择权(borrower's call option)之概念,进行传统住宅抵押贷款再融资的研究。经评估结果发现:利率的变动会影响住户做提前偿还之决定;住户之收入与规模增加时会刺激抵押贷款提前偿还;户长年龄在40与60岁之间者,其提前偿还机率低于其他住户;区域的不同亦显示不同的提前偿还机率,例如:New England,the North Central,and the Pacific region等地区,则比较喜欢提前偿还;婚姻状况对提前偿还没有影响。

3. 研究方法

Logistic模型的显着优势是它解决了不连续变量的回归问题,尤其对于因变量属于分类变量的利用该模型可以获得准确的结果。逻辑分析模型在确定自变量对个人住房抵押贷款违约风险的研究尤为适合,对最后定性、定量研究抵押贷款违约风险具有其独特优势。而Logistic模型从Logit模型导出的。Logit模型用逻辑概率分布函数(cumulative logistic probability function)数学表达为

P i = e z i 1 + e z i

P i = 1 1 + e z i

对上式两边乘以 1 + e z i ,进而获得:

( 1 + e z i ) P i = 1

再对上式两边除于 P i ,并减去1,可得:

P i 1 P i = e z i

在上式两边取自然对数,最终获得Logistic模型:

Ln ( P i 1 P i ) = z i

其中, Z i = β 0 + β 1 γ i + β 2 γ 2 + + β n γ n + μ i

Pi是个人住房抵押违约的概率

1 P i 代表的是不违约的概率

β i 则是需要估算的系数值

γ i 表示的是自变量

μ i 是一个随机误差项。

最大似然估计方法用于测试Logistic模型的拟合效应,并且通过Wald统计测试回归系数。Wald检验值越大,自变量的影响越明显。

本研究采取Logistic回归法,logistic回归方式的基本形式与一般线性回归(如:复回归)大致相似,但是logistic方式之因变数(被解释变数)的结果必须转换成介于0到1之间的概率值,因此其因变数未必符合常态分配假设,此即与一般线性回归法最主要差异之处。

若方式中因变数的值为0或1两种结果之一,则应采用二元logistic回归法进行分析。而若因变数为多元顺序尺度(multiple ordinal scale)或类别尺度的变数,例如:可将客户信用或违约程度分为1,2,3,4 及5等五个等级,等级愈高者表示信用愈不好(或愈好),或违约程度愈严重(或愈不严重),则可将此五个等级以0到1之间的值表之,1表示0 P < 0.2,2表示0.2 P < 0.4,3表示0.4 P < 0.6,4表示0.6 P < 0.8,5表示0.8 P < 1。此种多元尺度之因变数的logistic回归法,在SPSS统计软件中即称为多元logistic回归(multinomial logistic regression)。Logistic回归的基本方式如下:

P i = F ( Z i ) = 1 1 + e Z i

Z i = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + + β n X n

其中,Pi为事件i (违约或未违约)发生的概率,F(·)为Logistic的积累概率分配函数(cumulative density function),Xn为回归式中第n个预测变数,预测变数个数的多寡则视预测方式而定,而n则为回归式中第n个预测变数的系数。

Logistic模型是将以数值方式转换成以概率方式呈现,在分析之前不需假设资料具有常态性假设、自变数间也不存在共线性,但是要注意的是样本数需大于回归参数的个数。

Logistic模型的函数型态预测出的结果是介于0至1间的概率。样本分成房贷违约户和正常无违约房贷户2群,分别预估出违约房贷户的Logistic函数,最后将违约房贷户与正常无违约房贷户之变数分别代入Logistic函数中即可计算出一概率值。由概率值预测与判断是房贷户违约之预测行为,若预估出的概率高过分割点(cutoff point)概率也就越靠近1则认定为违约户,若预估出的概率低过分割点即概率越接近0则认定为无违约户,没有灰色地带所以不会造成无法认定是违约户或是无违约户的问题。金融机构能藉由此信用风险模型的建构而预测发生违约的可能。当分数高过于某一门槛值则认定为违约,而低于某一门槛值则认定为正常无违约,介于两门槛值中间则属于灰色地带,而灰色地带无法准确的认定公司为违约户与正常无违约户,所以通常由金融机构或与该金融机构有密切往来的客户自行判断。过去研究的结论,大多认为由于logistic回归对解释(或预测)变数的分配并无特定限制,当解释变数中同时有离散(discrete)及连续(continuous)变数时,logistic回归法所建立之预测方式的预测准确率通常较高。

4. 实证结果

为建立最终的LR方式,首先针对该金融机构目前所使用的评分表作分析,希望通过信用评分表撷取有效信息。此外,也希冀能由转档后的资料得到与授信成败攸关之关键变数,再将二部份的显着变数一并放入正式之LR方式以作为授信自动化、效率化且降低逾放比的工具。我们将所有搜集的变数分为该金融机构目前所使用之信用评分表列变数,包含:婚姻状况、家庭月收入、借款人年龄、贷款期限、还款方式、贷款金额、贷款利率、建筑面积、住房购买价格、贷款价值比、月还款额占家庭月收入比例与房价指数。

以下将依上述部份,对个别变数与贷款好坏(正常件、违约件)之间的关系进一步探讨。

本研究中,将缴息正常的贷款(正常件)定义为好贷款(Good Loan)、目前已达诉讼阶段的贷款(违约件)定义为坏贷款(Bad Loan),而好贷款和坏贷款为因变数的两种出象(Outcome)。为使该金融机构日后对LR方式使用的方便性、实用性提高,本研究的目的系为求出贷款申请者将来为“好贷款”的概率而非“坏贷款”的概率,故将不良贷款视为事件不发生,将正常贷款视为事件发生。本节将表列变数全部强迫进入LR模式,不仅可检讨该金融机构所使用之评分表其区分好、坏借款者的能力,且亦可找出显着变数,并与上一节所检定出显着的变数相互对照、比较。

(一) 常态性检定

既然我们把表列变数视为等距尺度,等同于连续变数,而信用评分表本身也给各变数的每个选项不同分数,所以,我们又把表列变数采乃根据表上给予各选项的实际数值。我们使用Kolmogorov-Smirnov统计量检定两组独立样本在各变数下是否为常态分配,样本数大于50,故需考虑Lilliefors之显着性修正,实证结果如表1所示。

表1明显可见:两组独立样本不管在表列原始变数,其Kolmogorov-Smirnov统计量之P值均显着低于0.05,均违反单变量常态分配。因此,对于两组独立样本之差异性检定,需采用无母数统计法之卡方齐一性检定和Kruskal-Wallis检定。

(二) 差异性检定

为检定好、坏贷款在各个变数是否存在显着差异,故虚无假说、对立假说设立如下:

H0:好、坏贷款在此变数上无明显差异(亦即两组样本具齐一性)

H1:好、坏贷款在此变数上有明显差异(亦即两组样本具差异性)

Table 1. The normalization of the original variables

表1. 表列原始变数之常态性检定

a. Lilliefors Significance Correction.

由于先前两组样本在各个变数均为非单变量常态分配,故对于间断性变数(包括名目变数、顺序变数)需用卡方齐一性检定而非t检定;至于唯一连续性变数-贷款期间亦违反常态,故采Kruskal-Wallis检定,以找出使两组独立样本具有显着差异的变数。表2即为各变数与因变数(贷款好坏)的卡方与Kruskal-Wallis检定结果:

表2差异性检定,经由无母数统计之差异性检定,在显着水准α = 0.05下,好、坏贷款只有在变数为家庭月收入、贷款金额、贷款利率、建筑面积、住房购买价格、贷款价值比、月还款额占家庭月收入比例等为差异显着,亦即拒绝虚无假说,宣称贷款好坏在这些变数存在明显差异。同时也说明假设1:LTV越大,抵押贷款违约的可能性越高。

(三) 表列原始变数之LR模式

以机率值0.5为分类的临界值模式的总正确率为57.2%,归类情形如表3,变数在方程式中的参数估计值和相关统计量如表3所示:

表3表4可知,以原始表列变数为主之LR模式,其正确率不高,尤其在原本为坏贷款部份,只有65.0%经LR模式归类为坏贷款,而高达35.0%的坏借款人被误认为好借款人,模式的总正确率也呈现偏低的情形。至于个别参数部分因为其P值高过0.05,呈现不显着,故我们对其完全不加考虑;显着变数有家庭月收入、贷款期限、贷款金额、贷款利率、建筑面积、住房购买价格、贷款价值比、月还款额占家庭月收入比例成为进入最后LR模式的显着变数。同时也证明假设2:个人月收入占家庭收入比例大,贷款违约概率也就越大。

为探讨相同等级之不同原始变数是否对授信成败有显着影响,因此,接下来的分析将显着变数有家庭月收入、贷款期限、贷款金额、贷款利率、建筑面积、住房购买价格、贷款价值比、月还款额占家庭月收入比例成为进入最后LR模式进行分析。同时也证明假设3:借款人的财务情况好的,其贷款违约率也自然越小。

此模式之配适度比原始变数模式高一些,但整个模式归类正确率也提高如下表5表6所示,对于模式原有变数的符号没有影响、参数估计值也产生变化大。可见将家庭月收入、贷款期限、贷款金额、

Table 2. Discrepancy Verification: Chi square and Kruskal-Wallis Test

表2. 差异性检定:卡方与Kruskal-Wallis检定

Table 3. LR Pattern (table column original variable) classification table

表3. LR模式(表列原始变数)之归类表

Table 4. Parameter Estimation of the LR Pattern (table column original variable)

表4. LR模式(表列原始变数)之参数估计

Table 5. Subdivision Pattern LR schema categorization table

表5. 细分之模式LR模式归类表

Table 6. LR model parameter estimation of subdivision pattern

表6. 细分之模式LR模式参数估计

贷款利率、建筑面积、住房购买价格、贷款价值比、月还款额占家庭月收入比例细分后,能改善原始变数LR模式之区别能力。由表5表6可知,以细分表列变数为主之LR模式,其正确率提高,尤其在原本为坏贷款部份,只有65.0%经LR模式归类为坏贷款,而高达35.0%的坏借款人被误认为好借款人,现在提高至81.0%,而只剩19.0%的坏借款人被误认为好借款人,表示细分后的模型模式的总正确率呈现提高的情形。

5. 结论与建议

(一) 研究结论

授信评估即银行根据授信基本原则及有关法令规章并参酌对借户征信调查所得资料加以综合判断借款人信用之良否,及授信之风险程度以决定应否核贷及如何核贷(含金额、期限、条件等)之过程,其目的在于授信品质的管理,授信品质管理得宜不仅可持续生利,银行债权亦可确保。

本研究实证结果发现,在不考虑其他因素时,细分变数模式信用评等模式是最佳模型。在此模式中家庭月收入、贷款期限、贷款金额、贷款利率、建筑面积、住房购买价格、贷款价值比与月还款额占家庭月收入比例为影响住房抵押贷款风险管理因素分析品质好坏的主要因素。以模式归类之正确率而言,细分变数模式能对实际归类为好贷款的借款人做70.3%之正确预测归类;对于实际归类是坏贷款的借款人预测之准确度也可达到81.0%,整体总正确率是75.7%,因此,本研究以细分变数模式作为最终的信用评等模式,以此模式所包含的变数,作为审核借款人信用条件、决定是否核贷的重要关键因素。LR模式除了利于实际运用外,也可提供授信人员另一客观之授信准则。利用最终模式求出之机率,可作为除担保品之外的另一审核标准,使授信政策更具弹性,也可作为对顾客执行差别取价之依据。使金融机构不仅可降低金融机构逾放比例、提高放款品质之目的,更可兼顾放款量之提升。

其次,本研究希望能了解在实务上银行业在对住房抵押贷款授信时,产生逾期放款之可能影响因素为何及何项为影响较大之因素,并将在许多产生逾期放款之影响因素中,筛选简化成几个关键的因素,以利研究了解逾期比率不同的银行群组间,对于住房抵押贷款授信产生逾期放款之可能影响因素认知上有何显著的不同。因此本研究认为银行授信评估考虑因素上,就其相对重要性言,有许多因素随授信用途、授信期限别而异,而有些状态为银行授信时可预见变化的,有些因素其状态为银行授信不可预见的,而需由授信人员加以判断,易受主观因素影响。故银行对于可预见变化的因素,授信前要详实征信,对不可预见变化的因素除授信前应做好预估工作外,授信后应做好追踪工作。

最后,本研究模式在实务上,可提供借款人作为申请贷款时之衡量工具,并可协助银行作为初步筛选借款人之参考,从而减轻借款市场上借贷双方严重资讯不对称之情形。

(二) 研究建议

首先,银行应建立严谨的授信管理制度,授信人员能以审慎的态度作授信决策,才有良好授信品质。此外,尚应不断加强授信人员训练,使其将5P之授信原则及相关政策、准则及程序,融为推展授信业务之基本动作,逐渐形成良好的授信文化,才能维持良好的授信品质,确保银行永续经营。其次,金融机构在授信审核过程中,应做到查证申请者填写资料是否属实,确实做好征信的工作,并确认借款人与其他金融机构之借贷金额、往来情形,而不是以担保品价值作为核贷与否之唯一条件。最后,建议银行业须对外在大环境之变化所可能产生之影响,保持警觉,经常检视授信策略并修正之。

第二,进一步加强银行的电子化建设。银行历来是信息技术领域的先行者和倡导者。将银行的信贷政策、会计系统以及市场拓展部门搜集整理的各种信息汇集到一起,自动分类、整理、分析、储存,以供内部管理人员作信贷审批、审查之用。近年来我国商业银行都不惜投入巨资进行电子化建设,使我国银行的电子化建设水平得到迅速提高。但住房抵押贷款样本资料录入计算机系统的信息很少,大量信息仍堆积于档案库中,而没有进行无纸化处理。所以当前还不能有效利用各种系统提供的信息进行快速、准确地识别、评估和管理风险。因此,未来我国商业银行信息现代化建设应逐步转向以风险管理为统领的整体性网络建设上来。

第三,从国外银行业务发展趋势来看,消费信贷特别是住房抵押贷款成为银行贷款发放的主要领域之一,并有稳定增长之势,如美国住房抵押贷款余额占到银行信贷余额的22%左右。而我国住房抵押贷款业务发展却因风险管理的滞后面临着看似统一却又矛盾的两种困境:一方面从银行来讲,虽然银行已认识到信贷政策应向住房抵押贷款倾斜,但由于缺乏有效的风险识别技术和风险控制措施,银行在扩大住房抵押贷款业务过程中存在种种顾虑、束手束脚、信贷政策变化较大,风险和收益不能达到均衡,影响了银行利润的最大化。另一方面从社会来讲,居民通过住房抵押贷款融资可改善居住条件,提高生活水平,促进社会总福利的最大化。但银行住房抵押贷款门槛太高,使一部分有能力分期付款的人被拒之门外,无法获得住房抵押贷款改善居住条件,从而影响了社会总福利的最大化。因此当前的关键问题是构建和完善住房抵押贷款风险识别技术和风险管理措施,以搭起发展银行业务与改善居民居住条件的桥梁。

文章引用:
吴政仲, 蔡雅茹, 阳梦麟. 应用Logistic Regression分析住房抵押贷款风险管理因素分析之研究[J]. 财富涌现与流转, 2018, 8(1): 1-10. https://doi.org/10.12677/ETW.2018.81001

参考文献

[1] 吴双全, 刘水林. 论理性违约的道德性及其责任性质[J]. 兰州学刊, 1998(5): 45-47.
[2] 刘廷祥, 王志平, 尚斌. 汽车消费信贷风险探究[J]. 中国市场, 2006(8): 12-13.
[3] 白蔚萌. 汽车贷款的风险及对策[J]. 沿海企业与科技, 2005(11): 73-74.
[4] 吴政仲. 房屋贷款违约与提前清偿风险因素之研究[D]: [博士学位论文]. 高雄:高雄第一科技大学管理研究所, 2010.
[5] 裴国晶. 商业银行个人住房抵押贷款借款风险研究[D]: [硕士学位论文]. 长春: 长春理工大学硕士论文, 2014.
[6] 余晓雷. 个人住房抵押贷款违约风险影响因素实证研究[D]: [硕士学位论文]. 杭州: 浙江大学, 2016.
[7] Schwartz, E.S. and Torous, W.N. (1989) Prepayment and the Valuation of Mortgage-Backed Securities. The Journal of Finance, 44, 375-392.
https://doi.org/10.1111/j.1540-6261.1989.tb05062.x
[8] 陈勇. 住房抵押贷款及其金融创新产品[M]. 长沙: 湖南大学出版社, 2011.
[9] Hall, A.R. (1985) Valuing the Mortgage Borrower’s Prepayment Option. Real Estate Economics, 13, 229-247.
https://doi.org/10.1111/1540-6229.00352
[10] Giliberto, S.M. and Thibodeau, T.G. (1989) Modeling Conventional Resi-dential Mortgage Refinances. The Journal of Real Estate Finance and Economics, 2, 285-299.
https://doi.org/10.1007/BF00177949