1. 引言
二十大报告指出,必须坚持创新是第一动力,加快实施创新驱动发展战略。我国经济的高质量发展离不开实体经济和虚拟经济失衡的困境 [1] 。随着中国城镇化的发展,在过去二十年里,我国的房地产行业迅猛的发展。由于房地产行业的产业关联性极强,已然成为我国民经济的重要“支柱产业”之一。在宽松的货币政策以及“去库存”的战略条件下,埋下了房地产泡沫的隐患。所以,有效的预测房地产企业的信用风险,对抑制房地产泡沫的产生有着至关重要的作用。
众所周知,房地产行业属于资本密集型产业,在众多房地产企业资金回收速度放慢,负债率高的情况下,许多企业的资金主要来源于银行贷款。在过去的几年,房地产的非理性繁荣,积聚了众多风险。对于房地产企业的信用风险研究有助于商业银行在发放贷款时进行有效的风险防范。同时,对于房地产行业的信用风险的研究,也是能保证企业利润的一个重大措施。
信用风险又称违约风险,是评价一笔债务由于某些因素遭受损失的可能性 [2] ,是信用关系中债务人用以偿还债务的资产或收入来源存在巨大的不确定性。这种不确定性可能导致债务人无力偿还债务,从而引发违约事件 [3] 。
对于一般企业的信用风险研究分为三个发展阶段:起初是传统的信用风险研究,最具代表性的是Altman在1968年建立了传统统计模型,通过构建判别分析对信用风险进行了研究;而我国对于企业的信用风险的研究则更多的依托于资产评估公司;这些方式虽从一定程度上提高了企业的风险防范水平,但实施过程艰难,评估结果精度较差,不利于推广使用。
随着互联网的发展,不同的学者通过建立不同的模型,能够更精确的预测企业的信用风险。王慧选取了2009年至2016年共计147家房地产上市企业的数据,通过穷举法,选用KVM模型预测了我国房地产上市企业的违约风险 [4] ;李杰辉选取了房地产上市公司的14个相关财务指标,采用Logistic模型对我国房地产企业的信用风险进行了预测 [5] 。Daniel C基于问题的期望最大利润和计算利润,选取了Logistic Regression和XG Boost模型,优化了竞争性信用风险评分模型 [6] 。
为进一步提高信用风险的预测效果,更多的学者开始利用算法建立模型,何睿利用卷积神经网络,在构建银行间债券市场信用债知识图谱的基础上,构建了异构信息处理(R-GCN-BKG)的违约债券预测算法,其准确率可达92% [7] 。
2. 研究方法和数据来源
2.1. 研究方法
2.1.1. 因子分析法
因子分析是研究相关阵或者协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。
2.1.2. Logistic回归模型
Logistic回归模型因其简单的形式和优越的性能成为了信用风险研究中较为主流的方法。Logistic回归模型对数据的要求不严,可以不需要满足正态分布,也不需要保持自变量与因变量的线性关系。
2.2. 数据来源
本文数据来源于国泰安数据库,经过查阅资料,选择了部分能描述房地产公司信用风险的指标,最终选取了2020年我国房地产上市公司的14个财务指标。
3. 建模与分析
本文通过因子分析从14个财务指标中概括出能够解释原始变量的4个公共因子,然后根据实际意义,选择其中的2个公共因子作为建模的自变量,最后根据企业是否为ST企业(证券交易中实行“警示存在终止上市风险的特别处理”的企业,以提示该公司的股票可能有被终止上市的风险)作为因变量,建立能够描述房地产企业的风险的Logistic模型。
3.1. 指标筛选
通过因子分析筛选出能解释大部分原始变量的公因子,依据这几个对原始数据代表性较高的公因子作为自变量,结合因变量建立Logistic回归模型。
3.1.1. 碎石图
碎石图可以表示各个因子的重要程度,它将所提取的因子特征按照从大到小的顺序排列,从图中可以很直观地了解到解释变量的主要因子。
如图1所示,其中第一个和第二个因子的特征值较高,对解释原有变量的贡献最大;第三个和第四个因子的特征值较为明显,但第四个因子之后的其余因子则趋于平坦状态,所以提取前四个公因子作为解释原始变量的主要因子。
3.1.2. 累计贡献率
累计贡献率是因子特征值之和和所有因子特征值之和的比值。代表了抽取出的因子变异对所有变量变异的解释力,也就是抽取出的因子对所有变量的代表性。累计贡献率越高,说明这个因子的能够代表原始数据的信息越多。

Table 1. Cumulative contribution statement
表1. 累计贡献率表
通过表1可以看到这四个因子对于变量的解释程度,第一个因子对变量的解释达到了37%,第二个因子对变量的解释达到了27%,第三个因子对变量的解释达到了26%,第四个因子对变量的解释仅仅只有10%。说明第一个因子和第三个因子对于原始数据的代表性较高。
3.1.3. 因子载荷矩阵
因子载荷矩阵是将特征向量归一化后得到的矩阵,表示了各因子对各变量的影响程度。

Figure 2. Point diagram of factor load matrix
图2. 因子载荷矩阵点图
表2表示了因子各因子在原始变量上的载荷,图2可以更加清晰的看到因子载荷矩阵的分布。综上可以看到变量“固定资产比率”和“综合杠杆”对于任何一个变量的影响程度都很弱,说明这两个变量不具有能解释原始变量的作用,因此将其剔除。
3.1.4. 因子分析
根据因子载荷矩阵可以进一步提取出4个公共因子,以及归纳出每个因子所包含的变量,由此进行因子分析。

Table 3. Factor interpretation table
表3. 因子解释表
图3清晰的显示了每个因子所包含的变量,这有助于划分因子包含的不同变量。结合图3,可以总结如表3的因子解释表。根据表3可以看到四个因子的含义以及每个因子所包含的变量,根据实际意义,将第一个因子M1命名为“盈利能力”,将第二个因子M2命名为“每股净资产”,将第三个因子M3命名为“偿债能力”,将第四个因子M4命名为“产权比率”。根据每个因子所包含的解释变量,M2和M4这两个因子只包含了一个解释变量,不具有实际意义,所以在后续建模的过程中将其剔除。
3.1.5. 模型检验
通过卡方检验可以判断选取的房地产上市公司的财务指标是否适合建立因子分析模型,最终通过卡方检验的P值大小判断。

Table 4. Test table of factor analysis model
表4. 因子分析模型检验表
从表4可以看出模型的卡方检验结果为9.2*e25,该值小于0.05,说明数据通过因子分析法进行建模是可行的。
3.1.6. 因子得分系数
因子得分系数则是用来计算每个观测值在公因子上的得分。根据各个因子的得分可以写出各个因子关于各个指标的表达式。

Table 5. Factor score coefficient table
表5. 因子得分系数表
表5为因子得分系数表,表中显示了不同因子对原始变量的解释程度,在剔除了前面的两个无关变量“固定资产比率”和“综合杠杆”以后,得到了M1、M2、M3、M4这四个公因子的因子得分系数。根据房地产上市公司各个财务指标的实际意义,在下一章节中将选择公因子M1“盈利能力”和公因子M3“偿债能力”进行Logistic建模,以下为M1和M3公因子关于房地产上市公司各个财务指标的表达式:
在表达式中,x1为“资产负债率”,x2为“净资产收益率”,x3为“总资产收益率”,x4为“总资产回报率”,x5为“每股收益”,x6为“每股净资产”,x7为“流动比率”,x8为“产权比率”,x9为“速动比率”,x10为“流动负债率”,x11为“营业毛利率”,x12为“销售净利率”。
3.2. 建立Logistic回归模型
根据上述因子分析的结果,从房地产上市公司中的14个原始财务指标进行提取了其中2个具有代表性的公共因子,分别命是M1“盈利能力”和M3“偿债能力”。在建立的Logistic回归模型中,Y表示了企业是否为ST企业(证券交易中实行“警示存在终止上市风险的特别处理”的企业,以提示该公司的股票可能有被终止上市的风险)。若该上市企业为ST企业,则反应变量取值为1,说明该企业的信用风险较大;若该上市企业不为ST企业,则反应变量取值为0,说明该企业的信用风险较小。选取M1和M3作为自变量,Y作为因变量,建立Logistic回归模型。
3.2.1. 变量筛选

Table 6. Summary of Logistic regression results
表6. Logistic回归结果汇总表
注:***P < 0.001,**P < 0.01,*P < 0.05,下同。
表6是根据M1“盈利能力”和M3“偿债能力”建立的Logistic回归模型,可以看到自变量M1的P值为0.01,其结果小于0.05,说明自变量M1对回归结果的影响是显著的。而自变量M3的P值为0.42,其结果大于0.05,说明自变量M3对回归结果的影响不显著,故剔除该变量,选取自变量M1与因变量Y建立Logistic回归模型。
3.2.2. 建立Logistic回归模型

Table 7. Summary of Logistic regression results
表7. Logistic回归结果汇总表
剔除M3后,根据变量M1“盈利能力”以及因变量Y“是否为ST企业”,建立二元Logistic回归模型。
从表7能看M1的P值为0.00841,其结果小于0.05,说明该变量对结果是显著的,代表了模型的拟合效果很好。根据R语言的输出结果显示,模型的AIC值为43.921,其值较小,能代表原始数据的更多信息,所以最终选择建立二元Logistic回归模型。根据表7可以写出Logistic模型的回归方程:
由回归方程可以看出Logistic模型的系数为−2.31,也就是说事件的发生比为−2.31,由于该系数小于1,说明自变量随着事件的发生有负向作用,即房地产企业的盈利能力这一因子在企业违约的情况中占主导作用,且房地产企业的盈利能力越好,违约的概率约低。
4. 结论及建议
4.1. 结论
依据Logistic模型的回归结果显示,决定我国房地产企业信用风险的主要因子是企业的盈利能力,其主要具体对应财务指标是净资产收益率、总资产回报率、总资产净利润率、每股收益、营业毛利率、销售净利率。所以在房地产企业经营的过程中,要时刻关注这几个指标的波动,当指标出现过低或者过高的情况时,要及时调整经营战略,以防止出现企业的信用问题,减少企业的违约风险。
4.2. 建议
房地产企业要在新环境背景下加强内部经营与内部控制能力,提高企业盈利能力,企业就有足够利润偿还债务,企业违约风险就越小。同时也要树立优良产品理念,加强房地产企业内部管理与监督,积极通过多种途径提升员工技术专业水平、创新能力、道德水平,形成优秀企业文化,创立优质企业品牌,不断提升房地产企业竞争力,使企业盈利能力与偿债能力不断加强。