# 中小企业破产模型的判别分析与Logistic回归分析The Discriminant Analysis and Logistic Regression Analysis of SMEs Bankruptcy Model

• 全文下载: PDF(467KB)    PP.604-612   DOI: 10.12677/PM.2018.86081
• 下载量: 143  浏览量: 234

In multivariate statistical analysis, discriminant analysis and Logistic regression analysis are both used to predict and interpret the classification. Regression models are used to predict and interpret metric variables, while discriminant analysis and Logistic regression analysis are used to solve situations where explanatory variables are non-metric variables. When the explanatory variable contains two types, both discriminant analysis and Logistic regression analysis are applicable; when the explanatory variable contains more than two types, only discriminant analysis is applicable. However, discriminant analysis is only applicable when the explanatory variables satisfy the multivariate normality and the equivalent covariance matrix hypothesis. Logistic regression does not require a series of assumptions about explanatory variables, and good results can still be obtained. In this paper, the bankruptcy model of SMEs (Small and Medium Enterprises) was analyzed by discriminant analysis and Logistic regression analysis respectively, and the differences and similarities between the two classification methods were compared.

1. 引言

2. 判别分析的基本思想

1) 选择恰当的解释变量，解释变量不是越多越好，要“越有代表性越好”，解释变量多了会出现多重共线性的结果，影响判别分析方法的使用。

2) 判断解释变量是否满足判别分析的假设条件：

i. 每个解释变量不能是其他解释变量的线性组合；

ii. 各组变量的协方差阵相等；

iii. 各个解释变量间具有多元正态分布 [1] 。

3) 选择合适的准则判别对象和类别之间的距离。常用的判别方法有：

i. 距离判别；

ii. Bayes判别；

iii. Fisher判别；

iv. 逐步判别。

4) 对模型的拟合效果进行显著性检验。

5) 对模型的结果进行分析和解释。

3. Logistic回归的基本思想

$Q=\mathrm{ln}\frac{p}{1-p}$

$\mathrm{ln}\frac{p}{1-p}={b}_{0}+{b}_{1}{x}_{1}+\cdots +{b}_{n}{x}_{n}$

Logistic回归的步骤：

1) 选择恰当的解释变量和被解释变量 [2] 。

2) 令 $Q=\mathrm{ln}\frac{p}{1-p}={b}_{0}+{b}_{1}{x}_{1}+\cdots +{b}_{n}{x}_{n}$

3) 使用极大似然估计 ${b}_{0},{b}_{1},\cdots ,{b}_{n}$

4) 解出p值。

5) 对模型的拟合效果进行显著性检验。

6) 对模型的结果进行分析和解释。

4. 数据背景

${x}_{1}$ = 现金流量/总债务；

${x}_{2}$ = 净收入/总资产；

${x}_{3}$ = 流动资产/流动债务；

${x}_{4}$ = 流动资产/净销售额 [2] 。

5. 判别分析

Table 1. Ogarithmic determinant

Table 2. Test results

Wilks’s Lambda准则用来评估判别函数的判别效力的显著性。Spss默认引入变量的临界值为3.87，剔除变量的临界值为2.71。

Table 3. Variables not in the analysis

Table 4. Variables in the analysis

Table 5. Classification function coefficients

Table 6. Canonical discriminant function coefficient

a) 由表5可以看出两类的Fisher判别函数分别是

${f}_{\text{1}}=-\text{2}.\text{789}+\text{2}.\text{4}0\text{2}{x}_{2}-11.169{x}_{3}$

${f}_{2}=-5.908+4.043{x}_{2}-1.028{x}_{3}$

b) 由表6可以看出非标准化的判别函数为

$f\left(x\right)=-1.771+5.497{x}_{2}+0.89{x}_{3}$

c) 根据Fisher线性判别函数对原始数据进行回判，根据非标准的线性判别函数计算每个观测的Z得分。由表7判别函数在y = 1的重心为−1.003，而在y = 2的重心为0.842。计算分割点为0，可以根据待判样品的每个观测的Z得分进行分类 [1] 。

Table 7. Functions at group centroids

Table 8. Wilks’ Lambda

Table 9. Structure matrix

Table 10. Canonical discriminant function coefficient

6. Logistic回归分析

Table 11. Omnibus test of model coefficients

Table 12. Model summary

Table 13. Hosmer and Lemeshow test

Table 14. Variables in the function

Table 15. Variables in the function

Table 16. Variables in the function

Table 17. Classification table

a.切割值为0.500。

7. 判别分析与Logistic回归分析的比较

8. 结论

 [1] 郭蕾. 2型糖尿病的判别分析和Logistic回归分析[D]: [硕士学位论文]. 长沙: 中南大学, 2007. [2] 何晓群. 多元统计分析[M]. 第4版. 北京: 中国人民大学出版社, 2014: 105-305. [3] 郭志刚. 社会统计分析方法: SPSS软件应用[M]. 第2版. 北京: 中国人民大学出版社, 2015: 177-306.