探索性因子分析在中石化安全绿色高质量指标体系评估中的应用——以市场竞争力和资源可持续能力为例
The Application of Exploratory Factor Analysis on the Safe, Eco-Friendly and High-Quality Development Evaluation Indicators System of Refinery Enterprise—Taking Market Competitiveness and Resource Sustainability as Examples
摘要: 在碳达峰、碳中和的时代背景下,中国石化集团为了准确评估企业发展现状,指导企业转型,参考国内外多个先进指标体系后制定了中国石化安全、绿色、高质量发展炼化企业评价指标体系。然而该指标体系的科学性和实用性还有待检验,很多测度分析仅仅基于指标得分的可视化展示和分析,但缺乏对指标体系本身的可靠性和有效性的分析,导致上级管理部门难以对指标体系的运行状况进行把控。本次研究的主要目的是以指标体系中的市场竞争力和资源可持续能力为例,运用探索性因子分析找出可能存在问题的三级指标项与指标体系构建过程中的不足,并反馈给指标制定部门以对指标加以衡量和改进,帮助中国石化集团构建更加科学合理的指标体系。
Abstract: In the context of carbon dioxide peaking and carbon neutrality, Sinopec’s safe, eco-friendly, and high-quality development evaluation indicators system of refinery enterprise was built based on multiple domestically and internationally recognized indicator system in order to accurately assess an enterprise’s development status and provide guidance for industrial restructure. However, it is uncertain whether the indicator system is scientific and efficient. Many measurement analyses on-ly focus on the visual display of indicator scores, lacking reliability and validity analysis of the in-dicator system itself, thus making it difficult for higher management to evaluate the current status of the system. Taking market competitiveness and resource sustainability as examples of tier 1 in-dicators, the main purpose of this study is to find possible problematic tier 3 indicators in the sys-tem and major drawbacks of the system development process with the help of exploratory factor analysis. This analysis could provide feedback to developers for further improvements and assist Sinopec in the construction of a well-established indicator system.
文章引用:刘畅, 刘洋, 张晓红. 探索性因子分析在中石化安全绿色高质量指标体系评估中的应用——以市场竞争力和资源可持续能力为例[J]. 管理科学与工程, 2022, 11(4): 479-487. https://doi.org/10.12677/MSE.2022.114060

1. 引言

中国石化安全、绿色、高质量发展炼化企业指标评价体系(以下简称中石化安全绿色高质量指标体系)是中国石化集团在综合对比了国内外多个相关指标体系后制定的,用于准确量化衡量企业发展水平、辅助企业制定合理规划的指标评价体系。该指标体系由六个一级指标,四十个子项指标组成,总分为一千分,六大一级指标项在总分值中所占比例由高到低为市场竞争力、绿色低碳能力、资源能源可持续利用能力、本质安全能力、科技创新能力、社会影响力。指标项得分通过将企业在该指标项上的填报结果代入该指标项对应的计算公式计算得到。管理人员可以通过企业在各指标中的得分对企业现状做出综合评价,并给出提升方向上的建议,指标体系为企业的转型发展提供了有力的数据支持。而另一方面,数据分析部门则需要基于企业填报数据对中石化安全绿色高质量指标体系自身的可靠性和准确性进行验证、分析并提出指标体系的改良建议。

2. 样本选择

我们对2019年至2021年前半段的中石化下属24家炼化企业的指标得分进行了Cronbach’s α系数计算和组内相关性分析。分析结果显示,市场竞争力与资源可持续能力在所有一级指标中是信度较高的两项,Cronbach’s α信度分别达到0.68和0.52,说明此两项一级指标的下属三级指标项分别测量了一个特质,内部一致性达到可接受程度 [1] [2] [3],并具备了进行结构效度检验的前提条件,即达到信度检验标准 [4]。而其它几项一级指标暂时不适合进行结构效度检验,需要指标制定者对指标进行修改后再进行后续分析。

市场竞争力和资源可持续能力共包括15个三级指标项。市场竞争力指标代表炼化企业的市场竞争力,由六个三级指标得分组成,包括盈利能力(已占用资本回报率)、财务风险(经营现金流比率)、成本费用(成本费用利润率 + 吨油完全费用 + 单位高附现金操作费用)和人力资源(全员劳动生产率);资源可持续能力指标代表炼厂在资源获取和利用方面的可持续能力,共包括九个三级指标得分,分别是资源获取(资源获取能力)、能源消耗(能源消费总量 + 万元工业产值能耗 + 炼油单因能耗 + 吨高附能耗)和资源利用(炼油高价值产品收率 + 高副产品收率 + 工业水重复利用率 + 炼化一体化率)。

3. 研究问题

本文将基于一级指标项市场竞争力、资源可持续能力进行以下研究:

1) 指标体系内的三级指标间是否有一定的相关性,是否能对指标体系进行探索性因子分析。

2) 能否找出合适的因子来解释三级指标间的相关性。

3) 发现指标体系构建过程中存在的不足。

4. 分析流程

探索性因子分析(exploratory factor analysis)能够将具有复杂关系的原始变量综合为少数几个未观测到的潜在变量,称为因子。本次实验中的三级指标是原始变量,而一级指标是我们想要找出的隐藏因子。我们选择R中的psych模块(2.2.5版本) [5] 作为分析工具,分析流程如图1所示。Bartlett球形检验 [6] 和KMO检验 [7] 分别用于检测数据是否适合进行探索性因子分析。Bartlett球形检验主要用于检查变量间是否各自独立。KMO检验反映了相关系数在多大程度上反映了公因子方差(communality,即因子对每个变量方差的解释度)。KMO值越接近1意味着变量间的相关性越强。Kaiser给出的度量标准是:KMO值 > 0.7时因子分析的效果最好,而KMO值 < 0.5则不适合进行因子分析 [7]。

Figure 1. Exploratory factor analysis flow chart

图1. 探索性因子分析流程图

接下来需要选择因子抽取方法。最常见的因子抽取方法是主成分分析法(principal components analysis)和主轴因素法(principal axes factoring),两者的唯一区别在于所分析的数据矩阵 [8]。主成分分析法假设指标的全体方差全部由公因子方差组成,不允许特殊方差或测量误差的存在,这意味着主成分分析法所分析的相关系数矩阵对角线均为1。该方法将所有变量做线性变化加以合并,这些线性组合为主要成分。主成分分析法适用于单纯的简化变量成分,以及作为因子分析的初步准备过程。主轴因素法则只分析指标的公因子方差而非全体方差,因此矩阵对角线上的1将被公因子方差h2替代,得到新的矩阵,对其分别求解特征根与特征向量并得到因子解。主成分分析法假设数据是完全可信的,主轴因素法没有此要求 [8]。

在抽取因子的方法选择上,由于此次分析的目的是为了找出数字背后隐含的意义与潜在结构,换言之,我们想探讨抽象概念的理论性意义并建立假设性框架,因此选择主轴因素法更为合适,并采取迭代式的主轴提取方法,通过多元相关平方(squared multiple correlation)来预估初始的公因子方差。然后计算矩阵的特征值,并通过平行分析(parallel analysis)来确定合适的因子个数。在进行平行分析时,会使用原始数据生成一定数量的模拟数据集,然后对这些模拟数据集进行因子分析,并对这些结果中相应的因子特征根取平均值,再将这些值与为原始数据提取的特征值进行比较,保留特征值高于模拟数据集的所有因子 [9]。

在抽取因子的方法选择上,由于此次分析的目的是为了找出数字背后隐含的意义与潜在结构,换言之,我们想探讨抽象概念的理论性意义并建立假设性框架,因此选择主轴因素法更为合适,并采取迭代式的主轴提取方法,通过多元相关平方(squared multiple correlation)来预估初始的公因子方差。然后计算矩阵的特征值,并通过平行分析(parallel analysis)来确定合适的因子个数。在进行平行分析时,会使用原始数据生成一定数量的模拟数据集,然后对这些模拟数据集进行因子分析,并对这些结果中相应的因子特征根取平均值,再将这些值与为原始数据提取的特征值进行比较,保留特征值高于模拟数据集的所有因子 [9]。

由于一级指标在构建时遵循了弱相关原则,我们假设因子之间没有相关性,因此选择正交旋转中最常见的最大变异法(varimax) [10],并对比未旋转与进行正交旋转后的因子提取结果。旋转后因子载荷(factor loading)矩阵结构简化,使每个变量仅在一个公因子上有较大的载荷,在其他公因子上的载荷较小,因此更容易对公因子进行解释。建立因子分析模型的目的不仅是要找出公因子以及对变量进行分组,更重要的是要知道每个公因子的意义,以便对实际问题做出科学分析。

5. 分析结果

表1中是指标数据的描述性统计分析,从中可知大多数指标间的相关系数大于0.3,可以进行下一步检测。Bartlett球形检验的结果显示相关性矩阵不是单位矩阵(显著性p < 0.05),说明变量相关性显著。KMO值 = 0.55 > 0.5,表明数据的相关系数矩阵可以被分解,适合进行探索性因子分析。图2为平行分析的结果,碎石图与psych模块的分析均建议提取两个因子。在检测因子设定的合理性时,我们遵循一个简单的原则,即因子荷载量 > 0.4则表明指标和因子之间有明显的对应关系 [11]。所有大于0.4的因子荷载量均在表2中用粗体标出。

表2中可得知,未进行旋转的因子与旋转后的因子上指标的因子荷载相差不大,但旋转后因子对整个数据集的解释程度略高一些(26% + 19% > 26% + 18%)。第一个因子与吨油完全费用、单位高附现金操作费、吨高附能耗、高附产品收率和炼化一体化率高度相关,第二个因子与已占用资本回报率、经营现金流比率、成本费用利润率、全员劳动生产率、能源消费总量和万元工业产值能耗高度相关。资源获取能力、炼油单因能耗和工业水重复利用率则与任何因子的相关性都很低,提取出的两个因子对这三个指标的解释度同样非常低(公因子方差分别为0.07、0.01和0),因此可以考虑删除指标或修改指标内容 [11]。

旋转后的因子1解释了26%的总体方差和58%的公因子方差,而因子2解释了19%的总体方差和42%的公因子方差,两个因子对指标数据的总体方差解释程度并不算高。但是由于每个因子内的三级指标组成比较混乱,目前很难对因子所代表的实际含义进行专业的命名解释。总体来说,探索性因子分析中所提取的因子无法对应中石化安全绿色高质量指标体系中的一级指标,说明指标体系内的市场竞争力和资源可持续能力这两个一级指标并不适合通过两因子模型来解释,在三级指标的选择、指标的计算、问卷的填写形式、填写人员的选择等方面均有不足,需要反馈给指标体系设计者进行后续的修改调整。

6. 问题分析

参考Morgado和Meireles等人的量表开发相关文献综述 [12],我们总结出本次研究中发现的指标体系构建过程中的不足:

Table 1. Input data (correlations, standard deviations, and means) for analysis of two tier 1 indicators from Sinopec’s development evaluation indicators system

表1. 分析中石化安全绿色高质量指标体系内信度合格的两个指标所用数据(相关系数、标准差、平均值)

Figure 2. Scree plot with parallel analysis

图2. 平行分析碎石图

Table 2. Standardized pattern coefficient for unrotated and varimax-rotated factors of the Sinopec’s development evaluation indicators system

表2. 中石化安全绿色高质量指标体系中未旋转与进行最大变异法旋转后的因子荷载、因子特征值、方差解释度和每个指标的公因子方差

6.1. 样本量过少

因子分析需要大量样本,样本过少会导致结果出现偏度和峰度的问题。通常来说,探索性因子分析要求样本量和指标量的比例为10:1,但一些研究者提倡更高的比例,例如20:1。具体的样本量要求取决于数据的特性,当一个因子包含3~4个指标且各项指标的平均公因子方差 > 0.7时,样本量可以适当减少 [13]。在这种理想情况下,10:1的样本量与指标量比例也许可行,但样本量少于100的因子分析可能不可靠。然而,当上述条件不成立时,则需要20:1的样本量与指标量比例和至少400个以上的样本量 [14]。Costello和Osborne的研究发现,大多数样本量与指标量比例 < 10:1的因子分析结果是错误的,当这一比例为2:1时,错误率高达90%,会导致大量指标被误归类到错误的因子上,并且将近1/3的此类分析由于技术问题无法得出结果 [15]。本次研究的样本量仅有24个,而三级指标共有15个,明显低于10:1的比例。指标的平均公因子方差为0.49 < 0.7,并不符合减少样本量的要求。

6.2. 未对指标进行理论分析

在量表开发过程中,理论分析是十分重要的一环。建立初始指标集后,需要对指标的内容效度进行评估,判断指标集对所研究构念的测量是否准确 [16],才能保证后续结果推理的有效性。指标体系制定者不能想当然的认为体系内应包含哪些指标。任何未使用过、更改过或未检测过的指标需要至少由一个专家小组做出评判 [17],并听取调查对象的意见,对指标集进行增删改查 [12]。中石化安全绿色高质量指标体系的构建说明中并未提及指标的理论分析方法,忽视这一步骤会导致指标体系内出现不合适的指标,从而影响探索性因子分析的结果。

6.3. 自我报告问卷存在缺陷

在定量研究中,自我报告的问卷形式可能会带来研究参与者偏差、社会期望偏差、要求特征、反应定势等问题,进而影响研究的有效性 [18]。本次研究采取了向参与企业发送EXCEL版问卷、由企业内部人员填写并返回的问卷形式。出于提升企业形象等原因,每家企业填报的自我报告问卷无法做到完全的公平公正,并不是企业真实情况的反应。此类情况的发送会造成指标间出现虚假的相关性或体系内部分相关关系被压制 [19],对后续的探索性因子分析产生干扰。

6.4. 指标的选择和编写不合适

建立指标集时,如果所选的指标不符合整个体系的构念,会直接影响指标体系的聚合效度(convergent validity),这在量表开发中是很常见的现象,可能是由于缺少相关的构念衡量标准导致的 [12]。研究者应多参考相关文献,查找与构念相关的额外理论支持。此外,指标问题描述模糊和难以回答也是常见问题之一 [20]。这会导致调查对象无法理解指标问题,做出自相矛盾或不一致的答复。合格的指标问题应该做到语言简洁,让调查对象易于理解,并明确说明需要回答的内容。问题不应具有诱导性或潜在假设,不可泛化或可估计,要保证回答的多样性 [12]。指标问题的排序也很重要,比如把简单有趣的问题放在前面,复杂枯燥的问题留到最后,有助于调查对象顺利完成问卷 [21]。本次调查中,各个炼厂在填写问卷时均遇到了部分无法理解或难以填写的问题,例如:资源获取能力指标要求填写低碳能源占比这一过于复杂的概念。问卷中不仅没有详细的说明或示例,还要求炼厂自行计算比值,导致一些炼厂放弃填写或填错,影响数据的质量。

6.5. 改进建议

· 参考国内外与绿色可持续发展相关的文献,选择经常被他人研究的对象作为指标加入到指标集中。

· 听取相关领域专家的意见,对指标集内的指标进行修改或删除。

· 选取一些能够代表各炼化企业问卷填写人员的群体,如炼化企业的工程师,进行指标的初步测试,让他们提出对指标问题编写的建议,使问题更加简洁明了,易于填写。

· 改进问卷的填写形式。可以考虑对企业内有一定相关背景知识的人员进行详尽的填写培训,或请专家去各企业考察后由专家统一进行填写,提升数据的有效性。

· 每次填写后都要对问卷结果进行探索性和验证性因子分析,用来更好的分析指标体系内的三级指标是否适合归入假想的一级指标,检验指标体系的结构效度。

· 由于石油化工项目建设周期长,投资额巨大,炼化工厂数量一般情况下较为稳定,不会在短时间内出现较大浮动,所以在客观条件影响下,中国石化指标体系的统计研究在一定时间段内只能在较小样本量下进行。因此在检验结构效度时也可以考虑使用多特质–多方法矩阵(multitrait-multimethod matrix)和方差分析(ANOVA)等方法进行补充 [22]。

· 梳理各部门分工和责任,完善数据分析机制,将效度分析等与指标密切相关的重点数据科学研究列入指标体系建设工作的长期规划。

· 通过信息化技术如在线文档、移动端应用等提高企业问卷填写的便捷性与准确性,减少因误填、问卷返回不及时等因素而对开展后续指标数据分析工作所造成的阻碍。

7. 未来展望

中国石化安全、绿色、高质量发展炼化企业指标评价体系是中国石化指导企业绿色转型,实现高质量发展的重要环节,指标体系设计的准确性和科学性关系到炼化企业的长期发展。效度分析是对指标准确性的评估,通过应用探索性因子分析对指标体系进行效度检验,可以帮助指标管理者找到可能存在问题的三级指标项并予以修正。日后针对指标体系的构建和完善,可以考虑开发相应的指标体系运转体系,例如:由指标设计者设计问卷、给各炼厂的问卷填写人员进行培训、指标设计者统计问卷结果并进行分析调整,不断优化问卷设计,使问卷更加合理,帮助企业管理者总结工业规律,制定更加科学的工业企业发展规划。加强更多如因子分析的统计分析方法在评估研究中的应用,并根据企业集团的实际情况优化评估流程,提升问卷质量,希望在未来能够对系统内所有炼化企业进行分步推广。

参考文献

[1] 张志颖, 张子军, 康凯, 王云峰. 信息系统能力模型的信度与效度分析[J]. 情报杂志, 2009, 28(5): 78-81.
[2] 张庆文, 马苓. 大学绩效评估指标系统的信度与效度分析[J]. 河北大学学报: 哲学社会科学版, 2009, 34(3): 88-92.
[3] Taber, K. (2018) The Use of Cronbach’s Alpha When Developing and Reporting Research Instruments in Science Education. Research in Science Education, 48, 1-24.
[4] 风笑天. 现代社会调查方法[M]. 第六版. 武汉: 华中科技大学出版社, 2022: 99-102.
[5] Clark, M. (2020) Factor Analysis with the Psych Package. https://m-clark.github.io/posts/2020-04-10-psych-explained
[6] Bartlett, M.S. (1951) The Effect of Standardiza-tion on a χ2 Approximation in Factor Analysis. Biometrika, 38, 337-344.
https://doi.org/10.1093/biomet/38.3-4.337
[7] Kaiser, H.F. (1974) An Index of Factorial Simplicity. Psy-chometrika, 39, 31-36.
https://doi.org/10.1007/BF02291575
[8] Kline, R.B. (2013) Exploratory and Con-firmatory Factor Analysis. In: Applied Quantitative Analysis in the Social Sciences, Routledge, New York, 171-207.
[9] Horn, J. (1965) A Rationale and Test for the Number of Factors in Factor Analysis. Psychometrika, 30, 179-185.
https://doi.org/10.1007/BF02289447
[10] Kaiser, H. (1958) The Varimax Criterion for Analytic Rotation in Factor Analysis. Psychometrika, 23, 187-200.
https://doi.org/10.1007/BF02289233
[11] Watkins, M. (2018) Exploratory Factor Analysis: A Guide to Best Practice. Journal of Black Psychology, 44, 219-246.
[12] Morgado, F., Meireles, J., Neves, C., Amaral, A. and Fer-reira, M. (2018) Scale Development: Ten Main Limitations and Recommendations to Improve Future Research Practices. Psicologia: Reflexão e Crítica, 30, Article No. 3.
https://doi.org/10.1186/s41155-016-0057-1
[13] MacCallum, R., Widaman, K., Zhang, S. and Hong, S. (1999) Sample Size in Factor Analysis. Psychological Methods, 4, 84-99.
https://doi.org/10.1037/1082-989X.4.1.84
[14] Fabrigar, L., Wegener, D., MacCallum, R. and Strahan, E. (1999) Evaluating the Use of Exploratory Factor Analysis in Psychological Research. Psychological Methods, 4, 272-299.
https://doi.org/10.1037/1082-989X.4.3.272
[15] Costello, A. and Osborne, J. (2005) Best Practices in Exploratory Factor Analysis: Four Recommendations for Getting the Most from Your Analysis. Practical Assessment, Research & Evaluation, 10, 1-9.
[16] Hinkin, T.R. (1995) A Review of Scale Development Practices in the Study of Organizations. Journal of Management, 21, 967-988.
https://doi.org/10.1177/014920639502100509
[17] Hardesty, D. and Bearden, W. (2004) The Use of Expert Judges in Scale Development: Implications for Improving Face Validity of Measures of Unobservable Constructs. Journal of Business Research, 57, 98-107.
https://doi.org/10.1016/S0148-2963(01)00295-8
[18] Mahudin, D., Cox, T. and Griffiths, A. (2012) Measuring Rail Passenger Crowding: Scale Development and Psychometric Properties. Transportation Research Part F: Traffic Psychology and Behaviour, 15, 38-51.
https://doi.org/10.1016/j.trf.2011.11.006
[19] King, M. and Bruner, G. (2000) Social Desirability Bias: A Ne-glected Aspect of Validity Testing. Psychology and Marketing, 17, 79-103.
https://doi.org/10.1002/(SICI)1520-6793(200002)17:2<79::AID-MAR2>3.0.CO;2-0
[20] Gottlieb, U., Brown, M. and Ferrier, E.F. (2014) Consumer Perceptions of Trade Show Effectiveness. European Journal of Marketing, 48, 89-107.
https://doi.org/10.1108/EJM-06-2011-0310
[21] Clark, L. and Watson, D. (1995) Constructing Valid-ity: Basic Issues in Objective Scale Development. Psychological Assessment, 7, 309-319.
https://doi.org/10.1037/1040-3590.7.3.309
[22] Crocker, L. and Algina, J. (1986) Introduction to Classical and Modern Test Theory. Cengage Learning, Mason, 230-235.