1. 引言
双碳目标既成为了全球环境治理的共识,也成为我国经济高质量发展的重要任务。2021年5月,碳达峰碳中和小组在北京召开第一次全体会议,2021年10月,国务院印发《关于完整准确全面贯彻新发展理念做好碳达峰碳中和工作的意见》。在“双碳”政策背景下,与双碳相关的绿色词汇连续多年出现在各级政府工作报告中,绿色词汇成为了年度热词,企业也逐渐意识到绿色投资成为企业可持续发展的重要支撑。而个人投资者在投资决策过程中开始关注企业绿色转型程度,这可能会影响证券市场中股票收益率。部分投资者在投资决策过程中会关注股票在企业年报中公开披露的绿色化信息。投资者对企业绿色的关注度会逐步形成绿色偏好,通过投资组合偏好影响股票价格[1]。
基于此,本文将在Fama-French因子模型的基础上增加企业绿色因子,应用计量方法检验企业绿色因子在当前A股市场上的有效性。
2. 文献综述
2.1. 异类因子
随着股票市场的不断发展和因子的不断挖掘,传统因子面临着超额收益率越来越低的现状,而诸多学者开始思考还有没有哪些未被广泛使用的数据(另类数据)能构建新的因子。有学者从投资者角度出发,利用换手率[2]、股吧评论[3]、社交媒体新闻[4]构建投资者情绪因子。此外,李新等(2023) [5]通过机构投资者持股比例构建投资者结构因子,加入到Carhart四因子模型中,发现沪深主板、创业板均存在投资者结构溢价。还有齐岳等(2020) [6]从公司角度出发,使用主成分分析法从13项公司治理变量中,降维提取出主要信息,以各主成分的方差占比重作为权数,加权构建公司治理因子。此外,马甜等(2022) [7]在方法上进行了创新,使用生成式对抗网络(GAN)构建深度学习模型,构建了企业特征因子数据库,研究了中国股票市场的可预测性。
2.2. 绿色因子与股票收益率
对于股票绿色定价的研究,学者们发现企业绿色因素是股票收益率的重要影响因素。尹晓娜和李静萍(2023) [8]基于医疗卫生行业,发现ESG表现对股票收益率产生正向影响,但对国有企业的影响不显著。胡铭宇等(2023) [9]以碳排放试点地区为研究对象,研究发现碳排放权交易提高了低碳企业的股票收益率。
不同的学者构建绿色因子采用了不同的做法。韩国文和樊呈恒(2021) [10]基于行业碳排放构建了碳风险因子,发现建立碳排放交易所增加了市场碳风险溢价。李岩等(2024) [11]依据华证ESG评级信息,构建ESG投资绩效因子,确认了A股市场上ESG投资绩效因子的有效性。韩立岩等(2017) [12]以节能环保相关的股票为对象,运用绿色和非绿色概念股票收益率之差构建了绿色因子。
综上所述,诸多学者皆在寻找异类因子来解释股票超额收益率,且多数学者对于绿色因子的构建大多采用企业财务数据或ESG评级信息,本文试图从上市公司公开披露的年报中构建企业绿色因子,从企业角度出发反映企业绿色化程度。
3. 模型构建和数据准备
3.1. 数据说明
本文采用2010~2023年中A股主板、创业板和科创板股票的月度数据,对金融行业股票、ST股票以及退市的股票进行剔除,为了避免中国特有壳影响,对流通市值后30%股票进行剔除[13],相关财务数据来自于CSMAR数据库。上市公司年报文本来源于中国研究数据服务平台(CNRDS)中的管理层讨论与分析数据库(CMDA),该数据库为我们提供了较为完整且处理后的上市公司文本数据,本文不再进行特殊处理。对于缺失的数据进行剔除,为了避免一些极端值的影响,对数据进行缩尾处理。
3.2. 企业绿色词频构建
企业绿色因子的构建采用文本分析法,主要思路是基于上市公司年报中的管理层分析与讨论(MD&A)部分,利用python程序对文本进行词频统计。绿色词典主要参考张建鹏等(2021) [14]的做法,绿色关键词主要涵盖了“环保目标”、“环境因素”、“环境污染”以及“环保措施”四个方面,选取27个关键词,从多维度反映企业对于环境问题的关注。具体参考关键词如下表1所示。
Table 1. List of keywords
表1. 关键词表
维度 |
关键词 |
数量 |
环保目标 |
环境保护、环保、绿色、清洁、低碳、蓝天、绿水、青山 |
8 |
环境因素 |
生态、空气、气候 |
3 |
环境污染 |
二氧化硫、化学需氧量、雾霾、颗粒物、二氧化碳、能耗、散煤、燃煤、排污、偷排、尾气、污染 |
12 |
环保措施 |
节能、减排、脱硫、脱硝 |
4 |
基于绿色词典,使用python中的jieba模块对上市公司年报文本进行分词处理。第一步,使用自定义词典列表的方法将所有绿色关键词导入到jieba中,经过处理后未被jieba识别的新词不会再被拆分,能够更准确地计算关键词数量。第二步,加载停用词库,主要包括中国人民大学、四川大学、哈尔滨工业大学以及百度停用词表四大主流中文停用词库,将常见且无意义的词汇予以剔除。第三步,使用jieba中lcut方法,采用精确模式进行词语切割,得到每个年报文本分词后的词语列表。最后,对词语列表中的绿色关键词进行统计,以此反映企业绿色程度。
Figure 1. Annual trend chart of green word frequency
图1. 绿色词频年度趋势图
基于文本分析法,能够得到每家上市公司绿色词频随时间的变化趋势,并按照年份进行加总。结果如上图1所示,横坐标表示年份,纵坐标表示该年上市公司年报管理层分析与讨论中出现的绿色词频总数。总体来说,我们能直观发现绿色词频呈现逐年增加的趋势,一方面是由于企业对于绿色低碳转型关注的持续提升,另一方面也可能是上市公司数量增长导致的。另外,2015年词频数量的急剧下降和2021年词频数量的急剧上升也很明显,究其原因,可能是政策实施导致的,2015年修订了最严环境保护法,被称为史上最严环保法;2021年则是“双碳”的提出和一系列政策出台引起的。
3.3. 模型的因子构建
Table 2. Factor construction formula
表2. 因子构建公式
因子 |
财务指标 |
分界点 |
计算公式 |
规模因子 |
流通市值 |
50% |
|
|
|
|
|
价值因子 |
账面市值比 |
30%, 70% |
|
盈利因子 |
ROE |
30%, 70% |
|
投资因子 |
总资产增长率 |
30%, 70% |
|
动量因子 |
按前2~12个月的累积收益率 |
30%, 70% |
数据来源于CSMAR数据库 |
企业绿色因子 |
绿色词频 |
30%, 70% |
|
本文参考Fama和French (2015) [15]的分组方法,采用双重独立排序构建因子。不同的因子分组方式(2 × 2, 2 × 3, 2 × 2 × 2)均不会对模型解释性产生影响,因此本文采用最经典的2 × 3分组方式构建因子。规模因子、价值因子、盈利因子、投资因子分别使用流通市值、账面市值比、ROE、总资产增长率作为因子构建使用的财务指标。规模因子构建以股票流通市值的中位数为分界点,流通市值分为大市值组(B)和小市值组(S);账面市值比(H/M/L)、ROE (R/M/W)、总资产增长率(C/M/A)分别以30%和70%为临界点,划分为高、中、低三组。
流通市值(大、小)分别与账面市值比、ROE、总资产增长率(低、中、高)相互交叉构成18个组合。以规模–账面市值比为例,大规模(B)、小规模(S)两组分别与高账面市值比(H)、中账面市值比(M)、低账面市值比(L)三组形成6个投资组合,即BH、BMBM、BL、SH、SMBM、SL。以月为单位,每个月更新投资组合,计算组合收益率以流通市值作为权重,得到6个组合收益率。
企业绿色因子作为新加入的因子,同样采用2 × 3分组,按照上文文本分析法计算出的绿色词频作为拆分依据,分为高绿色组(G)、中绿色组(M)、低绿色组(P)。因子具体计算过程如表2所示。
3.4. 含企业绿色因子的Fama-French模型构建
将企业绿色因子加入到传统三因子和五因子模型中拓展为四因子与六因子模型。为了检验新增企业绿色因子有效性,主要通过比较扩展因子模型与原模型在对股票收益率解释能力的差异来实现。
Fama-French五因子的公式如下:
(1)
其中,
代表股票的月度收益率与月度化无风险收益率之差,MKT、SMB、HML、RMW、CMA分别代表市场因子、规模因子、价值因子、盈利因子和投资因子。
随着气候问题的日益突出和企业绿色化进程的加速,投资者也逐渐将企业绿色纳入投资决策,基于此构建了加入企业绿色因子的拓展六因子模型,公式如下:
(2)
其中,GMPt为t期高绿色词频组与低绿色词频组的组合收益率之差,反映投资者对于绿色企业投资意愿的系统性风险。
4. 实证分析
4.1. 描述性统计
4.1.1. 因子描述性统计
Table 3. Descriptive statistics of factors (%)
表3. 因子描述性统计(%)
|
样本数量 |
均值 |
标准差 |
最小值 |
最大值 |
MKT |
168 |
0.244 |
5.919 |
−24.288 |
17.501 |
HML |
168 |
−0.531 |
4.971 |
−26.584 |
15.702 |
RMW |
168 |
0.896 |
2.016 |
−5.639 |
5.454 |
CMA |
168 |
−1.454 |
3.226 |
−15.202 |
9.089 |
GMP |
168 |
−0.315 |
1.977 |
−5.919 |
6.799 |
SMB |
168 |
−0.472 |
4.287 |
−22.716 |
13.249 |
UMD |
168 |
−0.003 |
5.162 |
−15.911 |
16.810 |
上表3汇报了包含市场因子(MKT)、规模因子(SMB)、价值因子(HML)、盈利因子(RMW)、投资因子(CMA)、动量因子(UMD)、企业绿色因子(GMP)在内七因子的平均值、标准差、最大值以及最小值。
4.1.2. 组合月平均收益率
参照Fama和French (2015) [15]的做法,将股票按照流通市值从小到大分为五组(Small, 2, 3, 4, High),账面市值比、ROE和总资产增长率分为五组(Low, 2, 3, 4, High),将规模分别与账面市值比、ROE和总资产增长率两两交叉一共得到125个投资组合,计算每个月投资组合超额收益率,并在时间序列上将收益率取平均,反映收益率与账面市值比、流通市值、ROE和总资产增长率之间的关系。具体数据见表4。
Table 4. Average excess return rate of the 5 × 5 investment portfolio (%)
表4. 5 × 5投资组合平均超额收益率(%)
Panel A:账面市值比–规模组合 |
规模 |
Low |
2 |
3 |
4 |
High |
Small |
2.578 |
1.563 |
0.673 |
0.309 |
−0.559 |
2 |
2.838 |
1.564 |
0.860 |
0.327 |
−0.331 |
3 |
3.596 |
1.847 |
1.329 |
0.756 |
0.049 |
4 |
3.707 |
2.031 |
1.370 |
0.945 |
0.072 |
Big |
3.335 |
2.015 |
1.691 |
1.266 |
0.488 |
Panel B:ROE-规模组合 |
规模 |
Low |
2 |
3 |
4 |
High |
Small |
−0.002 |
0.666 |
0.771 |
1.386 |
2.202 |
2 |
0.479 |
0.786 |
1.203 |
1.343 |
2.254 |
3 |
1.130 |
1.235 |
1.569 |
1.558 |
2.288 |
4 |
0.882 |
1.319 |
1.329 |
1.940 |
2.488 |
Big |
0.691 |
0.863 |
1.256 |
1.523 |
2.388 |
Panel C:总资产增长率–规模组合 |
规模 |
Low |
2 |
3 |
4 |
High |
Small |
0.080 |
0.263 |
0.950 |
1.213 |
1.933 |
2 |
0.603 |
0.775 |
0.991 |
1.172 |
2.093 |
3 |
0.982 |
1.192 |
1.315 |
1.630 |
2.348 |
4 |
1.240 |
1.095 |
1.407 |
1.746 |
2.732 |
Big |
0.902 |
0.819 |
1.446 |
1.941 |
2.981 |
从规模–账面市值比、规模-ROE、规模–总资产增长率三个组合来看,股票收益率均出现随规模增大而增大的现象,说明了小公司的规模溢价正在逐渐消失,出现了发达国家20世纪80年代相似的规律,且符合当前机构抱团大市值股票的现状[16]。从Panel A的每行数据,我们发现在控制规模后,股票收益率随账面市值比的增加而减少;从Panel B的每行数据,发现股票收益率随盈利的增加而增加;从Panel C的每行数据,发现股票收益率随投资的增加而增加。
4.2. 相关性检验
为了排除因子之间的相关性,导致回归结果出现多重共线性问题,回归前检验因子之间的相关性水平。下表5汇报了因子间的相关系数矩阵,发现GMP因子与其他因子之间相关性普遍小于0.5。账面市值比(HML)和投资因子(CMA)之间的相关性为0.748,通过1%的显著水平,可能是由于账面市值比大的公司,市场对于企业发展前景乐观,企业更能从市场中获得资金,从而促使企业的投资行为;盈利因子(RMW)和投资因子(CMA)相关性为−0.619,通过1%的显著性测试,可能是由于对于盈利状况较好的公司,因其业务模式稳定,不愿意承担高风险的投资。总体来说,各因子之间不存在非常严重的共线性。
Table 5. Factor correlation coefficient matrix
表5. 因子相关系数矩阵
|
MKT |
HML |
RMW |
CMA |
GMP |
SMB |
UMD |
MKT |
1.000 |
|
|
|
|
|
|
HML |
−0.057 |
1.000 |
|
|
|
|
|
RMW |
−0.224*** |
−0.302*** |
1.000 |
|
|
|
|
CMA |
−0.017 |
0.748*** |
−0.619*** |
1.000 |
|
|
|
GMP |
0.037 |
0.446*** |
−0.055 |
0.209*** |
1.000 |
|
|
SMB |
0.124 |
−0.479*** |
−0.333*** |
−0.238*** |
−0.268*** |
1.000 |
|
UMD |
−0.060 |
−0.306*** |
0.491*** |
−0.421*** |
−0.036 |
−0.140* |
1.000 |
注:***表示在1%水平下显著,**表示在5%水平下显著,*表示在10%水平下显著。下同。
4.3. 回归分析
4.3.1. 全样本回归
Table 6. Regression results of the overall sample of the factor model
表6. 因子模型整体样本回归结果
|
(1) |
(2) |
(3) |
(4) |
五因子模型 |
扩展六因子模型 |
四因子模型 |
扩展五因子模型 |
MKT |
1.039*** |
1.037 *** |
1.063*** |
1.058*** |
(252.83) |
(252.07) |
(267.44) |
(265.00) |
SMB |
0.592*** |
0.599*** |
0.675*** |
0.677*** |
(78.38) |
(78.91) |
(108.99) |
(109.31) |
HML |
−0.131*** |
−0.172 *** |
−0.228*** |
−0.271*** |
(−16.76) |
(−19.12) |
(−41.67) |
(−44.75) |
RMW |
−0.468*** |
−0.439 *** |
|
|
(−23.94) |
(−22.14) |
CMA |
−0.338*** |
−0.295*** |
|
|
(−24.20) |
(−20.02) |
UMD |
|
|
−0.031*** |
−0.041*** |
(−6.38) |
(−8.31) |
GMP |
|
0.122*** |
|
0.209*** |
(9.21) |
(16.53) |
截距项 |
0.010*** |
0.009*** |
0.009*** |
0.008*** |
(37.60) |
(36.46) |
(32.47) |
(30.53) |
adj. R2 |
0.2488 |
0.2490 |
0.2474 |
0.2480 |
注:括号内为t值,下同。
参考李岩等[11]的做法,为了检验因子模型在整体样本的有效性,使用所有股票超额收益率作为因变量,因子作为自变量进行回归。结果如表6所示,发现无论是在扩展六因子还是扩展五因子模型中,企业绿色因子(GMP)都在1%的水平下显著。在加入企业环境关注因子后,五因子和四因子模型的截距项都出现了一定的减少,说明加入环境关注因子后模型的解释能力得到了提升。市场因子(MKT)、规模因子(SMB)和账面市值比因子(HML)在四因子模型、五因子模型以及拓展五因子、拓展六因子都通过1%的显著性水平测试。盈利因子(RMW)、投资因子(CMA)和动量因子(UMD)也同样在1%水平下显著。总而言之,MKT、SMB、HML、RMW、CMA、UMD以及GMP因子都能在一定程度上解释股票的超额收益率。
4.3.2. 组合收益回归
由于个股收益率具有噪声,所有进行估计的beta系数可能与实际值存在偏差,接下来采用市值与账面市值比(BM) 5 × 5分组构建的投资组合估计组合beta系数。加入企业环境因子的拓展六因子回归结果如表7所示,汇报了GMP因子的回归系数与模型的调整R2。在25组分组回归中,只有9组通过显著性测试。小规模组(small, 2)的回归系数普遍低于大规模组(4, big),且大规模组通过显著性测数的数量高于小规模组,充分说明大规模公司更有可能出现绿色溢价。25组回归系数的调整R2均大于80%,扩展六因子模型在很大程度上解释了股票的超额收益率。
Table 7. Combined regression results of market value and book market value ratio
表7. 市值与账面市值比组合回归结果
BM |
Low |
2 |
3 |
4 |
High |
规模 |
GMP |
Small |
−0.032 |
−0.046 |
0.060 |
0.117 |
0.041 |
(−0.29) |
(−0.49) |
(0.74) |
(1.05) |
(0.41) |
2 |
−0.090 |
0.170** |
0.150* |
0.144* |
−0.038 |
(−0.92) |
(2.33) |
(1.67) |
(1.86) |
(−0.38) |
3 |
0.128 |
0.251*** |
0.095 |
0.143 |
−0.057 |
(1.04) |
(2.60) |
(0.93) |
(1.48) |
(−0.65) |
4 |
0.217* |
0.010** |
0.254** |
−0.043 |
−0.031 |
(1.93) |
(2.10) |
(2.38) |
(−0.42) |
(−0.34) |
Big |
0.094 |
0.241* |
0.003 |
0.298*** |
0.109 |
(0.73) |
(1.77) |
(0.02) |
(2.60) |
(1.27) |
规模 |
Adj. R2 |
Small |
0.931 |
0.947 |
0.957 |
0.915 |
0.924 |
2 |
0.948 |
0.967 |
0.946 |
0.956 |
0.914 |
3 |
0.919 |
0.943 |
0.925 |
0.930 |
0.934 |
4 |
0.924 |
0.915 |
0.915 |
0.918 |
0.924 |
Big |
0.867 |
0.836 |
0.818 |
0.875 |
0.916 |
4.4. GRS检验
GRS检验是一种常用于检验资产定价模型效果的方法。一般来说,GRS值越小,不能被模型解释的部分就越少,模型效果就越好。A|α|和A (R2)分别代表组合回归平均截距项和平均调整R2,一般而言,平均截距项越小,模型效果越好;平均调整R2越大,模型的解释效果越好。
从下表8,市值与ROE 5 × 5组合的GRS检验结果来看,无论是三因子、四因子、五因子还是扩展五因子、扩展六因子,GRS值均通过了1%的显著性测试。相较于原模型,加入企业绿色因子后的扩展因子模型,GRS值均在一定水平下出现了减少的趋势,平均截距项同样发生了减少,而平均调整R2却出现了上涨,这充分说明了加入企业绿色因子的拓展模型更能解释股票收益率,证明了企业绿色因子的有效性。
Table 8. GRS test for the fitting effect of the combination of market value and ROE
表8. 市值与ROE组合拟合效果的GRS检验
25 Size-ROE组合 |
GRS |
A|αi| |
A (R2) |
MKT SMB HML |
3.845*** |
0.911 |
0.900 |
MKT SMB HML UMD |
3.836*** |
0.873 |
0.902 |
MKT SMB HML UMD GMP |
3.783*** |
0.856 |
0.902 |
MKT SMB HML RMW CMA |
4.222*** |
0.970 |
0.918 |
MKT SMB HML RMW CMA GMP |
4.177*** |
0.963 |
0.919 |
5. 结论与政策建议
本文从上市公司公开披露的公司年报中,通过文本分析方法提取出了企业绿色信息,并依据绿色词频构建了企业绿色因子。将构建的因子引入Fama-French的三因子、四因子和五因子模型,分析了企业绿色因子对中国股票收益率的影响。主要研究结论归纳如下,第一,引入企业绿色因子的扩展因子在全样本和分组回归下均能更好地解释股票风险溢价;第二,根据相关性检验发现,基于文本构建的企业绿色因子与其他因子之间的相关性普遍较低;第三,通过组合收益回归发现,大企业更容易出现绿色溢价。
在双碳大背景下,企业绿色因素对股票价格的影响越来越大,考虑金融市场中绿色定价有效性也具有较大的现实意义。针对国内绿色金融发展提出以下建议,第一,强化市场绿色激励。进一步强化企业ESG评级发展,促使企业重视绿色信息披露,使企业绿色因子能够更快、更有效地反映在股票价格中,促使资金更多地流向绿色企业。第二,正确引导市场参与者。一方面,引导投资者建立绿色投资理念的宣传和推广,有利于投资者树立正确的绿色投资理念,减少对绿色企业的投机炒作;另一方面,引导企业强化绿色意识,促进中国经济的绿色转型。第三,丰富绿色金融产品。扩大绿色金融产品的市场份额,包括但不限于绿色债券、绿色股票、绿色保险,丰富投资者参与绿色投资的渠道,使投资组合中更有可能增加相关绿色金融产品的配置,也为各类金融机构提供了一类产品设计的方向,为中国双碳目标的实现提供助力。