1. 引言
股票收益预测和投资组合管理、资金成本和市场有效性等金融问题密切相关,是金融研究的核心问题之一。众多研究发现许多指标可以有效地预测未来的市场收益率,Mclean [1] 收集整理了历史文献报道的97个预测因子,研究发现在相关研究发表后因子的样本外预测性能下降58%,表明投资者会关注关于资产定价的学术研究并应用于投资实践,纠正市场的错误定价。股票收益的可预测性研究不仅可以为投资者提供决策依据,明确企业资本成本,也有利于推动股票市场健康发展。
2. 文献综述
关于股票收益率可预测性的研究层出不穷,公司特征指标、宏观经济指标以及市场交易数据等都被证实对股票收益有预测能力。
基本面信息是影响股票价格的重要因素。早在二十世纪七十年代前后,股息率 [2] 、市盈率 [3] 、账面市值比 [4] 等指标就被证实对股票收益具有预测能力。随着时间的推移,部分变量依然被证实具有预测能力。Golez et al. [5] 发现股息率对英国股票收益具有持续且稳健的预测能力。Yufeng Han [6] 以94个公司特征变量为研究对象,检验发现大部分变量仍然具有预测能力。Jiang et al. [7] 和谢谦 [8] 等研究发现上市公司的盈利水平能够显著预测未来股票收益,众多基本面指标成为学者和投资者的重点关注因素。
消费财富比率 [9] 、债券市场利率 [10] 、经济不确定性 [11] 等宏观经济指标也逐渐被证明具有预测效果。在我国股票市场中,朱英姿 [12] 等研究发现景气先行指数和商品房销售面积在样本内外预测性检验中均具有显著的预测能力。汪弘 [13] 等基于新闻报道构造中国经济政策不确定性指数,发现经济不确定性指数对未来3个月的股票市场收益有显著的正向影响。
除公司层面和宏观层面外,一些股票市场交易、波动数据也被发现对收益有预测能力。陈坚等 [14] [15] 研究发现基于极值理论的VaR和已实现偏度具有较强的预测能力。邢红卫等 [16] 以2000年1月至2015年6月的深沪A股为对象,研究发现股票横截面预期收益是换手率的先增后降函数。郑振龙等 [17] 在同期贝塔法的框架下同时考虑方差风险和偏度风险,大大提高了其对市场收益率的预测效果。
关于股票收益率可预测性的研究丰富多彩,但受到样本区间选择、因子计算差异等因素的影响,相同因子的预测性在不同研究中呈现出不同的结果,如市盈率因子 [18] [19] 、市净率因子 [20] [21] 。此外,Goyal and Welch [22] 对已有文献中被证明有预测能力的指标进行再检验后发现,它们的样本内和样本外预测效果都不理想。Mclean也发现因子的预测能力会随着研究信息的公开而降低。随着股票市场的发展与完善,投资者不断趋于成熟,这种可预测性是否依然存在值得进一步探讨。本文通过构建35个投资组合,对比分析样本内外预测性的表现差异,实证分析较为系统和全面。为了解决因子变量高度持续性、异方差性等问题,本文采用广义最小二乘回归的方法进行回归估计。
3. 样本与数据
3.1. 数据来源
本文选取沪深A股的全部股票超额收益率为研究对象,因沪市的主要上市公司在2005年底开始实施股权分置改革,故本文选取2006年7月至2022年6月为研究区间,剔除ST和*ST股票,收益率和因子数据来自锐思数据库和同花顺金融终端。本文构造四类投资组合,剔除缺失值后行业投资组合按照证监会一级行业分类标准分为:A农、林、牧、渔业;B采矿业;C制造业;D电力、热力、燃气及水生产和供应业;E建筑业;F批发和零售业;G交通运输、仓储和邮政业;H住宿和餐饮业;I信息传输、软件和信息技术服务业;J金融业;K房地产业;L租赁和商务服务业;N水利、环境和公共设施管理业;R文化、体育和娱乐业。账面市值比和市值投资组合按照每年7月的账面市值比和市值将所有股票等分成10组进行构造,BM1表示账面市值比排名前10%的股票组合。同理,SIZE1表示市值排名前10%的股票组合。
3.2. 指标选择
本文的因子选择参考Welch和Goyal、姜富伟 [23] 、蒋志强 [24] 等国内外文献,共选取8个了因子,包含6个基本面因子(账面市值比、股利分配率、股息价格比、股息收益率、每股收益价格比、现金收益价格比)、1个市场因子(沪深300指数波动率)、1个宏观因子(通货膨胀率)。因子的计算方式见表1。

Table 1. Definition of main variables
表1. 主要变量定义
4. 检验方法
4.1. 样本内检验
与相关文献一致,单因子样本内检验的模型如下:
(1)
其中,
代表股票的超额收益,
代表预测因子,
是残差项。通过回归系数 对应的t统计量来判断预测因子
是否具有显著的预测能力。原假设是
等于零,即变量
对组合收益没有预测能力;备择假设是
不等于零,即变量
中包含的信息能够预测组合未来的收益。当回归系数不为零且通过显著性检验时,可以认为变量
中所包含的信息对组合的超额收益具有预测作用。
4.2. 样本外检验
相较于样本内预测,样本外预测对投资者的投资决策更有意义。本文采用扩展估计法进行股票收益率的样本外检验,将整个样本划分为有
个观测值的样本内估计期和有
个观测值的样本外检验期。利用最小二乘法对前
期的估计样本估算模型参数,进而预测
期的收益率,不断迭代直至计算出整个预测样本。具体来说,根据上式(1),将
对常数项和
做普通最小二乘回归,得到参数
和
,再根据公式(2)得到下一期的预测收益
。
(2)
以此类推,再将
对常数项和
做普通最小二乘回归可以得到
和
再根据公式(3)得到下一期的预测收益
。
(3)
最终可以得到
个股票收益的样本外预测值。
如果股票市场不具有可预测性,则股票价格符合随机游走模型,经济变量的预测效果并不能优于历史均值模型,反之,如果预测变量包含的信息能够预测中国股票市场收益,那么使用该因子的单因子预测回归模型应该比历史平均收益模型有更好的样本外预测能力,通过
统计量来检验单因子模型的样本外预测表现,
统计量测度了使用预测性回归模型代替历史平均收益带来的均方预测误差减少量。
(4)
公式(4)是
统计量的计算公式,其中,
是历史均值收益率,是过去
期收益的平均值,
是真实收益率,
是预测模型的样本外预测值。如果预测模型中包含的信息能够预测股票收益,那么此模型的均方误差就应小于历史均值模型,即
。反之,经济变量对股票收益没有样本外预测能力。
此外,本文通过MFSE统计量来判断样本外预测性检验的显著性,其计算方式如下:
(5)
将
对t进行OLS回归得到常数项的t检验统计量即为MFSE统计量,其能够在一定程度上反映样本外预测性检验的显著性。
5. 实证检验
5.1. 描述性统计
各投资组合收益率的描述性统计结果见表2~4,市场的平均超额收益率为2.14%,偏度为负值,说明市场的超额收益率受到低收益股票的影响较大。行业投资组合的平均超额收益率中最低的为交通运输、仓储和邮政业,其收益率为0.97%,最高的为制造业,其收益率为2.43%,房地产业、金融业的收益率均值远大于中值,二者相差3倍以上,特别是房地产行业达到了10倍以上,且偏度均为正值,说明该行业高收益趋势显著,均值受到高收益率股票的影响更大。
账面市值比投资组合的平均超额收益率在1.78%到2.33%之间,从均值来看并不符合Fama和French 提出的账面市值比效应,高账面市值比组合偏度基本都为正值,能够在一定程度上说明账面市值比高的投资组合倾向高收益,但不同账面市值比组合的标准差基本相同,且从中值来看也并不符合高账面市值比组合平均收益率更高的账面市值比效应。

Table 2. Descriptive statistics for market and industry investment portfolios
表2. 市场及行业投资组合的描述性统计量

Table 3. Descriptive statistics of book to market value ratio of investment portfolio
表3. 账面市值比投资组合的描述性统计量
市值投资组合平均超额收益1.76%至2.14%之间,SIZE1-SIZE5的偏度均为正值,SIZE9-SIZE10的偏度均为负值,说明大市值组合倾向低收益而小市值组合倾向高收益,此外,投资组合的标准差随着市值的减小而增大,说明我国股市在一定程度上满足市值效应,即市值小的投资组合平均收益大,波动性也更强。

Table 4. Descriptive statistics for size value investment portfolios
表4. 市值投资组合的描述性统计量
5.2. 计量检验
本文对收益率及因子序列是否存在高度持续性、异方差等进行了检验。通过收益率和因子序列的AR(1)检验发现,除了收益率序列、INF和DE因子外,其他所有因子序列的AR(1)检验系数均是显著的,表明存在高度的持续性。本文运用LM检验法检验收益率及因子序列是否满足自回归条件异方差(ARCH)过程。设定检验模型的最大阶数为10,通过计算LM检验的F统计量发现,除了DE、INF因子外,其他所有因子序列在1%的显著性水平下拒绝“不存在ARCH效应”的原假设。综上,大部分因子序列存在高度持续性和异方差性等问题,直接用最小二乘法进行预测性研究会造成偏误,无法准确度量因子的预测性。因此,本文采用广义最小二乘法(GLS)进行检验,从而在一定程度上解决上述问题。
5.3. 样本内检验
总体市场和行业投资组合的实证结果如表5所示,从因子对市场收益率的预测能力来看,DP、DY、EP和CFP四个因子能显著预测总体市场的收益率,其余因子均不显著。从因子对行业投资组合收益率的样本内检验结果来看,CFP和DY的预测效果最好,可以显著预测9个和8个行业组合的收益率。其次是DP和EP因子,可以预测5个行业组合的收益率。从行业投资组合收益率的被预测程度来看,信息传输、软件和信息技术服务业,农、林、牧、渔业和制造业是最能被预测的投资组合,均能被5个因子预测,房地产业和金融业是最不能被预测的行业。总体来看,EP、DP、DY、CFP的预测表现较好,BM、DE、INF、SAVR是预测性能较差的因子。
账面市值比投资组合的实证结果如表6所示。从因子的样本内检验结果来看,DY的预测能力最好,能够预测4个投资组合的收益率,其次是BM、EP、DE因子,均能够预测2个投资组合的收益率,其余因子的预测能力较差。与市场及行业组合的预测结果相比,DP、CFP因子的预测能力显著降低,DE因子的预测能力有所提升。从投资组合收益率的被预测程度看,BM2组合的收益率的被预测性较好,BM3、BM5、BM9 组合收益率的被预测性最差,不能够被任何因子预测。总体来说,EP、DE、DY、BM的预测表现较好,DP、CFP、INF、SAVR是预测性能较差的因子。

Table 5. In-sample testing of market and industry investment portfolios
表5. 市场及行业投资组合的样本内检验

Table 6. In-sample test results of book to market ratio investment portfolio
表6. 账面市值比投资组合的样本内检验
市值投资组合的实证结果如表7所示。从因子的样本内检验结果来看,DY是预测能力最好的因子,其能够预测6个组合的收益率。其次是CFP和DP因子,二者均可以预测2个投资组合的收益率,INF和SAVR因子预测能力较差,不能预测任何组合的收益率。从投资组合收益率的被预测程度看,SIZE2组合的被预测性较好,可被3个因子预测,SIZE4组合的被预测性较差,不能被任何因子预测。总体来说,CFP、DP、DY的预测表现较好,BM、DE、EP、INF、SAVR是预测性能较差的因子。

Table 7. In-sample test results of size value investment portfolios
表7. 市值投资组合的样本内检验
综上所述,投资组合的样本内检验结果为:
1) DY因子的预测能力最强,能够预测19个投资组合的收益率,CFP、DP、EP 因子的预测能力其次,可以预测8个以上投资组合的收益率,其中EP在行业投资组合以及账面市值比组合中表现较好,CFP和DP在行业投资组合和市值组合中表现较好,INF和SAVR因子的预测能力最差。
2) 总体市场、信息传输、软件和信息技术服务业,农、林、牧、渔业,制造业投资组合、账面市值比组合BM2和市值组合SIZE2的被预测程度最强,最少可被3个因子预测,而金融业、房地产业投资组合,账面市值比组合BM3、BM5、和BM9,市值组合SIZE4的被预测性最差,不能被任何因子预测。
5.4. 样本外检验
本文将研究区间2006年7月至2022年6月平均分成两部分,前半部分2006年7月至2014年6月为样本估计期,后半部分2014年7月至2022年6月为样本预测期。本文认为,
大于0且MFSE统计量显著即认为因子具有样本外预测性。因子的样本外检验结果如下表所示。表8表明,BM、DP、DY、EP、SAVR因子可对市场收益率进行有效的样本外预测。在行业投资组合中,EP因子预测了8个行业的收益率,样本外预测能力最强,其次是DY、CFP因子,二者均预测了4个行业的收益率。交通运输、仓储和邮政业投资组合的样本外预测能力最好,住宿和餐饮业,文化、体育和娱乐业,水利、环境和公共设施管理业,农、林、牧、渔业,租赁和商务服务业,采矿业的样本外预测能力最差。总体来看,EP、DY、CFP的预测表现较好,DE、INF、SAVR的预测表现较差。
账面市值比投资组合的样本外检验结果如表9所示。结果表明,因子DE的样本外预测能力最强,其能够预测7个投资组合的收益率。因子CFP的样本外预测能力其次,可预测5个投资组合的收益率,因子SAVR样本外预测能力最差。投资组合BM6是样本外预测效果最好的组合,可被6个因子预测,BM1和BM2组合的样本外预测表现较差,不能被任何因子预测。总体来说,DE、DP、CFP的预测表现较好,INF、SAVR的预测表现较差。

Table 8. Out-of-sample testing of market and industry investment portfolios
表8. 市场及行业投资组合的样本外检验

Table 9. Out-of-sample test results of book to market ratio investment portfolios
表9. 账面市值比投资组合的样本外检验
市值投资组合的样本外检验结果如表10所示。DP、DE因子的样本外预测能力最强,分别预测了8个和7个投资组合的收益率。其次是EP和CFP因子,SAVR因子的样本外预测能力最差。投资组合SIZE1的样本外被预测性最好,能被7个因子预测,SIZE7组合的样本外被预测表现较差。总体来说,DE、DP、CFP的预测表现较好,BM、INF、SAVR的预测表现较差。
综上所述,样本外检验结果可总结为:
1) EP是样本外预测能力最强的因子,不但可以对市场收益率进行样本外预测,还能对16个组合进行样本外预测,INF、SAVR是样本外预测能力最差的因子。因子CFP、DP、DE的样本外预测表现相对良好,能至少预测15个组合的收益率。
2) 样本外被预测效果较好的行业投资组合有交通运输、仓储和邮政业投资组合,BM6投资组合,SIZE1投资组合,其均可被半数以上因子预测。

Table 10. Out-of-sample test results of size market investment portfolios
表10. 市值比投资组合的样本外检验
6. 结论
基于2006年7月至2022年6月中国沪深A股市场,本文构建了市场组合、行业组合、账面市值比组合和市值组合,选取8个预测因子(账面市值比、股利分配率、股息价格比、股息收益率、每股收益价格比、现金收益价格比、通货膨胀率、股票波动率),通过描述性统计检验结果可知,我国股市不存在账面市值比效应,但在一定程度上符合市值效应,通过对不同投资组合超额收益率进行样本内与样本外的可预测性检验发现,DY、CFP、DP、EP 因子的样本内预测能力较强,DE、CFP、DP、EP的样本外预测能力较强,INF、SAVR的样本内外预测能力均较差,大部分因子样本内外的预测结果具有一致性。
本文分不同组合探究了不同因子的样本内外可预测性,在一定程度上提升了投资者对我国股市发展现状的了解,为理性投资决策提供科学依据。但值得一提的是,本文并没有对不同投资组合因子预测能力差异的原因进行探讨,同时选取的因子数量也较为有限,值得后续进行更加深入的研究。