1. 引言
1.1. 选题的目的及意义
我国金融市场从开创至今,仅仅经历不到三十年的发展,各方面都远不及西方金融市场的成熟,仍然处于不完善半成熟阶段。对于广大投资者而言,由于相关投资知识匮乏,且处于极度信息不对称的一方,在金融市场上不能够做出正确的投资决策,进而导致亏损的扩大。本文希望通过研究分析,探索股票价格的影响因素,研究其内在经济规律,引导投资者理性投资。
1.2. 研究思路及方法
通过多元回归模型进行实证分析,逐步拟合平均股价数据与财务指标、股本指标、交易指标、估值指标,探索他们之间存在的关系。在此基础上,基于多元回归模型的加法形式,探索平均股价数据与上述指标存在的非线性形式。再而,根据模型拟合结果,改进模型,消除多重共线性,得出相关结论。
1.3. 本文的创新之处
1、本文所涉及指标不限于财务指标,还涉及股本规模、交易指标、估值指标,变量体系丰富,指标的维度高,具有较高的说服力。
2、相比前人的研究,本文不仅仅考虑了因变量和自变量之间普通的线性关系,还发现了股票均价与指标变量之间存在的非线性关系,更能刻画具体指标的影响作用。
1.4. 本文的不足之处
1、影响股票价格因素复杂,非可计量因素无法在模型中得到体现。
2、个别证券价格波动出现异常可能会干扰模型计量。
3、市场存在的非理性化因素,导致现有数据无法正确公允价格。
4、部分模型经济学假设无法满足所有学者对同一经济问题的看法。
5、未能进一步探明相关变量不符合经济学假设的原因。
2. 文献综述
Ball、Brown (1968) [1] 发现财务指标对平均股价具有正向促进作用;Beaver (1968) [2] 发现在财务报告报出短时间内,股票成交量显著地高于平常,进而影响股价的平均变动;N. Chen,R. Roll,S. Ross (1986) [3] ,提出五因素因素分析模型,将证券投资收益率分解为五个因素:工业生产变化、期望通货膨胀变化、非预期的通货膨胀变化、长期公司债券相对于长期政府债券的超额收益、长期政府债券相对国库券的超额收益;Eugen F·Fama和Kemeth R. French (1996) [4] 提出三因素模型,将证券投资收益率分解为三个因素:市场因素、股票数量小的投资组合相对股票数量大的超额收益、高账面-市值比股票组合的投资组合相对低账面-市值比股票的超额收益。
汪长剑(2004) [5] 发现企业规模,账面-市值比、深证综指、净资产收益率等是证券收益率主要的影响因素;郑志凌(2005) [6] 研究发现了沪深两市每日的股票价格与成交量之间存在着静态关系、动态关系、条件波动性;刘凤玲(2010) [7] 研究发现,财务指标中,每股收益、每股净资产、每股主营业务利润和托宾Q对股票价格变动的解释力较强;赵华、吕雯(2010) [8] 研究发现,中国股票市场的动态三因素中,规模因素影响最为显著,其次是市场因素,账面市值比因素影响最弱。
3. 实证假设与设计
3.1. 经济学假设
1、假定上市公司的主要财务指标:每股收益,每股净资产,每股营业收入,净资产收益率,对平均股价具有正向促进作用。其他指标对公司股价具有不同程度、不同方向的影响作用。
2、假定所有的上市公司于每年的4月30日同时报出上一年的年报。假定4月30日~6月30日,市场对年报数据进行充分解读,在此期间的五个特定时点产生的收盘价、交易换手率的算术平均值作为股票的公允价值、平均交易换手率。
3、假定带“ST”公司股票处于不确定状态,股票价格具有很大的不确定性,不纳入研究范围。
4、假定行业的平均估值水平正确反映市场对整体行业的价值评估。
3.2. 实证变量的选取
实证分析选取平均股价(P)作为因变量,财务指标、股本指标、交易指标、估值指标作为自变量。其中财务指标包括每股指标(EPS, NAPS, MIPS)、盈利能力指标(ROE)、偿债能力(CR)、成长能力(EPSgrrt)、营运能力(Invtrtrrat)、资本结构(Dbastrrat)、收益质量(OPItprf);股本规模指标为总股本规模(Size);交易指标为平均交易换手率(Stto);估值指标包括(市盈率PE、市净率PB、市销率PS)。
3.3. 数据来源及其处理
本文数据来源于RESSET股票数据库,共收集了2014~2016三年的财务指标、股本规模、估值指标,以及其下一年度股票平均价格和平均交易换手率。
选定五个特定时点(4~30, 5~15, 5~31, 6~15, 6~30)的股票价格和交易换手率的算术平均数作为平均股价和平均换手率。五个交易日中,达到三个及其以上的交易日停牌导致数据缺失的,直接剔除出研究对象。带“ST”公司股票处于不确定状态,股票价格具有很大的不确定性,不纳入研究范围。
对于某些变量可能与因变量之间存在非线性关系,进行尝试性地非线性探索。由原始自变量做其N次幂,开奇数方根,取对数,得到关于原价自变量的一组非线性变化值。对比其与因变量的相关系数,选择最高系数的形式作为其非线性形式变量。
3.4. 模型实证设计
根据多元回归模型,本文逐步拟合如下几个总体多元回归模型。
模型一,拟合平均股价与财务指标之间的关系;
模型二:考虑平均股价与财务指标、股本规模、交易换手率之间的关系;
模型三:基于模型二,考虑平均股价与财务指标、股本规模、交易换手率、估值指标之间的关系;
模型四:基于模型三,考虑平均股价与非线性自变量调整。
4. 模型实证分析
4.1. 模型一、二、三汇总

Table 1. Comparison table of goodness of fit of the four models
表1. 四个模型拟合优度对比表

Table 2. Test summary of the three models
表2. 三个模型的检验汇总表
注:1、表中P表示统计学检验,“0.05”表示未能通过0.05的显著性检验“0.01”表示,通过显著性为0.05但未能通过0.01的检验,P列为空表示通过通过0.01的显著性;2、表中E表示经济学检验,经济学检验的对象为EPS、NAPS、ROE、EPSGRRT,√表示通过经济学检验、×表示不符合经济学假设,E列为空表示该变量不进行经济学检验。
从模型的拟合优度上看,随着自变量体系的完善,模型对平均股价的解释程度越来越高。2016年的拟合效果一般,但是2014年度数据的拟合程度欠佳,模型仍然存在改进的空间。仅依靠模型一拟合的财务指标,难以充分解释股票的平均价格。从模型一到模型二引入股本指标、交易指标并且其都显著地通过了统计学检验,一定程度上完善了模型的变量设定。平均交易换手率对平均股价起到了正向的促进作用,股本规模对平均股票价格具有反向抑制作用。在模型二中,虽然模型拟合优度得到显著提升,但是2014年、2015年数据的解释程度依旧不高。值得注意地是,从模型二到模型三引入估值指标,增加模型变量却没能如同预期一样引起拟合优度的显著提升。引入的估值指标基本都显著地通过了统计学检验,再次一定程度上完善了模型的变量设定。至此,模型变量的设定应该停止增加,但是模型拟合度提升遇到瓶颈,模型改进和完善需要另寻出路。
从模型的时间维度上来看,随着年份增加,模型拟合优度总在不断上升,越来越显示出其内在趋势。虽然2014年的数据拟合效果还比较低,但是不可否认的是A股市场的可量化程度正在逐渐改善提升。
如表2所示,从模型的检验结果来看,CR、SIZE、STTO指标在模型中表现显著;MIPS、INVTRTRRAT、DBASTRT、OPITPRF比较多次未能通过统计学检验;EPS指标表现最为良好,通过了所有的统计学检验和经济学假设;同时,NAPS也通过基本通过了所有的经济学假设,模型表现显著;ROE、EPSgrrt两个指标多次不符合经济学假设,与我们所熟知的经济学知识相悖;在模型中,这些变量显著地不符合经济学假设,导致模型解释效果差,这可能是由于模型设定偏误,或者缺失重要变量,或者引入了其他不显著变量。
4.2. 模型四:股价与非线性变化调整自变量多元回归分析
上述的模型假定都是建立在因变量与自变量之间都是存在某种线性关系的基础之上。然而实际上,模型因变量与自变量存在着各种非线性关系,通常难以刻画。笔者通过做因变量与自变量及其N次幂的相关性系数,尝试寻找其可能的非线性关系。
在某些变量上发现开三次方根,开五次方根或取对数之后,相关系数得到提升。在各变量的非线性探索中,EPS其本身,NAPS的1/3次幂形式,ROE的1/3次幂形式,EPSGRRT的1/5次幂形式,INVTRTRRAT其本身,MIPS、CR的对数形式,OPITPRF、STTO、PE的1/5次幂形式,PB、PS的对数形式与平均股价的Pearson系数最高。SIZE取其对数形式。
根据非线性关系的探索,建立股价与非线性变化调整自变量的多元回归模型。得到模型检验表见表3,模型拟合优度见表1。
1) 拟合优度检验
2016年R2达到了0.857923 Adjusted-R2达到了0.857226,2015年R2达到了0.799307 Adjusted-R2达到了0.799307,2014年R2达到了0.825256,Adjusted-R2达到了0.824163,相对比前三个模型模型拟合良好,拟合度得到了巨大的提升。
2) 经济学检验
通过非线性变量变换之后,四个变量的经济学检验中,EPS符合三年数据的经济学假设,NAPS^(1/3)变量在2015年不符合经济学假设,EPSGRRT^(1/5)、ROE^(1/3)都不符合经济学假设。

Table 3. Significance test of model four variables and test table of economics
表3. 模型四变量显著性检验及经济学检验表

Table 4. Test table of model 4 multicollinearity variance inflation factor (VIF)
表4. 模型四多重共线性方差膨胀因子(VIF)检验表
3) 统计学检验
2016年的数据中,EPSGRRT^(1/5)、INVTRTRRAT、LN(CR)、OPITPRF^(1/5)、STTO^(1/5)、LN(PS)共六个变量没有通过0.05的显著性检验;LN(SIZE)没有通过0.01的显著性检验;
2015年的数据中,NAPS^(1/3)、INVTRTRRAT、LN(CR)、OPITPRF^(1/5)、LN(SIZE)、LN(PB)共五个变量没有通过0.05的显著性检验;
2014年的数据中,EPSGRRT^(1/5)、INVTRTRRAT、LN(CR)、OPITPRF^(1/5)、LN(PB)共五个变量没有通过0.05的显著性检验。
通过非线性自变量的调整,三年数据的模型拟合优度得到了大幅提升,但是出现大面积的变量不显著情况,该情况存在的原因可能是前文已经论证的部分变量不显著引起,也可能是由于变量多重共线性引起的变量不显著以及经济学检验失效多重共线性检验。为了解决模型多重共线性问题,笔者做了关于非线性自变量调整后的方差膨胀因子检验(VIF检验)。相关检验表见表4。
从VIF检验结果可以看出,2016年数据LN(MIPS)、NAPS^(1/3)的标准化VIF值都大于10;2015年数据LN(MIPS)、NAPS^(1/3)、LN(PB)的标准化VIF值都大于10;2014年数据LN(MIPS)、NAPS^(1/3)、LN(PB)、LN(PS)的标准化VIF值都大于10,模型都存在较严重的多重共线性。
4.3. 模型五:多重共线性调整-非线性变化自变量的调整剔除
多重共线性调整及其模型检验结果如表5。

Table 5. Summary table of significance test and multicollinearity test of l five variables mode
表5. 模型五变量显著性检验及多重共线性检验汇总表
经过不断调整模型变量,EPSGRRT^(1/5)、ROE^(1/3)两个变量系数表现始终为负数,始终不符合经济学假设,故将其剔除出模型。
2016年,根据模型多重共线性及变量显著性检验剔除LN(MIPS)、LN(PS)、LN(CR)、DBASTRT、OPITPRF^(1/5)变量;2015年,剔除EPSGRRT^(1/5)、ROE^(1/3)、LN(MIPS)、LN(PS)、LN(CR)、DBASTRT、OPITPRF^(1/5)、INVTRTRRAT、LN(SIZE);2014年,剔除DBASTRT、OPITPRF^(1/5)、INVTRTRRAT、LN(PS)。
模型经过变量的剔除筛选,最终进入模型的含经济学假设的自变量(EPS, NAPS)全部符合经济学假设;进入模型的所有变量全部通过显著水平为0.05的统计学检验。相对比模型四而言,虽然模型和拟合度有所下降,但是模型五,降低了模型的多重共线性,精简了模型变量并且使得每个变量都是显著的。
在模型中,EPS变量始终表现良好,符合经济学假设,且变量统计学表现显著。在模型四中NAPS指标虽然存在多重共线性,但是经过变量的剔除筛选,共线性降低且统计表现显著,在模型中得到保留,与EPS成为显著的变量。
EPSGRRT^(1/5)、ROE^(1/3)与经典的经济学常识相悖存在的原因可能在于:其一,我国证券市场仍然在发展中,市场的扭曲导致对上市公司的报表数据解读并不理性;其二,VIF多重共线性检验方法的弊端,导致模型中还可能存在其他多重共线性未被发现,导致模型修正的失败将可能是重要的变量剔除出模型。其三,模型设定缺少某种重要自变量。关于这两个指标对股票标的价格的影响有待未来做进一步研究。
在估值指标方面,市净率PB、市盈率PE指标的表现优于市销率PS。在实际投资决策中,市场投资者往往更加看重PE,但值得一提的是,在一系列模型中,PB指标对模型拟合程度的贡献程度高于PE指标,这为以后分析决策提供了新的出发点。
5. 研究结论
本文通过对2015~2017三年的几个关键时点的平均交易股价,对2014~2016三年的相关数据,不断扩展自变量体系,不断完善模型变量设定,对影响股价的因素不断进行探索,先后提出共计四个模型及模型修正。本文最终得到如下结论及建议。
1) 样本相关性分析
从三年的数据样本的因变量和自变量的相关分析中可以得出,与其他变量相比,自变量EPS、NAPS与因变量P之间,始终存在较高且为正向的相关关系。
2) 模型拟合分析
仅靠财务数据无法充分说明股价的变动影响因素;引入PB变量的模型表现强于PE、PS;EPS、NAPS表现十分显著,EPS的回归系数逐年增加,NAPS的回归系数逐年减少,由此可以看出沪深A股的市场风格主要为重视短期盈利能力;EPSGRRT、ROE变量一直不符合经济学假设,由此可以看出A股市场仍然可能有不理性的因素存在。
就年度数据而言,越新的数据,模型的拟合程度较高,这侧面说明我国A股市场表现发展逐渐成熟。证券市场的不断成熟,有助于通过分析标的资产的基本面进行投资决策。
从调整的模型结果来看平均股价的主要影响因素还是在于EPS (每股收益),NAPS (每股净资产),PB (上一年度的估值指标市净率)。其中,财务分析中的核心指标净资产收益率ROE和衡量公司成长能力的指标EPSGrrt在所构建的模型中数据表现不仅不能如预期进入模型,还不符合经济学假设,具体原因有待下一步学习研究。
研究还发现模型自变量与模型因变量之间并不只是简单的线性相关,部分自变量与因变量之间存在非线性关系。通过调整的自变量非线性模型能够更加有效地刻画经济规律。其中在多元回归模型中,NAPS、ROE适合采用1/3次幂形式,EPSGRRT、OPITPRF、STTO、PE适合采用1/5次幂形式,CR、MIPS、SIZE、PB、PS适合采用对数形式。
基金项目
2018教育教学改革立项课题(109051360018XN009/058)。
参考文献