1. 引言
资金盈余单位和资金紧缺单位之间,通过直接融资迅速集中大量资金,使得资金盈余单位的盈余资金得到增值,资金紧缺单位筹集到资金,即股份公司通过面向社会发行股票的过程及意义,它为资本市场的有效运行提供了坚实的基础,在此过程中新股的定价问题尤为重要。对发行人来说,合理的价格决定企业是否能够达到融资目的,以保证企业筹集到的资金能够满足生产所需;对投资人来说,制定市场能够接受的价格,可以有效降低风险,保证投资者利益。
张效梅 [1] 对中国股市的现状做了分析,提出了保持我国经济的增长速度不下滑、少下滑等有效措施的建议。陶冶 [2] 阐述了新股定价过高或过低都将直接影响股票市场资源配置的有效性理论,从而揭示了合理的价格对市场的重要性。Ibboston [3] 通过实证研究发现,发达的股票市场上供应是充足的,以及新股低价发行的合理性。张炜 [4] 运用实证研究的方法探讨我国新股定价机制的合理性,讨论了我国定价机制发展中出现的问题,并提出了部分建议以供参考。成惠芝 [5] 认为新股上市首日价格的可量化影响因素有发行价、换手率、发行市盈率等;不可量化的因素有市场因素、投资者因素等。胡志强 [6] 探讨了不同影响因素与IPO价格表现之间的关系并通过系列的实证分析得出结论。童艳和刘煜辉 [7] 通过理论分析和实证检验,以1996~2007年在沪深上市的1182只新股为样本,对中国资本市场IPO高抑价的制度基础和具体的形成原因进行了系统的分析。孔玉生和王忠杰 [8] 以2000年1月至2002年6月在上海证券交易所上市的184家新股(A股)为样本,建立了一个新股上市首日定价的预测模型,以期为投资者的投资决策行为提供有益的帮助。杨文涛和陈杰 [9] 从整体的层面出发对利率水平和市场整体平均市盈率做了实证分析。
张效梅和陶冶对新股定价的问题进行定性分析,并没有给出适当的模型;张炜、成惠芝等人,对新股定价问题进行了定性分析后,选择了相应的影响因素建立多元线性模型,但选取的因变量不够全面,对数据的描述也不够详细;孔玉生和王忠杰使用的数据没有随机或是平均地选取其他交易所的股票,只能反映上证上市股票的情况,在参考时不能获得更多有利的信息。综上,我们对选取的研究对象的具体数据进行了搜集、筛选和分析。在现有的研究基础上,先对问题进行定性分析,用理论知识结合相应的数据,分析影响新股定价的不可量化因素,为之后的定量分析提供基础;再对问题进行定量分析,用EViews对问题进行定量分析,以建立一个合理的多元线性模型,用统计学方法解析各个因变量对自变量的影响程度并得出结论。
本文通过对发行新股公司所属行业、财务状况、市场因素和投资者因素进行分析并得出初步结论。之后再对问题进行定量分析:首先建立多元线性模型;再对模型进行检验;最后对模型进行预测,并对预测效果做了检验,模型预测效果可靠。
2. 定性分析
2.1. 定性变量分析
我们选择企业所属行业、每股收益、市场利率、投资者因素四个因素 [10] 进行分析,从而为定量分析提供新思路。企业所属的行业与其股票价格的变化是息息相关的,企业所属行业的发展前景会影响投资者对公司发展前景的预期。每股收益是投资者或其他信息使用者据以评价企业的盈利能力、成长潜力等进而做出相关经济决策的重要的财务指标之一。每股收益越高,理论上股票价格应该是越高的。市场利率是指由资金市场上供求关系决定的利率,市场利率下降,企业的融资成本降低,使得净利润上升,最终企业的市值上涨;市场利率下降,企业投资于固定收益的资金减少,投资于股市的资金增加,使得市场的总体成交量上升。投资者因素,它对股市交易的影响是不可忽视的。为了研究这一影响,我们将其与市盈率结合起来,我们就市盈率来研究投资者因素对新股价格的影响,在股票相对估值方法中,价格倍数会随着投资者情绪的变化而变化。如果投资者保持乐观态度,收益乘数就较高,市场价格也较高。通过对上述不可量化影响因素的分析,初步确定了模型研究中需要用到的解释变量,我们再对变量进行定义并进行定量分析。
2.2. 数据的相关描述
在2018年度中,总共发行了102只股票(数据来自东方财富网数据中心——新股申购与中签查询),由于有些企业的过往业绩数据无法得到,我们剔除了数据搜集不完整的一些股票后,选取数据完整的50只股票作为此次的研究对象。选取的50只股票中,涉及到的行业十分广泛,我们将其划分为九个类别进行归类,统计占比如表1所示。
此外,选取的50只股票发行时间为2018年1月17日至2018年12月27日,且均来自A股(即人民币普通股票)。表2给出它们的发股类型和上市版块。

Table 2. Types of issuance and listing sections
表2. 发股类型和上市版块
在确定了数据样本之后,我们选取如下的影响因素进行定量分析:
为新股发行价格,单位为元;
为股票的总发行数量,单位为股;
为对股票的总发行数量取对数后的值,由于总发行股数数值较大,
为了便于计算,我们对
取对数,即
;
为发行市盈率(%),即股票价格/每股收益;
为市场利率(%),此处使用的是SHIBOR,对照每只新股的发行时间选择出的利率;
为行业前景,为虚拟变量,1表示占比大的前三个行业,0表示其他行业;
为每股收益(选择上年度12月的数据为样本),即税后利润与总股数的比值,反映企业的经营成果;
为股票发行前每股净资产(选择上年度12月的数据为样本),企业完成改制后评估出的资本总额和总股数的比值,反映每一股所拥有的资产现值;
为每股现金流,即(营业带来的净现金流量 − 优先股股利)/流通在外的普通股股数,是评估每股收益“含金量”的重要指标。
3. 建模分析
3.1. 模型建立
将每股发行价格
作为因变量,对定义的总发行数量对数化后的数值
、发行市盈率
、市场利率
、行业前景
、每股收益
、发行前每股净资产
和每股现金流
作为自变量进行建模,对2018年新股的定价问题建模分析,从而得出影响新股价格的因素。
首先我们通过EViews绘制出的散点图来确定因变量与各个自变量之间的线性关系。在EViews中导入数据后绘制出现因变量和各个自变量的散点图如下所示。

Figure 1. Scatter plot of IPO price and its influencing factors
图1. 新股发行价格及其影响因素的散点图
从图1中可看出,
和
与
之间存在十分显著的线性关系;
、
、
、
与
之间存在较明显的线性关系;
和
与
之间没有明显的线性关系。需要行一步的研究,来判断新股上市价格与各个影响因素之间是否存在关系,为了对其进行进一步判断,更加直观地得出结论,我们可以将模型设定为:
(1)
其中,
为常数项,
为变量的系数,以便于对模型进行参数估计和检验。
3.2. 模型检验
在初步确定模型的形式后,通过最小二乘回归(WLS)估计模型的参数,并对模型进行检验。利用WLS对模型(1)进行回归分析(表3),模拟多元回归方程。

Table 3. Simulate regression equation output results
表3. 模拟回归方程输出结果
此时
,可决系数较高,F值为97.5059,较为显著,但是解释变量
、
、
和
的t检验没有通过,这表明可能存在严重的多重共线性。根据可用的检验多重共线性的方法,我们选择通过相关系数矩阵的计算确定是否存在多重共线性。
3.3. 多重共线性
多重共线性会由于模型的解释变量之间存在高度的相关关系而使建立出的模型估计量与经济意义不相符,而后进行的显著性检验会失去意义;更有可能导致我们的预测失去作用,由于多重共线性使得方差变大,会使预测区间变大。所以为了模型的有效性,我们要对模型进行多重共线性的检验。
一般来说,相关系数矩阵中相关系数大于0.7左右我们就认为各变量之间存在多重共线性。根据表4中的数据:
和
之间的相关系数较大,证明确实存在多重共线性。接下来我们采用逐步回归法(向前回归和向后回归),去解决各变量之间存在的多重共线性。
可利用逐步回归的方法消除多重共线性,选择向前法回归[Forward],回归结果如表5所示:

Table 4. Explanatory variable correlation coefficient matrix
表4. 解释变量相关系数矩阵

Table 5. Forward regression method regression results
表5. 向前回归法回归结果
此时
,模型为
。
根据回归结果可以看出,
,可决系数和修正后的值较大,
,即t检验通过,此时的拟合效果较好。回归结果中只有
和
留下了,向前法下的逐步回归剩下的解释变量较少。我们需要综合考虑模型的拟合效果,探究是否有其他更好的拟合模型,所以接下来采用向后法回归[Backward],回归结果如表6所示:

Table 6. Backward regression method regression results
表6. 向后回归法回归结果
此时
,模型为
。
根据回归结果可以看出,
,可决系数和修正后的值较大,
,即t检验通过,又
远远大于临界值;综合上述,此时的拟合效果较好,相较向前回归的效果,此时回归后留下的解释变量较多,所以我们选择向后法回归的结果来进行建模。
消除了多重共线性之后,模型的拟合结果还没有很好,为了保证模型参数的估计量具有良好的统计性质,我们还应该对模型进行异方差检验。异方差产生的主要有原因:1) 来源于截面数据;2) 来源于测量误差、模型中被省略的一些因素对被解释变量的影响;3) 有时产生于计量经济模型所研究问题的本身等。异方差性产生的主要原因较为符合我们所研究的模型,即模型可能存在异方差性,需要做进一步检验。
3.4. 异方差性
在线性回归模型的研究中,对异方差的检验和修正是我们常常遇到的问题,它的存在对回归分析有极强的破坏作用,所以检测模型的异方差性是很必要的:通过绘制残差平方序列的散点图来确定模型的异方差性。
首先进行异方差的图性检验:绘制残差平方序列
与解释变量
、
和
的散点图。

Figure 2. Scatter plot of residual squared series
图2. 残差平方序列的散点图
残差平方序列
与解释变量
、
和
的散点图主要分布在左下角,大致看出有变动的趋势,因此,模型在很大程度上可能存在异方差。为了确定由图2得出的结论,我们进行进一步的检验——White检验,除了图形检验之外这是最常用的检验异方差性的方法。下面我们对模型进行White检验,由此确定模型存在异方差。
对模型进行White检验,无交叉乘积项的检验结果如表7所示:
取显著水平
,由于
,所以拒绝原假设,即模型存在异方差。
调整异方差--利用加权最小二乘法(WLS)调整,我们选择权重为“1/abs(E1)”,再对模型进行White检验,得到有交叉乘积项的检验结果如表8和表9所示:

Table 9. White test results after WLS regression
表9. WLS回归后的white检验结果
取显著水平
,由于
,模型已经不存在异方差,可见对模型进行了WLS调整(权数为1/abs (E1))后,已消除异方差。为使调整的结果更合理,我们再选择一个权数(1/E2)对模型进行调整,调整后的结果以及检验结果如表10和表11。
取显著水平
,由于
,模型依然存在异方差,可见对模型进行了WLS调整(权数为1/E2)后没有消除异方差。所以我们选择表8和表9的结果作为最后的模型:
(2)

Table 11. White test results after adjusted WLS regression
表11. 调整后WLS回归后的white检验结果
可以看出,
,修正的可决系数
,可决系数和修正后的值较大,
,即最终模型(2)拟合效果较好。
3.5. 假设检验
已知原假设为
,备择假设为
不全为0。取显著水平
,查询F分布表可知自由度为
和
时的临界值
。由表11得到
,由于
,应拒绝原假设
,说明回归方程显著,即“发行市盈率”、“每股收益”、“发行前每股净资产”三个变量联合起来确实对“新股上市价格”有显著影响。
查t分布表可得,自由度为
时的临界值为:
。由
可知,其绝对值均大于临界值2.0141,即在给定的显著性水平
下,分别都应当拒绝原假设
,即当在其他解释变量不变的情况下,解释变量
、
和
分别对被解释变量新股定价
有显著的影响。
4. 模型预测
为了说明最终模型的拟合效果,我们根据模型对
值进行预测,观察实际值和预测值之间的误差,用以证明模型是可靠的并且是否能够用在样本外的预测,所以接下来我们将从样本内预测和样本外预测两个角度对模型进行预测并分析预测效果。
4.1. 样本内预测
此时仍然选择建模时使用的50只股票为对象进行预测(我们在预测时选取的是静态预测)。图3中,左侧方框内的蓝线表示预测值YF;红线表示置信区间(即估计区间),通常是在单点预测的基础上加减置信水平的分位数乘以估计方差,此时图中位于蓝线上方的红线表示预测值+2*S.E。位于蓝线下方的红线表示预测值−2*S.E。在图3上方的虚线方框中给出的是第10~15只股票的预测值与其置信区间的详图,我们可以清晰地看到每一个位置的预测值都落在了置信区间之内,预测效果较好。
图3中,右侧方框内给出的是衡量预测准确度的统计值:Root Mean Squared Error:表示均方误差根,是估计值与真值之差平方的期望值,用以衡量数据的变化程度,此时为2.6827;Mean Absolute Error:表示平均绝对误差,是将平均误差绝对值化,反映实际预测误差的大小,此时为1.7867;Mean Abs. Percent Error:表示平均相对误差,对平均相对误差取绝对值,它的计算公式乘以了100%,所以输出结果中其值的度量单位为百分比,此时为15.5411%。Theil Inequality Coefficient (Theil不等系数),只能取0到1之间的值,其值为0说明预测十分准确,其值为1说明预测值非常不准确,此时为0.0667,此值接近于0,说明预测效果较好。
Theil值被分为三部分:Bias:表示预测值是否有系统性的偏差,此时为0.000031,说明存在的系统性偏差很小;Variance:此时为0.013083,说明实际值的波动与预测值的差别不大;covariance:此时为0.986886,表示的是非系统的预测误差。上述三部分的值之和:0.000031 + 0.013083 + 0.986886 = 1。即Theil值的三部分相加等于1。
综合上述,模型的预测结果表明预测过程中没有出现错误,预测值Y和实际数据Y值误差不大,预测效果很好。为了进一步分析预测效果,接下来计算预测值和实际值的误差,它反映了预测值与实际值的偏离大小。将误差区间分为四个层次,统计每个误差对应的单位,计算其比重,结果如表12所示。
由表12,绝对误差在±2.00以内的有36只,占比为72%,绝对误差最高为8.44,最低为−8.68。此结果说明我们最终的模型的拟合程度是比较高的,预测的误差分布大部分在较小的范围之内,只有几只的预测误差较大,从统计学的角度上看,产生这个程度的误差是正常的。

Table 12. Error distribution for in-sample forecasts
表12. 样本内预测的误差分布
4.2. 样本外预测
在已知的50只股票范围外重新选取其他的新股作为对象进行预测,目的是为了进一步证明预测结果的准确性。
我们选取2019年上市的10只新股作为预测对象进行预测,这10个样本的上市时间为2019年1月8日至2019年7月2日,分别为:华林证券、威尔药业、威派格、永冠新材、迪普科技、博通集成、日丰股份、鸿合科技、泉峰汽车和天准科技。它们全来自A股,发股类型和所属行业也与样本中股票相符。发股类型和所属行业的占比如图4所示。
根据预测结果,对实际值Y与预测值YF进行比较,计算出绝对误差,如表13。
由表13,样本外数据的实际值与预测值的绝对误差(除天准科技(最后一项)外)都在样本数据预测误差范围之内且总体的误差较小,说明模型的预测效果是可靠的,预测结果也合理,这一结果对企业发行新股的定价具有重要意义。由于天准科技这一只新股不符合我们的预测,所以我们现在来单独对它进行分析。天准科技是在科创板上市的,科创板是独立于现有主板市场的新设板块,天准科技的定价与预测价的绝对误差为14.13,超出正常误差范围,所以由主板、中小板、创业板上市的这些新股的定价模型并不能适用于科创板上市的股票的定价。
5. 结语
在模型的建立过程中,我们消除了异方差以及多重共线性,对模型的F值、t值和可决系数做了分析,最后根据模型作出的预测,将预测值与实际值进行了比对,还做了外延数据的预测,证明了建模效果较好。从模型的结果可知,在本文选取的七个影响因素中,新股上市价格在98.9578%以上的概率可以用“发行市盈率”、“每股收益”、“发行前每股净资产”来解释。公司想要从发行股票这一行为中募集到更多的资金,就应该重点关注每股收益的变化;市盈率的升高,一定程度上会使股票的上市价格提高;发行前每股净资产对其定价的影响虽然是呈现出负相关的,但是其影响程度十分小。此模型对于投资者来说,有参考作用,虽然不能完全有把握预测,但是对个人投资者来说是足够的,可以根据自己的需求,参考模型中的分析结果来评估某只新股的定价是否合理、是否值得投资、能否达到预期效果等。
NOTES
*通讯作者。