1. 引言
在全面注册制改革的背景之下,采用市场化的承销机制使得企业IPO定价的自由度更高,破发等市场的过度反应等现象普遍存在。破发指的就是一只股票在上市之后,它的股票价格跌破了首次公开发行价格(IPO)或者股票的发行价的现象。IPO破发这一现象最早是由Stigler (1963)在研究工业企业时发现的,随后有学者在研究股票市场表现时陆续发现了这一反常现象,并将这一现象归结于不确定性程度相对较高[1]。Derrien和Kent (2003)认为,股票破发是因为投资者对股票价格的判断过于乐观,发行时定价不合理,导致股票定价过高的现象[2]。Khurshed (2009)发现股票发行人为了能够筹集到更多的资金而选择提高发行价格,这些行为都会导致股票后期发生破发现象[3]。从目前关于破发的研究来看,导致破发发生的原因有两种,一种认为承销商基于自身利益考量提高IPO发行价格(陆宇建,2015),另一种认为投资者过度反应,即投资者情绪导致股价跌破发行价格(谢汉昌,2014) [4] [5]。
招股说明书是企业首次面向公众进行全面系统的信息披露,因此招股说明书弥补公众对企业信息的空白,极大程度上降低企业、投资者之间的信息不对称。上市企业招股说明书可读性影响投资者对信息披露的理解,因此很大程度上影响投资者的决策。Dale和Chall (1949)从沟通效果角度对可读性进行了定义,可读性是所有对读者最佳阅读速度产生影响的因素的总和[6]。Loughran和McDonald (2014)认为,可读性指的是相关价值信息是否得到了有效的传递交流[7]。Tinker (1955)认为由书的写作风格所引起的文本阅读的难易程度就是可读性[8]。Baker和Kare (1992)将文本的复杂程度、篇幅长短作为衡量年报可读性的指标[9]。为了提高向社会公众投资者传达股票发行信息的效率,应该提高招股说明的可读性。
投资者通过招股说明书获取企业相关信息时,会面临信息不对称问题( Hanley & Hoberg, 2012) [10]。信息不对称指的是,在一个信息不充分的市场,掌握信息相对完全的,就具有优势;而信息相对欠缺的,处于劣势。复杂的信息披露会影响投资者的判断,将投资者排除在股市之外,降低投资者参与度,并逐步扩大股市参与者之间的差距(Tan等,2014) [11]。投资者获取信息成本和难度的增加(Grossman和Stiglitz,1980;Bloomfield,2008),加剧了IPO市场中的信息不对称程度(Asay等,2018) [12]-[14]。提高招股说明书的可读性有助于减少信息不对称问题。Fazzari等(1988)认为,市场中存在信息不对称等问题,使得资本市场不完善[15]。在股票发行过程中,招股说明书的可读性影响信息不对称程度,从而影响IPO定价(Li et al., 2018) [16]。在中国股市中,散户投资者占比较大,因此信息不对称程度的增加使得他们信息处理的成本提高(Dyck et al., 2008),导致对该股票需求减少,二级市场价格下跌,破发发生的比率也会提高。因此本文基于信息不对称,研究招股说明书可读性对股票破发的影响[17]。
本文研究方法采用文本分析,分析对象是,上市时间在2014~2024年上交所A股上市制造业公司的招股说明书,以指标法作为可读性的衡量指标,来考察制造业中文金融文本可读性与股票破发之间的关系。本文研究结果表明,招股说明书信息披露可读性越好,股票破发现象就会越少,这个结论进行稳健性检验之后,依旧成立。此外,本篇论文也得出了上市企业招股说明书可读性与股票破发之间的关系是通过承销商行为来进行传导的,招股说明书可读性越高的公司,承销商对于IPO价格定位越准确,更真实地反映其内在价值,股票破发发生情况会减少。
本文的主要贡献在于以下几个方面:首先,研究对象的创新。前人对于IPO定价效率多数从IPO抑价率角度进行研究,对破发研究还不是十分广泛,通过本文的考察可以进一步补充上市企业股票破发的研究。其次,研究方法的创新。在实证分析中爬取了2014~2024年上交所的招股说明书作为研究样本,构建了公式法和文本法这两种可读性衡量方法,从总字数、总句子数和总词语数等几个方面进行可读性指标构建,并且考虑了中文文本情况下可读性指标的构建。
2. 文献综述
对于可读性的研究,前人提出了许多不同的方法来对可读性进行衡量。迄今为止已经提出了一套较为成熟的财务可读性衡量指标,例如迷雾指数(Fog Index)、弗莱施–金凯德指数(Flesch Kincaid Indices)、弗莱施阅读轻松度(Flesh Read Ease)等指数。这些指数主要应用于英文语言环境,通过分析公司财务信息披露的句子数量、单词的复杂程度等,来衡量年报的可读性。在1952年,Robbert Gunning提出了用于测度英文文本可读性指标——FOG指数[18]。Loughran和McDonald (2014)将年报文档大小,作为可读性指标。他们的研究发现:可读性高的财务报告所对应的公司信息价值会更加准确,因此减少了投资者和公司之间的信息不对称程度[7]。张光利(2023)认为问询回复函的可读性与上市公司IPO抑价率之间存在负相关的关系,并认为传导机制是二级市场投资者情绪[19]。
股票市场上存在的信息不对称,使得投资者无法准确了解企业运营状况,因此这将对投资者的投资决策产生影响。Subramanian (1993)发现一些上市公司经营业绩较好,这些上市企业年报可读性会相对更高,信息不对称程度减少[20]。Bushee (2017)认为,企业业绩良好的时候,管理者会更加主动地披露信息,而当企业业绩不佳的时候,管理者就会使用晦涩难懂的表达方式去混淆信息[21]。Hasan (2018)认为财务报告中披露的可读性与上市公司管理者的管理能力呈显著正相关[22]。Chakrabarty (2018)认为管理者混淆信息披露的动机是增加回报的波动性以此来增加期权的价值[23]。Jin和Myers (2006)认为,上市公司可以改变信息披露的语言特征以此来隐藏不良信息,这一结果会导致信息不对称程度增加[24]。Athanasakou (2020)假设并检验了权益资本成本与上市公司年度报告披露水平之间的U型关系,说明存在着最佳的披露水平,此时信息不对称降到最低[25]。Loughran和Mcdonald (2013)认为对于关键性词语而言,一些不确定性的词语与年报披露后的股票波动率呈现显著正相关,因此这些模糊的词语就增加了股票波动的不确定性[26]。Chen等(2024)研究了注脚对于财务报表信息披露的影响,当注脚信息所呈现出的主观性较高的时候,上市公司当前的收益和未来的收益之间的关联性就较低[27]。Tetlock (2008)研究发现,语言媒体把握住公司基本面中难以量化的部分,投资者将这些难以量化的信息立即反映到股价中[28]。较高的年报可读性可以加强企业信息披露,有效减少企业面临的融资约束(李春涛,2020) [29]。
国内外关于IPO定价问题研究可以分为两类,一类研究抑价,一类研究破发。抑价指的是二级市场价格高于股票发行价格。Ziyue Xuan (2023)探讨了承销商利益约束与中国IPO抑价之间的关系[30]。Shirley (Shuo) Chen (2024)研究结果表明,高度的尽责性会刺激发行人对承销商的谈判鼓励,强调了国家层面的特征是IPO市场定价动态的关键决定因素[31]。Wanbin Pan (2024)以2009~2022年中国股市1656个上市公司IPO为样本,证明经济政策不确定性(EPU)的增加显著降低了IPO抑价水平[32]。曾静(2024)研究了研发税减免政策对首次公开发行(IPO)定价过低的影响[33]。
破发指的是二级市场流通价格跌破发行价格。Stoll和Curley (1970)认为公司经营的财务状况较差以及股票定价过高,最终导致股票价格长期破发的现象[34]。Benveniste (1989)参考美国累计投标定价机制,认为新股破发现象产生的主要原因就在于证券承销商和投资者之间的信息不对称[35]。Jagannathan (2006)发生破发的比例比以固定价格发行的股票发生破发的程度会更小[36]。杨晶和熊艳(2017)认为信息不对称和信息传递的渐进性使得投资者在上市公司IPO一段时间之后才可以发现公司故意提高发行价格,并做出消极反应,最终导致破发[37]。谢汉昌、何瑞卿(2014)运用案例分析法,发现了导致IPO破发的主要原因是过高的市盈率以及过高的发行价格[5]。张卫国、姚若凡(2022)通过随机前沿模型,构建了IPO定价的随机上边界模型、随机下边界模型,研究我国A股二级市场股票的定价效率、破发的影响因素[38]。叶小杰(2022)从一级市场定价和二级市场流动性两个角度来考察成大生物发生破发的原因,研究发现科创板一级市场新股定价过高导致了股票破发[39]。
3. 数据说明与模型构建
3.1. 数据说明
本文研究样本选取了2014年1月到2024年4月上交所主板、科创板所有制造业上市公司相关数据以及爬取到的招股说明书,其中制造业包括:电器机械及器材制造业、服装及其他纤维制品制造企业、等制造业。所有上市公司财务数据、新股发行市场数据源于CSMAR数据库、同花顺数据库;本文是通过编写Python网络爬虫程序,从上海证券交易所主板、科创板专区批量下载上市企业的招股说明书,初始样本包含980家上市公司。初始样本还需要进行如下处理:剔除所有ST、*ST的上市公司;考虑到金融行业具有特殊性,样本数据剔除包含的金融上市公司;爬取到的招股说明书中,存在上市公司招股说明书加密或者编码问题,无法进行正确txt格式转换,剔除样本后还剩620个观测样本,分别借助Python对这些招股说明书进行字数、平均句长、招股说明书是否有目录和总页码等信息统计。为了避免极端异常值对结果的影响,本研究运用stata软件,对指标进行winsor2缩尾处理,对得到的数据进行实证分析。
3.2. 指标定义与模型构建
在实证分析中,被解释变量用BD表示,是根据logistic模型计算得出的,它代表新上市股票IPO破发的发生比率。解释变量可读性指标包括两种计算方法:
首先借鉴了Senter和Smith (1967)提出的可读性衡量模型。该指标利用了两个最原始、最重要的指标来进行衡量[40]。这里AR指标是一个与可读性负相关的一个指标,这个指标越大就表明文本越难以理解,可读性就比较低。因此为了方向的一致性,就采用该指标的负值来表示文本的可读性,该指标构建如(1)所示:
(1)
其次借鉴了弗莱施–金凯德指数(Flesch-Kincaid)公式,这一指标表明了对于阅读者阅读能力的要求,如果这个指标越大,对于阅读能力的要求也就越高,对应的文本可读性也就越低,参考以上指标,同时对这个指标乘以(−1),使得FK指标与文本可读性水平高低在方向上一致,该指标构建如(2)所示:
(2)
本篇研究选取的控制变量包括保荐费用总额取对数值、募集资产取对数值、上市日行业市盈率、上市前公司总资产取对数值、公司财务指标包括资产回报率和上市前公司资产负债率,上市首日换手率、是否为国有企业,为虚拟变量、股权承销商排名是否为前十,为虚拟变量,公司治理指标包括股权集中度和董事会规模。此外,控制了行业和年份的固定效应。控制变量包括公司治理、财务状况等因素,减少遗漏变量偏差问题。本文变量定义如表1所示。
Table 1. Variable definition table
表1. 变量定义
变量类别 |
变量名称 |
变量符号 |
变量释义 |
被解释变量 |
上市首日是否破发 |
BD |
BD = eẏ/(1 + eẏ) |
解释变量 |
可读性衡量指标1 |
AR |
−ln [4.17 × (总字数/词语数) + 0.39 × (词语数/句子数) − 21.43] |
可读性衡量指标2 |
FK |
−ln [0.39 × (词语数/句子数) + 11.8 × (总字数/词语数) − 15.9] |
控制变量 |
保荐费用总额 |
BJ |
保荐费用取对数 |
募集资产总额 |
RM |
募集资产总额取对数 |
上市日行业市盈率 |
PE |
公司上市之前行业的市盈率 |
上市前公司总资产 |
TA |
公司上市之前总资产取对数 |
资产回报率 |
ROA |
公司上市之前的资产回报率 |
上市前资产负债率 |
AD |
公司上市之前资产负债率 |
上市首日换手率 |
TR |
公司上市首日换手率 |
企业性质 |
XZ |
是否为国有企业,是为1,否为0 |
承销商声誉 |
SY |
股权承销商排名是否为前十,是为1,否为0 |
股权集中度 |
GQ |
前十大股东持股比例之和 |
董事会规模 |
DS |
公司董事会成员的数量 |
年度 |
Year |
年度固定效应 |
行业 |
Industry |
行业固定效应 |
在本篇研究中上市公司股票是否出现破发现象是一个定性变量,将研究对象分为了破发组和非破发组进行对比,因此属于二分类变量。由于样本是IPO企业的招股说明书,每家上市企业只存在一个IPO招股说明书(企业更换名称包括在内),所以无法控制个体固定效应,最终本文控制了行业效应、年度效应。基准回归模型如(3)所示:
(3)
在该模型中,P表示新股破发的发生比,β0是该回归常数项系数,xi表示影响新股发生破发的因素,βi表示第i个变量的回归系数。根据Logit模型计算出上市新股破发的发生比率作为解释变量,可以构建的回归模型为(4)和(5)式:
(4)
(5)
4. 统计与计量分析
4.1. 描述性统计
本篇论文通过网络爬虫技术,获取了上交所制造业上市企业招股说明书,剔除掉所有ST、*ST和金融公司之后,再通过python软件计算出招股说明书总页数、总词语数、总表格数、总图象数和总句子数,所得数据如表2所示。其中招股说明书总页数最大是欧派家居,是1066页,总页数最小的是华曙高科公司,为300页,所有招股说明书总页数的平均值是490.02页。
Table 2. Data overview of prospectuses
表2. 招股说明书相关数据情况
|
最大值 |
最小值 |
平均数 |
总页数 |
1066 |
300 |
490.02 |
总词语数 |
603,258 |
6013 |
258365.7 |
总表格数 |
533 |
150 |
245.24 |
总图象数 |
36,054 |
16 |
329 |
总句子数 |
7587 |
35 |
2750.666 |
本文选取了2014~2024时期上市的制造业新股作为分析对象,并将其分为破发组和未破发组进行对比分析,表3是数据的描述性统计。破发组AR指标的均值是−3.787,FK指标均值是−5.113,BD的均值是0.923;未破发组AR指标的均值是−3.759,FK指标均值是−5.092,BD的均值是0.822,说明了破发组的招股说明书可读性相对较低,导致相对较高的破发发生比率。
4.2. 相关性分析
本篇论文的变量较多,可能会产生较强的相关性,因此会导致多重共线性问题,为了防止这一问题存在,先进行相关性分析。首先运用stata18软件,计算各个变量之间的相关系数,如表4所示,除了两个可读性指标之外,其他相关系数都在0.4以下,因此可以认为各个变量之间的相关性较弱,即不存在多重共线性问题。
4.3. 回归分析
根据表5列出的回归结果,该模型整体的R2是0.893和0.888,说明这两个模型的拟合效果较好,同时这两个模型的P值都为0.000,整体都是显著的。当企业的可读性指标是AR时,AR指标在1%的显著性水平下,通过检验,并且回归系数是负数,与预期假设相符,即就是上市企业招股说明书可读性越高,新股发生破发的发生比就越小。当上市企业的招股说明书可读性指标是FK时,FK指标在1%的显著性水平之下通过了检验,得出相同的结论。
Table 3. Summary statistics
表3. 描述性统计
|
(1) |
(2) |
(3) |
(4) |
(5) |
变量 |
Obs |
平均值 |
标准差 |
最小值 |
最大值 |
分组 |
总数 |
破发组 |
未破发组 |
破发组 |
未破发组 |
破发组 |
未破发组 |
破发组 |
未破发组 |
BD |
980 |
0.922 |
0.822 |
0.140 |
0.210 |
0.172 |
0.128 |
0.999 |
1.000 |
AR |
980 |
−3.725 |
−3.799 |
0.342 |
0.465 |
−4.313 |
−9.375 |
−2.349 |
−2.488 |
FK |
980 |
−5.067 |
−5.121 |
0.248 |
0.357 |
−5.532 |
−9.375 |
−4.159 |
−3.473 |
BJ |
980 |
0.229 |
0.703 |
1.037 |
1.868 |
0 |
0 |
5.011 |
7.255 |
RM |
980 |
11.962 |
11.154 |
0.752 |
0.788 |
10.815 |
6.739 |
14.611 |
13.910 |
PE |
980 |
32.016 |
28.422 |
10.917 |
13.163 |
2.16 |
2.95 |
49.68 |
51.46 |
TA |
980 |
20.073 |
20.509 |
1.279 |
0.992 |
17.626 |
18.047 |
23.464 |
24.641 |
ROA |
980 |
−0.103 |
0.875 |
0.409 |
0.142 |
−1.738 |
−1.677 |
0.371 |
0.419 |
AD |
980 |
61.531 |
36.104 |
48.548 |
27.567 |
0 |
0 |
211.57 |
180.74 |
TR |
980 |
0.079 |
0.066 |
0.045 |
0.074 |
9.00e−05 |
1.00e−05 |
0.147 |
0.190 |
XZ |
980 |
0.071 |
0.081 |
0.261 |
0.274 |
0 |
0 |
1 |
1 |
SY |
980 |
0.643 |
0.552 |
0.485 |
0.498 |
0 |
0 |
1 |
1 |
注:为了减少异常值的影响,对所有连续变量均在1%的水平上进行winsor2处理。
Table 4. Correlation analysis
表4. 相关性分析
变量 |
BD |
AR |
FK |
BJ |
RM |
PE |
TA |
ROA |
AD |
TR |
XZ |
SY |
BD |
1 |
|
|
|
|
|
|
|
|
|
|
|
AR |
−0.644*** |
1 |
|
|
|
|
|
|
|
|
|
|
FK |
−0.636*** |
0.984*** |
1 |
|
|
|
|
|
|
|
|
|
BJ |
0.0530 |
−0.00800 |
−0.0140 |
1 |
|
|
|
|
|
|
|
|
RM |
0.131*** |
0.113*** |
0.116*** |
−0.059 |
1 |
|
|
|
|
|
|
|
PE |
0.135* |
−0.0840 |
−0.0850 |
0.067 |
0.0770 |
1 |
|
|
|
|
|
|
TA |
−0.274*** |
0.122*** |
0.121*** |
−0.027 |
0.363*** |
−0.002 |
1 |
|
|
|
|
|
ROA |
−0.0150 |
−0.0560 |
−0.0590 |
0.040 |
−0.155*** |
−0.050 |
0.096** |
1 |
|
|
|
|
AD |
0.0270 |
0.001 |
0.00400 |
−0.039 |
0.282*** |
0.041 |
0.155*** |
−0.363*** |
1 |
|
|
|
TR |
−0.140*** |
−0.0340 |
−0.0260 |
−0.019 |
0.187*** |
−0.130 |
−0.32*** |
−0.156*** |
0.193*** |
1 |
|
|
XZ |
−0.185*** |
0.0530 |
0.0510 |
0.011 |
0.164*** |
0.141* |
0.266*** |
−0.0310 |
0.086** |
0.086** |
1 |
|
SY |
−0.145*** |
−0.0140 |
−0.0240 |
−0.055 |
0.227*** |
0.127 |
0.119*** |
−0.0570 |
0.107*** |
0.104*** |
0.049 |
1 |
注:***、**、*分别表示1%、5%、10%的显著性水平。
Table 5. Regression results
表5. 回归分析
|
(1) |
(2) |
变量 |
BD |
BD |
AR |
−0.410*** |
|
(−13.84) |
FK |
|
−0.531*** |
(−13.43) |
BJ |
−0.000 |
−0.000 |
(−0.03) |
(−0.06) |
RM |
0.106*** |
0.107*** |
(6.91) |
(6.79) |
PE |
0.001 |
0.001 |
(0.90) |
(0.89) |
TA |
−0.090*** |
−0.090*** |
(−8.32) |
(−8.11) |
ROA |
0.013 |
0.014 |
(0.38) |
(0.39) |
AD |
0.000 |
0.000 |
(1.11) |
(1.15) |
TR |
−1.256*** |
−1.269*** |
(−7.26) |
(−7.16) |
XZ |
−0.032 |
−0.032 |
(−0.91) |
(−0.89) |
SY |
−0.040* |
−0.039* |
(−1.95) |
(−1.89) |
GQ |
0.001 |
0.001 |
(1.05) |
(1.04) |
DS |
0.006 |
0.006 |
(1.56) |
(1.45) |
常数项 |
−0.083 |
−1.270*** |
(−0.32) |
(−3.88) |
样本量 |
153 |
153 |
调整后R2 |
0.893 |
0.888 |
行业固定效应 |
是 |
是 |
年份固定效应 |
是 |
是 |
注:括号内为t统计量;***、**、*分别表示1%、5%、10%的显著性水平。
4.4. 机制分析
通过对已有的文献进行梳理,可以总结出两个可能的传导机制,包括承销商行为和投资者情绪这两个渠道。
4.4.1. 承销商行为
Lewellen (2010)认为承销商行为可以用承销费用总额(CX)取对数来表示[41],承销商有动机提高保荐费用总额从而获得更高的收入。本篇文章更加注重某一家上市企业招股说明书可读性对承销商定价决策的影响,因此选取这一指标对上市公司更具有针对性。IPO破发往往是由于存在着信息不对称,承销商根据所得的信息对企业股票做出了错误定价,从而向市场上传递着错误的信息。企业招股说明书是承销商判断即将上市企业经营状况的主要依据,因此招股说明书的可读性会影响承销商信息的获取。出于承销商自身利益考虑,有故意提高发行价格的动机,从中获益。股票在二级市场上流通后,价格回归理性,就会出现破发现象(陆宇建,2015) [4]。
机制检验模型设定由式(6)和(7)所示:
(6)
(7)
4.4.2. 投资者情绪
投资者情绪可以用上市首日换手率(TR)进行表示,换手率体现出投资者行为,而行为就是情绪表达的结果。这里的投资者情绪的变化是源自于对某一上市公司相关信息获取程度,因此选取公司股票上市第一天的换手率更能反映出投资者受企业信息的影响程度。上市企业招股说明书可读性影响着投资者信息的获取,如果可读性较高,投资者获取信息较为完全,此时投资者更加理性。中小投资者容易出现过度反应,而机构投资者由于过度自信也会出现过度反应,此时股票市场就会出现破发现象(谢汉昌,2014) [5]。投资者情绪的变化会影响到交易行为,当市场普遍乐观时,投资者可能会变得更加大胆,增加交易频率,所以这里用换手率表示投资者情绪。模型如式(8)和(9)所示:
(8)
(9)
如上所示,CX和TR是中介变量,Controls是控制变量,通过机制分析,本文得出招股说明书可读性提高减少承销商为了获得较高承销费用而故意提高发行价格的行为,减少了市场信息不对称程度,使得IPO发行价定价更为合理,从而减少了新股破发的发生比率。
通过观察表6第(4)~(6)列,说明上市公司招股说明书可读性提高会减少换手率,即减少投资者的非理性因素,但是通过列(6)可以得出换手率和破发之间是负相关的关系,即与本篇论文的主回归得到的结论相反,说明投资者情绪不是主要的传导机制,根据表6得出结论:投资者情绪并不是主要的传导途径。
Table 6. Mediation effect results
表6. 机制分析
|
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
变量 |
CX |
CX |
BD |
TR |
TR |
BD |
AR |
−0.045* |
|
|
−0.008* |
|
|
(−1.73) |
(−1.68) |
FK |
|
−0.057* |
|
|
−0.011* |
|
(−1.69) |
(−1.65) |
CX |
|
|
0.053*** |
|
|
|
(2.72) |
TR |
|
|
|
|
|
−0.477*** |
(−3.22) |
ROA |
−0.013 |
−0.012 |
0.035 |
−0.025* |
−0.025* |
0.021 |
(−0.18) |
(−0.16) |
(0.69) |
(−1.76) |
(−1.78) |
(0.42) |
AD |
−0.000 |
−0.000 |
0.000 |
−0.000 |
−0.000 |
0.000 |
(−0.56) |
(−0.58) |
(0.88) |
(−1.01) |
(−1.19) |
(0.38) |
RM |
0.570*** |
0.567*** |
0.011 |
−0.003 |
0.002 |
0.054*** |
(34.66) |
(34.86) |
(0.78) |
(−1.11) |
(0.45) |
(4.75) |
SY |
0.028 |
0.028 |
−0.065*** |
0.003 |
0.012 |
−0.067*** |
(1.57) |
(1.57) |
(−3.88) |
(0.65) |
(1.42) |
(−4.04) |
XZ |
−0.052 |
|
−0.138*** |
0.013 |
|
−0.144*** |
(−1.16) |
|
(−4.52) |
(1.58) |
|
(−4.77) |
常数项 |
1.809*** |
1.707*** |
0.308** |
−0.039 |
−0.097*** |
0.192 |
(8.24) |
(6.45) |
(2.14) |
(−0.94) |
(−2.70) |
(1.47) |
样本量 |
614 |
614 |
613 |
614 |
614 |
613 |
调整后R2 |
0.780 |
0.780 |
0.129 |
0.473 |
0.471 |
0.160 |
行业固定效应 |
是 |
是 |
是 |
是 |
是 |
是 |
年份固定效应 |
是 |
是 |
是 |
是 |
是 |
是 |
注:括号内为t统计量;***、**、*分别表示1%、5%、10%的显著性水平。
4.4.3. Bootstrap检验
根据表7的结果,置信区间同为负数或者正数,区间内没有介于正负即0之间的数,因此可以认为存在中介效应,即上市企业招股说明书可读性通过承销商行为这一机制影响股票破发的发生。
Table 7. Bootstrap test
表7. Bootstrap检验
|
系数 |
标准差 |
z值 |
P > |z| |
[95%置信区间] |
_bs_1 |
0.0128871 |
0.0048286 |
2.67 |
0.008 |
0.0034232 |
0.022351 |
_bs_2 |
−0.4446518 |
0.0195193 |
−22.78 |
0.000 |
−0.4829088 |
−0.4063947 |
_bs_3 |
−0.4317647 |
0.0191927 |
−22.50 |
0.000 |
−0.4693817 |
−0.3941477 |
4.5. 稳健性检验
4.5.1. 仅保留近四年样本数据
科创板从2021年开始频繁出现新股破发的情况,并成为A股破发重灾区,打破一直以来新股不败的神话,给许多投资者带来了损失甚至影响科创板市场融资,所以这里仅保留2021年以后的数据来进行回归分析,回归结果如表9第(1)和(2)列所示。通过表格可以得出,可读性衡量指标AR、FK系数增大,说明近四年可读性对于上市企业破发发生比率影响作用更明显,仍然可以得到可读性与上市企业破发发生比率表现出负相关关系。
4.5.2. 加入其他控制变量
将承销费总额的对数值和每股净现金流量加入模型中来控制上市公司招股说明书可读性对于上市企业破发发生概率的影响。根据表9第(3)和(4)列回归结果得,模型拟合度较好,在控制了行业、年度的固定效应之后,上市公司招股说明书可读性与上市企业股票破发发生比率呈现出负相关关系。
4.5.3. 替换解释变量
可读性还可以用文本法来衡量,该指标的构建包括统计招股说明书是否有目录、招股说明书的页码(标准化)、招股说明书的字数(标准化)、招股说明书的平均句长(标准化、同向化处理)、句子数(标准化再乘以10)、词语数(标准化)这六个指标。所有文本分析都在Python环境中运行,具体的步骤包括:第一步是招股说明书的预处理,将所有PDF文件转换为TXT格式;第二步是获取各招股说明书的总字数、总句数等数据,并计算出平均句长。第三步构建可读性指标,将标准化的数据结果相加,计算出最终可读性指标值。结果如表8所示。
Table 8. Textual readability metrics
表8. 文本法可读性指标构建
交易代码 |
目录 |
页码 |
总字数 |
平均句长 |
总词语数 |
Readability |
600929 |
1 |
0.0352 |
0.3610 |
0.9997 |
0.1256 |
2.1966 |
600933 |
1 |
0.0824 |
0.4132 |
0.9996 |
0.1379 |
2.6331 |
...... |
...... |
...... |
...... |
...... |
...... |
...... |
688819 |
1 |
0.1156 |
0.4417 |
0.9995 |
0.1492 |
2.7060 |
根据表9第(5)列可以得出在10%的显著性水平之下,上市企业招股说明书的可读性越高会使得上市企业股票发生破发的发生比率越低,这和主回归分析得到的结论相一致。
4.5.4. PSM
PSM结果如表9第(6)和(7)列所示,为了避免模型可能会产生内生性干扰,本研究采用了可读性指标AR以及FK中位数作为基准。大于中位数的数据表记为1否则为0,此时用可读性AR1和FK1来表示。同时在不替换情况之下进行1:1最近邻匹配,再次返回匹配成功的样本,结果依然稳健,仍可以得出在控制行业和时间的固定效应之后,上市企业招股说明书可读性与股票破发发生比率呈现负相关的关系。
Table 9. Robustness analysis
表9. 稳健性检验
|
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
变量 |
BD |
BD |
BD |
BD |
BD |
BD |
BD |
readability |
|
|
|
|
−0.256*** |
|
|
(−4.52) |
AR |
−0.409*** |
|
−0.412*** |
|
|
|
|
(−18.26) |
(−17.96) |
AR1 |
|
|
|
|
|
−0.150*** |
|
(0.0169) |
FK |
|
−0.526*** |
|
−0.531*** |
|
|
|
(−17.86) |
(−17.59) |
FK1 |
|
|
|
|
|
|
−0.151*** |
(0.0163) |
BJ |
0.007 |
0.007 |
0.007 |
0.008 |
0.006 |
0.0105* |
0.0113** |
(1.45) |
(1.48) |
(1.48) |
(1.51) |
(0.70) |
(0.00572) |
(0.00559) |
RM |
0.112*** |
0.112*** |
0.107*** |
0.107*** |
0.098*** |
0.115*** |
0.114*** |
(11.34) |
(11.17) |
(5.07) |
(4.96) |
(5.31) |
(0.0153) |
(0.0150) |
PE |
−0.000 |
−0.000 |
−0.000 |
−0.000 |
0.000 |
9.60e−05 |
0.000169 |
(−0.84) |
(−0.86) |
(−0.68) |
(−0.68) |
(0.39) |
(0.000727) |
(0.000686) |
TA |
−0.079*** |
−0.080*** |
−0.079*** |
−0.079*** |
−0.097*** |
−0.0920*** |
−0.0932*** |
(−11.06) |
(−10.94) |
(−10.63) |
(−10.51) |
(−6.36) |
(0.0100) |
(0.00945) |
ROA |
0.015 |
0.017 |
0.014 |
0.015 |
0.051 |
−0.0207 |
−0.0174 |
(0.58) |
(0.65) |
(0.52) |
(0.57) |
(0.82) |
(0.0429) |
(0.0386) |
AD |
0.000 |
0.000 |
0.000* |
0.000 |
0.000 |
−0.000277 |
−0.000325 |
(1.63) |
(1.60) |
(1.67) |
(1.66) |
(1.02) |
(0.000285) |
(0.000269) |
TR |
−1.410*** |
−1.417*** |
−1.414*** |
−1.422*** |
−0.742*** |
−1.579*** |
−1.536*** |
(−11.54) |
(−11.41) |
(−11.50) |
(−11.39) |
(−4.72) |
(0.176) |
(0.158) |
XZ |
−0.024 |
−0.023 |
−0.022 |
−0.020 |
−0.132*** |
−0.00303 |
−0.0319 |
(−1.30) |
(−1.22) |
(−1.16) |
(−1.07) |
(−4.41) |
(0.0276) |
(0.0266) |
SY |
−0.063*** |
−0.063*** |
−0.062*** |
−0.062*** |
−0.069*** |
−0.0648*** |
−0.0717*** |
(−4.54) |
(−4.47) |
(−4.39) |
(−4.32) |
(−4.24) |
(0.0200) |
(0.0195) |
LN |
|
|
0.005 |
0.006 |
|
|
|
(0.18) |
(0.22) |
LL |
|
|
0.004 |
0.005 |
|
|
|
(0.80) |
(0.91) |
常数项 |
−0.257 |
−1.395*** |
−0.280 |
−1.435*** |
0.810*** |
1.665*** |
1.706*** |
(−1.36) |
(−5.87) |
(−1.44) |
(−5.87) |
(4.30) |
(0.207) |
(0.203) |
样本量 |
153 |
153 |
153 |
153 |
613 |
174 |
172 |
调整后R2 |
0.849 |
0.844 |
0.850 |
0.845 |
0.181 |
0.628 |
0.656 |
行业固定效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
年份固定效应 |
是 |
是 |
是 |
是 |
是 |
是 |
是 |
注:括号内为t统计量;***、**、*分别表示1%、5%、10%的显著性水平。
5. 进一步分析
上文结果显示上市企业招股说明书可读性影响破发发生比率,那么不同情况下招股说明书可读性对破发的影响作用程度相同吗?本部分进行实施注册制前后与按照企业性质划分之后的异质性分析。
5.1. 实施注册制前后
科创板首批核心公司在2019年已经开始在市场上进行交易,这说明科创板正式开始实施注册制,所以本篇文章将2014~2018年作为注册制实施之前的阶段,将2019~2024年作为注册制实施之后的阶段。根据表10所示,(1) (2)列表示注册制之前的上市企业招股说明书可读性和股票破发之间的关系,(3) (4)列表示的是注册制之后的招股说明书可读性与股票破发之间的关系。可以看到注册制之前AR的系数是−0.405,实施注册制之后AK的系数为−0.409,表明可读性与股票破发之间的负相关关系更加突出,同样的可读性FK指标在实施注册制之前的系数是−0.508,在实施注册制之后的系数是−0.526,也表明了招股说明书可读性与股票破发之间的负相关关系更加突出。
5.2. 企业性质
根据企业性质分类,可以将所有上市企业分为国企控股和非国企控股,如表11所示,(1) (2)列表示的是非国企控股的上市公司招股说明书可读性与上市企业股票破发之间的关系,(3) (4)列表示的是国企控股的上市企业招股说明书可读性与上市企业股票破发之间的关系。经过对比可以观察到非国有企业控股公司AR的系数是−0.390,而国有企业控股的AR系数是−0.441,表明国有企业控股上市公司招股说明书可读性与股票破发之间的负相关关系更加突出,可以解释为国有企业控股公司经营状况一般来说比较好,招股说明书信息传递效率相对较高,比起私营企业信息传递效果好,信息不对称程度较低。因此IPO定价相对私企来说更符合市场的预期,此时发生IPO破发的概率低。
Table 10. Before and after the implementation of the registration-based system
表10. 实施注册制前后
|
(1) |
(2) |
(3) |
(4) |
变量 |
BD |
BD |
BD |
BD |
AR |
−0.405*** |
|
−0.409*** |
|
(−6.82) |
(−18.26) |
FK |
|
−0.508*** |
|
−0.526*** |
(−6.75) |
(−17.86) |
BJ |
0.003 |
0.003 |
0.007 |
0.007 |
(0.30) |
(0.28) |
(1.45) |
(1.48) |
RM |
0.133*** |
0.134*** |
0.112*** |
0.112*** |
(5.45) |
(5.44) |
(11.34) |
(11.17) |
TA |
−0.001 |
−0.001 |
−0.000 |
−0.000 |
(−0.59) |
(−0.63) |
(−0.84) |
(−0.86) |
ROA |
−0.080*** |
−0.079*** |
−0.079*** |
−0.080*** |
(−4.47) |
(−4.43) |
(−11.06) |
(−10.94) |
AD |
−0.058 |
−0.024 |
0.015 |
0.017 |
(−0.41) |
(−0.17) |
(0.58) |
(0.65) |
TR |
−0.000 |
−0.000 |
0.000 |
0.000 |
(−0.80) |
(−0.69) |
(1.63) |
(1.60) |
XZ |
−1.448*** |
−1.432*** |
−1.410*** |
−1.417*** |
(−4.33) |
(−4.26) |
(−11.54) |
(−11.41) |
SY |
−0.010 |
−0.009 |
−0.024 |
−0.023 |
(−0.26) |
(−0.24) |
(−1.30) |
(−1.22) |
常数项 |
−0.410 |
−1.484*** |
−0.257 |
−1.395*** |
(−0.97) |
(−2.84) |
(−1.36) |
(−5.87) |
观测数 |
37 |
37 |
153 |
153 |
调整后R2 |
0.851 |
0.849 |
0.849 |
0.844 |
行业固定效应 |
是 |
是 |
是 |
是 |
年份固定效应 |
是 |
是 |
是 |
是 |
注:括号内为t统计量;***、**、*分别表示1%、5%、10%的显著性水平。
Table 11. Nature of enterprise
表11. 企业性质
|
(1) |
(2) |
(3) |
(4) |
变量 |
BD |
BD |
BD |
BD |
AR |
−0.390*** |
|
−0.441*** |
|
(−15.90) |
(−8.56) |
FK |
|
−0.504*** |
|
−0.558*** |
(−15.63) |
(−8.22) |
BJ |
0.007 |
0.007 |
0.005 |
0.007 |
(1.26) |
(1.22) |
(0.39) |
(0.53) |
RM |
0.102*** |
0.102*** |
0.092** |
0.085** |
(9.03) |
(8.95) |
(3.19) |
(2.85) |
TA |
−0.000 |
−0.074*** |
−0.001 |
−0.109*** |
(−0.48) |
(−9.59) |
(−0.37) |
(−5.08) |
ROA |
−0.074*** |
0.011 |
−0.105*** |
0.212 |
(−9.72) |
(0.41) |
(−5.06) |
(0.84) |
AD |
0.010 |
0.000 |
0.193 |
0.002* |
(0.37) |
(1.61) |
(0.79) |
(2.01) |
TR |
0.000 |
−1.316*** |
0.002* |
−2.100*** |
(1.63) |
(−9.89) |
(2.01) |
(−3.80) |
SY |
−1.316*** |
−0.071*** |
−1.981*** |
0.000 |
(−10.01) |
(−4.84) |
(−3.75) |
(0.01) |
常数项 |
−0.180 |
−1.290*** |
0.240 |
−0.763 |
(−0.89) |
(−5.02) |
(0.53) |
(−1.42) |
样本量 |
130 |
130 |
23 |
23 |
调整后R2 |
0.834 |
0.830 |
0.978 |
0.976 |
行业固定效应 |
是 |
是 |
是 |
是 |
年份固定效应 |
是 |
是 |
是 |
是 |
注:括号内为t统计量;***、**、*分别表示1%、5%、10%的显著性水平。
6. 结论和建议
上市企业招股说明书对于投资者获取企业相关情况来说是一个十分重要的参考,它不仅影响着一级市场承销商对于上市企业新发股票定价,还影响着二级市场投资者的投资决策,决定着未来股票是否会发生破发。本文以2014~2024年上交所A股制造业企业招股说明书为分析对象,得出了上市企业股票破发的发生比率与招股说明书可读性之间负相关关系。在替换可读性指标之后,依然通过了稳健性检验,证明了这一研究结论。本篇文章为研究新兴资本市场上市制造业股票定价提供参考,推动注册下IPO信息披露机制的完善,同时为研究IPO定价影响因素提供了新思路。
我国资本市场实施全面注册制改革后,新股IPO发行定价更加市场化,受信息不对称的影响,股票破发现象也不断增加。为了更好地提高信息传递的效率,建设中国特色现代金融信息披露体系,本篇文章分别对政府、企业和市场投资者提出相关建议。对政府而言,完善注册制改革是关键,因此政府需要建立配套的法律监管体系,加强信息披露监管,不断完善新股发行信息披露机制,并优化企业上市信息披露标准。对企业而言,全面注册制改革带来了更加多元化的上市条件。因此上市企业需要不断提高信息披露质量水平,提高企业向投资者传递信息的能力。此外,企业还可以增加投资者与上市企业沟通的渠道,以减少与投资者之间的信息不对称。最后,对投资者而言,需要具备更多的专业知识和经验,不断提高自身获取信息的能力,并谨慎投资。