1. 引言
1.1. 研究背景
中国证券市场自1990年上海证券交易所正式运营以来,经过三十余年的快速发展,已成长为全球第二大股票市场。但与英美等发达国家相比,我国股市存在显著的制度性差异与发展特征:市场参与者结构以散户投资者为主(占比超过60%),政策调控影响显著,市场有效性相对不足。这种特殊的发展路径使得我国股市呈现出“新兴加转轨”的双重属性,其价格形成机制、波动特征与成熟市场存在本质区别。特别是近年来,随着资本市场双向开放进程加快,境内外市场联动性增强,但A股市场仍频繁出现持续性上涨或下跌的极端行情。例如,根据RESSERT股票数据库显示,2015年股灾期间上证综指连续17个交易日累计跌幅达32%,2020年公共卫生事件期间又出现连续12个交易日的剧烈震荡。这种持续性波动不仅加剧了市场系统性风险,更暴露出现有研究范式在解释中国股市特殊运行规律方面的局限性。
传统金融理论基于有效市场假说,认为资产价格已充分反映所有可得信息,价格波动服从随机游走过程。但行为金融学研究发现,投资者非理性行为会导致市场出现持续性反应不足或过度反应现象。这种理论分歧在我国股市尤为突出:一方面,机构投资者占比偏低使得市场容易形成羊群效应;另一方面,T + 1交易制度、涨跌幅限制等特殊机制又可能延长价格发现过程。在此背景下,探究股市持续性波动的形成机制与持续时间特征,对于完善市场定价机制、防范金融风险具有重要理论价值。
而生存分析作为事件史研究的核心方法,最初用于医学领域评估治疗方案对患者生存时间的影响。其方法优势体现在三个方面:第一,可有效处理右删失数据,这与金融时间序列中未终结的涨跌周期具有同构性;第二,风险函数能动态反映事件发生的条件概率,契合市场状态转换的时变特征;第三,Cox比例风险模型允许引入时变协变量,为探究交易量等市场指标对波动持续性的动态影响提供方法论基础。
生存模型通常被运用于医学和公共卫生研究中,通过长期跟踪一定时期后的生存数据来判断诊疗效果。生存数据不单单指的是生存或死亡的数据;广义来说,生存结局是研究对象是否出现研究规定的重点事件。例如在研究某病治疗后是否复发,则“复发”为死亡,“未复发”则为生存。在工业中研究某一设备的耐用度,则可以将“设备损坏”视作死亡,将“正常使用”视作生存。因此,我们可以将生存分析模型运用到股市,将股市的连续上涨和连续下跌视作一个生存死亡过程。当股指由连续上涨转为下跌时,可以视作上涨过程的“死亡”。当股指由连续下跌转为上涨时,可以视作下跌过程的“死亡”。每个连续过程中股指都在重复“生存”和“死亡”的过程,以此应用生存分析模型,探讨股市的连续涨跌与日交易量之间的关系。
1.2. 研究意义
将生存模型引入金融研究具有显著的理论创新性:在医学情境中,治疗干预对应“死亡风险”的改变;而在金融市场,交易量变化可视为影响“涨跌周期终结风险”的干预因素。具体而言,当股指出现连续上涨时,每个交易日都面临“周期终结”(转为下跌)的风险,这种风险概率可能受当日交易量、资金流向等因素影响。通过构建多期生存模型,可量化交易量对涨跌周期持续时间的边际效应,揭示量价关系的动态作用机制。这种建模思路突破了传统量价分析仅关注同期关系的局限,为理解市场状态的持续性特征提供了新的研究维度。
本研究选择上证综指作为研究对象具有典型代表性:该指数涵盖上交所全部A股和B股,市值覆盖率超过70%,能全面反映我国股市整体走势。通过构建基于生存分析的持续期模型。理论层面,研究突破传统波动率研究的幅度视角,将持续时间维度纳入分析框架,有助于完善金融市场微观结构理论。方法层面,通过改进Cox模型的时间刻度设置,建立适用于高频金融数据的生存分析范式,为后续研究提供方法论参考。实践层面,研究结论可为监管部门构建市场稳定性预警指标提供理论依据,帮助投资者优化持仓周期决策。特别是在程序化交易盛行的当下,准确预判涨跌周期的持续时间,对量化策略的止损止盈参数设置具有直接指导价值。
1.3. 文献综述
在波动率研究领域,经典ARCH/GARCH模型及其衍生形式(如EGARCH、FIGARCH)通过捕捉波动聚集性特征,为刻画金融时间序列的异方差性提供了有效工具。Anderson [1]构建了通过整合高频日内数据进行日度和更低频率波动率分别测量和预测的通用框架;Ha Young Kim [2]将LSTM模型与多种GARCH类模型结合用于预测股票价格指数的波动率。国内方面付春蕊[3]通过时间序列分析在一定程度上预测股票价格变动;李振[4]将随机误差项的分布推广至广义gamma分布,提出可引入外生变量的GCARR-X模型探讨我国股市的波动特征和信息驱动机制。可以说,统计模型方法在股市研究中被广泛应用。
对于国内股市特殊性涨跌周期的研究,冯阳、赵会玉[5]运用随机过程的阈值确立方法计算得到了股票涨跌周期和涨跌幅限制的阈值;温兴春[6]通过在动态随机一般均衡模型中加入了股票投资者的异质性预期,探究了投资者情绪变化和货币政策调整的影响;马家进[7]则通过DSGE模型从供给侧和需求侧分析了股价波动的传导机制。对于股市涨跌周期的研究从宏观来说有许多切入角度,但成交量方面的研究较少。
2. 股指生存模型的主要函数估计
2.1. 数据体系构建
由于我国股市起步较晚,且监管方式和环境与外国股市不同,在研究我国股市时我们将选择上海证券综合指数为对象。上海证券综合指数(以下简称上证指数)是最早发布的指数,是以上证所挂牌上市的全部股票为计算范围,以发行量为权数的加权综合股价指数。反映了上海证券交易所上市公司的整体表现,也是研究我国股市的重要指标。以此为研究对象,我们希望对我国股市有更深层次的研究。
我们选取了1992年12月24日至2025年2月5日的上证指数,共记7818个。如表1所示,在第3个连涨时期1992年12月31日至1993年1月5日中,上证指数连续上涨3个交易日,则记连涨天数x3为3,在第4个连跌时期1993年1月15日至1993年1月19日中,上证指数连续下跌3个交易日,则记连跌天数y4为3,……,以此类推,记X为连续上涨总体,Y为连续下跌总体。由于雷鸣[8]指出不同政策下收益率分布曲线是不同的,为了提高广泛性,我们同时统计了在政策“T + 0”(1992年12月24日~1994年12月31日),“T + 1”(1995年1月1日~1996年12月25日)和“涨停板”(1996年12月26日~2025年2月5日)下连涨天数X和连跌天数Y的分布,发现也存在差异。接下来我们将对此进行具体分析,本文数据均来自RESSET数据库。首先根据数据给出经验分布:
Table 1. Empirical distribution of continuous rise and fall
表1. 连涨连跌的经验分布
时间 |
股指收盘价p(t) |
连涨天数(%) xi |
连跌天数(%) yi |
1992-12-24 |
758.59 |
|
|
1992-12-25 |
764.28 |
1 |
|
1992-12-28 |
757.31 |
|
1 |
1992-12-29 |
768.91 |
1 |
|
1992-12-30 |
767.52 |
|
1 |
1992-12-31 |
780.39 |
|
|
1993-01-04 |
814.04 |
|
|
1993-01-05 |
858.72 |
3 |
|
1993-01-06 |
847.44 |
|
1 |
1993-01-07 |
868.97 |
|
|
1993-01-08 |
889.47 |
|
|
1993-01-11 |
977.42 |
|
|
1993-01-12 |
987.26 |
|
|
1993-01-13 |
1024.05 |
|
|
1993-01-14 |
1086.43 |
6 |
|
1993-01-15 |
1063.76 |
|
|
1993-01-18 |
1055.32 |
|
|
1993-01-19 |
991.83 |
|
3 |
1993-01-20 |
1043.31 |
|
|
… |
… |
… |
… |
2025-01-21 |
3242.6226 |
|
|
2025-01-22 |
3213.6237 |
|
2 |
2025-01-23 |
3230.1637 |
|
|
2025-01-24 |
3252.6264 |
2 |
|
2025-01-27 |
3250.6007 |
|
|
2025-02-05 |
3229.4876 |
|
2 |
从数据上可以看出,三个政策时期下的连涨(跌)天数集中在7天以内,没有超过11天的数据,见表2。接下来我们将对连涨天数X进行统计分析。对连跌天数Y的研究方法是相同的。
2.2. 不同政策下连涨天数X的生存函数S(t)的估计和比较
生存函数又称生存概率,它表示目标事件的生存时间长于指定时间t的概率。我们对连涨天数X的生存函数S(t)的定义是上证指数连续上涨的天数至少为t的概率,即
Table 2. Statistics of consecutive rising (falling) days under different policies
表2. 不同政策下连涨(跌)天数统计
|
持续天数 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
上涨 |
T + 0 |
140 |
55 |
26 |
10 |
4 |
2 |
1 |
0 |
0 |
0 |
0 |
T + 1 |
135 |
68 |
25 |
12 |
4 |
2 |
0 |
0 |
0 |
0 |
0 |
涨停板 |
1707 |
902 |
462 |
247 |
119 |
65 |
38 |
18 |
6 |
3 |
1 |
下跌 |
T + 0 |
140 |
69 |
31 |
16 |
10 |
5 |
4 |
1 |
1 |
0 |
0 |
T + 1 |
135 |
61 |
29 |
15 |
4 |
2 |
1 |
1 |
0 |
0 |
0 |
涨停板 |
1708 |
804 |
391 |
191 |
79 |
43 |
18 |
6 |
1 |
0 |
0 |
记N为该政策时期内连涨的总段数,例如在“T + 0”时间段,共有238个连续上涨段,M(t)表示连涨天数至少为t天的段数,则S(t)的矩估计为
在这三个政策下,大部分连涨天数不超过7天。我们以生存时间为X轴,生存概率为Y轴构建KM曲线图,X在不同政策下的生存函数S(t)的KM曲线如图1所示。
Figure 1. KM curve of S(t) under different policies
图1. 不同政策下S(t)的KM曲线
从图1可以看出,“T + 0”的生存概率在t = 2时骤降至41.18%,t = 8时归零,说明采用“T + 0”时,市场连涨持续性极低,大概在8天结束连涨,适合短线交易。“T + 1”的连涨持续性略优于“T + 0”,但仍属短期波动特征,需警惕第7天后趋势反转。“涨停版”在t = 2时生存概率仍高达52.16%,t = 11时接近0但仍未完全消失,说明在“涨停板”政策下连涨天数有所延长,尤其是在t = 2后仍有一定的持续性,适合中长期持仓策略。
“T + 0”时期的生存函数曲线在三者中位于图表最下方,意味着该政策下股市连涨天数的概率比另两个政策时期的概率要小。从数字特征上来看,“T + 0”政策的期望值最低,标准差较低,意味着该时期内平均寿命最短,即持续上涨平均天数较短,股市变化较快。而实行“T + 1”政策后,尾部生存曲线相比“T + 0”有所上升;在实行“涨停板”后尾部生存曲线最高,意味着连涨天数的期望更高,连续上涨天数的概率增加,如图3所示。
2.3. 不同政策下连涨天数X的概率函数f(t)的经验估计
生存分析下X的概率函数
可以表示为:
我们对该概率函数的定义是该政策时期下连涨N天的概率。X在不同时期的概率函数f(t)的经验分布如图2所示:
Figure 2. Probability function f(t) of X under different policies
图2. 不同政策下X的概率函数f(t)
从表上看,连涨天数大于等于4天时概率相差不大,而连涨3天内的概率在不同政策下有较大的区别。当连涨天数从1天转为2天时,“T + 0”概率下降最多,说明“T + 0”政策下股市动荡程度最大,这与“T + 0”当日换手率大相佐证。“涨停板”曲线在连涨天数大于等于3天时位于图表最上方,说明“涨停板”下股市连涨的概率提升,在实行“涨停板”政策后股市相对稳定。
2.4. 不同政策下连涨天数X的危险率函数h(t)的估计和比较
根据生存分析的定义,风险函数用于描述一个人或物体在某个特定时刻死亡或损坏的风险,描述了在t时刻前发生事件的速率,而生存函数S(t)则描述了在t时刻前没有发生事件的概率。因此,两者是相反的面向同一事物的量度。在我们的研究中,我们将连涨天数的危险率函数定义为:
它的矩估计为:
在研究连涨情况时,危险率函数h(t)表示股指已连涨t天时,在接下来一天下跌的条件概率,代表了股指在上涨到多少天时下跌的可能性大小,可以在已知股指连涨天数的情况下用于预测走势,为股票交易提供指导。X在不同时期的危险率函数如图3所示。
Figure 3. Hazard rate function h(t) under different policies
图3. 不同政策下的危险率函数h(t)
从图3可以看出,当连涨天数在5天以内时曲线较平坦,意味着在这段时间内无论已连续上涨多少天,在下一天下跌的概率都几乎相同。对“T + 0”和“T + 1”来说,极个别数据经历了第6天和第7天后下跌(分别为3个数据和2个)。而“涨停板”曲线平坦的情况延续到了第6天。
以上是对连涨天数X的统计与分析,对于连跌的天数Y也可以应用相同的方法进行分析。
3. 不同政策下连涨天数X的Cox回归分析
3.1. 指标体系和模型的构建
在前面的研究中我们已经了解了生存分析下不同政策的差异。此时我们想探究连续上涨的持续时间的影响因素。
Cox回归模型,又称比例风险回归模型,主要研究协变量对生存时间的影响,是一种半参数回归模型,可用于评估多个因素对患者生存时间的影响。Cox比例风险回归模型的公式如下:
其中X为预测因子或协变量,
为协变量X的线性组合;左边
表示在t时刻,协变量为X的个体的风险函数;右边
为基线风险函数,表示协变量X全为零时的风险,对所有个体来时都是一样的,所以个体之间的风险差别仅在于协变量的不同。
称为部分风险函数,对每个个体是不一样的。对数据的处理上,我们同样统计1992年12月24日至2025年2月5日的上证指数,记上涨为1,下跌为0。Bessembinder [9]指出相对成交量是很好的研究指标,我们将当日成交量与过去30个交易日的平均成交量的比值作为成交量的衡量指标,如表3所示。
Table 3. Data processing under volume covariates
表3. 成交量协变量下的数据处理
交易日 |
生存时间 |
生存状态 |
组别 |
成交量(相对) |
1992-12-24 |
1 |
0 |
T + 0 |
0.840380094 |
1992-12-25 |
1 |
1 |
T + 0 |
1.310139205 |
1992-12-28 |
1 |
0 |
T + 0 |
0.743587488 |
1992-12-29 |
1 |
1 |
T + 0 |
0.728877824 |
1992-12-30 |
1 |
0 |
T + 0 |
0.739122729 |
1992-12-31 |
1 |
1 |
T + 0 |
0.65127435 |
1993-01-04 |
2 |
1 |
T + 0 |
0.879007131 |
… |
… |
… |
… |
… |
2025-01-21 |
1 |
0 |
涨停板 |
0.740174227 |
2025-01-22 |
2 |
0 |
涨停板 |
0.708924231 |
2025-01-23 |
1 |
1 |
涨停板 |
0.908878254 |
2025-01-24 |
2 |
1 |
涨停板 |
0.802451629 |
2025-01-27 |
1 |
0 |
涨停板 |
0.799861562 |
2025-02-05 |
2 |
0 |
涨停板 |
0.855142743 |
3.2. 不同政策下连涨天数X的Cox回归分析效果
将三个不同政策时期的数据处理,对于跨越了两个时期的连涨(跌)周期记为删失数据,分别进行Cox回归分析,结果如表4所示。
Table 4. Cox regression analysis under different policies
表4. 不同政策下的Cox回归分析
政策时期 |
贝塔值(B) |
SE |
瓦尔德 |
显著性 |
Exp(B) |
95%Exp(B)的CI上限 |
95%Exp(B)的CI下限 |
T + 0 |
0.079 |
0.043 |
3.38 |
0.066 |
1.082 |
0.995 |
1.177 |
T + 1 |
0.044 |
0.051 |
0.73 |
0.393 |
1.045 |
0.945 |
1.155 |
涨停板 |
0.068 |
0.034 |
3.935 |
0.047 |
1.07 |
1.001 |
1.144 |
从分析结果来看成交量协变量下的“T + 0”和“涨停板”显著性小于0.1,说明成交量对上涨周期结束风险的影响在统计上显著,而“T + 1”的显著性则不满足,这可能是数据样本不够大引起的。对于“涨停板”,贝塔值(B)为0.068,Exp(B) = HR = 1.07说明成交量相对变化量每增加1单位,事件风险(上涨周期结束)的风险率增加7.0%,这是因为正系数表明成交量增加会提高上涨周期结束的风险,加速转为下跌。但95%置信区间的下限非常接近于1,表明成交量的实际效应可能微弱,需要进一步的分析。
Blume [10]曾指出高成交量可能缩短趋势生存时间,这与我们的研究结果相吻合。为了提高准确性,我们猜测需要将市场划分为大成交量和小成交量两种情况分别讨论。
4. 不同成交量下连涨天数的Cox回归分析
4.1. 不同成交量下的假设
我们推测,在小成交量下成交量的增加会提高连涨周期结束的概率,而在大成交量下成交量的增加则会降低连涨周期结束的概率。当市场处于温和成交量时,成交量的增长通常反映市场参与度提高和流动性增长。此时,更多的买方力量可能推动股指快速上涨,但也意味着市场共识较快达成,获利了结或分歧出现的概率增加,导致上升周期缩短;而大成交量反映的一些市场行为将会人为地延长连涨周期。因此需要进行分段回归。
4.2. 不同成交量下连涨天数的Cox回归分析
小成交量时给出原假设(H0):“成交量的增加对连涨天数的风险函数没有显著影响。”和备择假设(H1):“成交量的增加会提高连涨天数的风险函数”。我们把成交量划分为大成交量与小成交量两种类型,来分析不同成交量下增量的影响,结果如表5。
Table 5. Cox regression analysis under different trading volumes
表5. 不同成交量下的Cox回归分析
|
贝塔值(B) |
SE |
瓦尔德 |
显著性 |
Exp(B) |
95%Exp(B)的CI上限 |
95%Exp(B)的CI下限 |
小成交量 |
0.337 |
0.092 |
13.415 |
<0.001 |
1.401 |
1.17 |
1.679 |
大成交量 |
−0.135 |
0.067 |
4.003 |
0.045 |
0.874 |
0.766 |
0.997 |
显著性小于0.001,表明模型整体显著,成交量对股指连涨天数的风险有统计学意义的影响,拒绝原假设。贝塔值为0.337 > 0,表明小成交量下成交量增加会提高股指由上涨转为下跌的风险。风险比为1.401,说明相对成交量每增加0.1个单位,股指停止连涨的风险增加约4.01%。同时95%置信区间不包含1,进一步支持成交量的显著影响。
同理对大成交量时给出假设与分析,结果如表5,显著性为0.045 < 0.1,说明模型整体显著,拒绝原假设。贝塔值为−0.135 < 0,表明大成交量下成交量增加会降低股指停止上涨的风险。风险比为0.874,说明相对成交量每增加0.1个单位,股指由连涨转为下跌的风险减少约1.26%。95%置信区间同样不包含1。
4.3. 结果解读
总的来说,成交量与股指连涨天数存在分段回归的非线性关系。小成交量时,交易量增加反映连涨风险提高,周期易缩短。此时市场流动性较弱,少量资金流入可能引发价格过度反应,此时成交量的增加更多由短期投机者驱动,导致价格波动加剧,连涨周期缩短,符合流动性不足假说。同时在小成交量下,市场参与者对信息解读差异大,分歧交易放大了价格反转风险[11]。而高成交量时,市场深度得到改善,大资金入场更可能推动趋势延续,抑制短期反转风险(即正反馈交易理论),反而说明连涨风险降低,连涨天数可能延长。
从行为金融学方面分析,小成交量时增量温和增加反映犹豫性买入,情绪脆弱易反转;而当成交量突破阈值后,机构资金或趋势交易者主导,推动持续性上涨,符合动量交易模型[12]。
5. 结论与建议
本研究立足于中国股市特殊性的现实基础,融合计量经济学方法,对比不同政策下股票市场特征的差异,结果表明:不同政策下股市稳定性差异较大,其中“T + 0”最不稳定,而“涨停板”稳定性最高,连涨周期也最长。其次,通过对交易量和涨跌周期持续时间的研究,发现成交量与股指连涨天数存在非线性关系,不同成交量背景下的关系不同。根据上述研究可以得到以下结论:
(1) “涨停板”提高了股市的稳定性,延长了连涨周期,有利于股市的良性发展,是股市政策与时俱进的成果;(2) 在不同成交量下股市连涨风险不同,当超过特定值时,成交量将显著降低连涨风险。
针对上述结果,我们提出以下建议:
(1) 对股民:当市场成交量较低时,需警惕成交量增加可能伴随的短期风险上升(连涨周期缩短),此时可考虑减少高风险持仓或设置止盈止损点;若成交量已处于高位且持续增加,可能暗示市场信心较强,连涨周期可能延长,此时可适当延长持仓时间或关注趋势持续的机会。
(2) 对研究者:提供成交量与涨跌周期关系的新思路,为股市研究特别是我国股市引入新的模型体系,为构建基于持续期风险的市场预警系统提供了量化依据,进一步深入探讨成交量与涨跌周期之间的复杂关系,尤其是在不同市场环境和政策背景下的变化规律。利用统计方法,不断优化和完善股市预警系统,以提高预测的准确性和实用性,为股市的健康发展贡献更多智慧。
(3) 对监管机构:低成交量阶段预示市场流动性不足或投资者信心低迷,需警惕市场波动加剧的风险,而高成交量时需关注市场过热迹象(如泡沫风险),适时通过加强异常交易监测、信息披露、投资者教育等手段引导市场理性行为,及时发布风险提示,保护中小投资者的利益。同时,可以进一步优化股市政策,如根据市场情况动态调整“涨停板”等制度的实施细节,以提高股市的整体稳定性和抗风险能力。此外,加强对股民的教育和引导,提升其风险意识和投资能力,也是促进股市健康发展的重要举措。
(4) 对政府:在资本市场深化改革的背景下,研究促进市场稳定发展、保护投资者权益的政策,根据市场不同阶段进行差异化管理。依据成交量与股市涨跌周期的关系,制定更为精细化的政策措施;在成交量低迷时期,出台相关政策刺激市场活力,提升投资者信心;在成交量高涨时期,则要加强市场监管,防范市场过热和泡沫风险。同时,政府还应加强对股市预警系统的建设和优化,提高预测的准确性和实用性,为股市的健康发展提供有力保障。此外,政府还应积极推动股市政策的持续优化,如根据市场情况动态调整交易制度、信息披露制度等,以提高股市的整体稳定性和抗风险能力。