1. 引言
党的二十大要求金融业服务国家战略、走好中国式现代化新道路。股市是反映国民经济状况的晴雨表,是一国经济的风向标,是企业融资的重要场所。股市是是一国经济的风向标,是企业融资的重要场所。股民是网络用户的一大群体,是投资企业的一大主题。他们对某一公司股票反映出的情绪,有可能影响到该公司股票,进而影响该公司的融资以及社会对该公司的看法。
越来越多的投资者通过移动端APP和财经网页获取股市行情、国家行业及公司层面的各类信息,并在这些在平台上交流表达投资观点。根据CNNIC官网2022年12月第51次统计报告基础数据,我国网民数量已达10.67亿,互联网普及率达75.6%。互联网逐渐变成个人投资者进行股票市场观点探讨与交换的不可或缺的信息交流媒介。个人投资者受自身的精力与信息获取能力的约束,更容易受到股吧等网络媒体的信息影响,导致一些非理性的投资行为的出现。同时他们也发布信息,表达观点,成为信息的发布者。因此,股票论坛、微信朋友圈、微博等网络平台在个人投资者的投资决策影响因素中有着越发重要的地位。个人投资者群体形成的网络舆论对企业的影响力不可小觑。
在互联网媒体平台中,线上股吧是个人投资者进行股票市场观点探讨与交换的首要场所。通过股吧,个人投资者可以快速有效地完成信息交流与互换,汇总股票相关信息与投资意见,投资者情绪通过股吧中的互相交流可以进行相互之间的影响,相关观点也会传播扩散。股吧中投资者的留言记录反映着他们情绪的同时,也影响着他们情绪观点以及交易策略,对其最终投资决策产生影响。
综上所诉,股民情绪与股权收益波动的关系至关重要,股民情绪最终也会影响企业融资,进而影响企业发展。故本文选取东方财富网顺丰控股股吧作为研究主体,研究投资者情绪与股票收益率的关系。
2. 文献综述
关于投资者情感对股票收益的关系,伍燕然和韩立岩(2007) [1] 发现交易者情感对短期收益有正向影响,而对长期收益的影响为负向。投资者情绪可分为整体情绪和个体情绪,部分学者也研究了个体情绪对股票回报率的影响能力。张强等(2007) [2] 从机构情绪和个人情绪两个维度进行研究,发现仅机构情绪对股票收益有显著正向影响。李宝仁等(2012) [3] 用因子分析方法考察了投资情绪指数与股票收益间的内在作用机制。金雪军等(2013) [4] 研究发现投资者看涨情绪与股票收益正相关,且对第二天的收益率有预测作用。安江丽和张立超(2016) [5] 则发现当期的个人情绪和机构情绪均对超额收益有显著正向影响。孟雪井等(2016) [6] 利用百度搜索指数衡量投资者情绪,发现中国股票市场的投资者情绪与市场指数之间存在联动机制。段江娇等(2017) [7] 以上证A股公司的股吧帖信息为研究对象,利用文本分析提取帖子中投资者情绪,发现论坛情绪会显著正向影响股票当日收益率,论坛发帖数会显著正向影响当日股权收益波动,显著负向影响股票未来两日收益率。金秀等(2018) [8] 发现投资者情绪与股票指数收益之间存在单向因果关系。石善冲等(2018) [9] 从股市类微信公众号的文章中提取投资者情绪,利用格兰杰因果检验研究不同类别的投资者情绪与上证综指收盘价和成交量之间的互动关系,发现乐观和中性情绪会影响成交量,而消极情绪主要影响收盘价和收益率。尹海员和吴兴颖(2019) [10] 的研究发现中国股票市场的日内投资者情绪能正向预测股票市场运行,该预测作用下午交易时段表现得更显著。赵庆国等(2022) [11] 发现中国大部分行业的股票收益率对投资者情绪有较强的敏感性,投资者情绪易受市场整体波动情况影响,进而影响股票市场价格走势。孙培怡(2022) [12] 用主成分分析法及VAR实证检验投资者情绪对股票收益的影响,结果表明投资者情绪与股票市场收益相互影响。
3. 相关理论及假设
3.1. 过度自信理论
过度自信是指人们过于自信自己的决策,从而无视市场上与之相反的信息。投资者倾向于将盈利的投资决策归功于自身,而将亏损的投资决策归为外部因素影响。过度自信的投资者投资行为大都不保守,偏好高风险的投资选择,判断失误导致价格偏离时,投资者会坚持己见,理性的套利行为会比理论上少。
3.2. 羊群效应理论
羊群效应在股市中,表现为众多投资者跟随市场的判断,在非理性情绪下进行非理性的交易,导致投资决定的趋同化,加大股票市场波动。机构投资者有自身人才优势或是资金来获取有效信息,而个体投资者缺乏所谓的人才优势或是足够资金,因而对所谓的内幕消息特别敏感。通过移动互联网,投资者可以快速低成本地与众多投资者交流,客观上加剧了羊群效应。
3.3. 噪声交易理论
噪声交易模型认为噪声交易者情绪化的交易行为,会导致股权收益高于或低于其正常估值,使得理性交易者的套利风险过高,一定程度上限制了套利活动。
综上,当投资者看好某只股票,会通过购买或持有股票等行为对该股票价格进行实质性的影响,使得股票价格上升,收益率上升,同时通过发帖发声等行为,经过羊群效应,进一步扩大这种影响。反之,投资者看跌某只股票,会陆续抛售该股,使得未来一段时间股票价格下降。因此,本文做出假设:股票收益率可被投资者情绪预测,且投资者情绪对顺丰控股股票收益率存在正向相关关系。
4. 股吧爬取以及情绪分析
4.1. 爬取对象
本文选择东方财富顺丰控股股吧作为研究投资者网络社交和沟通信息的代表性平台。首先,东方财富网日浏览量接近一亿,日活跃用户数上千万,是现阶段中国最受投资者欢迎与喜爱的股票网络交流平台。它作为中国目前最大最活跃的股吧,可以最全面及时地反映投资者的观点变化和情绪变化。此外,该网帖子数量众多,留存时间长,有个股、主题、行业、概念的专业分类,可以为本文的研究提供全面有效的数据。同时,该股吧保留了发帖人、发帖时间、标题、点击量、评论量等变量,变量齐全。而且,主贴内的回帖大多千篇一律,重复内容较多,回复简略,灌水严重。评论多为“顶”“支持楼主”等信息,这些简略的回帖难以判断其情感倾向,所以只抓取主贴标题部分的内容。
本文选择顺丰控股股吧帖子信息作为实证分析的研究样本,有以下几点理由:首先,顺丰控股于2017年2月24日上市,截止至2022年底,顺丰控股市值突破2000亿元,且股票日成交额在5亿人民币左右,公司体量庞大;其次,顺丰速递速度快、安全性高,并已成为国内领先的快递物流综合服务商、全球第四大快递公司,具有极高的研究价值。最后,顺丰控股股吧帖子数据量很大,方便运用数据挖掘技术衡量投资者情绪,选取最新和最具代表性的数据作为研究对象,能够更好的反映顺丰控股股票的变化情况。
4.2. 爬取股吧评论
本文用Python3.11爬取网络数据。爬虫代码涉及requests库、Beautiful Soup库以及snowNLP模块等。首先发送HTTP网页请求,获取网页源代码,解析得到评论数据进行舆情分析。由requests向网站发送请求,使用fake_user agent更改User-Agent信息,用lxml解析网页代码。for循环遍历评论,用requests向目标网站发送请求,用lxml库解析返回的HTML代码,并用xpath语法来选取需要的数据。使用pandas的read_csv函数读取CSV文件,并将其存储在Data Frame中。根据评论内容构建训练集,选取1143条积极评论、986条消极评论进行机器学习,而后选择SnowNLP进行分词、特征提取从而量化得到每一条评论的舆情值。其中,舆情分值小于0.5表示消极,大于0.5则表示积极。再对舆情值进行加权,得到月度舆情值。月度舆情值介于(−0.5, 0)的视为偏向乐观,介于(0, 0.5)的视为偏向悲观。结果如表1所示:
Table 1. The daily weighted mood scores
表1. 每日加权情绪得分
5. 实证分析
5.1. 样本选取与模型构建
本文以东方财富网顺丰控股股吧帖子为研究样本,时间范围为2021年8月2日~2023年10月30日,共109周。本文的被解释变量为周度的股票收益率(Yield),即周内股票收益率的加权值,若本周不开盘则由上周的数值替代,单位为百分比。解释变量为周度投资者情绪得分(Sentiment),即为一周情绪得分的加权值。此外,本文选取控制变量为周度股票成交量(Volume)和中国投资者综合情绪指数(CISI)。股票成交量可以反映股票交易的活跃程度和交易人群的情况,单位为亿元。成交量越大,市场越活跃,交易人群也越广泛。同时,成交量的变化也可以反映市场的情绪和趋势,成交量的增加可能意味着市场情绪的升温和投资者对市场的看好程度的提高,而成交量的减少则可能反映出市场情绪的降温和投资者对市场的谨慎态度。中国投资者综合情绪指数是在收集网络能反应投资者情绪的上亿条金融文本大数据的基础上,使用深度学习方法,度量文本信息,以反映中国散户投资者情绪的新工具。结果如表2所示:
Table 2. Description of the variables
表2. 变量说明
由此,构建回归模型如公式(1):
(1)
公式中,
表示第t + 1周股票收益率。Sentimentt表示第t周的周度情绪得分,Volumet第t周的周股票成交总量,CISIt表示第t周的周度CISI综合情绪指数情绪得分。由于股票股民情绪影响股票收益率有时滞性,故采用滞后一期股票收益率的周度数据作为被解释变量。
5.2. 描述性分析
首先,为了统计本文研究样本的总体特征,本文针对上述选取的变量开展了描述性统计,结果如表3所示:
Table 3. Descriptive statistics of the variables
表3. 变量描述性统计
从表中可以看到,周度股票收益率的均值为−0.372,为负数,说明顺丰控股自2021年8月2日~2023年10月30日股票下跌了近40%,这可能与疫情影响使得经济下行股市低迷以及快递业受阻有关。投资者情绪得分均值为−0.045,数值小于0,说明本文研究的投资者情绪样本反映出的投资者情感倾向于悲观。由此可见这与提出假设:投资者情绪与股票收益率呈正相关关系相符。平均每周股票交易量为18.61亿元,最大值31.87亿元与最小值11.30亿元之间相差较大,由其标准差即可看出其波动程度较大。
5.3. 格兰杰因果检验
根据构建的模型,本文选择了滞后一期的周股票收益率作为被解释变量。故对两个变量进行滞后一期的格兰杰因果检验,结果如表4所示:
*p < 0.1; **p < 0.05; ***p < 0.01.
进行格兰杰因果检验,滞后阶数为1阶,从上表可知:针对Yield不是Sentiment的格兰杰原因,p值 = 0.658 ≥ 0.05,因而接受原假设,意味着上周股票收益率不是投资者情绪的格兰杰原因。针对Yield不是Sentiment的格兰杰原因,p值 = 0.002 < 0.05,因而拒绝原假设,意味着上周投资者情绪是股票收益率的格兰杰原因。两者之间不存在双向因果关系。
5.4. 样本回归分析
对模型进行回归,结果如表5所示:
Table 5. Regression results
表5. 回归结果标准试验系统结果数据
*p < 0.1, **p < 0.05, ***p < 0.01.
从回归结果可以看出,模型的决定系数达到了51.8%,说明本文构造的投资者情绪得分对股票收益率有一定解释能力。且上述变量方差膨胀因子检验表结果所示,VIF均小于10,说明不存在多重共线性问题。
周度投资者情感得分的系数为2.918,意味着在其他变量不变的情况下,周度投资者情感得分每增加一个单位,周度股票收益率会增加2.918%,也意味着投资者情绪与股票收益率之间为正相关,与本文的研究假设吻合。若投资者情感变得积极,更偏向看好该支股票,则可能代表投资者群体有更强的意愿去买入或持有股票;同时对股票看好的人群发表积极情绪言论也会影响到其余网民,使后者增加持有该股票的可能性,从而对收益率起到拉升作用。相反地,若网民发表悲观言论,则会影响售出该只股票可能性,致使股权收益下跌。后经过股市的追涨杀跌,该效应也会被放大。控制变量中周度股票成交量的系数为0.168,意味着在其他变量不变的情况下,周度股票成交量增加1亿元,周度股票收益率会上升0.168%。股票成交量是股票的风向标,成交量越大,代表股市中的资金越多,投资者参与度越高,股票上涨的概率越高,相反,成交量越小,代表市场上资金越少,投资者参与度不高,股票上涨概率越低。这也证明了股市中“量价同向”的现象。周度CISI综合情绪指数的系数为0.138,也表示CISI综合情绪指数与股票收益率之间为正相关。投资者综合情绪指数不仅包含过去市场信息,也能反映投资者投资意愿和对股市走势的预期。投资者综合情绪指数走高,对股市整体收益率产生正向影响。顺丰控股作为单一股票受到市场整体向上环境的影响,也产生正相关的效果。相反地,当投资者综合情绪指数走低,则影响大宗股票收益率降低,进而影响单一股票收益率下降。
6. 结论与建议
6.1. 结论
本文选取东方财富网顺丰控股股吧2021年8月2日~2023年10月30日共1,917,526条帖子信息作为研究样本,选取投资者情绪、股票成交量来解释股票收益率。通过分析,本文发现:投资者情绪对未来股票收益率变化有一定预测能力。若投资者情绪乐观,则代表投资者群体有更强的意愿去买入或持有股票,对收益率起到拉升作用;若投资者情绪悲观,则代表投资者群体不愿意买入或持有股票,致使收益率下跌。
6.2. 建议
受疫情影响,我国各行各业遭受重创,尤其是物流行业。作为快递业的巨头——顺丰控股的股市表现不尽人意,由于股民的情绪的悲观,更是使其股票收益率持续下行,对齐进一步融资造成了困难。为了缓解该公司股票下跌颓势,缓解融资困难,进一步促进快递业、物流业发展,本文得到如下启示:
监管层面,金融监管机构应认识到网上舆论的重要性,及时掌控舆情并对其采取合适的监管手段,减少虚假或过激言论影响或操纵市场的行为。同时建立健全的监管网络舆情的框架和制度,加强对监测和分析,及时发现和处理虚假信息和不当行为,促进市场的稳定和健康发展。进而投资者能更好的进行投资,带动物流业发展。此外,监管机构还可以加强对投资者的教育和引导,提高投资者的风险意识和识别虚假信息的能力,从而减少虚假信息和过激言论对市场的影响。
投资者层面,投资者在投资过程中应该丰富投资相关知识,更好地进行投资决策。此外,投资者还应该调整情绪,有针对性地减少非理性投资行为,做出更加理性、科学、专业的投资策略。对于机构投资者或个人投资者来说,也可以利用其他投资者情绪的波动:网络舆论的信息可以作为判断股票收益的因素之一,进一步提高投资决策的效率。可以通过整合和研究网络舆论的信息,来了解市场情绪和投资者情绪的变化趋势以及舆论对股票价格的影响,从而更好地预测股票价格的波动,制定更加合理的投资策略,降低投资风险,提高收益。