1. 引言
黄金在金融领域的作用主要体现在价值储存、避险工具、国际储备资产、与美元和石油价格的关联、金融市场投资品种、经济指标反映以及市场稳定性和信心建设等方面。这些作用共同构成了黄金在金融市场中不可或缺的地位。投资者情绪是影响市场走势的另一重要因素。当投资者对经济前景感到悲观或担忧时,他们可能会转向避险资产,如黄金,以对冲潜在的财富损失。分析黄金价格在投资者情绪影响下的走势和波动,在政策制定和投资策略方面都具有重要意义。
关于黄金价格波动影响因素的研究,大致可归纳为两类:一是金融市场因素,黄金价格的波动与金融市场中的多个关键指标紧密相连。这些指标包括美元的走势,因为美元作为全球储备货币,其强弱直接影响到黄金的国际定价[1];汇率的变动,尤其是主要货币之间的汇率,它们的波动也会对黄金价格产生影响;利率的变动[2],作为资金成本的重要指标,利率的高低直接影响投资者的资金配置选择,从而影响到黄金的需求;股票市场的表现[3],股市的涨跌往往伴随着投资者情绪的波动,进而影响黄金作为避险资产的需求;以及大宗商品市场的整体走势[4],大宗商品市场的繁荣与衰退通常也会带动黄金价格的相应变动。二是非金融市场因素,除了金融市场因素外,非金融市场因素也对黄金价格的波动起到重要作用。政治因素[5]是影响黄金价格的重要因素之一,国际政治局势的紧张或缓和都会直接影响投资者的避险情绪,进而影响黄金的需求;数据信息的公布[6],如宏观经济数据、货币政策调整等,往往会引起市场的预期变化,从而影响黄金价格;此外,不确定性事件[7],如自然灾害、地缘政治冲突等,往往会给市场带来不确定性,使投资者转向黄金等避险资产,从而推动黄金价格上涨。
随着互联网技术的飞速发展,近年来,某些市场因素以外的因素如投资者情绪以及投资者关注度等逐步被量化同时受到了广泛的关注和研究。包括Hajek等人和Mensi等人的多项研究,都已经证实了投资者情绪会对黄金价格波动产生显著影响。许多相关研究会更支持投资者情绪的消极影响,即出现投资者悲观情绪上升的情况时,其对于黄金投资的需求会增加,从而导致其价格波动加大。这一观点得到了Balcilar以及梁超等人的支持。从时间维度来看,投资者情绪在短期内对黄金价格波动的影响是显著的,这一观点在Balcilar等人的研究中得到了验证。然而,当我们将视角拉长至长期时,投资者情绪对黄金价格的影响则变得不那么显著,这一点在Aggarwal等人的研究中得到了体现。此外,另有一部分学者试图运用投资者情绪来预测黄金价格,如Aggarwal等人和Hajek等人的研究。这些研究不仅提高了价格波动率的预测精度,还为投资者和市场分析师提供了更为准确和全面的分析工具。这一领域的研究不仅深化了我们对黄金市场运行规律的理解,也为金融机构的风险管理和资产配置提供了重要参考。
但研究中的一个关键问题是如何度量投资者情绪。投资者情绪指标的传统构建方法可分为直接法和间接法。直接法是通过问卷调查获得受访者的观点。我国一些研究机构发布的情绪指数就是基于直接法编制的,也有研究者使用消费者信心指数衡量情绪。直接法比较直观,不过也存在如下局限:第一,可靠性较差,因为受访者几乎没有诚实回复的动机[8]。第二,频率较低,对情绪的反应有滞后性。调查通常每月开展一次,而当市场有效程度相对较高时,错误定价只会在短期内存在,所以使用低频数据难以发现投资者情绪的效应。第三,考虑到样本量和成本,调查一般只针对整体市场情绪,而无法获得投资者关于个别金融资产的情绪。然而,人们对个别金融资产的投机行为可能仅受有关个别金融资产的情绪驱使,而与整体市场情绪无关[9]。
与现有研究相比,本文可能存在的边际贡献为:在获取数据方法上面采用了网络爬虫技术获取了滞后性较低,针对性较高的数据构建情绪指标进行研究,在一定程度上丰富了对黄金价格波动规律的认识,同时为经济政策制定者和投资者提供了更为精准的数据支持和决策依据。
2. 研究设计
2.1. 数据
2.1.1. 评论数据
本文的研究样本为“东方财富网股吧(https://guba.eastmoney.com/)”中的黄金吧的论坛的评论信息,时间区间为2018年4月1日~2024年4月1日,共6年。股吧论坛是我国开放程度较高、极为活跃的投资者网络交流平台,投资者的情感可以通过股吧交流得以明确呈现并迅速传播扩散,东方财富网股吧相较于雪球网、同花顺论坛等,个人用户活跃度更高,且个人用户的评论信息更好获取,因此本文选取东方财富网股吧中的黄金吧的论坛的评论信息作为研究样本。本文利用request库构建爬虫程序,并利用代理IP突破网站反爬限制,对东方财富网黄金吧的所有帖子信息进行爬取,共爬取43万条帖子,关于每帖抓取的信息包括其标题、URL、作者、时间、浏览数以及评论数。爬取文本信息之后,我们再进行数据清洗,这包括以下几步:第一,删掉重复的文本信息,也就是说对连续且内容完全相同的帖子去重;第二,剔除官方发布的新闻、公告以及机构路演信息,例如内含“要闻”、“资讯”、“播报”、“公告”等词语的帖子,以及投资者和上市公司的互动信息;第三,删除转发的内容,即内部文字中包含“转”、“转帖”、“转发”等词语的帖子;第四删除广告贴,即含有“荐股”、“推荐”等词语的帖子;第五,去除匿名用户的发帖,同时去掉不需要的时间段的帖子信息。经过情绪筛选最终保留了38万条帖子记录,这便是最终分析样本,样本时间分布见图1。
2.1.2. 经济政策不确定性
由于不确定性因素会使得投资者对风险的感知和厌恶感受提升,同时也 是影响投资者情绪和决策行为的一个关键性因素,因此本文在进行研究时将同时考虑经济政策不确定性的影响。经济政策不确定性借鉴Baker et al.的研究,选取中国经济政策不确定性指数(CEPU)进行研究。中国经济政策不确定性指数是通过检索《人民日报》和《光明日报》所发表文章中含有“经济”“政策”和“不确定性”的关键词,进行统计和标准化处理后得到的。数据来自不确定性指数网站(http://www.policyuncertainty.com)。
2.1.3. 黄金价格
本文选择上海黄金交易所现货实盘Au99.99品种作为黄金价格代表进行研究,研究样本期为2018~2024年,总计得到1605个日度数据。
Figure 1. Monthly comment count for golden bar (2018.4~2024.4)
图1. 黄金吧月度评论数(2018.4~2024.4)
见图2,我国黄金价格总体保持在200~580元/g范围内,其中有两个时期黄金价格上涨幅度明显且波动幅度较大:首先是2019年中至2020年中,其原因包括一八年中美贸易摩擦加剧和一九年新型冠状病毒在全球迅速蔓延,各国经济遭受寒冬,世界不确定性因素增加,黄金价格上升,于2020年8月达到峰值。二是2022年中至今,主要原因为俄乌冲突爆发并逐步升级为战争,世界整体形势恶化,并于2024年2月达到峰值。
Figure 2. The line chart of gold Au99.99 Price in China from 2018 to 2024
图2. 2018~2024年我国黄金Au99.99价格折线图
2.2. 投资者情绪指标构建
获得评论帖子之后,我们接下来的任务是对每个帖子进行情感分类。
目前,文本的情感分析方法主要有两类。一类是按照金融专业情感词典进行分类,然后通过句法分析对文本进行情感分类。这种情感分类方式比较直观,不过准确度严重依赖于情感词典的构建质量。由于网络用语的变化很快,很难及时构建完备的情感词典。此外,该方法中每个词汇被打上唯一分数,但同一词汇(或语句)在不同语境下的情感差异会非常大。词汇汇总得到的情感分数忽略了这种差异性,从而会影响到分类的效果。另一类是基于机器学习算法分类,选取一部分人工情感分类的语句作为训练集,进行机器学习。面对海量文本数据,机器学习算法借助计算机力量进行情感分类,是近年来本文数据和自然语言处理中的重要进步。研究表明,在情感分析任务中机器学习算法的表现优于情感词典法[10]。
在使用机器学习方法进行分类之前,还有必要先对评论信息进行文本预处理工作。预处理的程序包括三步:文本分词、去除停用词和文本向量化。第一步,文本分词。与英文不同,中文语句中各词语之间无空格符切分,因此,对文本数据挖掘之前,要先对句子分词,这里我们使用Python中的jieba库进行分词。第二步,对分词后的文本数据去除停用词。中文文本中存在较多停用词(例如,“了”、“的”、“也”之类),它们对情感分析任务帮助不大,反而会大幅增加后续训练的运算成本。因此,利用整合了的常见的停用词表(包括哈工大停用词表、百度停用词表、四川大学机器智能实验室停用词库),去除了相关停用词。第三步,文本向量化,也就是将自然语言文本转化为计算机可识别的信息。本文使用Word2Vec方法将文本信息转化为文本向量,并输入到机器学习模型中。
我们利用Chinese-word-vectors (由DBIIR实验室开源)中利用金融新闻训练好的Skip-Gram词向量,将已完成前两步处理之后的语料转化为词向量。然后,将词向量输入到机器学习模型中,该机器学习模型为由前向LSTM层、后向LSTM层、合并层、输出层构成,并使用sigmoid激活函数及Aadm优化器等进行训练,并根据准确率、召回率等指标进行调优后的双向长短期记忆神经网络(BiLSTM),从而对每条帖子进行情感分类。训练分类效果见表1。
Table 1. The effectiveness of the machine learning model in classifying emotions for the training samples (%)
表1. 机器学习模型对训练样本进行情感分类的效果(%)
|
准确率 |
精确率 |
召回率 |
F1值 |
Bi-LSTM |
77.82 |
78.33 |
77.82 |
77.82 |
Table 2. Emotion classification of Bi-LSTM model in training samples and all samples
表2. Bi-LSTM模型在训练样本和全部样本中的情感分类
类别 |
人工分类结果 |
Bi-LSTM分类结果(%) |
看跌 |
中立 |
看涨 |
训练样本:看跌 |
33.33% |
29.04 |
2.41 |
1.88 |
训练样本:中立 |
33.33% |
1.48 |
30.17 |
1.68 |
训练样本:看涨 |
33.33% |
1.52 |
2.42 |
29.39 |
训练样本 |
2400条 |
32.25 |
32.55 |
35.20 |
全样本 |
38万条 |
22.67 |
47.36 |
29.98 |
通过Bi-LSTM模型对全部文本信息进行情感分类之后,我们获得了每只股票相关评论贴的正向情绪、中立情绪和负向情绪帖子的数量,见表2。在此基础上,我们使用Antweiler和Frank的方法[11],构建了三个维度的投资者情绪指标:情感指标、关注度指标和意见趋同指标。情感指标反映投资者看跌、看涨或者中立。我们使用如下公式计算投资者对黄金在时期t内的看涨指数(Bullishness Index):
(1)
其中,
和
分别代表第t期内的看涨帖子数和看跌帖子数。
反映了看涨贴和看跌帖的比例,其值越大表明投资者看涨该股票的情绪越强烈。当看涨与看跌帖子数相等时,
取值为0。
投资者关注度指数(Attention Index)用于反映一段时间内投资者对某股票的关注程度。我们使用论坛中的发帖数量衡量投资者在第t周期的关注度,即
(2)
其中,
,
和
分别代表论坛中第t周期的看涨帖子数、中立帖子数和看跌帖子数。
投资者意见趋同指数(Agreement Index)用于反映第t周期的投资者的意见一致程度:
(3)
该指数反映了看涨和看跌帖子数量的差异程度,取值范围为[0, 1]。当所有帖子均看涨,或者所有帖子均看跌时,均有
,代表投资者的意见极端一致。而当一半帖子看涨而另一半帖子看跌时,
,此时投资者的意见分歧最大。
由于周度评论数相对较少,且为和政策不确定性数据频率相符合,因此将周期t选择为一个月一个周期,同时将三个投资者情绪指标符合为:
(4)
2.3. 模型设计
在考察经济变量之间的关系时,特别是在处理不同频率的数据时,传统的数据同频化方法,如拆分低频数据或降低高频数据的频率,虽然能实现模型的构建,但这样的做法往往伴随着信息损失的风险,可能导致高频数据中的有价值信息被忽视,进而引发参数估计的偏误或波动预测的误差。
考虑到黄金价格的高频数据特性与经济政策不确定性和投资者情绪等月度数据的非同步性,本研究选择了一种更为先进和高效的方法——混频数据抽样模型(MIDAS)。该模型的优势在于它能够直接处理不同频率的数据,不用通过对数据进行人为的频率转换,进而能够较大限度地保留数据的原始信息和完整性。
通过应用MIDAS模型,本研究能够更准确地捕捉黄金价格与经济政策不确定性和投资者情绪之间的动态关系,避免了数据同频化过程中可能产生的信息损失和偏误。这不仅有助于提升研究的准确性和可靠性,还能为相关领域的政策制定和投资决策提供更加科学和有效的参考。
2.3.1. 单因子模型
参考已有研究,通过下式表示黄金波动率:
(5)
上式中:
表示第t期中第i天的黄金价格波动率,利用黄金的市场价格p计算得到;
为无条件均值;
为t期中的第
天的信息集。
(6)
(7)
在上式中:
可以被分成长期波动率
以及短期波动率
这两个部分。
短期波动
遵循GARCH(1, 1)过程,
为ARCH项系数,
为GARCH项系数。根据模型设定,参数
,
为非负数,
。
(8)
长期趋势
受已实现波动率(Realized Volatility,简称RV)的影响,表示为
(9)
上式中:m为长期常数项;θ为已实现波动(RV)对长期波动的影响系数;K为低频变量的最大滞后阶数。其中,月度已实现波动(RV)率表示为
(10)
是由贝塔函数构造的权重方程,表示为
(11)
为使得滞后变量的权重呈衰减变化(即时间越接近当期,影响越大),设定
,由系数
决定低频数据对高频数据影响程度的衰减速度。由此,式(11)可表示为
(12)
2.3.2. 多因子模型
为研究黄金价格所受的非对称影响,使用短期波动GJR-GARCH(1, 1)代替GARCH(1, 1)过程进行研究
(13)
(14)
式中:
为指示函数;
为非对称杠杆系数。为避免不同宏观变量与已实现波动率之间相互独立的问题,充分考虑可能存在的外生变量对黄金价格的影响,在式(9)基础上引入其他外生变量,如式(15)。
(15)
在构建用于分析黄金价格波动影响因素的模型中,我们考虑将经济政策不确定性(EPU)和投资者情绪(IS)这两个变量分别纳入一个双因子GARCH-MIDAS (广义自回归条件异方差混合数据抽样)模型中。具体来说,我们将EPU和IS作为外生变量,分别代入到GARCH-MIDAS模型的两个不同成分中,以捕捉它们对黄金价格波动率的长期和短期影响。首先,我们假设原始的GARCH-MIDAS模型为式(15),它描述了黄金价格波动率的基本动态结构。然后,为了分析EPU的影响,我们将EPU变量代入到模型的一个MIDAS (混合数据抽样)成分中,得到如式(16)所示的扩展模型。类似地,为了分析IS的影响,我们将IS变量代入到模型的另一个MIDAS成分中,得到如式(17)所示的另一个扩展模型。接下来,我们将式(16)和式(17)结合起来,形成一个双因子GARCH-MIDAS模型,该模型同时考虑了EPU和IS对黄金价格波动率的长期和短期影响。此外,我们还结合了式(5)和式(13)中的相关设定或假设,以确保模型的完整性和一致性。
(16)
(17)
将式(16)与式(17)联立,得出式(18),再结合式(5)与式(13),最终得到投资者情绪和经济政策不确定性对我国黄金价格波动影响的多因子 GARCH-MIDAS模型。
(18)
3. 实证分析
本文在分析黄金价格或其他金融资产的已实现波动率时,首先采用了单因子GARCH-MIDAS模型作为基础框架。这一模型能够捕捉到金融资产价格波动的内在动态性,为我们提供了关于市场波动状况的基础见解。随后,为了更深入地探究影响波动率的外部因素,我们在GARCH-MIDAS模型中引入了外生变量,如经济政策不确定性或投资者情绪等。这些外生变量的加入,旨在揭示它们与金融资产价格波动之间的潜在联系和相互作用。在确定模型的滞后期时,我们采用了信息准则作为选择标准,以确保模型能够准确地拟合数据并捕捉波动率的动态特征。通过这一方法,我们得到了几个不同配置的GARCH-MIDAS模型,每个模型都对应着不同的滞后期和外生变量设置。最终,我们比较了这些不同配置的GARCH-MIDAS模型的回归结果,以评估它们对已实现波动率的估计效果。这些结果不仅为我们提供了关于外生变量对波动率影响的具体信息,还为我们选择最优模型提供了依据。通过这一过程,我们能够更全面地理解金融资产价格波动的驱动因素,并为市场分析和投资决策提供有价值的参考。模型结果见表3,以下是这些模型及其主要结果的详细解释:
模型(1)为单因子GARCH-MIDAS模型,对应前文研究设计的式(5)、式(8)和式(9)。该模型仅考虑已实现波动率的单一因素。
和
参数均显著,该结构表明ARCH效应和GARCH效应显著,即说明短期波动具有显著的聚集效应。
,满足模型稳定的条件,同时由于值接近于1,说明了条件方差的持续性很强。
模型(2)和模型(3)为双因子GARCH-MIDAS模型。这两个模型在单因子模型的基础上加入了经济政策不确定性和投资者情绪作为额外的解释变量。短期波动成分由GJR-GARCH方程拟合,
均接近于1,反映出黄金价格具有较强的波动持续性。同时
和
均显著为正,说明黄金价格在短期看来波动有聚集性,正向的影响能够黄金价格的短期波动增大。
的估计值小于0,表明存在影响的非对称性,但不存在杠杆效应,即负面影响不会比正面影响引起更大的波动。
模型(4)为多因子GARCH-MIDAS模型,对应前文式(5)、式(13)和式(18)该模型同时考虑了经济政策不确定性和投资者情绪两个外生变量。模型的参数特性与双因子模型类似,显示出黄金价格短期波动的聚集性、持续性和非对称性。在分析GARCH-MIDAS模型的参数时,我们观察到所有模型的
参数均略微大于0。这一发现表明,当黄金市场面临正向冲击时,其短期内的价格波动反应是相对有限的,并不会立即引发剧烈的波动。这反映了黄金市场在面对利好消息时,其价格波动的响应机制相对平稳,避免了过度的市场波动。同时,参数
的值接近于1,这一结果揭示了黄金价格的短期波动在很大程度上受到前期波动的影响。换句话说,黄金市场具有较强的记忆性,其当前的价格波动往往会延续前期的波动趋势。这种波动持续性体现了黄金市场的一种稳定性机制,即市场倾向于在一段时间内保持其波动特征,而不是频繁地出现大幅度的变化。这种特性使得黄金价格在面对外部冲击时,其波动可能会持续一段时间,而不是立即消散。这些模型为理解和预测黄金价格的短期波动提供了有力的工具,并揭示了经济政策不确定性和投资者情绪在影响黄金价格短期波动中的重要作用。
Table 3. Model evaluation result
表3. 模型估价结果
参数值 |
参数 |
模型(1) RV |
模型(2) RV + dCEPU |
模型(3) RV + dCICSI |
模型(4) RV + dCEPU + dCICSI |
|
0.0312 |
0.0532 |
0.0254 |
0.0137 |
|
0.1302*** |
0.1201*** |
0.1060*** |
0.1171*** |
|
0.7623*** |
0.7713*** |
0.7245*** |
0.7928*** |
|
|
−0.0873*** |
−0.0671*** |
−0.0101 |
|
0.9683*** |
1.1108*** |
0.7033*** |
1.0680*** |
|
0.0063*** |
0.0059*** |
0.0052*** |
0.0050*** |
|
7.0012*** |
6.9022*** |
4.3312*** |
2.1079*** |
|
|
−0.0661** |
1.1378 |
−0.0252** |
|
|
1.3271*** |
1.7273** |
1.5951*** |
|
|
|
|
0.1250 |
|
|
|
|
4.1039** |
注:***、**和*分别代表在1%、5%和10%水平上显著。
从长期波动的视角来看,MIDAS模型的结果揭示了影响黄金价格波动的长期因素。
从模型(1)来看,已实现波动率(RV)的θ1参数显著为正,这表明当月的已实现波动率(RV)对下月的黄金价格波动率的长期成分有正向影响。换句话说,当月RV的增大将导致未来长期波动率也升高。
在模型(2)和模型(4)中,我们特别引入了经济政策不确定性(EPU)作为解释变量,并发现其对应的θ2参数显著为负。这一结果揭示了黄金价格的长期波动与经济政策不确定性之间存在一种独特的负向关联。具体而言,当经济政策不确定性增加时,我们可以观察到未来的长期黄金价格波动的部分并未随不确定性增加而上升,反而呈现出下降的趋势。这一现象可能源于投资者在宏观环境动荡时采取的行为策略。在处于经济政治环境剧烈变化的环境中时,投资者可能更倾向于遵循“Max-Min”准则,即最大化最小收益或最小化最大损失的策略。这种策略导致他们采取更为谨慎的投资态度,减少在黄金市场上的买卖活动,从而降低了市场的整体波动。这一发现与Bernanke (1983)的观点相契合,他提出当经济政策变化较大时,处于这一环境中的企业或投资者可能会选择增加等待时间,以获取更多信息来降低决策风险。在黄金市场上,这种行为表现为投资者减少交易,降低市场活跃度,从而在一定程度上减缓了价格的长期波动。
以模型(3)和模型(4)的视角,这两个模型还考虑了投资者情绪(IS)的变化。在对比经济政策不确定性(EPU)和投资者情绪的影响时,我们注意到投资者情绪变化的θ系数(在模型(3)中为θ2,在模型(4)中为θ3)呈现出正数但并不显著的特点。这一结果揭示了投资者情绪对黄金价格的长期影响相对较弱。具体而言,虽然投资者情绪的波动可能在短期内对黄金市场产生一定的影响,但在长期内,这种影响似乎被市场逐渐消化吸收。换言之,黄金市场似乎具备一种自我调节的机制,能够在长期内削弱或抵消投资者情绪带来的波动效应。这与经济政策不确定性的影响形成鲜明对比。经济政策不确定性的增加往往会直接反映在长期黄金价格的波动中,因为它涉及到更广泛和深远的经济因素。而投资者情绪,尽管在短期内可能对市场产生一定的扰动,但长期来看,其影响则相对有限。这一发现与Aggarwal et al. (2014)的观点相一致。
所有四个模型的ω估计结果均大于1,这意味着权重函数φk (ω)是递减函数。这表明距离当前时间越近,经济政策不确定性和投资者情绪变化对黄金价格波动的影响越大。也就是说,近期的信息或事件对黄金价格的长期波动具有更大的影响力。
综上所述,MIDAS模型不仅揭示了RV对黄金价格波动的直接影响,还深入分析了经济政策不确定性和投资者情绪在黄金价格波动中的长期作用。这些发现为理解黄金市场的动态行为提供了重要的洞见。
4. 结论
黄金价格波动的特征与影响因素是经济决策和投资规划的关键考量因素。本研究立足于风险规避和期望理论,将经济政策不确定性和投资者情绪纳入了综合分析框架,利用2018年至2024年的高频黄金价格日度数据和低频的投资者情绪指数以及政策不确定性等月度数据进行了深入研究。为了充分保留数据的原始信息,我们采用了混频模型进行分析。结果表明:(1) 黄金价格波动的自相关性:黄金价格波动表现出显著的自相关性,特别是长期系数为正,这意味着过去的黄金价格波动趋势对未来价格波动具有正向预测作用。换句话说,如果黄金价格在过去一段时间内呈现上升趋势,那么未来价格也很可能继续上涨;反之亦然。(2) 短期内的投资者情绪影响:在短期内,黄金价格的波动会受到投资者情绪波动的影响。具体来说,投资者情绪的正向冲击(如乐观情绪上升)会增大黄金价格的波动。这反映出市场情绪在短期内对黄金市场的直接影响。尽管短期内投资者情绪对黄金价格波动有显著影响,但从长期来看,这种影响变得不那么显著。这可能是因为市场在长期内能够逐渐消化和适应投资者情绪的变化,从而保持相对稳定的价格波动。(3) 长期的经济政策不确定性影响:从长期来看,经济政策不确定性的变化对黄金价格波动产生负向影响。这意味着在经济政策环境较为动荡的时期,黄金价格的波动性反而可能降低。这可能是因为投资者在经济不确定性高时更倾向于将资金转移到黄金等避险资产,从而减少了市场的整体波动性。