基于BP神经网络方法的量化投资——以券商为例
Quantitative Investment Based on BP Neural Network Method—Taking Securities Companies as an Example
DOI: 10.12677/SA.2023.125136, PDF, HTML, XML, 下载: 329  浏览: 1,439 
作者: 李佳宇:浙江财经大学,数据科学学院,浙江 杭州
关键词: BP神经网络量化投资证券行业R语言BP Neural Network Quantitative Investment Securities Industry R Language
摘要: 本文先是对BP神经网络以及量化投资的历史进了简的解,再是对BP神经网络以及量化投资的原理做了基本的说明,并且对我国证券行业从几个宏观的角度做了分析。最后以R语言中的neuralnet函数建立了我国证券行业的研究模型。基于BP神经网络预测的可靠性,以我国证券板块为研究对象,从我国整个证券行业中选取年度财务数据,以其中554组数据作为BP神经网络的训练集,再结合中信证券2005年至2020年的16组真实的数据,使经过训练的BP神经网络模型对其进行预测,并且通过预测的数据与实际的数据对比,最终得到了较为可靠的模型,并根据此模型成功选取了10支股票,并以此提出了一些投资建议。
Abstract: Firstly, this paper briefly explains the history of BP neural network and quantitative investment, then makes a basic explanation of the principle of BP neural network and quantitative investment, and analyzes China’s securities industry from several macro perspectives. Finally, the research model of China’s securities industry is established by using the neuralnet function in R language. Based on the reliability of BP neural network prediction, taking China’s securities sector as the research object, this paper selects the annual financial data from the whole securities industry in China, takes 554 groups of data as the training set of BP neural network, combined with 16 groups of real data of CITIC Securities from 2005 to 2020, makes the trained BP neural network model predict it, and compares the predicted data with the actual data. Finally, a more reliable model is obtained, 10 stocks are successfully selected according to this model, and some investment suggestions are put forward.
文章引用:李佳宇. 基于BP神经网络方法的量化投资——以券商为例[J]. 统计学与应用, 2023, 12(5): 1324-1335. https://doi.org/10.12677/SA.2023.125136

1. 引言

1.1. 研究背景与研究意义

利用数量化以及计算机标准化的方法产生交易的信息,以便获取比较稳健回报的交易技称作为量化投资。量化投资在国外的发展时间已经超过了三十年,投资的效益相对来说比较稳定。而且随着更多的投资者认可此方案,其市场的规模会越来越大。近几年,我国的量化投资也得到了一定程度的发展,但相比于国外而言,还是处于比较初级的阶段。

定量投资在实质上和定性投资是一样的,两者都是基金管理人以市场非有效性或弱有效性为基准,建立投资方案,从中获取相应的利润。量化投资和传统的定性投资的区别主要在于模型的建立。其中定性投资相对比较偏感性,主要依靠经验和感觉来判定是否投资。而量化投资相对比较偏理性,是通过所建立的模型输出结果来做出投资决策。

量化投资的四个特征,分别为纪律性、系统化、套利思维和以概率取胜。纪律性是指对量化投资的每一个决定都是通过模型来确定的,它最大的好处就是能够克服个人的非理性因素影响以及认识上的误差,因为做出的每一次决定都有着大量的历史数据作支撑。系统性体现为全方位、多角度的数据,相对于人脑的有限性,量化投资可以处理更多的数据,从而抓住其中隐藏的机遇。套利思维,则是指通过寻找估值洼地买低卖高的思维方法。概率取胜有两个方面,一是找出和运用有概率在未来重复的历史,二是通过组合证券,而并非单个或零散的证券取胜。

其实在以个人投资为主的年代,量化投资是并不会出现的。因为个人投资者既没有足够的时间,也不具备这样的专业能力。但是伴随着退休基金以及共同基金的急剧增加,并且产生了金融市场上的主要机构投资人,并委托专门金融机构开展投资的运作。从而在管理大量资金时,就会要求新的运营方法以及资金创新的技术手段,而资金管理人也比个人更有实力和精力投入研发以及利用这种新技术手段。

BP神经网络一般是指利用误差逆向传递方法训练多层前馈神经网络的一种模式,它被广泛地用于函数逼近、模型识别、数据分类和数据压缩等领域。经过三十多年的发展,BP神经网络在理论和性能方面已经相对比较成熟。BP神经网络具备两个突出的优势,一是拥有着强力的非线性映射的功能,另一种是有着柔性的网络构架。

在证券行业的发展过程中,经过2005年至2006年的股权分置改革和2012年的第一次证券业创新大会,中国证券业金融创新迎来了良好的发展时期,证券业务全面繁荣,融资融券,证券公司的资产管理和跨境业务迎来了快速发展的时期。根据中国证券交易所发布的133个券商报告表明,未经审计的财务报表显示,2019年133家券商实现营业收入3604.83亿元,环比增长35.37%;2019年实现了1230.95亿元的净利润,增长超过500亿元,环比增长超过80%。因此,我们认为券商行业有较好的未来和研究前景。

综上所述,本文主要结合BP神经网络与量化投资并根据券商行业的数据做出相应的模型,最终根据模型对券商行业投资提出可靠的建议。

1.2. 国内外研究现状和分析

1.2.1. 国外研究现状

BP神经网络是一种数学模型,它具有一定的预测功能。P神经网络是一种仿照人类大脑神经网络,它具有很强的自我学习能力和很强的容错性。因此,BP神经网络适合用于量化投资的预测分析。在国外的量化投资技术已经相对成熟,而且被大多数人所接受以及使用。

早在1943年,Mcculloch W和Pitts W [1] 就提出了BP神经网络模型,以及提出了根据神经网络对市场上的信息做出相应的调整和处理的方法。然后,White H [2] 运用了BP神经网络模型对未来的股价走势作出了预估计,即定量投资,他还利用了对样本(1988年IBM股票的每日报酬率)数据的估计,得到了比较好的预测效果。1996年,Gencay [3] 以美国的道琼斯工业平均价格指数1967~1988的历史数据作为样本,通过用BP神经网络模拟的实证数据分析与模拟检验,得出了较好的的实证结果。Arnold F. Shapiro [4] 将遗传算法引入到BP神经网络建模系统中,使BP神经网络获得了更进一步的完善和提高,而Kimk [5] 将支持向量机建模与BP神经网络建模系统结合。由此,BP神经网络的结构得到了进一步的改进,使得BP神经网络的结构更加准确。Zhang G P [6] 使用了同一组数据分别构建了ARIMA模型和BP神经网络模型,并且对比ARIMA模型和BP神经网络模型的数据,分析证实得出了BP神经网络模型的估计结果确实要好于ARIMA模型的预测结果。Ticknor J L [7] 发明了叶贝斯正则化的神经网络,并运用了金融关键技术指标预报了股价走势,并最终取得了比较好的效果。

1.2.2. 国内研究现状

我国目前主要还在使用传统的投资方法,对量化投资的关注与应用是在近几年才得到了一定的发展。因此国内基于神经网络的量化投资领域相对于国外的量化投资还不够发达。

邢娟 [8] 以钢铁企业的套期保值投资作为对象,通过研发黑色金属行业产品现货的量化投资系统,形成了针对钢材制造行业产品现货投资的量化投资系统,并利用量化投资的系统实现了投资结果,并且使公司利润达到了最大化。李子睿 [9] 确定了量化投资趋势择时战略,对沪深三百指数期货开展剖析,刘白兰、朱臻 [10] 用沪深三百指数和中小板价格指数建立了根据均线体系择时的交易方式,两者买卖的收益都要优于买入的单纯持股战略,同时投资风险也可以限制在较低的范畴之内。蒋树国 [11] 先生为了证明葛兰碧趋势择时法则可以在我国适用,他选取了上证综合指数的数据,并采用了葛兰碧法则的验证分析法,结果得到了比较好的预期效果。李响 [12] 则是运用BP神经网络模型,以我国的股市市场作为样本,对股市进行择时分析,并得出了很好的模型预测效果。赵晨 [13] 等人将BP神经网络的神经网络模型与思想演化相融合,并应用于股市的预测中,从而得到了比传统的BP神经网络更优的预测水平。周德红、冯豪 [14] 等人成功的利用了遗传算法优化后的BP神经网络评估了地震死亡人数,遗传算法优化后的BP神经网络相比于传统BP神经网络具有更高的逼近精度。我国的金融体系日趋成熟,定量投资在我国发展迅速,逐步形成了一个新的研究热点。定量投资逐渐被国内市场投资者所接受。机构投资者也开始尝试在国内金融产品交易中使用量化投资来降低风险。

1.3. 研究的发展趋势和展望

基于BP神经网络的量化投资在国内发展还并不算发达,国内对其的研究相对于国外还较匮乏。然而基于BP神经网络的优势以及国内金融行业的快速发展,传统的投资方法需要得到革新,因此它在国内的发展前景还是十分可观的。

随着量化投资的蓬勃发展,单个策略其实很难能够在长时间内稳定的获利,因而针对这个状况,基于对市场信息的更广阔的需求,并发挥量化投资覆盖面广的优点,将多个互补的策略融合在一起,来达到一个稳定的盈利状态。目前,最常见的方法是将股票量化投资与套利投资组合,以及将量化股权投资和CTA投资相结合。未来这个多策略融合运用将会更加的深入,发展趋势也会更加稳健的攀升。

未来中国国内的量化投资技术将会更加的发展与完善,而且会出现分化和融合并行,在人工智能等技术方面会有进一步的渗透,因此量化类多头策略也将会进一步的壮大。

2. 我国券商行业的宏观分析

数据的来源:以下文章的资料数据主要来自于国家统计局网站、东方财富,真实可靠。

样本数据选择的是东方财富证券行业的相关数据。技术指标依次分为:每股收益、资产负债率、营业净利率、每股净资产、固定资产净额、利润总额、净利润。一共拥有48个上市券商1995年至2020年的570组财务数据。其中,前554组数据作为训练组,后16组数据则作为测试组。通过BP神经网络实验所得到的每股收益预测数据,与实际的每股收益进行对比分析,从而检验BP神经网络模型的可靠性。

2.1. 券商行业近年形势

券商即是经营证券交易的公司,或称证券公司。由于巨大的人口基数、不断提高的人均收入以及不断提高的财富管理能力的影响,我国券商行业有可能成为最具投资前景的赛道之一。因此,本文先从股票成交金额、债券成交额、证券投资基金成交金额以及期货总成交额四个角度分析券商行业的近年行情。

2.1.1. 股票成交金额角度

Figure 1. Stock transaction amount and growth rate from 2012 to 2020

图1. 2012~2020年股票成交金额及其增长率

图1发现:我国证券市场的股票成交金额从2012年的31.5万亿到2015年的255万亿逐年增长,而从2016年到2018年逐年股票的成交金额减少至90万亿,从2019年到2020年有所回涨至206.8万亿。总体来看,2012年到2020年股票成交金额增长了6.6倍。值得注意的是2015年的股票成交金额环比增长率高达250%,而2016年至2018年股票成交金额出现负增长。针对此异常状况分析后发现:2015年的股票成交金额井喷式增长是由于2015年上半年我国股市的大幅上涨,而2016年至2018年的股票成交金额下跌是由于2015年的下半年发生了股灾。从上半年大盘突破5000点到下半年大盘跌破3000点,仅仅用了不到三个月的时间,这就使得后续两年的股票成交金额出现了负增长。

2.1.2. 债券成交金额角度

Figure 2. Bond transaction amount and growth rate from 2012 to 2020

图2. 2012~2020年债券成交金额及其增长率

图2可知,我国证券市场债券成交金额从2012年到2017年持续五年的增长,从40.3万亿至268.8万亿,2017年到2018年债券成交额出现负增长,2019年至2020年的债券成交金额上升并在2020年出现新高度。针对2018年我国证券市场债券成交金额的异常状况分析后发现:在2018年的“去杠杆”大环境下,多数企业无法依靠“借新还旧”的模式生存。因此这类企业很容易出现违约的状况。总之,债券市场在2018年年初大幅下跌以及继续发行国开债券等消息的影响下,在利率的上行周期中,债券市场的情绪极为脆弱,看空的声音远大于看多的声音。导致了2018年的债券成交金额出现负增长的状况。

2.1.3. 证券投资基金成交金额角度

Figure 3. Transaction amount and growth rate of securities investment funds from 201 to 2020

图3. 201~2020证券投资基金成交金额及其增率由

图3统计可知,我国证券投资基金成交金额从2012年至2020年总体呈现增长趋势,从0.87万亿至13.6万亿元,增长了近17倍。值的注意的是2014年以及2015年连续两年的环比增长率超过了200%,且在2015年达到了近几年的最高点。针对这两年我国证券市场证券投资基金成交金额的快速增长状况开展分析研究发现:证券投资基金成交金额受股市的影响巨大,其交易额的波动随股票交易额的波动而波动。因此2015年证券投资基金成交额巨大是受牛市的影响,而之后两年的下跌,也是股市大盘的下跌所产生的连锁效应。

2.1.4. 期货总成交金额角度

Figure 4. Total futures trading amount and its growth rate from 2012 to 2020

图4. 2012~2020年期货总成交金额及其增长率

图4统计可知我国证券市场期货总成交金额从2012年的171.1万亿增长至2020年的473.3万亿,增加了2.5倍以上,尽管期间有一些波动,但总体还是处于上升趋势。

从股票成交金额、债券成交额、证券投资基金成交金额以及期货总成交额四个角度分析券商行业的近年行情,可以得出证券市场尽管有时会波动,但长期是处于上升趋势的,且增长的速率较快,与本文预期的状况相一致,因此可以推测中国券商行业将成为中国最具投资前景的赛道之一,在未来有着较好的投资前景。

3. BP神经网络的建立与分析

3.1. BP神经网络的理论基础

3.1.1. BP神经网络的基本思想

BP神经网络算法就是误差的逆传播算,一般是指由BP算法来训练的多前馈神经网络,而图5是一个简单的BP神经网络结构拓补图。BP神经网络分为输入层、隐含层、输出层。其中输入层和输出层只有一层,但隐含层可能有多个层。其中 X 1 , X 2 , X 3 , , X n 作为输入值, Y 1 , Y 2 , , Y p 作为输出值即预测值,隐含层中每一个都有一个权重记为 ω 1 , ω 2 , ω 3 , , ω j 。此神经网络描述了从n个不同的自变量到p个因变量相互之间的函数映射的关联。

BP神经网络的基本思想是梯度下降法。BP神经网络采用了基于梯度法的方法,使得输出的真实值与预期输出值之间的方差之和最小。而所谓的“梯度下降法”,则是通过调节输入端与隐藏层的连接强度以及隐含层节点与输出层节点的连接强度和阈值,使得误差在梯度上逐步降低,再经过多次的学习和培训,最终得到最小误差相应的权重和阈值,从而结束训练。

Figure 5. Supplementary representation of BP neural network structure

图5. BP神经网络结构补表示图

3.1.2. BP神经网络的传递函数

Sigmoid函数是BP神经网络所采用的传递函数,它是一种非线性的变换数。Sigmoid函数具有比较好的函数性质,Sigmoid函数本身及其导数都是连续函数,因此在模型的处理以及应用上会比较方便。Sigmoid函数为:

f ( x ) 1 1 + e x

3.2. BP神经网络模型设计

本文的模型设计主要分为以下几个步骤:

第一步:实验所需包的准备。

首先检测R中是否含有包“neuralnet”,若不存在,则先通过install.Packages函数下载包“neuralnet”再用library函数加载包,以便接下来的函数模型使用。

第二步:数据的录入及预处理。

读取数据是通过使用r语言的read.table函数分别读入100组,300组,554组的训练数据,并用函数进行归一化处理,方便后续实验的进行。其中,Y:每股收益,X1:资产负债率,X2:营业净利率,X3:每股净资产,X4:固定资产净额,X5:利润总额,X6:净利润。

第三步:确定数据最优样本数。

以100组,300组,554组的训练数据和目标数据进行实验,并进行预测对比数据10组,15组,16组。函数的各类参数都需一致。实验的可视化结果如图6所示。

说明:图6中的纵坐为合数值,横坐标是目标数值,而对角线是完全拟合的状态,图中红色的点是预测的真实数值,与直线的距离越小则说明误差越小,即拟合的状态越好,反之,若真实值与直线的距离越大则说明误差越大,即表示拟合的状态越差。

从三个图像中的显示对比,不难看出神经网络的训练效果与数据的数量有着明显的的正向关系,数据越多拟合的效果就会越好,与预期相一致。所以在接下来的实验中本文将选取554组的数据进行训练。

第四步:确定隐含层神经元个数。

本文使用三个层的BP神经网络模型,分别是输入层,隐含层,输出层。在输入层方,有7个神经元,而输出层神经元数目为1个。最后需要决定隐藏层神经元的数量,而隐藏层神经元个数的选择一般

Figure 6. Visualization of three groups of training results

图6. 三组训练结果可视图

根据常用的公式:

l = n + m + α

在这些参数中,l表达了隐含层最优神经元数目,n代表的是输入层的神经元数目,m指的是输出层神经元数目,α则为一个1到10的任何常数。由此可得出隐含层最佳个数在4~14之间。本文选择7个神经元做实验。

第五步:绘制神经网络拓扑图。

Figure 7. Seven neuron extension graph

图7. 七个神经元拓补图

先是利用neuralnet函数训练训练集,得到实际的输出值与期望的输出值的误差平方和最小的函数模型,并利用plot函数绘制出神经网络拓补图,由神经网络拓补图可知一共进行了8842次迭代,迭代结束时,损失函数为0.168,线上的数据则为相应的联接强度,如下图7所示。

第六步:对测试集做出预测

从整个证券行业的公司中随机抽取一个公司股票作为预测的对象,使用sample函数随机抽取一组股票,抽中为中信证券,以中信证券作为测试集,根据中信证券2005年至2020年的相关指标数据做出其每股收益的预测,并将预测的每股收益与真实每股收益数据做对比,计算其预测值与真实值的相关性。

3.3. 基于BP神经网络的预测

利用compute函数获得每股收益预测值,其中每股收益预测值与每股收益真实值都是归一处理之后的数值。每股收益预测值与真实值对比,如表1所示。

Table 1. Predicted and true earnings per share of CITIC securities

表1. 中信证券每股收益预测值与真实值

从以上的数据不难看出中信证券股票的每股收益在2005年至2020年预测的结果与实际值基本一致。本文为了进一步检验模型的可靠性,基于以上每股收益的预测值与真实值,计算其均方误差MSE为0.001,均方根误差RMSE为0.33,平均绝对误差MAE为0.22。

特此,绘制了每收的预测值与真实值的对比图8。综合上述数据以及图表可以看出模型的拟合效果较好。由此可以得出基于BP神经网络的训练所得出的模型拟合优度比较高,预测结果比较准确。

本文基于上述BP神经网络模型,预测出2022年所有上市证券公司的每股收益,以每股收益从高到低进行排序,最终选出每股收益最高的10个证券公司,如表2所示。

Figure 8. Comparison between real and predicted earnings per share

图8. 每股收益真实值与预测值对比图

Table 2. Top 10 securities companies' earnings per share forecast for 2022

表2. 2022年券商每股收益预测前十

每股收益也称为税后每股利润和每股盈余,指税后利润与总股本的比率。也可理解为普通股股东每持有一股所拥有的公司的净收益,或公司的净损失。每股收益一般是用来反映公司的运营业绩,度量公司的盈利和投资的风险。这是一个非常关键的金融指标,可以用于评估企业的盈利能力,预测企业的发展前景,从而作出相应的经济决定。

因此,本文根据BP神经网络模型预测出2022年所有上市证券公司的每股收益,并根据所预测的每股收益对证券公司进行排名,选取所预测每股收益排名前十的证券公司,进而对投资者提出相关的投资建议。根据表2所示十个证券公司2022年每股收益的预测值都在1.15%以上,因此认为这十个证券公司的2022年经营状况良好,其公司股票往往较优,尤其是国泰君安以及中信建投的每股收益预测都在2.5%以上,比排名第三的财通证券高了将近0.9%。因此,本文建议投资者在2022年关注这十个证券公司的股票,特别是国泰君安以及中信建投。

以每股收益的预测值为权重,选取排名前5的股票进行投资组合。其中国泰君安占总投资额的27.6%;中信建投占总投资额的25.3%;财通证券占总投资额的16.5%:中金公司占总投资额的15.4%;广发证券占总投资额的15.3%。

4. 结论建议及不足

4.1. 研究结论

本文以券商行业为研究的目标,先是通过国家统计局的数据以及文献研究了212年至2020年国券商行业的近几年发展趋势。通过研究发现即使在2016年至2018年我国的证券市场的总交易额有所下跌,但从2019年到2020年我国的证券市场的总交易额有所上涨,并且我国证券市场的总交易额总体处于增长趋势。由此可推测,在未来的几年间,若无特殊的政策或社会环境的影响我证券行业的总交易额将会继续保持上升趋势,并且增长率会在相对稳定。

本文结合了券商行业的相关数据样本,通过对不同数量的训练集的拟合优度对比,确定了最优的训练样本数,并且通过对比不同隐含层的拟合优度,确定了隐含层的神经元个数为7,最终成功绘制出了神经网络拓补图,并且成功估计了中信证券16组的每股收益数据。最终基于BP神经网络模型成功选取了2022年每股收益前10的股票。由此得出基于BP神经网络的训练所得出的模型拟合优度比较高,预测结果比较好,对投资者进行量化投资有一定的参考价值。

4.2. 建议及不足

结合本文宏观层面的数据分析以及基于BP神经网络的模型构造及预测的结果,提出以下几个关于证券行的建议:

1) 本文所选的10支股票的每股收益比较可观,且从长期角度看,证券行业是具有较大上升空间的。因此,建议投资者长期关注。

2) 本文所用设立的BP神经网络模型可对证券行业的每股收益进行预测,从而对证券行业的股票投资具有一定的参考意义。

3) 本文不建议完全依赖此模型。因为模型仍有许多不足之处,需要加以完善,建议投资者结合其他模型以及实时的数据,从而做出更加准确的决策。

参考文献

[1] McCulloch, W.S. and Pitts, W. (1943) A Logical Calculus of the Ideas Immanent in Nervous Activity. The Bulletin of Mathematical Biophysics, 5, 115-133.
https://doi.org/10.1007/BF02478259
[2] White, H. (1988) Economic Prediction Using Neural Network: The Case of IBM Daily Stock Returns. IEEE 1988 International Conference on Neural Networks, San Diego, CA, USA, 24-27 July 1988.
https://doi.org/10.1109/ICNN.1988.23959
[3] Gençay, R. (1996) Non-Linear Prediction of Security Returns with Moving Average Rules. Journal of Forecasting, 15, 165-174.
https://doi.org/10.1002/(SICI)1099-131X(199604)15:3<165::AID-FOR617>3.0.CO;2-V
[4] Shapiro, A.F. (2002) The Merging of Neural Networks, Fuzzy Logic, and Genetic Algorithms. Insurance: Mathematics and Economics, 31, 115-131.
https://doi.org/10.1016/S0167-6687(02)00124-5
[5] Kim, K.J. (2003) Financial Time Series Forecasting Using Support Vector Machines. Neurocomputing, 55, 307-319.
https://doi.org/10.1016/S0925-2312(03)00372-2
[6] Zhang, G.P. (2003) Time Series Forecasting Using a Hybrid ARIMA and Neural Network Mode. Neurocomputing, 50, 159-175.
https://doi.org/10.1016/S0925-2312(01)00702-0
[7] Ticknor, J.L. (2013) A Bayesian Regularized Artificial Neural Network for Stock Market forecasting. Expert Systems with Applications, 40, 501-5506.
https://doi.org/10.1016/j.eswa.2013.04.013
[8] 邢娟. 基于数据挖掘的量化投资系统的研究[D]: [硕士学位论文]. 济南: 齐鲁工业大学, 2017.
[9] 李子睿. 量化投资交易策略研究[D]: [硕士学位论文]. 天津: 天津大学, 2013.
[10] 刘白兰, 朱臻. 双向交易背景下的指数基金量化投资研究[J]. 海南金融, 2012(5): 4-7.
[11] 蒋树国. 量化投资趋势策略分析和研究——基于葛兰碧法则[D]: [硕士学位论文]. 北京: 对外经济贸易大学, 2016.
[12] 李响. 基于BP神经网络的股价预测[J]. 大连海事大学学报, 2008, 34(S1): 114-116.
[13] 赵晨. 动态神经网络在量化投资预测中的应用[D]: [硕士学位论文]. 上海: 复旦大学, 2014.
[14] 周德红, 冯豪, 程乐棋, 李文. 遗传算法优化的BP神经网络在地震死亡人数评估中的应用[J]. 安与环境学报, 2017, 17(6): 2267-2272.