大数据背景下金融风险模型的统计分析
Statistical Analysis of Financial Risk Model under the Background of Big Data
DOI: 10.12677/aam.2024.1312509, PDF, HTML, XML,    国家自然科学基金支持
作者: 刘成良, 吴 盟, 王绪钰:山东农业工程学院国土资源与测绘工程学院,山东 淄博;甄肖燕*:山东农业工程学院基础课教学部,山东 淄博
关键词: 金融风险人工智能蒙特卡洛模拟时间序列模拟Financial Risks Artificial Intelligence Monte Carlo Simulation Time Series Simulation
摘要: 本文聚焦于金融风险管理的统计预测,运用VaR理论结合蒙特卡洛模拟,对金融风险进行了量化分析。研究中,以上证指数数据为样本,精确计算了上证指数的VaR值。基于资产定价理论,结合沪深市场数据,深入剖析了关键风险因子,并利用时间序列预测模型(如SMA)预测了主要股票指数的未来趋势及潜在亏损风险。此外,我们还创新性地引入社交媒体金融舆情分析,通过微博热搜数据评估社会风险系数,拓宽了风险监测的维度。在贵金属与外汇市场方面,我们同样进行了详尽的风险系数计算,剔除了市场正常波动,确保分析的准确性和针对性。基于上述综合分析,我们构建了一个集成化的金融风险反应模型,并利用Matlab平台结合机器学习技术,设计了一套金融证券风险反应程序。该程序能够实时接入证券等相关数据,对当前金融风险进行精确计算和深入分析,为金融业的稳健发展提供有力的指导和风险防范措施。
Abstract: This paper focuses on the statistical prediction of financial risk management, and uses VaR theory combined with Monte Carlo simulation to quantitatively analyze financial risks. In the study, the VaR value of the Shanghai Composite Index was accurately calculated using the Shanghai Composite Index data as a sample. Based on the asset pricing theory, combined with the Shanghai and Shenzhen market data, the key risk factors are analyzed in depth, and the future trend and potential loss risk of the main stock indexes are predicted by using the time series prediction model (such as SMA). In addition, we also innovatively introduce social media financial public opinion analysis, and evaluate the social risk coefficient through Weibo hot search data, which broadens the dimension of risk monitoring. In the precious metals and foreign exchange market, we also carried out a detailed calculation of the risk coefficient, eliminating the normal fluctuations in the market to ensure the accuracy and pertinence of the analysis. Based on the above comprehensive analysis, we construct an integrated financial risk response model, and use Matlab platform combined with machine learning technology to design a set of financial securities risk response program. The program can access securities and other related data in real time, accurately calculate and deeply analyze the current financial risks, and provide strong guidance and risk prevention measures for the steady development of the financial industry.
文章引用:刘成良, 吴盟, 王绪钰, 甄肖燕. 大数据背景下金融风险模型的统计分析[J]. 应用数学进展, 2024, 13(12): 5275-5289. https://doi.org/10.12677/aam.2024.1312509

1. 引言

近年来,随着大数据与人工智能技术迅速发展,全球经济一体化和金融市场的国际化水平显著提升,推动金融领域朝着智能化、创新化和数字化的方向不断演进。然而,面对经济波动与地缘政治紧张等因素的挑战,金融业的风险日益凸显,这使得对金融风险管理的深入研究变得尤为迫切。

融合大数据与前沿人工智能技术,能高精度评估和预测金融风险[1],为金融机构定制方案策略,助其在多变市场中稳健发展,也为金融市场筑牢防线,为监管部门提供决策支持,保障金融体系安全。在大数据和AI技术快速发展的当下,金融领域变革深刻,虽伴难题,但深入研究金融风险能提升机构管控能力,对金融监管和市场稳定关键。金融风险具多种不确定性,Value-at-Risk理论有局限,资产定价理论受影响,蒙特卡洛模拟和时间序列模拟用于管理与定价[2] [3]。为了弥补这些不确定性带来的影响,本文综合多种理论方法,结合大量案例数据,探寻更有效风险管理路径,支持金融行业稳定发展[4]

2. 研究设计

2.1. 总模型建立

影响金融发展的主要是客观因素和主观因素两部分组成,各种因素综合下,可得出下列式子:

=+ (1)

主观影响系数取决于个人想法等主观因素影响无法计算,但仍受客观因素影响。本文主要考虑客观风险系数对金融风险发生率的影响。进而,可给出影响客观风险系数的相关统计建模模型:

= μ 1 + μ 2 ++ μ i ++ μ X X (2)

其中, μ i 为风险因子,将其综合平均后得出总风险系数,即为客观风险系数。

本文为简便计算,主要考虑Value-at-Risk (VaR)理论的风险因子( μ 1 )、风险度量理论的风险因子( μ 2 )、时间序列模拟模型求解的风险因子( μ 3 )、社会大众的影响的统计数据及金价货币变化实际数据的求解的风险因子( μ 4 ),上述模型则可简化为:

P( ΔVVaR )=1c (3)

其中:

VaR F( x )dx =1c (4)

F( x ) 为社会风险系数,x为金价系数,c为货币系数。

2.2. 风险因子模型建立

2.2.1. VaR理论

根据VaR理论,在一定时期下,一般的市场条件和置信水平下,预期可损失的最多金额则为风险价值(VaR),一般由下列式子表示:

P( ΔVVaR )=1c (5)

用积分表达为:

VaR F( x )dx =1c (6)

其中 F( x ) 是关于x的概率密度函数。

基于VaR理论,在置信水平c下,资产或投资组合的损失最多的值为VaR,并通过蒙特卡洛模拟[5]求解:

Var( x ) s 2 = 1 N1 i=1 N ( X i X ¯ ) 2 (7)

其中:

X ¯ = 1 N i=1 N X i (8)

N通常表示模拟中生成的样本数量(或称为“试验次数”或“迭代次数”)。本文x取值为收盘价信息。

我们以VaR与初试资金之比为可能损失比例,近似代替损失概率,则损失概率可表达为下式:

P 1 = VaR C ×100% (9)

其中,C为初始资金,在VaR理论下,可利用 P 1 来近似 μ 1 ,即:

μ 1 = P 1 (10)

2.2.2. 资产定价理论

在资产定价理论的风险度量中,认为风险越高的资产预期收益也应越高[6]。CAPM基于这一理论,提供了一种衡量资产风险与预期回报之间关系的数学模型:

E( Ri )=Rf+βi×( E( Rm )Rf ) (11)

其中 E( Ri ) 是资产i的期望回报; Rf 是无风险利率; E( Rm ) 是市场组合的期望回报; βi 是资产i的贝塔系数,是资产相对于市场组合的波动性相关衡量。为方便模型求解,将公式(11)简化为:

E=F+ν×( MF ) (12)

在上述式子中, E=E( Ri ) R=Rf v=βi M=E( Rm )

基于此,我们可以给出下式:

μ 2 = P 2 =1ν=1 EF MF ×100% (13)

2.2.3. 时间序列模拟

以股票为例,采用时间序列预测的简单移动平均(SMA)方法,对其在未来一段时间内的走向进行预测和分析,进而获得该时间段内的股票盈亏情况。

SM A t = x t + x t1 ++ x tn+1 n (14)

其中 SM A t :在时间点t的简单移动平均值。 x t :时间点t的实际数据值。n:移动平均的窗口大小或周期,即用于计算平均值的过去数据点的数量。

得到相关图像走向后,通过拟合得出来的股票走向函数在某时间段单调递增(上涨)定为“收益”,单调递减(下跌)定为“亏损”。基于此,可根据下列式子进行盈亏概率的估计:

P 3 = m n G( x )dx t 1 t 3 G( x )dx ×100%( m,n[ t 1 , t 3 ] ) (15)

其中 G( x ) 为图像拟合后的近似函数。

在公式(15)中, t 1 t 3 是预期的起始时间与结束时间,mn为出现实时收益减少的起始时间和结束时间。

一般情况下,在预期变化下,函数不止一段增加减少,公式(12)可改写为更为一般的表达式:

P 3 = m 1 m 2 G( x )dx + m 3 m 4 G( x )dx ++ m i m i+1 G( x )dx ++ m n3 m n2 G( x )dx + m n1 m n G( x )dx t 1 t 3 G( x )dx ×100% (16)

即:

P 3 = m i m i+1 G( x )dx t 1 t 3 G( x )dx ×100%,( m i , m i+1 [ t 1 , t 3 ] ) (17)

需要注意的是, m 1 m 2 、…、 m n1 m n 不一定在时间上是连续的,更多的是分时间段的区间表示。

在时间序列模拟中,最终模拟出的图像未必可全部拟合成可以用积分所求的函数表达式,更多的是积分不便计算、无法计算的无规则的函数。而在函数递减的情况时,函数的导数小于0,对此可以利用函数的导数进行计算。

在实际股票交易过程中,股票在正常范围内的“上涨”、“下跌”的调整属于正常现象,为避免不正

常计算增加误差,一般采用的是 dy dx < 3 3 为相关指标。

为简化计算,以时间因素作为参考依据,将在函数的导数小于0的时间段和总时间段作为参考依据进行近似拟合,可得公式:

P 3 = T( dy dx < 3 3 ) T ×100% (18)

其中, T( dy dx < 3 3 ) 为所统计的时间区间内符合指标的时间段, T 为总时间段。 P 3 为所求的在当前时

间段内继续进行“持仓”后在未来一段时间内可能“亏损”的概率,将 P 3 作为未来的结果用到当前的模型中,可得出模型因子 μ 3

μ 3 = lim t0 P 3 (19)

2.2.4. 社会因素、金价、货币

在社会因素中,根据群众对当下金融、政治等影响金融风险的新闻等相关数据分析,得出社会风险系数 α

α= ×100% (20)

在金价和货币汇率变化中,金价系数 β 、货币系数 δ 则有下列式子进行计算:

β= ×100% (21)

δ= ×100% (22)

结合上面所有的论述,将公式(10)、(13)、(19)、(20)、(21)、(22)代入公式(3)得:

T( dy dx < 3 3 ) (23)

整理后得:

P 3 (24)

上述式子即为本论文所探讨的金融风险反应模型。

2.3. 模型图像样例图

由于金融的客观风险系数随时间变化而变化,不为固定值,正常情况下不会超过临界值A,当客观风险系数超过临界值A时,发生金融危机等的风险较高。这里,我们给出客观风险系数变化见图1

Figure 1. Sample plot of the change in objective risk coefficient

1. 客观风险系数变化样例图

3. 实证分析

3.1. 实例一

基于金融证券风险反应模型,利用VaR理论,根据蒙特卡洛模拟理论,结合下面的实例计算说明如何求解Value-at-Risk (VaR)理论的风险因子。

我们统计了自2024年1月2日到2024年4月23日上证指数、深证指数、创业板指数三大指数开盘价、收盘价等信息,为做总体市场风险概率计算,将三大指数收盘价等代替具体股票,进行接下来的计算。以上证指数为例,给出在该段时间其变化趋势见图2

Figure 2. Daily K change chart of the Shanghai Composite Index

2. 上证指数日k变化图

在Value-at-Risk (VaR)理论,我们可以根据蒙特卡洛模拟相关理论,通过蒙特卡洛模拟来进行VaR的计算[7]。设定模拟次数为10000次,持有期30天,置信水平为0.99,初试价格为最后一天的收盘价,使用上证指数相关数据,利用MATLAB将数据进行相关分析,见图3图4

经过计算求得在99.00%置信水平下,上证指数的VaR为:494.4056。

类比上述做法,我们可以得出深证指数与创业板指数的VaR值,将所求出来的结果带入(9),得出三大指数的相关结果,见表1

Figure 3. Monte Carlo simulates the path of the Shanghai Composite Index

3. 蒙特卡洛模拟上证指数路径

Figure 4. The final normal distribution of total assets after 30 days

4. 30日后最终总资产正态分布图

Table 1. Shanghai and Shenzhen market related data

1. 沪深市场相关数据

三大指数

VaR

可能损失比例

上证指数

504.3847

16.90%

深证指数

1893.0697

20.61%

创业板指数

389.7188

22.23%

将上述数据进行计算,得出模型 μ 1 =19.91%

3.2. 实例二

在资产定价理论中,令股息率近似代替市场组合的期望回报,以市净率代替资产期望回报,基于本文构建的金融证券风险反应模型,下面以沪深市场[7]三个月内的相关数据为例,计算风险度量理论的风险因子,见表2

Table 2. Shanghai and Shenzhen market related data

2. 沪深市场相关数据

统计指标

市净率

股息率

日无风险利率

沪深市场

1.43

2.26

0.000068

将上述数据带入式(13):

μ 2 =1ν= 1.430.000068 2.260.000068 ×100%38%.

3.3. 实例三

利用实例一,借助时间序列预测的简单移动平均(SMA)方法模拟出三大指数未来30日的发展趋势,并结合三大指数的收盘价等信息为统计数据,计算出未来出现“亏损”的概率,见图5~图7表3

Figure 5. Forecast chart of the Shanghai Composite Index after 30 days

5. 上证指数30日后的走向预测图

Figure 6. Forecast chart of the SZSE Index after 30 days

6. 深证指数30日后的走向预测图

Figure 7. Forecast chart of the ChiNext index after 30 days

7. 创业板指数30日后的走向预测图

Table 3. 30-day stock trend forecasts for the three major indices

3. 三大指数30天的股票走向预测相关数据

指标

上证指数

深证指数

创业板指数

T( dy dx < 3 3 )

12

10

13

总样本时间

30

30

30

P 3

40%

33.3%

43.3%

将三大指数 P 3 待入(19),求出模型 μ 3 =38.87%.

3.4. 实例四

针对本文构建的金融证券风险反应模型,以微博为例,我们统计了2024年4月1日到4月21日21天的微博热搜模块大众情绪中可能会影响金融行业的军事、政治等数据,求出其社会风险系数。表4为部分数据,将统计到的数据进行处理分析整合,通过公式(20)即可算出社会风险系数 α

Table 4. Public sentiment table (partial)

4. 社会大众情绪表(部分)

日期

事件

恐惧

平和

开心

疑惑

惊讶

生气

悲伤

讨厌

失望

期待

喜欢

4.1

1

19

6

26

0

13

19

6

11

0

0

0

2

0

31

15

0

15

10

19

0

0

0

0

3

8

38

24

0

2

16

12

0

0

0

0

4

0

12

6

5

0

0

10

0

8

5

54

5

0

26

17

13

0

11

15

0

5

10

0

4.2

1

39

21

0

20

0

20

0

0

0

0

0

2

0

14

25

0

11

0

20

16

14

0

0

3

0

6

50

0

0

0

31

0

13

0

0

4

20

19

18

16

0

0

16

0

7

0

4

5

50

10

0

25

0

0

14

0

0

1

0

利用Excel中的数据透视表功能,将21天社会大众情绪进行平均值计算,将结果进行汇总,如表5所示:

Table 5. Daily public sentiment chart

5. 每日社会大众情绪表

日期

恐惧

平和

开心

疑惑

惊讶

生气

悲伤

讨厌

失望

期待

喜欢

4.1

5

23

18

4

6

11

15

2

3

3

11

4.2

20

15

16

10

2

4

20

3

11

0

1

4.3

20

20

13

4

3

11

17

1

6

5

0

4.4

20

26

25

0

5

7

13

0

3

2

1

4.5

9

24

12

6

4

17

14

7

2

4

0

4.6

22

14

13

2

3

16

14

4

11

0

1

4.7

15

20

21

6

0

12

19

2

3

0

2

4.8

8

27

5

8

2

15

17

0

13

3

5

4.9

9

35

20

1

3

19

7

0

3

3

1

4.10

16

25

4

0

8

10

20

6

10

2

0

4.11

14

17

11

9

7

14

17

4

6

2

0

4.12

16

23

21

3

4

9

10

3

6

3

2

4.13

15

27

13

6

2

11

11

3

10

2

0

4.14

19

17

4

7

13

4

23

7

6

0

0

4.15

18

23

26

3

1

9

15

1

3

0

0

4.16

6

21

52

3

2

7

9

0

0

0

0

4.17

18

20

23

6

7

15

10

2

1

0

0

4.18

5

12

29

9

9

3

17

3

15

0

0

4.19

1

39

18

11

1

15

8

4

4

0

0

4.20

18

2

5

15

3

38

15

0

4

0

0

4.21

29

11

11

11

7

11

6

2

12

0

0

按照式子(25)、(26),求出社会有利系数与社会不利系数。

+++++= (25)

++++= (26)

将所整理的数据进行代入公式(25)、(26),可得出4月1日到4月21日这21天每一天的社会有利系数和社会不利系数,见表6表7

Table 6. Daily statistical table of social advantage coefficient and social advantage coefficient

6. 每日社会有利系数、社会不利系数统计表

日期

社会有利系数

社会不利系数

4.1

63.6

36.4

4.2

43.2

56.8

4.3

45.0

55.0

4.4

58.0

42.0

4.5

50.8

49.2

4.6

33.0

67.0

4.7

48.8

51.2

4.8

48.8

51.3

4.9

63.3

36.8

4.10

38.8

61.3

4.11

46.0

54.0

4.12

56.0

44.0

4.13

50.0

50.0

4.14

41.6

58.4

4.15

53.8

46.2

4.16

77.7

22.3

4.17

55.8

44.3

4.18

57.5

42.5

4.19

68.3

31.8

4.20

25.5

74.5

4.21

40.0

60.0

将社会不利系数大于55的天数与小于等于55的天数分别统计出来:

Table 7. Daily statistical table of social advantage coefficient and social advantage coefficient

7. 样本总社会不利系数统计表

社会不利系数

天数

>55

6

≤55

15

将上表数据代入公式(20)中,可得社会风险系数:

α= 6 21 ×100%28.6%.

3.5. 实例五

结合目前金价变化和货币汇率变化,以每日收盘价作为统计根据,根据金融证券风险反应模型计算出相应的风险系数 β,δ 。我们统计了1月2日到4月19日交易日的“现货黄金”的金价变化数据作为原数据进行计算,将金价收盘价进行相关统计,如图8所示:

Figure 8. Gold price fluctuation chart

8. 金价浮动变化图

以金价不合理上涨作为统计依据,为避免金价的相关正常波动影响数据统计与计算,一般有以下指标,见表8

Table 8. Gold price floating evaluation index

8. 金价浮动评价指标

指标

含义

dy dx 3 3

正常调整

dy dx > 3 3

异常浮动

根据图像变化,进行图像拟合并进行导数计算,可得出表9

Table 9. Statistical results of gold price fluctuations

9. 金价浮动统计结果

指标

样本时间

dy dx 3 3

22

dy dx > 3 3

77

将上述统计结果带入(21)中,可得:

β= 22 77 ×100%28.6%.

3.6. 实例六

在货币汇率变化数据中,我们统计了日元的汇率变化情况,将每日收盘价作为统计根据,并将相关数据整理成图,见图9

Figure 9. Chart of changes in the yen exchange rate

9. 日元汇率变化图

为排除市场正常调整的相关数据,保证数据的准确和精确,一般以下指标,见表10

Table 10. Currency depreciation evaluation index

10. 货币贬值评价指标

指标

含义

dy dx 3 3

非正常(贬值)

dy dx > 3 3

正常调整

根据图像变化,进行图像拟合并进行导数计算,可得出表11

Table 11. Statistical results of sample data

11. 样本数据统计结果

指标

样本时间

dy dx 3 3

24

dy dx > 3 3

49

将上述统计结果带入(22)中,可求出 δ

δ= 24 73 ×100%32.9%.

α β δ 代入(4)中,可得出 μ 4

μ 4 = 28.6%+28.6%+32.9% 3 30.03%.

μ 1 μ 2 μ 3 μ 4 代入(3)中,可得出模型客观风险系数:

= 19.91%+38%+38.87%+30.03% 4 =31.7025%.

受篇幅和历史数据所限,本论文并没有给出该模型的临界值A,在实际运用过程中,需要根据2008年金融危机,欧洲主权债务危机等相关金融危机发生时的相关数据计算出达到发生金融危机时的临界值,从而使模型更加完整,从而更好地服务于金融风险反应。

4. 结论与建议

4.1. 结论

本模型中运用了较多的数据,通过不同的理论从金融市场的各方面进行系统分析[8] [9]表12为相关结果。

Table 12. Summary table of objective risk factor example solving

12. 客观风险系数实例求解汇总表

因子

实例结果

μ 1

19.91%

μ 2

38%

μ 3

38.87%

α

28.6%

β

28.6%

δ

32.9%

客观风险系数

31.7025%

在Value-at-Risk (VaR)理论计算求得的结果中,三大指数分别为16.90%、20.61%、22.23%,综合结果为19.91%。在排除正常调整下该数值较低,代表市场较为稳定。

在资产定价理论结果中,38%的风险代表着现在风险中等,风险处于可控制范围内。

在时间序列模拟中,预测后续走向浮动较大,整体出现不稳定的现象。

在社会情绪统计中,最终求得的社会风险系数,代表着在影响金融行业的相关事件中,相关数据依旧较好,并没有发生大范围影响金融行业导致金融风险的事件的情况发生,社会风气较好。

在金价变化中,最终结果为28.6%,金价风险处于合理范围之内。

在货币汇率变化中,最终变化结果为32.9%,数值较大,金融风险概率增大。

在最终综合求解后的数值为31.7025%,代表市场目前正处于稳定状态。

但受数据和预测范围的影响,以及在现实中的金价不断抬升和日元受美元资本收割的影响下不断贬值,结果不一定准确,需根据现实情况辩证看待。

4.2. 建议

金融机构应建立完善的风险管理体系,包括风险评估、风险监测、风险控制和风险应对等环节。通过定期评估市场风险、信用风险、流动性风险等各类金融风险,及时发现和解决潜在问题。投资者应将资金分散投资于不同的资产类别、行业和地区,以降低单一投资标的对投资组合的波动性影响。这种分散投资的策略有助于平衡不同资产之间的风险,使投资者能够参与多样化的市场机会。投资者应定期评估投资组合的表现,并及时进行调整。通过主动管理,可以及时把握市场变化,减少投资损失。例如,在市场风险增加时,可以适当减少风险较高的资产配置,增加风险较低的资产配置。投资者和金融机构应持续关注市场情况,包括宏观经济指标、行业动态等,以及时了解市场变化并做出相应的调整。这有助于做出更准确的判断和决策,优化投资组合的配置。在金融投资中,设置风险止损机制是非常重要的。这可以帮助投资者在市场出现不利变化时及时止损,避免损失进一步扩大。目前正处于历史的关键时刻,金融市场的未来也愈发迷离。建立一套合适的金融风险模型在未来的相关行业的重要性也与日俱增。本文所建立的金融风险反应模型可利用到相关的风险分析程序中,从而保障金融行业的健康发展。

基金项目

国家自然科学基金面上项目(12071237);山东省统计科研课题(KT23068)。

NOTES

*通讯作者。

参考文献

[1] 刘通. 含有外部事件共同冲击的金融机构系统性金融风险建模[D]: [硕士学位论文]. 苏州: 苏州大学, 2020.
[2] 许梦博, 寇依. 财政政策、货币政策与高质量就业——基于TVP-SV-VAR模型的动态分析[J]. 华东经济管理, 2024, 38(5): 90-102.
[3] 李菁昭, 张雨欣, 王傲君. 互联网金融风险管理研究[J]. 合作经济与科技, 2024(13): 52-54.
[4] 苏辛, 谢尚宇, 周勇. 金融风险度量的建模理论与方法的一些进展及其应用[J]. 运筹与管理, 2018, 27(1): 185-199.
[5] 李琳. 基于高斯过程回归和蒙特卡洛模拟的期权定价算法研究[D]: [硕士学位论文]. 贵阳: 贵州财经大学, 2023.
[6] 战雪丽, 张世英, 张锐锋, 等. 金融资产定价理论方法及应用探讨[J]. 价格理论与实践, 2005(12): 49-50.
[7] 李嫣资, 王翰墨. 基于蒙特卡洛模拟法的证券投资组合风险分析[J]. 新经济, 2016(17): 38.
[8] 李刚. 基于Copula-VaR方法的沪深股市投资组合风险分析[D]: [硕士学位论文]. 武汉: 华中科技大学, 2013.
[9] 王仲会. 黄金∙货币∙金融安全——中国黄金体系改革与发展研究[D]: [博士学位论文]. 大连: 东北财经大学, 2005.