1. 引言
随着全球经济一体化的进一步推进以及资本市场的快速发展,股票市场作为企业与投资者之间直接融资的媒介之一一直备受关注,与此同时,股票投资已成为越来越多投资者财富增值的重要渠道和理财方式。然而,股票市场的高度波动性和不可预测性给投资者带来了难以预估的风险,大量的财务指标等分析指标、海量的金融数据往往使人眼花缭乱、无所适从。所以如何快速且准确地提取金融数据中的有效信息成为了投资者关注的焦点,在这样的背景下,投资者就需要具备理性的投资观念和有效的操作方法,以寻求在风险可控的前提下实现资产的稳健增长。随着全球化趋势的不断加强和我国经济金融体制改革的不断深入,在全球范围内无论是发达国家还是新兴国家,股票市场的总市值和规模都在稳步增长,我国股票市场也呈现持续稳定发展的态势,证券投资已成为大众化产物的一种,是现代经济产物中较为常见的理财和投资方式,但日新月异的股票投资市场是一把“双刃剑”,总是利益与风险并存。如若没有有效的方式方法去权衡两者的比重,则会被投资市场这个“南墙”撞得头破血流,损失惨重。
近年来,由于投资者的盲目投资和缺乏综合定量分析能力,导致许多投资决策仅仅依赖于每股收益、每股净资产和净资产收益率等简单指标的比较。同时,许多分析者采用模棱两可的评判方法对多项指标进行综合分析,导致指标权重失衡,决策结果缺乏可信度。面对复杂的经济问题决策,单指标分析的方法就显得捉襟见肘,于是,多指标决策方法就不得不应运而生了。它能够为投资者和决策者提供更为合理和切实可行的方法和建议,以应对各种问题。关于股票投资价值分析的研究已有不少成果,如:文献[1]针对23家煤炭业上市公司,构建了涵盖4个维度9个具体指标的投资价值评价体系。首先利用主成分分析法评测了相关公司的综合指标投资价值,然后采用聚类分析法将所选23家公司分成3类投资。文献[2]运用主成分分析法和聚类方法分析了农业上市公司的投资价值。为全面地评价新能源行业上市公司,文献[3]首先采用因子分析法进行分析,并利用聚类分析法对综合得分大于零的公司进一步分析。然后,再将聚类分析结果与市盈率排名进行比较,寻找内在价值被明显低估的群体,确定最终投资范围。文献[4]运用主成分分析和模糊C均值聚类法对AI产业的109只股票进行了投资价值分析。文献[5]同样采用因子分析和聚类分析法研究了科创板首批上市的25家公司。文献[6]建立了一个因子分析–主成分分析排序模型,确定分析了集成电路产业上市公司的投资价值总量及排名,然后运用系统聚类分析法对分析对象进行分类。基于量化分析的股票投资价值分析的相关研究还有,基于聚类分析的算法[7];基于核主成分–模糊C均值聚类分析方法[8];基于聚类和决策树算法[9];基于神经网络的方法、随机森林的模糊综合评价方法[10]等。
在科技革命和产业变革的推动下,人工智能技术正成为经济高质量发展的核心。全球经济体都在积极布局人工智能,其卓越的自然语言处理和深度学习能力已与各行业深度融合。随着应用与市场的不断拓展,人工智能已成为众多国家和地区的重点发展领域,并得到政策支持,为相关企业带来了巨大的增长潜力。投资者对人工智能行业前景看好,但技术发展不确定且市场竞争激烈,因此,挑选人工智能板块的“潜力股”至关重要。
因此,本文在前人研究的基础上,深入探索人工智能板块的投资价值。采用主成分分析法和K-Means聚类分析两种先进的统计分析方法,对人工智能板块的公司进行全面的投资分析。通过主成分分析法提取关键信息,减少数据冗余,从而更清晰地揭示公司的核心竞争力和投资价值。通过K-Means聚类分析将相似特征的公司进行分组,为投资者提供更具体的投资目标和策略。为确保分析结果的准确性和可靠性,对相关指标数据进行了细致入微的预处理。这包括数据的正向化处理,以消除指标间的方向性差异,使得所有数据都指向同一评价方向;Z-score标准化处理,以消除量纲和数量级的影响,使得不同指标之间具有可比性;以及归一化处理,将数据处理到同一量度范围内,从而进一步确保分析结果的公正性和客观性。通过这些严谨的数据处理和分析方法,期望能够为投资者提供更为精准、科学的投资决策依据,助力他们在人工智能板块捕捉到真正的“潜力股”。
2. 基于主成分分析和聚类分析的股票投资价值分析
2.1. 指标选取与数据预处理
2.1.1. 指标选取
本文旨在分析人工智能概念板块股票的投资价值,以辅助投资者进行精准选股。由于资产负债表、现金流量表、所有者权益变动表和利润表等财务报表能够全面反映一个公司的经营状况,因此,它们是评估股票投资价值的重要基础。为了深入探究这些股票的投资潜力,我们从上市公司的微观层面入手,进行详尽的财务分析。在构建财务评价指标体系时,我们力求全面反映上市公司的综合能力。为此,本文从盈利能力、偿债能力、营运能力和发展能力四个维度,精心选取了12个关键财务指标。具体来说:
在盈利能力方面,选取了净资产收益率(ROE)、总资产报酬率(ROA)和营业利润率,以衡量公司赚取利润的效率。
在偿债能力方面,考虑了资产负债率、流动比率和速动比率,这些指标有助于评估公司偿还债务的能力。
对于营运能力,通过分析应收账款周转率、流动资产周转率和总资产周转率,来了解公司资产管理的效率。
最后,在发展能力方面,关注总资产增长率、每股收益增长率和净利润增长率,以预测公司的成长潜力和未来收益。
通过这套综合评价指标体系,能够更全面地分析人工智能概念板块股票的投资价值,为投资者提供更为准确和科学的选股建议。
2.1.2. 数据来源与处理
本文数据来源于东方财富旗下的金融数据库——Choice金融终端。本文从中选取了2023年的年度财务报表数据进行分析。然而,由于所选取的指标体系中的每个指标都拥有自己的量纲和变动差异性,这给后续的综合分析建模带来了困难。因此,需要对收集到的原始数据进行预处理,目的是消除这些量纲和变动差异性的影响。
在数据预处理的过程中,首先对人工智能概念板块中的536只股票数据进行了筛选。为了确保数据的完整性和准确性,剔除了那些存在任意指标数据为空值的股票,最终剩余了526只有效股票的数据。接下来,对部分指标进行了调整。为了确保所有数据指标在综合分析中能够保持一致的方向性,从而提高分析的准确性和可靠性,将适中指标(资产负债率、流动比率和速动比率)进行了正向化处理。最后,利用SPSS将所有数据进行Z-score标准化和归一化处理。
2.2. 基于主成分分析法的投资价值分析
利用SPSS对盈利能力指标、偿债能力指标、营运能力指标和发展能力指标的12个变量之间的标准化数据分别进行KMO和Bartlett检验。表1列出了KMO值和Bartlett检验显著性值。由表1可见,KMO值分别为0.534、0.641、0.547、0.506,均大于临界值0.5,这表明变量间的相关性足够强,适宜进行主成分分析。此外,Bartlett球形度检验的结果也支持这一结论。检验的显著性均为0.000,远低于0.05的显著性水平。这意味着我们拒绝了各变量之间相互独立的原假设,进一步确认了这些指标适合进行主成分分析。
Table 1. KMO and Bartlett test table for profitability, solvency, operating ability, and development capacity
表1. 盈利能力、偿债能力、营运能力和发展能力的KMO和Bartlett检验表
检验类别 |
KMO取样 适切性量数 |
Bartlett球形度检验 |
近似卡方 |
自由度 |
显著性 |
盈利能力 |
0.534 |
597.751 |
3 |
0.00 |
偿债能力 |
0.641 |
2040.330 |
3 |
0.00 |
发展能力 |
0.506 |
544.604 |
3 |
0.00 |
营运能力 |
0.547 |
899.026 |
3 |
0.00 |
利用统计软件SPSS对数据进行主成分分析,提取主成分如表2所示。
Table 2. Contribution rate of each component
表2. 各成分贡献率
能力类别 |
成分 |
初始特征值方差 |
提取载荷平方和 |
总计 |
百分比 |
累积% |
总计 |
方差百分比 |
累积% |
盈利能力 |
1 |
1.992 |
66.386 |
66.386 |
1.992 |
66.386 |
66.386 |
2 |
0.811 |
27.029 |
93.416 |
- |
- |
- |
3 |
0.198 |
6.584 |
100.000 |
- |
- |
- |
偿债能力 |
1 |
2.494 |
83.132 |
83.132 |
2.494 |
83.132 |
83.132 |
2 |
0.489 |
16.315 |
99.447 |
- |
- |
- |
3 |
0.017 |
0.553 |
100.000 |
- |
- |
- |
营运能力 |
1 |
2.058 |
68.598 |
68.598 |
2.058 |
68.598 |
68.598 |
2 |
0.838 |
27.936 |
96.534 |
- |
- |
- |
3 |
0.104 |
3.466 |
100.000 |
- |
- |
- |
续表
发展能力 |
1 |
1.821 |
60.698 |
60.698 |
1.821 |
60.698 |
60.698 |
2 |
0.981 |
32.716 |
93.414 |
- |
- |
- |
3 |
0.198 |
6.586 |
100.000 |
- |
- |
- |
由表2可知,盈利能力、偿债能力、营运能力和发展能力这四项成分均成功提取了一个主成分。这些主成分的累计贡献率分别达到66.386%、83.132%、68.598%和60.698%。计算得出,这四个主成分平均解释了全部方差的69.704%。这一数据表明本文所提取的四个主成分能够有效地代表原始12个指标中69.704%的信息量。
进一步来说,这四个主成分不仅能较好地评估上市公司的投资价值,而且还实现了数据的降维处理,简化了分析过程。如果从原始数据中提取这四个主因子,就相当于保留了原始数据69.704%的信息量,这足以合理反映人工智能概念板块中股票公司的偿债能力、成长能力、营运能力和盈利能力。
综上所述,选择盈利能力、偿债能力、营运能力和发展能力四个主成分作为代表,以替代原始数据,对人工智能概念板块中的股票投资价值进行评价,这样的做法是合理且有效的。
Table 3. Correlation matrix of principal components during the reporting period of the 2023 annual report
表3. 2023年年报报告期内主成分的相关矩阵
|
成分 |
1 |
2 |
3 |
4 |
总资产报酬率ROA (%) |
0.932 |
|
|
|
营业利润/营业总收入(%) |
0.883 |
|
|
|
净资产收益率ROE (平均) (%) |
0.586 |
|
|
|
速动比率正向化 |
|
0.966 |
|
|
流动比率正向化 |
|
0.962 |
|
|
资产负债率正向化 |
|
0.797 |
|
|
流动资产周转率(次) |
|
|
0.949 |
|
总资产周转率(次) |
|
|
0.940 |
|
应收账款周转率(不含应收票据) (次) |
|
|
0.524 |
|
净利润同比增长率(%) |
|
|
|
0.944 |
总资产同比增长率(%) |
|
|
|
0.943 |
营业收入同比增长率(%) |
|
|
|
0.201 |
由表3可知,第一主成分在总资产报酬率载荷最大,因此可将其定义为盈利能力成分;第二主成分在速动比率上载荷最大,可将其定义为偿债能力成分;第三主成分在流动资产周转率载荷最大,可将其定义为营运能力成分;第四主成分在净利润增长率上载荷最大,可将其定义为发展能力成分。
根据成分得分系数矩阵(表4),得出了每个股票的主成分权重,于是可以列出股票得分表达式为:
Table 4. Score coefficient matrix for each component during the reporting period of the 2023 annual report
表4. 2023年年报报告期内各成分得分系数矩阵
|
成分 |
1 |
2 |
3 |
4 |
总资产报酬率ROA (%) |
0.294 |
|
|
|
营业利润/营业总收入(%) |
0.468 |
|
|
|
净资产收益率ROE (平均) (%) |
0.443 |
|
|
|
资产负债率正向化 |
|
0.320 |
|
|
流动比率正向化 |
|
0.386 |
|
|
速动比率正向化 |
|
0.387 |
|
|
应收账款周转率(不含应收票据) (次) |
|
|
0.255 |
|
总资产周转率(次) |
|
|
0.457 |
|
流动资产周转率(次) |
|
|
0.461 |
|
基本每股收益同比增长率(%) |
|
|
|
0.518 |
净利润同比增长率(%) |
|
|
|
0.519 |
总资产同比增长率(%) |
|
|
|
0.110 |
其中,
为标准化后的值,
分别代表第一、二、三和四个主成分得分。
将以上四个主成分的贡献率为权数求加权平均值,得到各人工智股票的综合主成分表达式为:
通过上述实验过程可以输出各人工智能股票的综合得分,对股票进行排名,得到排名前30的股票,如表5所示(仅列出前30名)。
Table 5. Overall score ranking of the top 30 stocks
表5. 前30股票的综合得分排名
证券名称 |
成分1 |
成分2 |
成分3 |
成分4 |
综合得分 |
排名 |
国联股份 |
1.1126 |
0.8068 |
7.8846 |
0.2210 |
6.9522 |
1 |
三维通信 |
0.1808 |
0.7343 |
6.0985 |
0.0310 |
4.9327 |
2 |
神州数码 |
0.3635 |
0.1185 |
5.2627 |
0.1779 |
4.0579 |
3 |
蓝色光标 |
0.0279 |
0.4797 |
4.9699 |
0.3211 |
4.0216 |
4 |
华凯易佰 |
0.8924 |
0.3793 |
4.3433 |
0.1933 |
4.0045 |
5 |
吉宏股份 |
0.8112 |
0.4981 |
3.8948 |
0.2713 |
3.7890 |
6 |
孩子王 |
0.1832 |
0.5109 |
4.2629 |
0.1914 |
3.5868 |
7 |
续表
安克创新 |
1.1527 |
0.4361 |
2.5765 |
0.2666 |
3.0570 |
8 |
视源股份 |
0.4971 |
0.6663 |
3.0744 |
0.1017 |
3.0546 |
9 |
来伊份 |
0.1567 |
0.7758 |
3.1893 |
0.0299 |
2.9549 |
10 |
万事利 |
0.3389 |
0.3945 |
0.7253 |
3.0702 |
2.9140 |
11 |
思美传媒 |
−0.2987 |
0.5672 |
3.5839 |
0.2101 |
2.8592 |
12 |
顺丰控股 |
0.4246 |
0.7816 |
2.6629 |
0.1498 |
2.8492 |
13 |
工业富联 |
0.6174 |
0.8993 |
2.3123 |
0.1242 |
2.8190 |
14 |
华东医药 |
0.8073 |
0.5438 |
2.1240 |
0.1586 |
2.5413 |
15 |
长安汽车 |
0.5028 |
0.6058 |
2.2231 |
0.2691 |
2.5258 |
16 |
新国都 |
1.2760 |
−0.2963 |
0.6826 |
2.2309 |
2.4231 |
17 |
协创数据 |
0.6380 |
0.8619 |
1.3132 |
0.5611 |
2.3815 |
18 |
TCL智家 |
1.3773 |
0.0517 |
1.8080 |
0.2886 |
2.3728 |
19 |
南钢股份 |
0.3323 |
0.5305 |
2.3921 |
0.1029 |
2.3650 |
20 |
吴通控股 |
0.1345 |
0.8416 |
2.1680 |
0.1188 |
2.3482 |
21 |
长虹美菱 |
0.3193 |
0.4189 |
2.1932 |
0.4282 |
2.3245 |
22 |
广合科技 |
1.1901 |
0.8198 |
0.9720 |
0.2410 |
2.2846 |
23 |
九州通 |
0.3344 |
0.4212 |
2.3490 |
0.1204 |
2.2566 |
24 |
乐歌股份 |
1.1219 |
0.7604 |
0.8459 |
0.4025 |
2.2014 |
25 |
康冠科技 |
0.8022 |
0.8844 |
1.1349 |
0.2551 |
2.2010 |
26 |
浪潮信息 |
0.3199 |
0.6422 |
1.8702 |
0.1608 |
2.1268 |
27 |
领益智造 |
0.6019 |
0.8939 |
1.2657 |
0.1593 |
2.1076 |
28 |
科沃斯 |
0.3828 |
0.8955 |
1.3954 |
0.0354 |
1.9773 |
29 |
九号公司-WD |
0.4650 |
0.8631 |
1.1776 |
0.2138 |
1.9638 |
30 |
由表5可知,财务综合评价得分是衡量企业财务经营状况的重要指标:得分越大,显示出企业的财务经营状况越优越;反之,则表明财务状况欠佳。在评估的527只人工智能股票中,国联股份凭借其卓越的财务表现位列第一,紧随其后的是三维通信和神州数码,分别占据第二和第三的位置。这些企业不仅拥有稳健的财务基础,还展现出持续的成长潜力和强大的竞争力,同时盈利能力也较为突出。因此,它们在市场中有着明显的优势,极有可能为投资者带来显著的投资回报。然而,在财务综合评价的另一端,易华录、*ST信通和方直科技的得分最低,分别位列倒数第一、第二和第三。这一评价结果表明,这些企业的竞争力和盈利能力相对较弱,可能会面临较大的经营挑战和财务风险。
进一步分析这526家人工智能股票公司,我们发现其中有306家公司的财务综合评价值为正,而剩余的220家则为负。这意味着近五分之二的公司当前的财务状况并不理想。但需要明确的是,这一现状并不直接预示着人工智能行业的长期前景黯淡。因为该行业的竞争激烈,技术更新迅速,新进入者众多,同时可能还面临着行业快速变化、高昂的投入成本或市场接受度提升缓慢等多重挑战。因此,投资者在决策时应全面考虑公司的财务状况、行业发展趋势以及宏观经济环境等多重因素。
2.3. 基于聚类分析法的投资价值分析
为进一步帮助投资者做出更准确的决策,根据主成分分析选取得到的四个主成分因子对人工智能板块的526只股票进行K-Means聚类分析,得到的结果如表6和表7所示。通过K-Means聚类分析方法,将这526只股票分为三类。第一类有380只股票,其中包含国联股份、三维通信、神州数码等;第二类有10只股票,其中包含荣联科技、绿盟科技、启迪设计等;第三类有136只股票,其中包含荣旗科技、网宿科技、移为通信等。
Table 6. Number of clusters
表6. 聚类个数
|
类别 |
个数 |
聚类 |
1 |
380 |
2 |
10 |
3 |
136 |
有效 |
526 |
缺失 |
0 |
Table 7. Stock classifications
表7. 各股票分类
第一类 |
国联股份、三维通信、神州数码、蓝色光标、华凯易佰、吉宏股份、孩子王、安克创新、视源股份、来伊份、万事利、思美传媒、顺丰控股、工业富联、华东医药、长安汽车、新国都、协创数据、TCL智家、南钢股份、吴通控股、长虹美菱、广合科技、九州通、乐歌股份、康冠科技、浪潮信息、领益智造、科沃斯、九号公司-WD (只展示了30只股票) |
第二类 |
荣联科技、绿盟科技、启迪设计、ST高鸿、中威电子、福昕软件、芯海科技、会畅通讯、建艺集团、易华录 |
第三类 |
荣旗科技、网宿科技、移为通信、通达海、浩瀚深度、中科创达、君逸数码、瑞芯微、国子软件、新炬网络、力合微、赢时胜、汇纳科技、富瀚微、泰禾智能、声迅股份、金溢科技、瑞纳智能、*ST工智、我武生物、日海智能、恒华科技、天润科技、拓尔思、海看股份、竞业达、远方信息、川网传媒、ST数源、思泰克(只展示了30只股票) |
为更全面地了解各类公司在不同财务能力方面的表现,根据主成分分析得到的四个主因子得分情况和表7中的分类结果,计算出这三类公司的盈利能力成分因子(F1)、偿债能力成分因子(F2)、营运能力成分因子(F3)、发展能力成分因子(F4)四个主因子的得分均值,计算结果如表8所示。
Table 8. Mean score table of various principal components
表8. 各类主成分得分均值表
|
第一类 |
第二类 |
第三类 |
F1 |
0.24650 |
−1.85498 |
−0.55235 |
F2 |
0.37275 |
0.11044 |
−1.04962 |
F3 |
0.26014 |
−0.47544 |
−0.69189 |
F4 |
0.16435 |
−6.30694 |
0.00454 |
根据表6~8,人工智能股票可分为三个类别,并据此得出以下结论:
首先,第一类包含国联股份、三维通信、神州数码等380家股票。这些公司在盈利能力(F1)、偿债能力(F2)、营运能力(F3)和发展能力(F4)上的得分均高于第二类和第三类。这表明这些公司的资产利用效果优异,销售能力强劲,且未来前景乐观。这些公司展现出高水平的竞争力和潜力,能够在市场上稳固自己的地位,并持续创新和适应不断变化的行业需求。对于投资者而言,这些公司是值得考虑的投资对象。
其次,第二类包括荣联科技、绿盟科技、启迪设计等10家公司。这些企业的平均盈利能力(F1)、偿债能力(F2)和营运能力(F3)表现一般,而发展能力(F4)则相对较弱。这可能意味着这些企业正面临某些挑战和风险,需要调整其运营和发展策略以提升自身竞争力。投资者在评估这些公司时,应全面审视其商业模式、行业竞争环境以及未来的增长潜能,以便更准确地了解其投资价值和相关风险。同时,应关注这些公司在提升运营效率、增强研发实力以及扩大市场份额等方面的举措,并判断它们是否有能力改善盈利状况并实现长远的发展。
最后,第三类涵盖了荣旗科技、网宿科技、移为通信等136只股票。这些企业的盈利能力(F1)、偿债能力(F2)和营运能力(F3)同样表现一般,但其发展能力(F4)相较于第二类要稍好一些。这表明这些企业的资产管理水平和经营业绩尚可,且拥有较大的市场发展潜力。对于投资者来说,这些公司值得长期关注,但在做出投资决策时仍需谨慎评估其各方面的状况和风险。
通过对比主成分分析与聚类分析的结果,可以发现两种方法所得出的股票综合得分排名大体一致。因此,将聚类结果中的第一类定义为优质股。从综合分析的角度来看,这些股票确实值得投资者给予特别的关注。
3. 结论与展望
3.1. 结论
本文聚焦于人工智能概念板块中的526只股票,深入探究了它们的投资价值。为实现这一目标,我们采用了主成分分析和聚类分析两种统计学方法,以期挖掘出人工智能板块内各股的投资潜能并识别其风险特征。
首先,本文成功地利用主成分分析法对多个财务指标进行了降维处理,并从中提炼出四个核心主成分:总资产报酬率、速动比率、流动资产周转率和净利润增长率。这四个主成分分别映射了企业的盈利能力、偿债能力、营运能力和发展能力,从而揭示了影响投资价值的关键要素。
进一步地,我们通过聚类分析将人工智能板块的企业按照其财务指标划分为三个类别,并依据主成分分析的结果为每个类别的股票计算了投资潜力得分。这一步骤为投资者在构建投资组合时提供了有力的数据支撑。
结合主成分和聚类分析的结果,对人工智能板块中的不同类别股票进行了详尽的评估。研究发现,包含国联股份、三维通信、神州数码等在内的380家人工智能股票显示出更为稳健的财务表现,从而具有更大的投资价值。借助主成分分析和聚类分析,我们能够更加清晰地洞察人工智能行业的发展动向及企业间的差异,进而提升投资决策的精准度和效率。本文所采用的投资价值分析方法也将获得更广泛的实践应用和深入研究。
3.2. 展望
随着人工智能技术的不断革新和应用领域的拓宽,人工智能板块将持续成为市场关注的热点。未来的研究工作可以从以下几个方面进行拓展:
1) 考虑整合社交媒体情感分析、宏观经济指标等更多维度的数据,以提供更全面的投资价值分析视角。
2) 在现有分析的基础上,引入机器学习、深度学习等先进技术,旨在提高预测精度和模型的适应性。
3) 鉴于市场和企业状况的不断变化,构建能够实时更新和追踪投资价值的动态模型,以更好地适应瞬息万变的市场环境。
4) 结合实际投资策略,对分析模型的有效性进行验证,并在实践中不断优化模型,同时探明其应用价值和潜在限制。
致 谢
本文由湖南人文科技学院科学计算与数据分析创新创业中心资助。
NOTES
*通讯作者。