1. 引言
代数在现实应用中非常广泛,其涉及的领域包括密码学算法(例如Shamir秘密共享算法[1]),几何与设计(例如作图法[2] [3]),相似文本检测(例如文献重复率检测,搜索引擎等[4])。在数据统计中,可将多个经济指标看作向量的各个分量,分析其相关性。
在当今数字基础设施逐步加快建设的基础上,我国互联网经济蓬勃发展,腾讯、阿里巴巴和哔哩哔哩等大型企业作为我国互联网企业的典型代表,在市场中的扮演重要角色。在各大企业数字化能力飞跃提升的背景下,互联网企业经营状况不仅受内部管理和市场竞争的影响,宏观经济也发挥着关键作用。而国家的经济形势与企业经营之间的关系一直是应用数学、经济学、以及管理学等多学科之间的共同议题,受到国内外许多学者关注(例如[5]-[9])。
本文聚焦于2019~2023年这一具有代表性的时间段,通过代数视角,构建描述宏观经济的向量和反映互联网大型企业经营状况(如收入、毛利等)的向量,计算二者的夹角的余弦值,深入剖析宏观经济与企业营收之间的内在关系。代数视角是独特的,以往该视角仅用于文本检测,本文首次将其运用于经济学领域。
本文行文结构如下:本文的第2节包含两个小节,分别论述了本文的代数理论依据以及向量空间模型的建模方法;在第3节钟,本文利用向量空间模型计算了我国整体经济形势与所选研究对象的营收之间的相关性;第4节是本文的初步研究成果,表明了宏观经济形势与互联网企业经营数据之间的强相关性。
2. 向量空间模型
本节的第一部分从高等代数的角度回忆向量空间、内积以及范数的定义,并简单介绍向量空间模型(vector space model, VSM)。本节的第二部分将提供2019~2023年期间我国国民的经济数据以及一些企业的营销数据,并将它们实现到上述向量空间模型中。
2.1. 向量的共线与内积
向量空间在实际社会研究和数据分析中主要使用的是Euclid空间
。从抽象代数的观点看,实数集
上的向量空间(vector space)指的是
到某个Abel群M的自同态环
上的环同态
。具体地说,它是一个以形如
的n元实数组为元素的集合,并且具有加法(addition)运算
以及纯量乘法(scalar multiplication)运算
,
可参考[3]的第3章,[10]的第3章,或[11]的第3章。对于两个向量
和
。如果存在
使得
,则称这两个向量是线性相关的或者共线的(colinear),并用分式
来衡量二者的线性相关性,其中:
,
,
。
被成为内积(inner product),记号
表示对向量求范数(norm)。分式
的值始终介于−1和1之间,因此也被用来定义为两个向量的夹角,即:
。
显然,当两个向量夹角越接近0˚或者180˚,分式
的绝对值越接近1。上述性质常被用于构造“向量空间模型”。该模型由Salton-Wong-Yang在20世纪70年代提出,并被用于信息检索[4]。如今可以看到该项应用非常成功,许多搜索引擎和检索模型(包括文字收索与查重,声乐检索等)都是基于此开发。
2.2. 国民经济数据与大型电子网络企业营收的向量空间模型
表1是2019~2023年期间我国
的国民的经济数据,由国家统计局公布,它能很好地反映我国在2019~2023年的经济形势,见[12]。可以看到,从2019年到2023年期间,尽管经历了疫情带来的经济下滑,但是我国国民总收入(单位:亿元)、人均国内生产总值(单位:元)、城镇/农村居民人均可支配收入(单位:元)、以及第三产业增加值(单位:亿元)仍然呈现稳步上升的趋势。
Table 1. National economic data
表1. 国民经济数据
年份 |
国民总收入(亿元) |
人均国内生产总值(元) |
城镇居民人均
可支配收入(元) |
农村居民人均
可支配收入(元) |
第三产业增加值(亿元) |
2023 |
1249990.6 |
89,358 |
51,821 |
21,691 |
688238.4 |
2022 |
1194401.4 |
85,310 |
49,283 |
20,133 |
642727.1 |
2021 |
1141230.8 |
81,370 |
47,412 |
18,931 |
614476.4 |
2020 |
1005451.3 |
71,828 |
43,834 |
17,131 |
551973.7 |
2019 |
983751.2 |
70,078 |
42,359 |
16,021 |
535371 |
表2~4是本文作者分别从腾讯、阿里巴巴、哔哩哔哩三个企业获取的2019年~2023年的部分经营数据,其中包括收入、毛利、以及除阿里巴巴外另两个企业的增值服务收入(单位:百万元),见[13]-[15]。
Table 2. Turnovers of Tencent
表2. 腾讯经营数据
年份 |
腾讯收入(百万元) |
腾讯毛利(百万元) |
腾讯增值服务收入(百万元) |
占收入总额(百分比) |
2023 |
609015 |
293,109 |
298,375 |
49% |
2022 |
554552 |
238,746 |
287,565 |
52% |
2021 |
560118 |
245,944 |
291,572 |
52% |
2020 |
482064 |
221,532 |
264,212 |
55% |
2019 |
377289 |
167,533 |
199,991 |
53% |
Table 3. Turnovers of Alibaba
表3. 阿里巴巴经营数据
年份 |
阿里巴巴收入(百万元) |
阿里巴巴净利润(百万元) |
2023 |
941,168 |
71,332 |
2022 |
868,687 |
65,573 |
2021 |
853,062 |
47,079 |
2020 |
717,289 |
143,284 |
2019 |
509,711 |
140,350 |
Table 4. Turnovers of Bilibili
表4. 哔哩哔哩经营数据
年份 |
哔哩哔哩收入(百万元) |
哔哩哔哩毛利(百万元) |
哔哩哔哩增值服务收入(百万元) |
占收入总额(百分比) |
2023 |
22,528 |
5442 |
9910 |
44% |
2022 |
21,899 |
3849 |
8715 |
40% |
2021 |
19,384 |
4043 |
6935 |
36% |
2020 |
11,999 |
2840 |
3846 |
32% |
2019 |
6778 |
1190 |
1641 |
24% |
接下来,本文将按照年度来对各表所提供的数据的相关性展开分析。虽然各表所使用的单位不同,但是这可以被忽略。这是因为,从计算上,有
,
其中
和
是向量的单位化,由于分子与分母单位一致,所以在计算过程中单位被约分,故
和
的单位为1。本文选取了2019年~2023年五个年度的数据,因此选择向量空间
作为本文所要使用的向量空间模型,
中的向量
的分量
~
分别表示2023,2022,2021,2020,2019年度的数据。具体如下:
:国民总收入(见表1的第2列),其中,
,
下文的向量类似,为了写作简便起见,本文省略;
:人均国内生产总值(见表1的第3列);
:城镇居民人均可支配收入(见表1的第4列);
:农村居民人均可支配收入(见表1的第5列);
:第三产业增加值(见表1的第6列);
:腾讯年度收入(见表2的第2列);
:腾讯年度毛利(见表2的第3列);
:腾讯增值服务收入(见表2的第4列);
:腾讯增值服务占收入总额的百分比(见表2的第5列);
:阿里巴巴年度收入(见表3的第2列);
:阿里巴巴年度净利润(见表3的第3列);
:哔哩哔哩年度收入(见表4的第2列);
:哔哩哔哩年度毛利(见表4的第3列);
:哔哩哔哩增值服务收入(见表4的第4列);
:哔哩哔哩增值服务占收入额的百分比(见表4的第5列)。
以上数据在各企业的财务报告中有着非常详细的分析,本文不再过多赘述。表5给出了上述向量的单位化向量。例如向量
,其范数为:
,
于是,得:
Table 5. Vector unitization
表5. 向量单位化
原向量 |
单位化后对应向量 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. 相关性分析
将表5第2列中的向量分为两组:
(宏观经济向量组)与
(企业经营向量组)。为了分析两组数据的相关性,本文需要计算所有的
,其中,
,
。以
且
的情形为例,有
,其中
和
已经由表5给出。重复上述计算步骤,就得到了表6。
Table 6. The linear dependence of vectors
表6. 向量的相关性
|
|
|
|
|
|
|
0.997 |
0.997 |
0.996 |
0.998 |
0.997 |
|
0.996 |
0.996 |
0.995 |
0.997 |
0.996 |
|
0.997 |
0.997 |
0.997 |
0.998 |
0.997 |
|
0.992 |
0.992 |
0.995 |
0.991 |
0.992 |
|
0.994 |
0.994 |
0.992 |
0.995 |
0.994 |
|
0.88 |
0.88 |
0.893 |
0.881 |
0.885 |
|
0.965 |
0.965 |
0.958 |
0.966 |
0.963 |
|
0.955 |
0.955 |
0.950 |
0.958 |
0.956 |
|
0.937 |
0.937 |
0.928 |
0.939 |
0.936 |
|
0.994 |
0.994 |
0.993 |
0.996 |
0.995 |
4. 结论
通过数量积和夹角余弦值的计算与分析,发现宏观经济因素与互联网企业营收有着密切的关联。其关联表现在以下几个方面:
1) 用于描述宏观经济的向量
~
与用于描述本文所研究企业营业额的向量
~
的线性相关性
表现非常显著。从表6第2~6行、第8~11行的数据来看,
的数值介于0.9与1之间,总体接近1。
2) 净利润与国家经济形势线性相关性显著。代表净利润的向量
与
~
的线性相关性约为0.88 (见表6第7行)。由于没有另外两家企业的净利润数据,因此该项数据暂时没有可以对比的案例。净利润的数值等于毛利润扣除上税的税额,其对公民的直接消费能力的反映弱于毛利润,这是因为毛利润直接反映了消费者的真实消费额。因此,它与
~
线性相关性弱于其他数据具有一定合理性。
3) 表6所反映的数据整体趋于稳定,未出现反常的个例。与阿里巴巴和哔哩哔哩相比,腾讯的营业数据(见表6第2~5行)与国家经济形势的线性相关性的均值最高,为
,
且就表6所给数值而言,线性相关性的数值表现非常稳定。初步推断这与该企业的增值服务营收占比(基本略高于50%左右,见表2)较高有关。与之相对的,哔哩哔哩的增值服务产生的营收占比较腾讯而言更低(见表6第10行),因此,其呈现线性相关性略微下降。根据表6所给的数据,可以算得此下降百分比为
。
此外,此数据呈现了一个有趣的现象:将哔哩哔哩的增值服务折算到总营业收入中后(见表6最后一行),与国家经济形势的线性相关性数值为0.9944,呈现出与国家经济形势极高的相关性。
作者声明
本文三位作者对文章的贡献是等同的;本文作者承诺本文内容不涉嫌反动言论;本文的通讯作者为上述承诺负第一责任人,且承诺本文无数据篡改、编造、和作假,无参考文献滥引现象,并对本文数据来源的真实性负第一责任。
基金项目
本文由河南工程学院教育教学改革研究项目(编号:2024JYZDX029)、贵州大学高等教育研究项目(编号:703217243301);贵州大学引进人才科研启动基金项目(贵大人基合字(2023)16号,(2022) 53号,(2022) 65号)、以及贵州省科技计划项目(黔科合基础-ZK[2024]一般066)资助。
NOTES
*第一作者。
#通讯作者。