国内算法治理的研究热点与演化趋势——基于CNKI数据库的可视化分析
The Research Hotspot and Evolution Trend of Algorithmic Governance in China—Visual Analysis Based on the CNKI Database
摘要: 为了解国内算法治理的研究历程及热点前沿,本文将2004~2022年期间CNKI数据库中CSSCI期刊收录的关于算法治理研究的348篇文献作为数据源,借助文献计量法和可视化软件CiteSpace,探讨我国算法治理的发展历程、热点主题和演变趋势。结果显示,从整体上来看,我国算法治理的研究呈现出了迅速增长的态势,其影响也在逐步提高。目前的热点话题包括了对算法本身的治理、利用算法进行治理和公共管理中的算法治理这三个方面,具体包括算法推荐、云计算、算法风险、算法政治、数字人权等内容。
Abstract: In order to understand the research process and hot frontier of algorithmic governance in China, this paper takes 348 documents on algorithmic governance research in CNKI database from 2004 to 2022 as the data source, and CiteSpace, the development process, hot topics and evolu-tion trend of domestic algorithmic governance research. The results show that the domestic algorithm governance research, which shows a rapid rising trend, and its influence is constantly increasing. The hot topics cover three dimensions of algorithm governance, algorithm governance and public management, including algorithm recommendation, cloud computing, algorithm risk, algo-rithm politics, digital human rights and so on.
文章引用:卢春芸. 国内算法治理的研究热点与演化趋势——基于CNKI数据库的可视化分析[J]. 运筹与模糊学, 2023, 13(3): 2378-2386. https://doi.org/10.12677/ORF.2023.133238

1. 引言

随着人类社会数字化程度的不断提升以及算法技术在互联网应用领域的不断渗透,其在为用户提供了某种程度上便利的同时,因算法而导致的对用户权益的侵犯问题也不断地发生。尤其是近年来“个性化推荐”“大数据杀熟”等名词的频繁出现,让越来越多的公众关注到算法,算法推荐、算法风险、算法黑箱等成为亟需解决的问题。例如,针对算法推荐问题,2022年初国家网信办等四部门出台《互联网信息服务算法推荐管理规定》,针对被诟病已久的问题提出明确要求 [1] 。除此以外,学术界也对算法治理领域展开大量的研究。除了数学及计算机科学外,算法治理还涉及到多个学科领域。对国内学者的研究成果进行梳理总结,可以将其分为两大类:一类是将算法作为治理的工具和方式,以对国家和社会进行治理,即算法治理,例如,在算法治理的含义上,张红春等将其定义为以算法为代表的新兴信息技术进行系统、集成应用的技术治理 [2] 。另一类是将算法作为治理的对象进行研究,即治理算法。算法本身存在着一些风险以及算法在治理过程中会带来一些隐患问题,对此,贾开提出如何在兼顾发展的前提下,对治理风险进行有效的控制,成了与算法治理有关的公共政策创新的一个重要内容。

随着国家和社会的重视与关注,国内关于“算法治理”的研究逐渐增多。那么关于算法治理研究的基本分布与状况如何?主要围绕那些主题进行讨论?算法治理研究的演进趋势又是什么?厘清这些问题有助于把握国内算法治理研究的现状、核心主题与发展演进趋势,对进一步推动算法治理研究具有重要意义。本文以2004~2022年间CNKI数据库中CSSCI期刊收录的有关算法治理研究的文献为分析对象,运用文献计量分析方法,借助CiteSpace软件,对算法治理研究相关文献的内容进行归纳总结,呈现国内算法治理研究的热点主题和演化趋势。

2. 数据来源与研究方法

本文的文本数据来源于中国知网(CNKI)数据库,为保证所收集数据的权威性和说服力,将来源类别限定为CSSCI,检索方式为:主题 = 算法治理,检索条件为高级精确检索,文献类别为学术期刊,时间范围不设限,但因为首篇相关文献于2004年出现,所以时间范围为2004~2022年,检索时间为2022年11月10日,共获得354篇文献。通过数据清洗,将“新闻报道”“会议”“图书”“学位论文”等文献剔除以及通过CiteSpace软件的去重功能,最终获得有效文献348篇。此外,本文借助CiteSpace V 6.2.R2可视化软件对数据进行处理,综合采用文献计量法、科学知识图谱和可视化分析方法,对2004~2022年间我国算法治理相关文献中的热点主题与演变趋势进行了统计分析,并将其可视化呈现出来,由此展现出了国内算法治理研究的知识全景。

3. 实证分析与讨论

3.1. 文献发文量分析

文献发表数量及时间分布能够从某种意义上揭示出这一学科的发展动态及其受到学界的重视。CSSCI数据库中算法治理研究的文献发表年份分布图,如图1

Figure 1. The number of domestic algorithm governance studies published in 2004~2022

图1. 2004~2022年国内算法治理研究发文数量

图1可以看出,在2004~2022年间,国内有关算法治理研究的相关文献除了2004年的一篇外,此后一直是空白,直到2011年才又开始有了相关研究,但2011~2015年这五年间每年仅都发文为1篇。此后,我国关于算法治理问题的论文发文量逐年增加,特别是最近三年的增长尤为显著。由此可以看出,我国的算法治理问题已经得到了越来越多的学者的重视。根据发文数量趋势图,可以将国内算法治理研究大致划分为三个阶段:萌芽探索期(2004~2015年)、初步尝试期(2016~2019年)和深入发展期(2020年至今),第一时期发文数量很少且中间还呈现停滞现象,年均发文量不足1篇,处于试探状态。第二个时期(2016~2019)是起步期,平均每年发文7篇,是上一个时期的7倍;第三个时期(2020~2022年)处于高速发展时期,与第一阶段相比,这个时期的发文数量有了很大的提高,平均每年发表103篇,比第二个时期翻了14倍。通过这一点,我们可以看到,在我国,对算法治理的研究已经进入了一个迅速发展和深入的阶段,并逐步成为了学术界的一个热门话题。

3.2. 研究力量分布

3.2.1. 核心作者发文量及合作关系分析

作者共现图谱直接反映作者发文次数,可以较为全面地呈现对该问题进行研究的作者的总体情况。如图2,连线代表作者之间存在着合作,连线颜色的深浅表示合作时间的远近,颜色越深,表示合作时间越近。字体的大小代表单个作者发文数量的多少。图中N值表示节点的数量为166,E值表示连线的数量为97,密度(density)值为0.0071,可以看出该数值较小,说明作者之间的合作比较分散。

核心作者代表着其在相关领域的研究中具有引领作用。根据莱普斯定律及其公式,m = 0.749 (ȵmax)1/2,其中,m代表核心作者发表论文的最小数量,ȵmax代表发表论文最多的作者的发文数量。根据该公式我们可以通过某一领域最高产作者的发文量来确定该领域核心作者的范围。根据图2可知,在国内算法治理研究领域发文数量最多的作者是张欣,在2019~2022年间共发表论文6篇,将ȵmax = 6带入公式,得到m = 1.83。由于论文发表数量必须取整数才有意义,所以m取23,根据计算结果,在该领域中,当作者的发文数量在2篇及以上时,即为核心作者。根据图谱信息可得核心作者分别有张欣(6篇)、贾开(5篇)、张凌寒(5篇)、张爱军(5篇)、许可(3篇)、周旅军(3篇)、肖红军(3篇)、唐桂垚(3篇)等。从图中可以看出国内算法治理研究的核心作者较为分散,呈现发散结构,可以看出多数作者为独立研究,仅陈霖团队、周旅军、陈劲等少数学者有合作,大部分学者之间尚未型成明显的合作研究。也一定程度上说明国内算法治理研究缺乏多层次的沟通和多向度的合作。

Figure 2. Analysis of the number of core authors’ publications and partnerships

图2. 核心作者发文量及合作关系分析

3.2.2. 研究机构发文量及合作关系分析

从机构(Institution)共现图谱中可以得出重点研究该领域的机构。如图3,节点表示研究机构,连线代表机构之间有合作,连线颜色的深浅表示合作时间的远近。从图中可以看出,在国内关于算法治理研究领域最具代表性的核心机构有对外经贸大学法学院(10篇)、电子科技大学公共管理学院(6篇)、华东政法大学政治学与公共管理学院(5篇)等。N值表示节点的数量为139,E值表示连线的数量为37,密度(density)值为0.0039,可以看出该值比较小,机构之间的合作比较分散,虽然机构之间存在合作但是合作还比较少。

3.3. 关键词词频及聚类分析

关键词指的是对文献主题与内容的高度浓缩和概括,关键词的词频代表了这个话题在学界的受欢迎程度与关注度。根据CiteSpace V软件生成得到2004~2022年国内算法治理研究的具体词频、中心性。其中,除了词频最高为95的关键词“算法治理”,词频排前的关键词分别是“人工智能”(词频52)和“算法”(词频为50),这反映出“人工智能”和“算法”是开展算法治理实践的基础性要素和关键支撑,在研究网络中占核心地位。

Figure 3. Number of publications and cooperation of research institutions

图3. 研究机构发文量及合作关系

CiteSpace以网络结构和聚类的清晰度程度为基础,通过Q值和S值两个指标来衡量图谱绘制的效果。根据关键词信息,并通过LLR算法可视化图谱分析得到11个主要的关键词聚类群,如图4,Q值为0.7475,大于0.3,S值为0.9038,大于0.5,表明社会结构显著、聚类效果良好且聚类结果令人信服。根据图谱信息可将热点主题分为两大维度:算法本身的治理和利用算法进行治理,第一个维度涉及算法治理的构成要素及算法治理引致的风险两个方面;第二个维度包括算法治理的应用研究以及政府层面的算法治理,如表1

Table 1. Keyword clustering chart of domestic algorithmic governance from 2004~2022

表1. 2004~2022年国内算法治理研究的关键词聚类图表

Figure 4. Keyword clustering map of domestic algorithm governance research

图4. 国内算法治理研究的关键词聚类图谱

3.4. 演进趋势分析

利用CiteSpace软件能够将某一时间范围内某个研究领域研究主题的演变趋势展现出来,还包括对相关研究进展和前沿动态进行考察。本文使用关键词聚类的突变词探测(Burst Detection)功能,展示2004~2022年间算法治理研究热点的变化。

突发主题词探测可以帮助检测短期内出现的关键字迅速增加或减少的现象。从图5可以看出,2004~2022年期间,国内算法治理方面的研究主要集中在以下三个时期:

Figure 5. Keyword sudden appearance diagram of algorithm governance research

图5. 算法治理研究的关键词突现图

第一阶段为2004~2015年,是算法治理研究的萌发时期,在此环节中,主要是以遗传算法为主,该关键字的出现频率较高,强度为2.64。相关文献主要围绕遗传算法以及电压优化与治理等的研究,对算法治理研究具有重要的启发和基础奠定作用。

第二阶段为2016~2019年,为算法治理研究的起步时期,这一时期,算法治理研究进展迅速,发文数量较前一时期有较大幅度增加,所涉及的关键词与聚类也比较丰富与全面,大部分关键词都是在此时期出现的,对于后续的算法治理研究起到了引导与传播的作用,其中以“谐波治理”、“人工智能”、“治理”、“新技术”、“智能投顾”、“算法歧视”等关键词最为突出。

第三阶段为2020~2022年,为算法治理研究的快速发展期,在这一阶段,与算法治理研究相关的发文量迅速增长,在前期已有主题的研究基础上,算法治理研究中出现了新的研究主题和关键词,包括算法权力、数据治理、算法决策、社会治理等。

4. 算法治理研究议题的梳理与评述

为了进一步探讨算法治理研究的进展,结合上述国内算法治理研究的关键词共现分析、关键词聚类分析与主题动态演进,从算法定义及外延、算法治理与治理算法、公共管理视角下的算法治理三个方面进行系统阐述。

4.1. 算法定义及外延

对于算法的概念,最开始与计算机科学没有直接关系,而是来源于公元9世纪波斯数学家花刺子米(al-Khwarizmi)名字的演化有关,直到20世纪30年将算法应用于计算机领域。

学者们根据不同的学科领域,形成了对算法的不同理解。在计算机科学领域,算法是计算机用来描述和解决问题的一种计算机制,可以简化理解为“算法 + 逻辑 = 控制”的表达 [3] 。进入21世纪,随着算法被越来越多地运用到社会生活中,它已经超越了传统的计算机科学而成为一种社会性的学科。

从社会层面看,算法不只是网络世界的代码,更是网络空间的法律规则 [4] 。而且,算法是一种新型的权力形式。社会学把算法看作是设计者和技术参数之间交互的结果,法学把它看作是法律原则外化的符号和象征,而哲学把它看作是法的道德属性。

可见,算法的概念研究有其特定的逻辑,随着科技的不断进步和人们对算法的认识不断深入,算法及其概念研究逐渐多元化。从单一具体的计算科学到社会学、法学、哲学等多学科的拓展,算法逐渐形成一个综合性概念。

4.2. 算法治理与治理算法

根据前文图谱信息以及算法治理的概念内容上,将算法治理分为两个维度,一是利用算法进行治理,即算法治理,算法是一种治理工具和方式;二是对算法本身的治理,这里算法是被治理的对象而不是治理方式,即治理算法。

4.2.1. 算法治理

当今社会进入了大数据和算法治理时代,人工智能在政府治理、社会治理等领域的应用中发挥着巨大的作用,尤其是随着人工智能和政府治理的逐步融合,产生了一种以算法决策为中心的新型的“算法治理”模式,它在很多方面帮助、甚至替代了人类的决策。

对于算法治理,学者们从不同的角度和方向进行理解。在胡键看来,算法治理的最重要的方式就是算法推荐,也就是根据所获取的线管数据,向有关的对象推荐,从而实现治理目标 [5] 。除此外,有学者从社会治理和国家治理的角度进行探析。首先在社会治理方面,算法治理可以促进社会治理体系现代化的实践过程、社会治理的理论创新以及重塑国家与社会的关系;在政府治理方面,梁玉成等认为算法治理的过程就是政府依托算法技术对社会实施管理,是政府运用算法进行治理,其治理对象是社会 [6] 。算法治理在精准扶贫、城市治理、疫情防控、教育管理等政府领域已经广泛应用,政府治理正经历着由传统治理向人工智能精准治理的范式转变。

4.2.2. 治理算法

算法治理隐藏着巨大的隐忧,在复杂的社会治理实践中,算法治理常常因存在算法不正义、算法歧视等现象而失效并引发一系列社会伦理和算法风险问题 [7] 。丁晓东从法律的角度,将算法带来的隐忧归为三个方面:一是算法黑箱可能挑战人类决策的知情权与自主决策。算法的不透明性被视为算法治理的最大挑战 [8] 。二是算法可能威胁个体隐私与自由。三是算法可能导致歧视与偏见。除了上述问题,人们还会面临更实际的算法伦理等方面的问题,尤其是偏见和歧视问题。当面对算法黑箱时,人们不得不担心自己是否被公平对待 [9] 。贾开关注算法因其技术逻辑及应用方式的特性而带来的问题,他认为算法在其应用过程中存在不可解释隐忧、自我强化困境、主体性难题这三方面治理挑战,并提出如何在兼顾发展的前提下,有效控制治理风险便成为算法治理相关公共政策创新的主要内容 [10] 。

综上所述,在算法治理中,不仅仅要有效利用算法这个新技术去进行有效治理,还有防范算法风险,对算法本身存在的问题进行治理。孙庆春等认为,对于算法的治理可以从以下三个问题解决:一是如何克服社会公众对算法黑箱在心理层面的担忧;二是如何实现算法与社会公众的有效沟通;三是确保算法决策是在负责任的基础上做出的。因此,算法框架应至少包括公开、解释与责任等三个方面 [9] 。

4.3. 公共管理视角下的算法治理

在公共管理领域,算法作为一种有效的治理手段被广泛地应用于各个领域,并在一定程度上提升了政府的工作效率与水平。

基于公共管理学科的视角,贾开着重探讨了算法对社会运行的影响规律,并尝试从规则的生成和运用两个方面来探讨算法对社会运行的作用机理和过程 [10] 。昌诚等从公共价值创造方面总结出算法治理在提升治理效率、改善服务质量以及创新治理方式三个方面创造绩效价值 [11] 。算法治理带来公共管理现代化的新形势,必然带来公共管理的新范式。它的核心机理是:一种新的治理技术与工具,以及作为一种新的公共行政组织形式的新治理模式。

5. 结论与展望

首先,从文章结构和研究意义整体上来看,本文将2004~2022年期间CNKI数据库中CSSCI期刊收录的关于算法治理研究的348篇文献作为数据源,借助文献计量法和可视化软件CiteSpace,探讨我国算法治理的发展历程、热点主题和演变趋势。

其次,针对文章中的内容和结果,本文研究发现从整体上来看,我国针对算法治理的研究呈现出了迅速增长的态势,其影响也在逐步提高,然而学界对算法治理的定义尚未形成统一的认识,同时对文献检索过程中其他同义词缺少考虑。

最后,在具体细节方面,仍有不足,未对算法治理进行深入分析,算法治理包括哪些工作,算法治理常常因存在算法不正义、算法歧视等现象而失效并引发一系列社会伦理和算法风险问题,这些风险体现在哪些方面,文献研究启示如何。

参考文献

[1] 王思北, 阳娜, 周琳, 颜之宏. 聚焦《互联网服务算法推荐管理规定》五大看点[EB/OL]. https://mbd.baidu.com/ma/s/V6pJCX9f, 2022-01-06.
[2] 张红春, 章知连. 从算法黑箱到算法透明: 政府算法治理的转轨逻辑与路径[J]. 贵州大学学报(社会科学版), 2022, 40(4): 65-74.
[3] Kowalski, R. (1979) Algorithm = Logic+Control. Communications of the ACM, 22, 424-436.
https://doi.org/10.1145/359131.359136
[4] [美]劳伦斯.莱斯格. 代码2.0: 网络空间中的法律[M]. 李旭, 等, 译. 北京: 清华大学出版社, 2018.
[5] 胡键. 算法治理及其伦理[J]. 行政论坛, 2021, 28(4): 41-49.
[6] 梁玉成, 张咏雪. 算法治理、数据鸿沟与数据基础设施建设[J]. 西安交通大学学报(社会科学版), 2022, 42(2): 94-102.
[7] 胡键. 算法治理及其伦理[J]. 行政论坛, 2021, 28(4): 41-49.
[8] 丁晓东. 论算法的法律规制载[J]. 中国社会科学, 2020, 300(12): 138-159+203.
[9] 孙庆春, 贾焕银. 算法治理与治理算法[J]. 重庆大学学报(社会科学版): 1-10.
[10] 贾开. 人工智能与算法治理研究[J]. 中国行政管理, 2019, 403(1): 17-22.
[11] 昌诚, 张毅, 王启飞. 面向公共价值创造的算法治理与算法规制[J]. 中国行政管理, 2022(10): 12-20.