摘要: 本文聚焦于中国知网2013至2023年间收录的关于国内数据新闻研究的核心期刊文献,运用CiteSpace可视化文献分析工具,从发文数量、核心作者群体分布、学科交叉情况、关键词共现与聚类分析、以及时间演化趋势等多个维度,对文献数据进行了系统而深入的可视化剖析。分析结果表明:数据新闻核心期刊的发文量呈现出先增后减的波动趋势;学者分布较为广泛,但作者间的合作紧密度不高,且研究跨越了多个学科领域。当前,该领域的研究热点紧密围绕大数据、可视化呈现、叙事策略、新闻生产模式、新闻业变革、《卫报》案例、媒体融合趋势以及数据科学等议题展开。值得注意的是,数据新闻的研究已逐步从基础的概念界定与生产流程探讨,向外拓展至伦理规范构建、数据科学应用及人工智能融合等前沿领域,体现了研究领域的不断深化与拓展。
Abstract: This paper focuses on the core journal literature about domestic data journalism research collected by China National Knowledge Internet (CNKI) from 2013 to 2023. By employing the CiteSpace visualization tool for literature analysis, the paper conducts a systematic and in-depth visual analysis of the literature data from multiple dimensions, including the number of publications, the distribution of core author groups, interdisciplinary situations, keyword co-occurrence and clustering analysis, as well as temporal evolution trends. The analysis results reveal that the number of publications in core journals on data journalism exhibits a fluctuating trend of first increasing and then decreasing. Scholars are widely distributed, yet the collaboration among authors is not tight, and the research spans multiple disciplines. Currently, research hotspots in this field closely revolve around topics such as big data, visualization, narrative strategies, news production models, journalism transformation, The Guardian case studies, media convergence trends, and data science. Notably, research on data journalism has gradually expanded from foundational concept definitions and production process discussions to cutting-edge areas including ethical norm construction, data science applications, and artificial intelligence integration, demonstrating the continuous deepening and broadening of the research field.
1. 引言
数据新闻作为一种新的新闻生产模式,能够提高新闻报道的准确性和可信度,受到越来越多传统媒体的青睐。自2011年起,我国传统门户网站网易、腾讯、搜狐相继开启了数据新闻的实践之路。如《网易数读》《谷雨数据》《数字之道》等。随着数据新闻在国内的深耕发展,国内学界也对数据新闻进行了深入探讨,累积了丰硕的研究成果。笔者通过对这些研究成果进行梳理和总结,充分了解当下研究热点、分析研究不足、提出研究展望,对更好地促进数据新闻本土化发展有着重要意义。
2. 数据获取与研究方法
2.1. 数据获取
本研究主要分析国内数据新闻的研究概况,故而以CNKI数据库为检索平台,数据来源为CSSCI,检索关键词为“数据新闻”、“数据新闻报道”、“数据新闻传播”、“数据新闻作品”、“新闻可视化”,检索年限为2013~2023年,去除明显与本研究不符的文献,最终共获取493篇文献。
2.2. 研究方法
CiteSpace是一款基于java程序的数据分析工具,它主要基于共引分析(cocitation analysis)理论和寻径网络算法(pathfinder network scaling, PF-NET)等,对特定领域文献进行计量,以可视化图谱的形式揭示学科领域演化的关键路径及知识转折点[1]。本文采用CiteSpace 6.2.R6 (64-bit)对数据新闻领域的相关文献进行可视化分析,绘制作者共现图谱、关键词共现图、时间线图谱、关键词突现图等,旨在深入分析数据新闻的发文量趋势、核心作者分布、研究热点以及发展趋势,从而为学界未来研究提供一定思路。
3. 数据分析结果
3.1. 发文量结果
2013~2023年数据新闻领域研究成果数量时间分布图如图1所示。2013~2023年10年间,学界有关数据新闻的研究,呈现了先爆发增长后缓慢衰落的趋势。根据图1可以将其分为两个阶段:第一阶段为2013年~2017年逐年上升阶段。从2013年21篇呈直线增长至17年的82篇,达到顶峰。第二阶段为2017年~2023年逐年下降阶段。从2017年的82篇缓慢递减至23年的17篇。由此可预测:未来学界对数据新闻的研究热情将缓慢递减。
Figure 1. Time distribution chart of research achievements in the field of data news from 2013 to 2023
图1. 2013~2023年数据新闻领域研究成果数量时间分布图
3.2. 核心作者分布
数据新闻领域的蓬勃兴起,得益于一批理论基础坚实且研究成果丰硕的核心研究力量的支撑[2]。在界定这些核心作者时,我们依据了发表文章的数量以及文章的被引用次数作为关键指标。借助CiteSpace软件,笔者绘制了图2:核心作者合作共现网络图谱,其中Nodes (节点)总数为274,Links (连线)数量为81,Density (密度)值为0.0022 [2]。分析结果显示,该领域内核心作者间的合作网络密度偏低,表明合作程度不高,尚未形成规模化、系统化的研究合作群体。
进一步观察图谱中的“Summary Table”,我们发现共涉及274位核心作者,包括合作作者在内。为了更清晰地展示高产作者群体,笔者筛选出发文量超过3篇的作者,并编制成表1:数据新闻研究高产作者表。根据普莱斯定律(Price’s Law),计算出该领域核心作者的最小发文量门槛M,公式为M = 0.749 * (Nmax)1/2,其中Nmax为最高发文量。在本研究中,Nmax = 12,因此M ≈ 4.494,四舍五入后M约为4。这意味着,发表文章数量达到或超过4篇的作者被视为该领域的核心作者。统计结果显示,共有8位作者符合此标准,他们共发表了44篇文章,占据了该领域总论文数的8.9%。
在这些核心作者中,张超、喻国明、孟迪、刘涛等学者的节点数较为显著,表明他们在该领域具有较高的影响力。同时,研究者之间虽已形成了一定的子网络结构,以彭兰、喻国明等人为核心的网络结构尤为突出,但整体上高产作者之间的合作较为稀缺且模式单一,与其他高发文量的学者合作机会有限。这一现象反映出数据新闻研究领域内的学者分布较为分散,尽管广泛引起了学术界的关注,但深入探究和集中研究的力量仍显不足,体现了该议题在研究集中度与深度上的双重挑战。
Figure 2. Collaborative co-occurrence network graph of core authors
图2. 核心作者合作共现网络图谱
Table 1. High yield author table for data news research
表1. 数据新闻研究高产作者表
排名 |
发文量 |
年份 |
作者 |
1 |
12 |
2018 |
张超 |
2 |
6 |
2013 |
喻国明 |
3 |
6 |
2016 |
孟笛 |
4 |
4 |
2016 |
刘涛 |
5 |
4 |
2015 |
任瑞娟 |
6 |
4 |
2017 |
曾庆香 |
7 |
4 |
2017 |
吴小坤 |
8 |
4 |
2013 |
彭兰 |
9 |
3 |
2017 |
卢长春 |
10 |
3 |
2013 |
方洁 |
11 |
3 |
2017 |
吴晓虹 |
12 |
3 |
2017 |
付晓静 |
13 |
3 |
2016 |
刘银娣 |
14 |
3 |
2016 |
陈积银 |
15 |
3 |
2013 |
徐腾飞 |
16 |
3 |
2014 |
刘义昆 |
17 |
3 |
2013 |
颜清华 |
18 |
3 |
2013 |
陈昌凤 |
3.3. 学科分布图
根据知网学科分布可视化图表,如图3可知,数据新闻研究主要涉及新闻传播学,占比87.3%。此外,高等教育、出版、图书情报与数字图书馆、计算机软件及计算机应用、民商法等领域也对数据新闻有所涉及。可见,数据新闻涉及学科较多,在未来研究应注重多元学科视角的插入。
Figure 3. Distribution map of disciplines in data news research
图3. 数据新闻研究学科分布图
3.4. 研究热点
3.4.1. 关键词共现图谱分析
Figure 4. The co-occurrence map of keywords in data news research from 2013 to 2023
图4. 2013~2023年数据新闻研究关键词共现图谱
通过CiteSpace软件对493篇文献进行关键词共现分析,揭示数据新闻领域研究热点。其中连线数量为500条,网路节点数量为262个,网络密度为0.0146。2013~2023年数据新闻研究关键词共现图谱如图4显示。在论文主题、关键词以及科学类别的网络图谱中,节点的大小代表他们出现的频次,之间的连线表示共现的强度[3]。关键词密度一般在3%~5%较为合适,密度为0.0146则表明数据新闻研究领域中不同的研究热点间关系不太紧密。
将图4图谱中的关键词共现的“Summary Table”导入Excel表格中并进行整理,得出表2:数据新闻研究高频及高中心性关键词表。结合图4和表2,可以看出,2013~2023年中,数据新闻研究领域主要围绕着数据新闻(277, 1.25),大数据(84, 0.27),可视化(68, 0.21),新闻生产(22, 0.05),媒体融合(16, 0.02),新闻传播(13, 0.04),《卫报》(12, 0.02),新闻叙事(10, 0.01)等议题进行了多维度的讨论。这表明数据新闻的研究是智能传播技术提高后对当下新闻写作叙事提出的新的要求。学界研究主要包含着对新闻业未来发展方向的思考、大数据时代下新闻叙事的改进策略、人才的培养以及新旧媒体融合等内容。
Table 2. High frequency and high centrality keywords in data news research
表2. 数据新闻研究高频及高中心性关键词
排序 |
关键词 |
频次 |
中介中心性 |
1 |
数据新闻 |
277 |
1.25 |
2 |
大数据 |
84 |
0.27 |
3 |
可视化 |
68 |
0.21 |
4 |
新闻生产 |
22 |
0.05 |
5 |
媒体融合 |
16 |
0.02 |
6 |
新闻传播 |
13 |
0.04 |
7 |
《卫报》 |
12 |
0.02 |
8 |
新闻叙事 |
10 |
0.01 |
9 |
人才培养 |
9 |
0 |
10 |
新闻业 |
8 |
0.08 |
11 |
叙事 |
7 |
0.02 |
12 |
人工智能 |
7 |
0 |
13 |
数据科学 |
7 |
0.02 |
14 |
新闻价值 |
7 |
0 |
15 |
信息图表 |
7 |
0.02 |
16 |
交互性 |
6 |
0 |
17 |
新闻报道 |
6 |
0.01 |
18 |
传统媒体 |
5 |
0 |
3.4.2. 关键词聚类图
相对于高频关键词的简单罗列,在CiteSpace中将高频关键词进一步聚类的功能,可以将样本中有明显特征的词汇作为聚类对象,挖掘出在过去十年间数据新闻研究的研究热点[4]。聚类结果如图5所示,Modularity Q = 0.5154,Silhouette值为0.8224。Q > 0.3表明网络结构化显著,数值越大,聚类结果越好,Silhouette值 > 0.5表明聚类结果合理。聚类信息具体见图5。根据图4显示,数据新闻领域研究热点主要集中在大数据、可视化、叙事、新闻生产、新闻业、《卫报》、媒体融合、数据科学领域,这表明研究领域较为全面。
Figure 5. Keyword clustering graph for data news research
图5. 数据新闻研究的关键词聚类图谱
3.5. 发展趋势
3.5.1. 时间线图谱
Figure 6. Time zone visualization map of hot topics in data news research from 2013 to 2023
图6. 2013~2023年数据新闻研究热点时区可视化图谱
为了进一步分析数据新闻研究热点在时间维度上的演进变化,本文利用CiteSpace软件得到2013~2023年数据新闻研究热点时区可视化图谱,如图6所示。由图可知,在早年间,大数据、可视化、叙事策略、新生生产一直是该领域研究的重点,后来随着科学技术的发展,媒体融合、新闻叙事以及数据科学也成了该领域新兴的研究热点。
3.5.2. 关键词突现图谱
除此之外,数据新闻在各个时期的议题各有不同,为了更加清晰地显示出各个议题的演进情况,笔者绘制了重点关键词突现图谱,如图7所示。数据新闻关键词突发性图谱展示了文献被引频次在某一时间段内出现的突增或突减情况。这些突现词直接反映了某一时间段内研究热点的重大转向。通过检测,研究发现5个关键词在这十年研究中存在突现:大数据、信息图表、人工智能、数据科学、新闻传播。其中“大数据”和“信息图表”仅在前两年突现,2018~2019年的突现词为“人工智能”,2019年的突现词为“数据科学”,2021年的突现词为“新闻传播”。其中“数据科学”和“新闻传播”二者的突现率一直延续至今,所以可以说明“数据科学”和“新闻传播”这两个议题仍是我国目前数据新闻研究的主要议题。
Figure 7. Key keyword emergence graph in data news
图7. 数据新闻重点关键词突现图谱
结合时区可视化图谱和重点关键词突现图,以及上文所列的大节点关键词、主题词的分布状态及演进趋势,将热点时区分为以下3个阶段:
(1) 数据新闻研究的初始阶段:2013年~2014年
这一阶段出现的关键词主要有“数据价值”、“中国实践”、“《卫报》”、“传统媒体创新”等等。这一时期,数据新闻在国内刚刚兴起,学界对数据新闻的态度还处于新潮与传统的十字路口间,关注点主要集中在数据新闻有无价值、与传统媒体有何关系、如何利用这三方面。
(2) 数据新闻研究的快速发展阶段:2014年~2017年
这一阶段出现的关键词主要有“媒体融合”、“新闻叙事”、“创新”、“交互性”、“开放数据”“人才培养”。这阶段国内研究学者对数据新闻的研究热情日益高涨,涉及的领域也在不断拓宽。如秦艺轩从数据新闻获取方式、表现形式以及叙事方式这三大核心要素出发,阐释数据新闻与其他新闻形式的区别[5]。方洁等人通过与数据新闻从业人员进行访谈,试图勾勒出我国数据新闻本土化生态的图景,并为数据新闻的在地化提供了一些建议[6]。
(3) 数据新闻研究的平稳发展期:2017年~2023年
这一阶段从整体发文数量以及关键词出现的数量来看,学界对该领域的研究进入了平稳发展期。这一阶段出现的关键词有“数据科学”、“人工智能”、“融媒体”、“数字新闻”、“5G传播”、“受众体验”等。在这个时间段,新兴技术不断涌入传媒领域,使得数据新闻有了更多样的表现形式,国内学者的研究也逐渐细化,转向对相应技术下新闻业表现形式创新的研究,这也不断充盈了数据新闻这一大课题。学者张超、闪雪萌、刘娟对2013~2018全球数据新闻获奖作品进行分析后,数据新闻在数据科学专业性上还有很大提升[7]。数据新闻是传统新闻业“再专业化”的一次契机,在大数据和人工智能技术的驱动下,媒体自建数据库为民众提供个性化服务、利用非结构化数据洞察更广阔的社会现实、借助人工智能提升大数据处理与洞察能力是未来数据新闻发展的新趋势。
4. 总结
从上述分析,今后学术界对数据新闻领域的研究热情将会有所下降,更多的学者是将数据新闻这一命题与前沿技术结合起来,共同探讨当下新闻业表现形式的创新研究,以回应新业态形势下,受众对新“新闻”的需求,并不断促进传媒业态转型升级。另外,学界还需加强学者与学者的交流合作,促进国内数据新闻研究的快速发展,并鼓励不同学科背景的研究学者特别是计算机领域、人工智能领域的学者进行交叉领域合作,不断拓展数据新闻涉及的领域和深入数据新闻的元概念性问题等。