国内数据新闻研究的知识图景与演进
Knowledge Landscape and Evolution of Domestic Data Journalism Research
DOI: 10.12677/JC.2023.114134, PDF, HTML, XML, 下载: 141  浏览: 529 
作者: 陈凯莉:暨南大学新闻与传播学院,广东 广州
关键词: 数据新闻文献计量CiteSpace知识图谱Data Journalism Bibliometrics CiteSpace Knowledge Graphs
摘要: 本文基于CiteSpace软件的知识图谱可视化功能,对CNKI数据库2002~2022年间关于中国数据新闻研究的CSSCI期刊文献进行文献计量分析,结果显示:2013年前,数据新闻研究产出非常有限,此后才经历“井喷–下滑–回升”等过程;在学术合作与共建上,该领域存在较为松散且低密度的学术合作关系。研究主要内容则聚焦基础理论、实践应用、伦理风险与规范发展、人才培养与数据新闻教育等方面。研究领域延展有限,多涉及“大数据”、“可视化”等议题。但面对新的数字信息环境,“可供性”生态学视角正在被引入数据新闻的研究领域,为其提供了新型视角及创新性的研究路径。
Abstract: Based on the knowledge graph visualization function of CiteSpace software, this paper conducts a bibliometric analysis of CSSCI journal literature on data journalism research in China between 2002 and 2022 in the CNKI database, and the results show that: the output of data journalism research was very limited before 2013, and then went through the process of “blow-out-decline-rebound”; in terms of academic cooperation and co-construction, there are loose and low-density academic partnerships in this field. The main content of the research focuses on basic theory, practical application, ethical risk and normative development, talent training and data journalism education. The extension of the research field is limited, mostly involving topics such as “big data” and “visualization”. However, in the face of the new digital information environment, the ecological perspective of “availability” is being introduced into the research field of data journalism, providing a new perspective and innovative research path.
文章引用:陈凯莉. 国内数据新闻研究的知识图景与演进[J]. 新闻传播科学, 2023, 11(4): 908-919. https://doi.org/10.12677/JC.2023.114134

1. 导语

近年来,随着大数据的迅猛发展,“数据新闻”这一概念逐渐流行于各实践领域。特别是在新闻传播行业,大数据被视为新闻创作和信息采集的关键资源。早在2012年英国《卫报》就创作出名为《伦敦骚乱中的谣言》的数据新闻作品,并赢得国际首届“新闻数据奖”的荣誉。不仅如此,从1997年开始,国外学术界便开始兴起了关于数据新闻的学理求证 [1] 。与国外相比,我国数据新闻的研究及实践相对滞后。但在近几年的发展中,国内也涌现出了诸如人民网的“图解新闻”、新华网的“数据新闻”等优质的数据新闻制作团队。鉴于数据新闻被普遍应用的现状及其现实意义,本文对国内数据新闻研究进行历时性的文献计量分析。

通过对CNKI数据库的初步检索发现,CSSCI期刊收录的关于数据新闻研究文献最早是在2002年,且国内此前已有文献对中外数据新闻的研究进行文献计量分析,样本时间多截止至2018年,但鉴于知识的演进会随着时间及技术的进步而迭代更新,因此本文以CNKI为数据源,以CSSCI期刊收录的与数据新闻相关的628篇文献为研究对象,运用CiteSpace探究数据新闻研究的发展脉络、知识图谱与前沿热点,旨在为深化数据新闻研究、实践应用等方面提供有益参考。

2. 研究方法与数据处理

2.1. 研究方法

科学知识图谱是以知识域为对象显示科学知识的发展进程与结构的一种图像 [2] 。本文采用信息可视化软件CiteSpace,它是由美国雷德赛尔大学的陈超美教授与大连理工大学的WISE实验室联合开发的科学文献分析工具。可对特定领域文献进行计量,以呈现某一学科领域的知识结构和发展路径 [3] 。本文主要运用了作者、机构和关键词共现等分析方法,借可视化手段直观呈现国内数据新闻研究的知识演进、前沿热点及学术版图。

2.2. 数据来源与处理

为保证文献的代表性,本文以“数据新闻”或“数据驱动新闻”或“数字新闻”为主题、以2002~2022年为时间范围、以CSSCI期刊为数据源进行高级检索,共获得628篇有效文献作为样本数据来源。

3. 国内数据新闻研究领域的发展状况与特点

本部分从数据新闻研究的时间分布、作者及机构等方面描绘国内数据新闻研究的基础知识图景。

3.1. 文献量分析

对于每一研究领域而言,文献量统计图能够明确反映并直观衡量其科研发展趋势以及研究热度变化。国内数据新闻发文量如图1所示。

Figure 1. Annual publications in the field of data journalism research in China

图1. 国内数据新闻研究领域年度发文量

图1可知,在时间维度上,国内数据新闻研究的总体发文趋势呈现阶段性变化,经历了零星出现–爆发式增长–下滑回落–快速回升。在2013年之前,国内关于数据新闻的核心科研成果极少,仅有零星发表,其中2002、2006年各1篇,2011和2013都仅有3篇,除此之外其他年份均无发表相关成果。但2013年至2017年间,研究成果出现井喷式增长,平均每年有60篇文章发表,其中缘由可结合业界实践:2012年,我国首个数据新闻实践平台成功上线,次年几名中国香港学生将《数据新闻手册》翻译出中文版,并致力于搭建中国的数据新闻网 [1] 。这些事件标志着数据新闻正式在国内兴起并逐渐流传开,并带来了学者研究热情的高涨。但2018年至2020年期间,数据新闻研究深入性不足 [1] ,无突破性成果,文献数量逐渐下滑。但与此同时,随着全球新闻业数字化的深入,新闻样态和业态持续变革,这刺激了新闻学的理论创新需求,呼唤研究新范式的诞生 [4] 。于是在2021年,常江、彭兰等学者将开始关注“可供性”概念,并探索出一种能够阐释数字技术背景下的新闻生产与接受实践模式的新路径 [5] 。数字技术使得多方面的“可供性”得到增强,也带来了多方向的深度融合,使得新闻业的边界不断消融 [4] 。从研究成果来看,2021年与2022年核心文献数量有所回升,均为79篇。

3.2. 学者合作网络分析

为了发现数据新闻领域研究的中坚力量,探寻该领域的核心作者群体,本文将CiteSpace的节点类型设置为“Author”,将时间切片设为1,TopN的阈值设置为30,最终绘制出了发文作者合作共现图谱(见图2)。

图中,发文频次越高的作者,其节点越大,而节点之间的连线则代表合作关系 [2] 。由图2可知,作者合作网络图谱共有节点725个,连线467条,网络密度为0.0018,这表明该领域虽然学者数量很多,但合作关系较为松散。具体而言,从发文数量看,核心作者中发文量10篇以上的学者有3位,其中常江学者的发文量最高,甚至相较其他学者发文量而言是断崖式的超越,总计41篇,其次张超学者共计发表17篇,田浩学者12篇,其他发表论文数量较多的作者还有白红义(8)、彭兰(8)、喻国明(6)等,这些作者形成了作者网络图谱中的关键节点,在数据新闻研究领域有一定的影响力。

Figure 2. Co-occurrence map of authors’ collaboration in the field of data journalism research in China

图2. 国内数据新闻研究领域作者合作共现图谱

从作者合作网络看,国内数据新闻研究领域各研究者之间相互合作形成了若干研究团队,其中以常江为中心的研究团队规模最大,共有15人,杨奇光、田浩、喻国明、杨惠涵等学者也分别形成了规模4~6人不等的合作团队。此外,在核心作者群之外还存在大量独立的发文作者,他们之间合作密度较低。纵观来看,国内不少学者围绕数据新闻展开了具体研究,但学术共同体的合作关系较为松散。

3.3. 研究机构分析

通过CiteSpace软件Institution模块可生成国内数据新闻研究机构合作关系图谱(见图3),从而进一步分析研究机构的发文量及其合作关系。

图3可知,研究机构图谱中共有408个节点,210条连线,网络密度为0.0025,可知在合作网络上,机构间的跨校合作氛围较好,但合作密度较低。具体而言,中心度较高的发文机构分别有中国人民大学新闻学院及其新闻与社会发展研究中心、中国传媒大学、北京师范大学新闻传播学院等机构,表明这些机构与其他机构进行科研合作的频次较高,是机构合作网络中的核心节点。

其次,从发文量上看,表1统计了国内数据新闻研究领域发文量前10的机构,据此可以看出,国内数据新闻研究依然以老牌院校为主导,其中中国人民大学新闻学院及其新闻与社会发展研究中心、清华大学新闻学院等单位是研究数据新闻的主力军。其次,深圳大学在数据新闻领域的研究实力不可小觑,其传播学院及媒体融合与国际传播研究中心的发文量分别位列第3、第6,科研成果显著。

Figure 3. Co-occurrence map of cooperation among research organizations in the field of data journalism research in China

图3. 国内数据新闻研究领域研究机构合作共现图谱

Table 1. Ranking of the number of articles published by the core organizations of domestic data journalism research

表1. 国内数据新闻研究核心机构发文量排名

4. 数据新闻的研究热点及趋势分析

4.1. 研究主题识别:通过关键词共现所呈现的学术脉络

通过CiteSpace软件可提取21年间国内数据新闻研究的高频和高中心性关键词,据此看出研究的核心领域及主题之间的相关性,继而了解国内数据新闻研究的总体特点。

根据图4表2,从关键词频次上看,可知除了“数据新闻/数字新闻”本体研究外,国内数据新闻研究热点领域主要集中在“大数据”、“可视化”、“新闻生产”、及“新闻业”等领域。其次,从关键词的中介中心性来看,“数据新闻”的中心性(0.67)最大(见表2),表示以数据新闻为中心的研究数量最具优势,与之相关联的有媒体融合、《卫报》、新闻生产等内容。值得注意的是,图4中的分支集聚圈数量不多且非常小。因此总体而言,21年间国内数据新闻的研究领域延展有限,尚停留在“大数据”“可视化”阶段,且相关领域之间的研究关联性与承接性不足,研究内容松散、孤立等特征显著,研究系统性有待完善。

Figure 4. Keyword co-occurrence mapping in the field of domestic data journalism research

图4. 国内数据新闻研究领域关键词共现图谱

Table 2. High frequency and high centrality keywords in data journalism

表2. 数据新闻高频及高中心性关键词

4.2. 研究内容归纳:以关键词聚类为基础所显现的学术版图

通过CiteSpace的LLR算法提取关键词,生成高频关键词聚类图(见图5),其中Modularity = 0.6184 > 0.3, Mean Silhouette = 0.807 > 0.5,说明聚类情况良好 [6] 。由表3可知,最大的两个聚类是聚类0“数据新闻”和聚类1“可视化”。

Figure 5. Data news keyword clustering mapping

图5. 数据新闻关键词聚类图谱

Table 3. Keyword co-occurrence network 13 automatic clustering

表3. 关键词共现网络13个自动聚类

接着,本文基于前人研究和上述关键词聚类图谱,将数字新闻研究内容分为以下几个板块,以期理顺国内数据新闻研究的学术核心版图。

4.2.1. 数据新闻基础理论研究

这类研究主要包括聚类图中的#0、#1、#2、#3,论文内容主要关注数据新闻的内涵与特征、数据新闻的功能与价值的学理性探究等。

一是关于数据新闻的内涵与特征,国内研究对数据新闻的定义经历一个“概念化转向”的过程。2020年以前,“数据”、“可视化”等概念是学界对数据新闻的理解“落脚点”,前者界定数据新闻是“数据经过收集、统计、分析以及可视化处理之后呈现在新闻报道中” [7] ,后者认为数据新闻是新闻领域的可视化产物,其具体呈现形式包括静态信息图和互动图表 [8] 。2020年,常江通过扎根理论,尝试对“数字新闻学”成为一种新新闻理论体系的现实性和可能性进行探索,并在后来从“可供性”概念切入做出细致考察,最终将“数字新闻”再定义为“由数字媒体的技术可供性培育的,兼有网络化、行动性和情感化特征的一种新型公共信息关系” [9] 。

二是数据新闻的价值及功能探析。学术界广泛认同,大数据正在积极而深刻地影响新闻业,拓展新闻报道的功能和价值。从微观层面来看,数据新闻能够在各方面以其数据优势赋能新闻业的信息传播,譬如在叙事效果上,大数据的可视化手段可以加深新闻叙事的深度及成效 [10] ;在事实解读上,数据挖掘与分析可直观呈现数据的关联性,并为揭示内部规律提供依据 [11] ;在趋势预测上,数据新闻能够有效预测未来的发展动向 [12] 。从宏观层面来看,数据新闻的普及对新闻行业的组织结构和人力资源的整合产生了积极的影响,不仅有助于提高新闻实践的创新力和竞争力,也进一步丰富了学者的研究视域和敏锐度 [13] 。在肯定数据新闻功能的同时,学界也对其进行价值反思,比如指出“数据维大”的大数据思维也容易导致新闻价值异化,甚至违背新闻报道的“个性化”“精确性”理念 [12] 。

4.2.2. 数据新闻实践应用研究

这类研究出现于图中的聚类#5,其中案例分析、比较分析、文本分析等研究方法较受青睐。论文内容主要由以下三个部分构成:

(1) 对国外数据新闻实践研究

国内学者多以案例分析为主,聚焦国外代表性媒体在不同新闻情境下的生产实践,继而总结国外数据新闻实践经验。如在突发事件新闻中,方洁等指出,在弗格森枪击案报道中,美国媒体整合多种渠道快速获取数据、结合对背景信息来寻找报道角度、在平时做好数据资料储备等新闻报道技巧给国内媒体以启示 [14] 。在财经新闻报道中,杭敏等以彭博新闻社报道为例,发现数据对于记者而言,能帮助其找出新闻点;对于事件而言,提供新的深入的解读视角;对于预测未来趋势而言,能够成为一种有效分析工具 [15] 。

(2) 对国内数据新闻本土化研究

在本土化研究中,学者集中于国内代表性的新闻机构,从内容创作、新闻融合、可视化设计等方面对其数据新闻实践进行经验性总结。内容创作层面,周善以我国网易、新浪、腾讯和搜狐四大网络新闻门户网站的数据新闻为例,分析了其选题构成、数据挖掘、可视化表达等方面的特点及不足,并提出了国内网站媒体在专业生产内容方面的可循之途 [16] 。在新闻融合层面,刘双等以“两会大数据”、“据说两会”为例,积极探索和推动大数据与我国电视媒体新闻报道的融合 [17] 。

(3) 对比中外数据新闻实践研究

在对比研究方面,主要是借鉴国外优秀的发展经验,以探讨如何完善中国的数据新闻产业的未来发展。刘义昆等探讨了数据新闻的中国实践与中外差异,并反思国内数据新闻生产的局限 [18] 。黄洪珍等人也总结了中外数据新闻实践的相似点,指出我国数据新闻实践领域面临的主要问题:数据获取渠道狭窄;很少关注民生;制作形式单一 [19] 。

4.2.3. 伦理风险与规范发展

这类研究主要在图中的聚类#2,论文内容主要探究采集及使用数据时的真实性、侵权等问题,同时探讨在未来如何处理各类数据,保障数据新闻生产的正确性及合理性。王海滨等指出目前数据新闻存在算法、隐私及应用风险,需从坚守新闻理念、风险预防、完善立法、行业监管等多个角度来进行实践规范 [20] 。张超也曾指出在数据新闻生产中存在个人数据滥用行为,而“知情同意、合法适度、公共利益优先与最小伤害”四项原则是纾困之道 [21] 。

4.2.4. 人才培养与数据新闻教育

图中的#2主要提及这类研究,在人才培育上,国内学者立足数据新闻实践要求,结合国外人才培育经验,对新闻从业者专业水平及数据素养的培育路径进行探究并提供参考。刘银娣在考察了欧美数据新闻人才培养方式后,为大数据环境下我国新闻人才培养模式的转型提供借鉴和参考 [22] 。在高校数据新闻教育上,学者一方面从国外数据新闻专业教育入手对其新闻教育进行经验性研究,一方面对我国数据新闻教育发展进行探讨。如高雁提出,高校应对专业课程进行增设创新,增加“网络新闻”、“数据挖掘”等课程,并在条件许可情况下,创建新媒体实验室 [23] 。

4.3. 研究趋势辨析:基于关键词聚类时间线所展现的演进路径

为了更形象地展现国内数据新闻研究领域的演进过程与趋势,本文通过CiteSpace软件绘制出了该领域的关键词聚类时间线视图(见图6)。

Figure 6. Timeline mapping of data news keyword clustering

图6. 数据新闻关键词聚类时间线图谱

前文已提及,由于在2013年之前国内对数据新闻研究文献资源稀缺,仅有1~3篇的零星发表,不足构成学科发展的起始点,故国内数据新闻的演变应从2013年正式开始的。结合图6图7的内容,本文对数据新闻的研究趋势阶段进行如下划分:

第一阶段:2013~2014。作为我国数据新闻领域研究的初创期,学界从介绍研究缘起(如精确新闻等)到应用条件(如大数据)再到呈现特征(如信息图表),接着转向国外的数据新闻实践(《卫报》)到呈现我国数据新闻的发展状况(新闻编辑),研究的广度和深度开始增加,并井喷出丰富的研究成果。

第二阶段:2015~2020。一方面,国家积极推进媒体融合发展(见图6主流媒体、媒体融合、新媒体等关键词),加之大数据技术的不断成熟,因此在这一阶段学者将研究重心聚焦于我国数据新闻呈现、内容生产和流程的变革(如新闻叙事、可视化)。另一方面,算法、人工智能在传媒行业的持续渗透也牵引着国内研究视角的转变,即从本体相关研究转向新伦理议题的探讨,与此同时,数据新闻引发的新闻业态变革也对新时代的新闻从业者产生新的专业技能和职业素养要求,因此人才培养方式成为该时期的紧迫性命题。

第三阶段:2021~2022。数字技术的深化深刻影响着新闻业态和实践经验,对新闻学的发展带来了新挑战,并催生新闻学的研究新范式 [24] 。面对新的时代特点和实践需求,“数字新闻”的本质究竟是数字逻辑培育出的“新新闻”还是新闻在数字技术条件下的延续和升级,成为数字时代新闻学理论发展的一个核心议题。对此,学界意识到“可供性”概念可能具备的阐释力,并对它在数字新闻学理论中的作用及其价值进行了深入的研究,以此为基础对“数字新闻”这一概念做出探索性界定并“想象”数字新闻学理论未来发展的新方向 [4] 。

Figure 7. Mapping of data news emergent words

图7. 数据新闻突现词图谱

5. 结论与研究不足

本文基于CiteSpace以CNKI数据库中有关数据新闻的CSSCI文献为样本,分析了数据新闻研究现状、知识图景、研究前沿等内容,总结如下结论:

(1) 自数据新闻提出和运用以来,引起行业和学术领域的广泛关注,近年来研究热情高涨,总体发展态势良好。在文献量的时间分布上,经历了零星发表–井喷式增长–下滑回落–快速回升的阶段。

(2) 从学术合作与共建的角度看,部分机构的跨校协作氛围良好,但数据新闻学术场域的合作团队比较松散,研究成果多由个人发表,未来数据新闻领域的学术合作尚有一定的发展空间。

(3) 通过文献关键词的共现分析,发现目前该学科的研究领域延展有限,除了“数据新闻/数字新闻”本体研究外,尚聚焦在“大数据”、“可视化”,相关研究之间关联性和承接性不足,研究内容相对松散、孤立。因此未来研究可进一步完善系统性的研究体系,并朝向现实需要,寻找数字新闻学理论的新发展方向,丰富用于解释数字技术环境下的新闻生产与接受实践模式的新路径。

(4) 通过文献关键词的聚类分析,数据新闻的学术版图主要包含四个方面内容:基础理论研究、实践应用研究、伦理风险与规范发展、人才培养与数据新闻教育。基于关键词聚类再分析所展现的研究时区图发现,面对新的时代特点和实践要求,数据新闻的研究也不断深化,一些新型视角如“可供性”正在被引入数据新闻的研究领域。

最后,在文献计量分析中,数据收集至关重要,但本研究的检索范围仅限于国内知网数据库的CSSCI期刊所收录的相关文献,尽管数据在学术领域而言有足够的代表性,但对业界经验的兼顾难以充分实现,因此仍存在进一步优化的可能性,有待后续研究进一步扩充数据样本来全面总结该领域的学术成果。

参考文献

[1] 傅居正, 喻国明. 中外数据新闻研究的滥觞与发展: 学科谱系的比较——基于CiteSpace知识图谱的可视化分析[J]. 西安交通大学学报(社会科学版), 2019, 39(1): 111-120.
[2] 陈悦, 陈超美, 刘则渊, 等. CiteSpace知识图谱的方法论功能[J]. 科学学研究, 2015, 33(2): 242-253.
[3] Chen, C. (2006) CiteSpace II: Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature. Journal of the American Society for Information Science and Technology, 57, 359-377.
https://doi.org/10.1002/asi.20317
[4] 常江, 田浩. 生态革命: 可供性与“数字新闻”的再定义[J]. 南京社会科学, 2021(5): 109-117, 127.
[5] 彭兰. 数字时代新闻生态的“破壁”与重构[J]. 现代出版, 2021(3): 17-25.
[6] 宁薇, 李雪, 周雨昕. 国内近20年建设性新闻研究图谱与热点分析——基于CiteSpace V的可视化视角[J]. 图书情报导刊, 2022, 7(6): 53-60.
[7] 樊国庆, 郑传洋. “互联网+”环境下电视数据新闻生产的可行性路径建构[J]. 南方论坛, 2015(2) :34.
[8] 黄志敏, 陈嘉慧. 财新数据可视化实验室的创新[J]. 传媒评论, 2015(4): 9-12.
[9] 常江. 数字新闻学: 一种理论体系的想象与建构[J]. 新闻记者, 2020(2): 12-20, 31.
[10] 陈力丹, 李熠祺, 娜佳. 大数据与新闻报道[J]. 新闻记者, 2015(2): 49-55.
[11] 喻国明, 李彪, 杨雅, 李慧娟. 大数据新闻: 功能与价值的初步探讨[J]. 南方论坛, 2015(2): 39-41.
[12] 戴世富, 韩晓丹. 增值与异化: 数据新闻范式中的价值思考[J]. 当代传播, 2015(1): 26-27, 31.
[13] 丁柏铨. 数据新闻: 价值与局限[J]. 编辑之友, 2014(7): 6-7.
[14] 方洁, 杜涵. 用数据新闻报道突发事件有哪些技巧——以弗格森枪击案为例[J]. 新闻与写作, 2015(2): 67-69.
[15] 杭敏, John Liu. 财经新闻报道中数据的功用——以彭博新闻社财经报道为例[J]. 新闻记者, 2015(2): 56-59.
[16] 周善. 数据新闻: 网站专业生产内容(PGC)的可循之途——四大门户网站的数据新闻实践[J]. 编辑之友, 2014(8): 70-73, 86.
[17] 刘双, 文卫华, 王向宁. 央视两会报道中的数据新闻探索——以“两会大数据”、“据说两会”为例[J]. 青年记者, 2014(18): 43-44.
[18] 刘义昆, 卢志坤. 数据新闻的中国实践与中外差异[J]. 中国出版, 2014(20): 29-33.
[19] 黄洪珍, 成亚倩. 中外数据新闻实践现状与比较研究[J]. 新闻战线, 2018(5): 69-73.
[20] 王海滨, 葛方度. 数据新闻伦理风险及规范发展研究[J]. 国际传播, 2020(5): 26-33.
[21] 张超. 试析数据新闻生产中的个人数据滥用与规避[J]. 编辑之友, 2018(8): 66-70.
[22] 刘银娣. 欧美数据新闻人才培养路径探析[J]. 中国出版, 2016(1): 49-52.
[23] 高雁. 大数据时代下的新闻专业教育反思[J]. 新闻知识, 2014(1): 91-92, 103.
[24] 吴飞. 将数字文明融入新闻理论创新[EB/OL].
https://m.gmw.cn/baijia/2022-11/29/36195819.html, 2022-11-29.