1. 引言
2019年底爆发的新型冠状病毒(以下简称“新冠”)疫情,对中国人民甚至全球人民来说都是一次重大的考验,疫情不仅影响着人们的学习、工作和生活,还制约着全球经济的发展和社会的进步。由于疫情对人类生命安全和健康带来了重大威胁,所以大众对新冠知识的需求和关注度水涨船高,国内外不同领域的科研人员也针对新冠疫情开展了许多研究,产出了大量科研论文 [1]。
文献计量学是通过对已发表的文献进行定量分析和描述,评价研究状态,预测发展趋势,从宏观角度把握相关领域研究现状的方法。针对新冠领域,国内也有部分专家和学者做了相关的研究,例如张荣娜等人基于Web of Science核心合集对新冠相关文献进行了文献计量学分析,陈锐锋等人在大数据视域下开展了相关研究,郭婷等人针对2019年12月~2020年3月的相关文献数据做了研究,陈玉恒等人以CNKI和PubMed数据库的数据展开探索 [2] - [9] 等,这些文章都从一定程度上丰富了国内新冠领域的研究。但考虑到上述文章存在研究时间较久远或研究范围较宽泛的问题,没有针对近两年国内的新冠形势进行论述,进而导致国内的研究缺乏相关数据和资料,故基于中国知网抗击新冠疫情知识服务平台(以下简称“新冠知识平台”),对该平台的中文文献开展文献计量学分析,统计分析相关文献的各项数据,并以可视化形式展示各时间段新冠研究的热点分布,为国内各行业工作人员及普通民众提供参考。
2. 研究设计
2.1. 研究对象
中国知网凭借优质的资源内容、领先的技术方法和专业人性的服务,在学术科研界享有极高的声誉,其学术性、科研性和权威性已得到各行各业的学者认同。为保证文献的研究内容都是新冠领域的且文献具有一定的影响力,本研究选取来自中国知网新冠知识平台的中文文献数据。该平台数据涵盖了科学引文索引(SCI)、中文社会科学引文索引(CSSCI)、中国科学引文数据库(CSCD)、工程索引(EI)、北大核心等多种类型的期刊,通过限定文献发表的日期为2020年01月01日至2022年09月30日,文献类型为期刊对文献数据进行纳入,并对数据进行清理。
2.2. 研究方法
文献计量学是一门用数学和统计学的方法,定量地分析一切知识载体的交叉科学,属于图书情报学分支科学。通过文献计量学分析,能将原本独立的文献汇集成一个大批量的文献集,深度挖掘出文献间隐藏的信息,从而定量的分析文献规律,清晰的把握计量对象特征。本研究从新冠疫情相关文献发文量、关键词共现、学科主题及类别、刊物数量及发文机构、检索类型、资助基金等多方面进行科学合理的分析,并将结果以可视化的形式展现。为保证对数据进行文献计量分析时的科学性、合理性和客观性,采用定性和定量研究相结合的方法,使用CiteSpace、VOSviewer和BiComb软件作为文献数据统计软件,辅以Python语言编程,得到相关结果并给出结论。CiteSpace是一款着眼于分析科学文献中蕴含的潜在知识,在科学计量学、数据可视化背景下逐渐发展起来的一款引文可视化分析软件 [10]。VOSviewer是荷兰莱顿大学科技研究中心的Van Eck和Waltman开发的一款软件,主要面向文献数据,侧重科学知识的可视化 [11]。BiComb是一款文本挖掘的基础工具软件,可对国际上诸多数据库的文献记录进行读取分析,并允许用户对系统功能进行修改、增加等拓展 [12]。将中国知网新冠知识平台中检索到的文献数据导入Excel电子表格中,编写程序对数据进行清洗并规范数据格式,最终纳入有效文献8038篇,其中2020年共5551篇,2021年共1525篇,2022年截至9月共962篇。
3. 结果分析
3.1. 发文量分析
发文量分析能获得月发文量数据,月发文量大小发映出当月国民对新冠疫情的关注程度。记录每篇文献的发表时间,统计出月发文量数据如图1所示,可以看到在2020年中,1月的发文量很低,2月急剧增长,2、3、4月是发文量最多的三个月,其中3月更是高达1399篇,5、6月发文量在450篇左右,7月开始月发文量逐渐下降并趋于稳定,最终保持在200篇左右;在2021年中,月发文量稳定在150篇左右,偶有发文量较低的月份如11月,只有71篇文献,总的来看,整年的发文量数据无大幅波动;2022年截至9月的月发文量稳定在100篇左右,无大幅波动。纵观整个时间轴,月发文量最多的时间段集中在2020年的2、3、4三个月份,后续月份月发文量比较稳定,结合2020年初国内严峻的新冠疫情态势,加之国民急需快速了解有关新冠疫情防控的知识,与发文量变化曲线的各时间点吻合,从侧面佐证了所选数据和所用分析方法的合理性和科学性。
3.2. 关键词共现分析
关键词共现分析能得到出现频次和关联强度较高的关键词,对把控新冠相关文献的主旨内容和研究方向有着指导作用 [13]。某一关键词的词频指该关键词出现的总次数,关联强度指文献中出现其它关键词同时出现该关键词的次数总和。假设共有M篇文献,其中N (N ≤ M)篇文献包含预设关键词,记这N篇文献中的第i篇文献有
个关键词,则该预设关键词的频次和关联强度可表示为:

Figure 1. Monthly distribution of COVID-19 related literature
图1. 新冠相关文献的月发文量分布图
使用VOSviewer软件进行关键词共现分析,考虑到VOSviewer软件支持的文件格式存在局限,故使用Python语言编程将文献数据改写成Refworks格式并导入到软件中进行关键词共现分析,删去“新冠疫情”、“新冠肺炎”等检索词,合并“疫情预防”、“防控”等同近义词,最终获取到关键词排序,统计频次为1的关键词数量为8913次,由1973年Donohue根据齐普夫第二定律提出的高低频词界定公式 [14]
式中:
为频次为1的关键词数量;T为高低频词分界值。
由此可以得到高低频词分界值约为133,对提取出的高频关键词按照关联强度排序得到表1。从该表中可以看出,词频与关联强度最高的词是“作用机理”,其次是“中医药”、“网络药理学”、“疫情防控”等,与新冠疫情下国民的关注点非常吻合。此外,高频关键词中出现的“现实群体”、“心理健康”等字眼,提醒我们在面对突发公共卫生事件,要全面关注社会中的不同群体,针对产生心理应激反应的群体推出更多更精准的心理干预,这对于维护社会稳定、全面防控疫情也是至关重要的 [15]。
文献关键词共现网络图如图2所示,其中元素的大小取决于节点的度、连线的强度等,元素的颜色代表其所属的聚类,不同的聚类用不同的颜色表示,通过该图可以发现研究热点的结构分布和关联情况 [16]。例如,与“疫情防控”关键词相关联的有“护理管理”、“应急管理”、“青少年”、“隔离”、“输入”等关键词,而这些关键词中又以“应急管理”的关联程度最高,由此可以推断出与“疫情防控”有关的文献通常也会与“应急管理”相关,使得高频关键词的共现分析有了实用意义。

Figure 2. Keyword co occurrence network diagram of COVID-19 related literature
图2. 新冠相关文献关键词共现网络图
文献关键词共现热力图如图3所示,图谱上每一点都会根据该点周围元素的密度来填充颜色,密度越大,越接近红色,密度大小依赖于周围区域元素的数量以及这些元素的重要性,从图3中可以看出,除了表1中列出的10个关键词,“医护人员”、“流行特征”、“数据挖掘”等关键词的重要性也比较高,反映出新冠疫情波及范围之广、牵涉领域之多。

Figure 3. Keyword co occurrence thermodynamic diagram of COVID-19 related literature
图3. 新冠相关文献关键词共现热力图

Table 1. Top 10 high-frequency keyword ranking of COVID-19 related literature
表1. 新冠相关文献高频关键词排序Top 10
3.3. 学科主题及类别分析
文章的学科主题指的是该文章所属的领域,根据《中国图书馆分类法》,用A-Z中的22个字母代表22个大类,表示军事、经济、医药卫生等领域 [17];学科类别则代表对应的研究方向,是学科主题内部更为细致的划分。通过对文献涉及的学科主题和类别进行统计分析,获得关联强度(此处的关联强度用每个学科主题或学科类别下的文献数量来衡量)前10的学科主题和学科类别如表2、表3所示。从表2中可以看出,新冠相关文献在医药、卫生领域的关联强度最高,高达8031,其次就是经济、工业技术等领域,与现实情况吻合。从表3中可以看出,在学科类别方面,呼吸系统疾病这一学科的关联强度最大,达到3108,之后是预防医学与卫生学、中医学等相关学科,通过观察可以发现这些学科类别都是与医药卫生相关的学科,反映出新冠疫情对国内医药卫生领域的影响之大。

Table 2. TOP10 subjects in major disciplines of COVID-19 related literature
表2. 新冠相关文献主要学科主题分布Top 10

Table 3. Top 10 major discipline categories of COVID-19 related literature
表3. 新冠相关文献主要学科类别分布Top 10
根据时间顺序对每个月关联强度前5的学科类别进行统计,如图4所示,该图反映了不同时间段国内民众和学者对不同学科关注度的变化。从图中可以发现,呼吸系统疾病这一学科每个月的关注度都比较高,其余学科的关注度则存在些许变动,但总体来看,人们重点关注的学科始终围绕在医药卫生方面。

Figure 4. Monthly attention distribution of subject category of COVID-19 related literature
图4. 新冠相关文献学科类别月关注度分布图
3.4. 刊物数量及发文机构分析
刊物数量分析能获得不同刊物刊登的文献数据,可以从侧面衡量疫情环境下该刊物的影响力。发文机构分析能获得发文量较多的机构排名,可用来衡量各机构在新冠疫情方面的学术和科研成就高低。使用BiComb软件统计刊文数前10的刊物和发文量前10的机构,结果见表4、表5。从表4中可以看出,刊文数前10的刊物都是医药卫生领域的,值得注意的是,武汉大学学报(医学版)是唯一一个在榜的高校学报刊物。在发文机构中,发文量最多的是华中科技大学和武汉大学,一方面是地理位置原因,另一方面也反映出其学术科研水平较高。统计每篇文献的发文机构数量,发现单机构独立发文2637篇,占比32.81%,多机构联合发文4361篇,占比54.25%,表明疫情期间国内各机构间的合作非常频繁。

Table 4. Top 10 sources of major journals of COVID-19 related literature
表4. 新冠相关文献主要期刊来源分布Top 10

Table 5. Top 10 major publishing institutions of COVID-19 related literature
表5. 新冠相关文献主要发文机构分布Top 10
3.5. 刊物数量及发文机构分析
对文献的检索类型进行统计分析,得到高水平论文的产出情况,如表6所示。由该表可以看出,新冠相关文献中核心论文共有4018篇,约占总文献数的50%,SCI论文共有186篇,占核心文献数的4.6%。对每个月不同检索类型的文献数量进行统计,如图5所示,从图中可以看出2020年3月产出的核心论文数最多,有600多篇,2020年5月的SCI论文数最多,有39篇,2020年2、4月的核心论文数在400多篇,2020年5、6、7三个月的核心论文数都在200篇左右,其余月份的核心论文数在100篇左右。

Table 6. Distribution table of each retrieval type of COVID-19 related literature
表6. 新冠相关文献各检索类型分布表

Figure 5. Monthly distribution map of papers by search type of COVID-19 related literature
图5. 新冠相关文献各检索类型论文月分布图
3.6. 刊物数量及发文机构分析
对新冠相关文献的资助基金进行分析,发现总计8038篇文献中,有6089篇(占比75.75%)文献有基金资助,其中4973篇(占比61.87%)文献获得了多项基金资助,而剩余的1949篇(占比24.81%)文献未有基金资助,如表7所示。经详细统计,所有文献共有资助基金10249项,这其中资助频次较高的几种基金如表8所示,可以看出国家自然科学基金的资助频次最高(971次),国家重点研发计划的资助频次紧随其后(353次),后面依次是省市自然科学基金(289次)、国家科技重大专项(144次)等。这些数据表明国家和政府在新冠疫情的防控和研究方面投入了大量的财力物力,很直观地反映出国家对新冠疫情的重视程度。

Table 7. Schedule of fund subsidies of COVID-19 related literature
表7. 新冠相关文献基金资助情况一览表

Table 8. Distribution of sub-vented funds by category of COVID-19 related literature
表8. 新冠相关文献资助基金类别分布表
4. 研究总结与思考
在围绕新冠疫情开展的学术科研环境下,本文从文献分析这一角度入手,对中国知网新冠知识平台的中文文献数据进行分析,从新冠疫情相关文献发文量、关键词共现、学科主题及类别、刊物数量及发文机构、检索类型、资助基金等多方面展开了相关内容的撰写,使用数据统计、共现分析、可视化展示等方式将此次疫情带来的各方面影响较为全面的展示在各位读者面前。与此同时,国内许多专家学者也开展了相关研究,相比而言,本研究的内容虽然只局限于国内新冠疫情研究现状,但文献时间跨度长,覆盖面广,具有针对性,所以最终结果和相关结论也有较大的参考价值。
通过本研究的数据挖掘和分析,总结了新冠相关文献研究的规律和走势,可以了解到新冠疫情环境下国内民众和学者对新冠研究的热点和关注度变化,对目前国内缺少相关研究的现状起了一个补充的作用,也使得新冠疫情研究这个框架变得更加丰富。透过相关数据和图表,也有些地方值得我们关注,例如由关键词共现网络图能发现,与重大公共卫生事件关联程度高的关键词有心理健康、现实群体等,因此在出现重大公共卫生事件时合理妥善的安置不同群体并给予相应的心理干预是非常必要的,笔者在这里未对其加以论述,但在后续的研究中会进行深入探讨。同时在疫情研究的学术科研框架下,文献计量学领域的论文数量较少,所以期待国内有更多的学者能在该领域内发表更新更有深度的学术成果。由于对新冠肺炎的相关研究不断更新,研究结果可能是初步的、不全面的,但通过本研究取得的一些结论仍旧可以在一定程度上反映出新冠研究热点及领域发展情况,可为此话题的相关领域提供参考。
基金项目
国家自然科学基金资助项目(11701434);武汉工程大学研究生创新基金(CX2021386)。