1. 引言
生物工程是在二十世纪七十年代发展起来的一门技术,在二十世纪九十年代,生物工程的发展走向了系统性和规范性。从二十世纪八十年代开始,我国为了响应世界卫生组织的号召,开始实行计划免疫,从此,中国的生物工程正式与世界接轨 [1]。生物工程是将生物相关技术应用于工农业生产、能源开发、环境保护、医药卫生等各个领域的学科 [2]。生物科学技术的日新月异促进了生物工程领域的发展,生物工程主要涵盖了基因工程、细胞工程、蛋白质工程、酶工程、发酵工程等多个学科 [3]。现如今,生物工程各个领域的研究成果已被广泛应用于日常生活的方方面面,如化工、医药、食品、农业、能源、资源和环境等 [4]。任爱华等人 [5] 利用CRISPR/Cas9系统建立TKs敲除A549细胞系,经过吉非替尼药物的干预,细胞活性明显降低,细胞凋亡率升高,细胞迁移能力明显增强,说明敲除TKs的A549细胞系对吉非替尼的药物敏感性升高,本研究为探索TKI介导的非小细胞肺癌化疗耐药机制提供了可靠依据。康欢 [6] 通过对5株嗜热链球菌发酵的酸奶在贮藏期间的酸度、双乙酰和乙醛及酶活进行测定,并分析其相关性得出β-半乳糖苷酶与酸度和双乙酰有很强的线性负相关性,可以把β-半乳糖苷酶作为酸奶贮藏过程影响酸度和双乙酰的重要因素。黄凯 [7] 对OsTrx1敲除植株进行苗期抗旱性试验,发现敲除植株的存活率显著低于野生型植株,表明OsTrx1可能参与了干旱胁迫响应,并发挥正调节作用。对生物工程领域近些年相关研究热点的分布、变化历程及发展趋势开展阶段性的归纳与总结,识别生物工程学科的知识图谱,有助于从整体上把握生物工程领域的研究态势,为后续的创新研究奠定一定的基础。本文以CNKI数据库中生物工程领域的文献为数据基础,运用信息可视化软件CiteSpace,对我国生物工程领域研究态势进行定量分析,绘制相关知识图谱,梳理生物工程领域的研究热点、前沿以及演进规律,从而为科研工作者的后续研究提供研究方向和创新空间 [8]。
2. 数据来源与研究方法
2.1. 数据来源
本文以CNKI中国知网数据库为数据源,同时,为了能够准确定位生物工程领域的发展方向,选择CNKI收录期刊中的学术期刊为数据来源 [9]。在文献分类目录中按《中国图书馆分类法》选择“基础科学”、“生物学”、“生物工程学”为检索词,以SCI来源期刊、EI来源期刊、北大核心、CSSCI、CSCD为来源类别,时间跨度为1992~2020年,共检索得到14,760篇文献。每篇文献包含作者、研究机构、关键词、摘要、发表日期等信息,所有文献均以Refworks格式导出到CiteSpace软件进行处理。
2.2. 研究方法
通过CiteSpace (5.6.R5)软件对所下载文献进行统计分析,以文献计量统计为基础,通过构建关键词聚类可视化图谱、关键词关联时间线视图、突变性关键词图谱,从内容知识图谱对我国生物工程领域的研究热点和演变趋势进行分析 [10]。
CiteSpace可视化软件是由美国德雷塞尔大学的陈超美博士开发的,它可以用来绘制相关领域发展的图谱,展现相关领域研究的新动态,从而探寻该领域的发展趋势、研究热点与前沿 [11]。在网络图中,不同的节点代表不同的元素,如作者、机构和关键词,而节点的大小反映了出版物的数量或频率 [12]。CiteSpace可视化软件利用知识图谱展示了学科领域的宏观结构与发展脉络,它将科学与艺术完美的结合在一起 [13]。
将CiteSpace软件参数设置为:时间跨度(Time Span) = 1992~2020,时间切片(Time Slicing)为Years Per Slice = 1,得到29个时间分段,主题词来源(Term Source) = 标题(Title) + 摘要(Abstract) + 作者关键词(Author Keywords) + 关联关键词(Keywords Plus),节点类型(Node Types)分别选择作者(Author)、机构(Institution)、关键词(Keyword),网络节点关联强度选择Cosine算法,选择标准(Selection Criteria) Top N = 20,即数据抽取每个时间切片排名前20的数据生成最终的网络。然后运行CiteSpace软件,获得文献记录的作者、机构和关键词等信息,整理得到1992~2020年中国生物工程领域的研究热点和演变趋势。
3. 结果与分析
3.1. 生物工程领域学术论文基本情况
3.1.1. 发文量分析
Figure 1. Number of research publications in bioengineering related disciplines from 1992 to 2020
图1. 1992~2020年生物工程领域相关学科研究发文数量
对生物工程领域相关文献进行年度统计分析,形成对生物工程领域的初步认知,有助于准确把握其研究动态及发展态势 [14]。1992~2020年CNKI中国知网数据库共收录生物工程学术论文14,760篇,文献年度曲线图(图1)显示,生物工程领域的发文数量在1992~2002年期间稳步增长,表明该期间生物工程的热度和受重视程度在不断上升。2002年,SARS事件在我国广东发生并迅速扩散至全球,一直持续到2003年中期疫情才被逐渐消灭,所以SARS事件的爆发刺激了生物工程领域的相关研究,导致2003~2006年期间,生物工程领域的发文数量迅猛增长,激增到了年度最大值894篇。在2006~2013年期间,生物工程领域的发文数量呈现下降趋势,尤其是2010~2013年期间,生物工程领域年度发文量骤减,这可能是由于2008年爆发的全球金融危机对我国经济造成的滞后影响使我国把大部分精力放在了振兴经济上,从而导致生物工程领域的研究减少。到了2014年,由于西非爆发了大规模的埃博拉病毒疫情,使得人们又重新重视生物工程领域相关学科的研究,发文数量连年上升 [15]。从发文量的整体趋势来看,我们可以得出一个结论:生物工程领域相关学科研究论文的发表数量与当年乃至前数年与生物相关的时事热点有着密切联系。
3.1.2. 发文机构分析
使用CiteSpace软件对生物工程领域的发文机构进行可视化分析,可以了解生物工程领域重要研究机构的分布及合作情况 [16]。生物工程领域相关学科研究的发文机构图谱如图2所示,表1列出了发文数量排名前20的研究机构。在发文机构图谱中,节点的大小代表发文量的多少,节点越大,说明该研究机构的贡献量越多。此外,节点之间的连线代表各机构之间的合作关系,连线越多,说明合作关系越紧密。图2显示,华东理工大学生物反应器国家重点实验室、中国科学院大学、中国农业科学院北京畜牧兽医研究院的节点较大,表明这些机构的发文量较多。中国科学院大学、中国农业科学院北京畜牧兽医研究院与其它机构的连线较多,表明该机构与其它机构的关系紧密,而其它非核心机构之间的连线较为松散,机构之间的合作交流有待进一步加强。结合表1得出,发文量排名前5的机构分别为华东理工大学生物反应器国家重点实验室、中国科学院大学、中国农业科学院北京畜牧兽医研究院、军事医学科学院生物工程研究所、江南大学工业生物技术教育部重点实验室,可以间接看出,这些机构的经费充足,相关课题也多。通过对发文机构的地域分析来看,我国生物工程领域的主要研究机构大多集中于北京及东部沿海城市,这可能从侧面反映了生物工程研究与城市的经济发展程度有一定的关系。
Figure 2. Research publication chart of related disciplines in the field of bioengineering from 1992 to 2020
图2. 1992~2020年生物工程领域相关学科研究发文机构图谱
Table 1. The top 20 research institutions in the field of bioengineering from 1992 to 2020
表1. 1992~2020年生物工程领域发文数量前20的研究机构
3.1.3. 发文作者分析
通过作者的发文量分析,可以分析某个学科或领域内的核心作者 [17]。第一作者发文量统计显示(表2),发文量最多的两个作者分别是杨志明(62篇)和张涌(54篇),其中,杨志明的主要研究方向为手外科、显微外科、创伤修复与功能重建;张涌的研究方向为动物克隆与转基因技术、动物胚胎工程。发文量在杨志明、张涌后的是窦忠英(50篇)、刘伟(42篇)、曹谊林(41篇)、张作生(31篇)等。累计发文量在40篇以上的作者共有5人,其中杨志明的发文量达到了62篇,是生物工程领域的重要学者之一。累计发文量在20篇以上的有25人,他们的发文量占论文总数的5.1%,是生物工程领域的核心作者群,奠定了该领域的学术基础。杨志明、张涌、窦忠英、刘伟等学者有力地促进了生物工程领域相关研究的发展。
Table 2. The top 30 authors in the number of published papers in the field of bioengineering from 1992 to 2020
表2. 1992~2020年生物工程领域学科发文数量前30的作者
3.2. 生物工程领域研究热点
关键词聚类分析
关键词是一篇文章内容的浓缩与总结,它能够对一篇文章的主题进行高度概括,因此,从文献计量学的角度对相关文献的关键词进行词频归纳与统计分析,有助于了解该领域的研究热点 [18]。中心性(Centrality)是以量化的方式展示关键词在网络结构中的重要程度,中心性值越大,其重要程度也越大。运用CiteSpace可视化软件对1992~2020年的生物工程文献进行关键词分析,计算出相应的中心性,导出被引频次前30的关键词列表(表3),并对关键词进行聚类,得到关键词聚类可视化图谱(图3)。表3显示,被引频次最多的5个关键词分别为“组织工程”(614次)、“固定化”(456次)、“细胞培养”(314次)、“生物信息学”(279次)和“纯化”(188次),从这可以反映出在1992~2020期间生物工程领域的几个热门主题。
根据网络结构和聚类的清晰度,CiteSpace可视化软件提供了模块值Q来作为评判聚类图谱的效果。图3中生物工程关键词聚类图的模块值Q = 0.6367,一般认为,当得到的Q值 > 0.3时,说明该图谱划分出来的聚类结构是显著的 [19]。根据图3显示,1992~2020年生物工程领域中的研究热点分为生物信息学、组织工程、生物相容性、酶学性质、胚胎干细胞和运动想象6类 [20],通过以上的结果可以分析得出,生物工程领域重在基础研究,同时,随着计算机的快速发展,生物工程与计算机发生了交叉融合,使得生物工程的研究进展不断向前。
Table 3. The top 30 keywords cited in the discipline literature of bioengineering from 1992 to 2020
表3. 1992~2020年生物工程领域学科文献被引频次前30的关键词
Figure 3. Keyword clustering visualization map
图3. 关键词聚类可视化图谱
3.3. 生物工程领域研究发展演变趋势与前沿
3.3.1. 时间线聚类图谱
时间线视图(Timeline)是CiteSpace提供的另一种类型的可视化视图,它侧重于描绘各聚类之间的关系以及某个聚类中文献的历史区间,可用来分析某个主题的发展趋势 [21]。在时间线视图中,以时间顺序把相同聚类的文献放置在同一水平线上,文献的时间置于视图的最上方。将1992~2020年生物工程领域关键词聚类图以Timeline模式显示得到时间线聚类图谱(图4)。
图4显示,生物工程的知识子群主要包括生物信息学、组织工程、生物相容性、酶学性质、胚胎干细胞、运动想象等6个方面。其中,生物信息学和组织工程的主题从1992年一直持续到2020年,且呈现递增趋势,表明该主题被学者持续关注。胚胎干细胞与酶学性质的主题从1992年持续到2017年左右,后续不再出现,究其原因可能是科研工作者在这两个方面的研究已经研究得很透彻。生物相容性的研究出现的时间是1992年,但它持续的时间不长,到2002年后相关研究显著减少,表明该研究方向已不适应生物工程领域的发展趋势。运动想象从1995年出现,到目前还在被学者不断地研究,表明这是一个被学者所重视的主题。
图4还能表明,1992~1995年生物工程主要前沿领域为基因工程、固定化、生物反应器、组织培养等;1996~2001年主要前沿领域为生物医学工程、支架材料、组织工程等;2002~2010年主要前沿领域为干细胞、分子生物学、分离纯化、分化、组织构建等;2011~2020年主要前沿领域为合成生物学、系统生物学、基因编辑、生物安全、人工智能等。从这个发展历程来看,随着时间的不断更替,信息技术的不断发展,生物工程逐渐与计算机发生融合,产生了一些新兴交叉学科,如生物信息学、生物医学工程等。
Figure 4. Keyword-associated timeline view
图4. 关键词关联时间线视图
3.3.2. 突变词知识图谱分析
通过分析突变词知识图谱,可以了解我国不同时间段内生物工程领域研究的侧重点 [22]。突变词(Burst term)是指在一定的时间段内,文献中被引用的词发生突然增加的一类词。通过CiteSpace可视化软件输出的结果,我们可以观察到突变词随着时间的变化,可以得出该研究领域的主题在不同时间段内的变化趋势 [23]。突现强度值越大,说明突现强度越高。本文运用CiteSpace可视化软件绘制出突变率在前30位的关键词图谱(图5)。图中一个色块代表一个年份,红色色块为关键词发生突变的时间段,根据红色色块出现的起始位置和终止位置可知关键词突变的起始年份和终止年份。
通过观察突变词图谱,以时间段来划分,我国生物工程领域的研究可以大致分为两个阶段。第一阶段为1992~2006年,这一时期的研究主要集中在生物材料、生物相容性、组织工程、生物力学等方面。第二阶段为2007~2020年,这一时期出现的关键词有脂肪酶、漆酶、生物信息学、合成生物学等。我国生物工程的研究具有明显的时代特征,在生物工程的研究早期,学者的研究主要是一些基础性的研究,而在生物工程的研究后期,随着计算机以及一些大型仪器的出现,生物工程迅猛发展,形成了一系列的交叉学科,生物工程的研究范围也更加综合全面。
在生物工程领域,2003~2011年的“分离纯化”和“细胞培养”曾成为突现词,但持续时间不长,主要原因可能是这两个主题被归纳到其他学科,如细胞生物学等。“脂肪酶”、“胚胎干细胞”、“漆酶”出现的频次和时间较长,可以间接看出这3个主题可探究的内容很多,值得各位学者的深入探究。近些年,随着计算机的快速发展,生物信息学成为突现词,与此同时,生物信息学还成为突发强度最高的研究前沿之一。
Figure 5. Mapping of mutability keywords in the disciplinary literature of bioengineering from 1992 to 2020
图5. 1992~2020年生物工程领域学科文献突变性关键词图谱
4. 讨论
本文运用CiteSpace可视化软件,以CNKI数据库为基础,构建并绘制关键词聚类可视化图谱、关键词关联时间线视图、突变性关键词图谱等,对1992~2020年的14,760篇生物工程领域相关文献进行分析,发现生物工程领域发文数量总体呈现上升的趋势,只是个别年份发文数量少,这与医疗卫生或者经济密切相关。生物工程领域发文数量在1992~2002年期间稳步增长,2002~2003年有所下降,从2004年之后又增加至2006年的峰值894篇,紧接着2006~2013年文献数量有所下降,2014~2020年又有所增加,提示生物工程领域的研究还有很大的开发潜力,值得学者的不断探索。
对生物工程领域相关的研究学者及研究机构进行分析显示,自1992年以来,我国在生物工程领域已经形成许多具有较高学术影响力的研究学者,如杨志明、张涌、窦忠英等,以及研究机构,如华东理工大学生物反应器国家重点实验室、中国科学院大学等。随着时间的推进,生物工程领域的研究呈现出加强递增趋势,相关文献所涉及的学科广度也“由少及多”。由于节点之间的连线代表各机构之间的合作关系,连线越多,说明合作关系越紧密,通过图2可以推测,学者与学者、机构与机构、学者与机构之间的合作交流还不够广泛、深切,这可能会使得相关课题遇到的瓶颈得不到及时有效地解决。
通过对近30年我国生物工程领域的研究热点分析发现,生物工程领域的热点主要集中在生物信息学、组织工程、生物相容性、酶学性质、胚胎干细胞、运动想象六大领域。通过对高频关键词进行分析发现,“组织工程”、“固定化”、“细胞培养”等关键词出现频次最高,表明这些主题一直被学者关注,从高频关键词也能够发现,生物工程领域目前的研究大多是基础性的研究,呈现出“接地气”不够的问题,与产业发展问题和社会需求问题的契合度还不够,应用研究还有待加强,如生物工程可以应用在医疗、卫生、商业等领域。从时间分布上来看,我国对于生物工程领域的研究大致经历了两个发展阶段。从早期的基础性的研究,再到后来随着信息技术的快速发展,大型仪器的出现,生物工程领域出现了生物信息学、生物医学工程等一系列的交叉学科,研究内容与研究范围也得到了进一步的深化。当前我国生物工程领域的研究还在持续探索的阶段,与世界先进水平相比仍存在不小差距,需要奋起直追。因此,未来生物工程领域的发展应与人才培养紧密联系在一起,与国家战略与区域经济发展结合,满足社会发展需求,把生物工程领域的理论成果转化为生产力。与此同时,生物工程领域的发展还要不断拓展研究的外延,推进学科交叉与融合,鼓励通过多学科和多视野分析,更为系统地深化生物工程领域的相关研究,从而更好地服务于社会。
基金项目
浙江省自然科学基金(No. LQ21C060003);浙江师范大学博士科研启动基金(No. YS304320122);金华科技计划项目(No. 2021-3-148)。
NOTES
*通讯作者。