基于社交网络的论文合著情况分析——以偏微分方程领域的相关论文为例
Analysis of the Co-Authorship of Papers Based on Social Networks—Taking the Relevant Papers in the Field of Partial Differential Equations as an Example
摘要: 本文结合CNKI中近五年来偏微分方程领域论文合著的有关数据,建立论文合著网络,分析了论文合著网络的网络特征,提出该领域论文合著情况的一些问题,并给出了解决措施。首先,本文从合著率和论文著者数两个角度反映了偏微分方程领域相关论文合著现象的特征和规律;然后,介绍了社交网络的特征属性,利用UCINET软件构建论文合著网络并分析了该网络的小世界特性和无标度特性;最后,提出了近五年来偏微分方程领域相关论文的合著情况存在的问题以及一些建议。
Abstract: This paper combines the relevant data of the papers in the field of partial differential equations in the last five years of CNKI, establishes a network of papers, analyzes the network characteristics of the papers, and puts forward some problems in the co-authoring of the papers and the solutions. Firstly, this paper reflects the characteristics and laws of the co-existing phenomenon of the papers in the field of partial differential equations from the perspective of the co-authorship rate and the number of authors. Then, UCINET software is used to construct the paper co-authoring network and analyze the small world characteristics of the network and no scale characteristics. Finally, the problems and development countermeasures of the co-authorization of papers related to the field of partial differential equations in the past five years are proposedr
文章引用:孙得. 基于社交网络的论文合著情况分析——以偏微分方程领域的相关论文为例[J]. 数据挖掘, 2019, 9(2): 27-33. https://doi.org/10.12677/HJDM.2019.92004

1. 引言

随着新学科和大量分支学科的产生,科研合作在现代学术发展中的作用显得尤为重要。经研究发现,20世纪初论文的合著率仅有10%,而到了21世纪末,论文的合著率超过了30%,并且一直在稳步上升中。论文合著不仅能提高科学研究的质量,还能产生更多知识的碰撞,加快知识的扩散。总的来说,论文合作对于促进相关学科建设,高质量的科研成果产出以及学科整体科研水平的提高具有重要意义。

据了解,我国多采用文献计量法对论文合著情况进行研究。文献计量法从各种不同的角度对论文合著情况进行统计、分析,得到论文合著的相关规律。近年来,由于社交网络相关研究逐渐在各领域流行,社交网络成为论文合著现象研究的热门主题。某领域的作者之间相互合作,形成了该领域的论文合著网络,作者之间通过该社交网络进行知识的交流,从而促进相关学科建设,提高科研水平。而对于社交网络,非常值得研究的是它的小世界特性和无标度特性。

本文在当前研究的背景下,以2014~2018年这五年以来 CNKI 中偏微分方程领域的相关论文为研究对象,应用文献计量法和网络分析法,对偏微分方程领域的论文合著情况进行了分析和研究。文献计量方面,本文从合著率、论文著者数两个角度对该领域论文合著的相关规律进行了探讨;社交网络方面,本文构建了偏微分方程领域的论文合著网络,分析了该网络的小世界和无标度特性,并根据当前论文合著情况存在的问题提出了相关建议。

2. 偏微分方程领域论文的合著情况研究

数据来源与处理

本文研究的是近五年来偏微分方程领域论文的合著情况,因此在CNKI数据库搜索“偏微分方程”,选择2014~2018年近五年的数据,共得到1243篇论文。然后,使用BICOMB软件,抽取作者信息,得到1243篇论文及对应的作者,部分整理数据如表1所示。

Table 1. Partial raw data

表1. 部分原始数据整理

借助EXCEL对1243篇偏微分方程领域的论文进行汇总、统计,发现1243篇偏微分方程论文中,两人及两人以上的合著论文有469篇,占总论文数的37.73%。

3. 论文合著情况分析

目前,论文的合著情况主要通过作者合著度和合著率来表示。论文合著率即为某一领域内参与合著的论文数与论文总数的比值;而论文合著度则比较复杂,它与当前的论文合著规模、科研发展水平有关,由于论文合著度的相关研究比较少,目前还没有统一的定论,所以我们这里只对论文合著率和论文著者数进行研究。

1) 论文合著率研究

CNKI中偏微分方程领域论文各年的合著率如表2所示。

Table 2. Cohesion rate of papers in the field of partial differential equations

表2. 偏微分方程领域论文的合著率情况

根据表2我们可以得到,该领域的论文中有1/3是合著论文。在这五年期间,CNKI中偏微分方程领域论文的合著率总体上呈上升趋势,但上升速率较为缓慢,2017年有略微波动。合著率最高为2018年的0.5086,合著率最低为2014年的0.3569,两者差值为0.1517,说明在这五年期间偏微分方程领域论文的合著情况有较为明显的发展。

2) 论文著者数研究

统计出近5年偏微分方程领域不同著者数的论文所占的比例,如表3所示。

Table 3. The number of different authors in the paper

表3. 论文不同著者数比率

表3可以看出,2014~2018年间,偏微分方程领域共发表论文1243篇,其中单篇论文合作著者署名最高达到8人。通过对各层次著者数比率分析可见,随着著者数从1人增加到5人以上,论文数所占比率在逐渐下降,著者数为5人以上的论文所占比率最小为0.0145;独著论文所占比率最高为0.6235。在合著论文中,两人合著的论文所占比例最高为0.1617。这说明偏微分方程领域相关论文的大部分合著仅限于两人到三人合著,尚未形成更大的合著网络。

4. 偏微分方程领域论文的合著网络及其分析

4.1. 论文合著网络的建立

下面需要通过构建论文的作者合著网络来反映论文合著现象。使用BICOMB软件,对附件二中1243篇论文的作者信息进行处理,共涉及1869个作者。

利用公式

a i j = { 1 , i j 0 , i j

得到论文合著网络的邻接矩阵 A = [ a i j ] 1869 1869 。将上述矩阵导入UCINET软件,生成1869个作者的

合著网络,如图1所示,该网络共有1659条边,是一个无向网络。

Figure 1. Co-authored network of papers in the field of partial differential equations

图1. 偏微分方程领域论文的合著网络

图1可见,该网络属于稀疏网络,密度很低,存在相当数量的作者没有与其他作者合作过,删除他们对网络的结构和网络的一些重要特征是没有影响的。

4.2. 网络特征属性的描述

1) 最短路径

无向网络中两节点之间路径的边数表示为两节点之间的距离 d i j ,当距离最小时, min ( d i j ) 称为最短路径。对于一个有N个节点的网络,其平均最短路径长度为:

L = 1 1 2 N ( N 1 ) i > j d i j , i , j = 1 , , N . (1)

2) 聚类系数

聚类系数可以用于表示网络的聚集化程度。在无向网络中,节点 v i j 的聚类系数可用 C i 来表示:

C i = n C k 2 = 2 n k ( k 1 ) , i = 1 , 2 , , N . (2)

其中,k表示节点 v i 的所有相邻节点个数;n表示节点 v i 的所有相邻节点之间相互连接的边的个数。而整个网络的聚类系数 C = 1 N i = 1 N C i .

平均最短路径和聚类系数是社交网络中两个重要的特性。

3) 度与度分布

度(degree)表示与一节点相连接的边数。在论文合著网络中,度代表与某作者合作的作者数目。

度分布(degree distribution)描述了网络中节点度的分布情况。通常采用度分布函P(k)来体现任意网络节点的选择概率,它的值等于度为k的节点数占网络中节点总数的比例。

4.3. 论文合著网络的网络特征分析

1) 小世界性

小世界网络,其特征路径长度随着log(n)增长中说明,在从规则网络向随机网络转换的过程中,实际上特征路径长度和聚合系数都会下降,到变成随机网络的时候,减少到最少。也就是说,如果一个网络点之间特征路径长度小,接近随机网络,而聚合系数依旧相当高,接近规则网络,则该网络具有小世界特性 [1]。

对UCINET数据矩阵进行二值化处理,计算该论文合著网络的聚类系数和平均最短路径。计算得该微分方程领域的论文合著网络其平均最短路径为2.120,可以看出该网络的平均最短路径较小,论文作者平均不超过3个作者就可以与其他的作者产生合作。此外,该合著网络的聚类系数为0.327,表明论文合著网络中与一作者合作的两个作者之间有合作的概率为0.327。

利用UCINET构造一个与该论文合著网络相同规模的随机网络,设置其密度与该合著网络密度相同为0.001,通过计算得到随机网络的聚类系数0.015,平均最短路径为2.351。可以得到,该随机网络的聚类系数远小于论文合著网络的聚类系数,而其平均最短路径与论文合著网络差别不大。因此,可以认为该论文合著网络具有小世界特性。

2) 无标度性

无标度网络具有严重的异质性,其各节点之间的连接状况(度数)具有严重的不均匀分布性。在一个网络中,若极少数节点具有大量连接,而大多数节点具有极少的连接,则称该网络具有无标度特性 [2]。

计算得到了网络中各节点的度,统计该论文合著网络的度分布情况,如表4所示。

Table 4. Degree distribution of network nodes

表4. 网络节点的度分布

统计结果发现,在1869个节点的网络中度很小的节点有很多,有1340个节点的度小于3;度较大的节点只有很少,有6个节点的度大于9。这说明了偏微分方程相关论文的大部分合著仅限于少数人之间合著,尚未形成更大的合著网络。分别用幂率函数和指数函数对度分布进行逼近,如图2所示。

Figure 2. Degree distribution map of paper co-authorship network

图2. 论文合著网络的度分布图

如果用幂率函数进行逼近,度分布函数为 y = 0.1016 x 1.484 , R 2 = 0.696 ,逼近效果并不明显;用指数函数进行逼近,可以得到理想的度分布函数 y = 0.2029 e 0.406 x , R 2 = 0.8468 。可见该论文合著网络的度分布呈指数分布。根据以上度分布情况来看,该网络中极少数节点的度较大,而大多数节点的度很小,可以得出该论文合著网络具有无标度性 [3]。

5. 结论及建议

5.1. 结论

本文利用文献计量法和网络分析法对常微分方程领域的论文合著现象进行分析,并得到了相关结论:

1) 2014~2018年5年期间偏微分方程领域的论文合著率总体上呈上升趋势,但总体而言尚处于较低水平,且上升速率比较缓慢,这说明偏微分方程领域的论文合著情况尚不完善,还存在很大的发展空间。

2) 在偏微分方程领域的论文中,独著论文所占比例最高,且大部分合著论文仅限于两人到三人合著,这说明偏微分方程领域相关论文的合著度较低,尚未形成更大的合著网络。

3) 从构建的偏微分方程领域论文合著网络来看,网络中有很多节点的度为0,也就是说,存在相当数量的作者没有与其他作者合作过;而有一些节点的度大于9,有很多合作过的作者,这说明不同作者之间的论文合著情况有较大差异。

4) 该论文合著网络具有无标度特性,就是说网络中大部分作者具有较少的合作,而只有一小部分作者有很多合作,且作者合著主要以2~3人合著为主,合著规模比较小。

5.2. 建议

随着偏微分方程学科领域的发展,对科研能力的要求越来越高,科研论文合作在学术发展中显得尤为重要。因此,科研人员要提高科研学术交流与合作,参考借鉴该领域其他作者的先进理论、创新思维;通过彼此启发、相互借鉴,拓展偏微分方程领域研究的深度和广度 [4]。此外,应该扩大论文合作的规模,不仅限于两到三人合著,合著网络的规模的扩大对于促进资源共享、提高科研水平有着很大的积极意义。

参考文献

[1] 孟繁华. 基于复杂网络的供应链建模及其鲁棒性分析[D]: [硕士学位论文]. 北京: 华北电力大学, 2018.
[2] 世攀科, 徐锡, 程文聪. 大规模网络拓扑属性特征及模型分析[C]//中国计算机学会. 中国计算机大会论文集: 2008年卷. 西安: 中国计算机学会, 2008: 464-472.
[3] 刘贵香, 蔡永明, 刘璐, 英玉超. 社会网络信息传播机制研究——以新浪微博为例[J]. 经贸实践, 2018(6X): 69-70.
[4] 施梅, 胡婷婷. 我国科技期刊论文合著现象分析——以图书情报学核心期刊为例[J]. 出版发行研究, 2018.