1. 引言
电路与系统是信息与通信工程和电子技术相关的一个学科,是信号处理、计算机研究的开发理论和技术基础。研究方向主要集中在图像处理、系统芯片设计、嵌入式系统、电路与计算机这些领域。但近年来随着深度学习、人工智能等新兴技术的大量涌入,该学科的研究方向有着明显的变化趋势。也从中反映出各高校的培养特色及各指导老师的研究方向会随着人工智能、互联网等现代信息技术的大力发展而发生改变。因此,在导师大方向的引导下,处在各个研究方向的硕士研究生都能紧跟当下热点研究的步伐。
2. 数据来源与研究进程
2.1. 数据来源
本研究以中国知网(CNKI)电路与系统专业硕士学位论文作为数据来源,进入CNKI主页点击“博硕”,在高级检索中将“学科专业名称”设为“电路与系统”,将学位年度设为2015年至2020年,共检索3621篇硕士学位论文,并获得每篇文献的题目、作者、期刊、关键词等数据做进一步分析。
2.2. 研究进程
第一步,从CNKI中导出研究资料,每500篇为一组,选择“导出与分析”中的“导出文献”,在“导出文献”中选择Refworks格式,分批逐年将检索的3621篇电路与系统专业硕士学位论文的题目、关键词、期刊等信息导出,并以.txt文件的形式保存;第二步,在保存的大量文本数据中仅单一存在并没有融合,对数据分析不易做处理的情况下,将所有保存的.txt文件导入data数据园3.0 [1] 中进行合并,再提取数据中的关键词,并保存格式为.csv文件;第三步,避免在大样本下数据重复、丢失等情况,使用GIGO1.1 [2] 对关键词进行数据清洗,并通过Co-Occurrence6.722 (COOC6.722)软件导出共词矩阵、关键词频数和社会网络图;第四步,将生成的共词矩阵转为相异矩阵后导入至SPSS24.0,分别生成聚类分析谱系图和欧式距离模型知识谱图(多尺度分析图);第五步,总结分析。
3. 数据处理结果与分析
3.1. 高频关键词词频统计分析
首先对数据进行筛选,对所得的集中关键字段进行了统计,共提取的关键词11109个,其中高频关键字频次为10以上,共有109个;其次,进行清洗数据和筛选,在获得高频关键词之后将含有相同意义的关键词合并,剔除与本次研究主题关联不大的关键词 [3],共得到35个关键词,其中有一部分如表1所示。由表中数据得知,2015~2020筛选后的关键字频次在某一领域的研究频次一目了然,可以直观的感受到当前研究热点主题有哪些,其中最高的为FPGA,深度学习紧随其后。

Table 1. 2015~2020 high-frequency keyword statistics (partial)
表1. 2015~2020高频关键词统计(部分)
3.2. 高频关键词共词矩阵分析
根据所获取的35个关键词,通过相关软件生成所需的共词矩阵(见表2)是一个36 × 36的相似矩阵,能够反映关键词之间的相互包容关系。其中行和列是表示相同的主题内容,除对角线数值为总频次外其余出现的数值均为共现次数。共词矩阵是后续做聚类分析以及生成相异矩阵的基础,为此对共词矩阵数值进一步细化分析如下:
根据学者提出的相互包容系数法 [4] 做了部分修改后,能更好的拟合共词矩阵中关键字的依赖性关系,如公式一所示:
(1)
其中
、
表示i,j高频关键字共现的次数,
、
表示关键字各自出现文献中的总频次,
表示关键词间的包容关系度,范围在0~1之间。其中数值越大(小)证明两者的包含关系越大依赖性也就越大(小)。由表1与表2所获得的数据中选取最典型的主题词并根据公式一计算:占据频次最高的高频关键词FPGA和深度学习的包容度
(0.000055),明显这两个主题词的包容值趋于0即两者不存在任何依赖关系,因此在硕士学位论文当中不会将深度学习与FPGA结合起来研究;另外,选择共现次数最多的主题词深度学习与卷积神经网络计算出他们词之间的包容度
(0.002361),对比前一组计算的数值我们发现,后者相比前者的数值明显增大近50倍,后两者词间的依赖性更大。由此通过表中的数据不论是直观感受还是数值上的差异明显,总之当前硕士研究生在本文筛选的热点词中将深度学习与卷积神经网络结合起来研究的更多。

Table 2. 2015~2020 high-frequency keyword co-word matrix (partial)
表2. 2015~2020高频关键词共词矩阵(部分)
3.3. 高频关键词相异矩阵分析
根据上述所整理出的共词矩阵,利用Ochiia系数法 [5] 对共词矩阵进行计算得出一个临时矩阵E并转换后得出最终相异矩阵。其中Ochiia系数计算公式如公式(2),其中A、B表示高频关键词:
(2)
手动计算出来的Ochiia系数组成临时矩阵E,并用1减去所有矩阵E中数值并取绝对值后组成的矩阵,我们称为相异矩阵。但考虑到手动计算会造成一定的数据误差,为了避免影响其他分析,我们采用共现转相异软件直接转换得到精准的相异矩阵(见表3)。通过对比,手动逐一计算的数值与软件计算的数值基本一致,即误差为0.0001%。
相异矩阵中的数字越小或无限接近0,说明两者的联系越紧密,反之越靠近1,越稀疏。以第二行“深度学习”关键词为例,与“深度学习”联系的紧密程度由高到低分别为:深度学习(0.0000)、卷积神经网络(0.7997)、特征提取(0.9434)、支持向量机(0.9702)、压缩感知(0.9843)、嵌入式(0.9857)、FPGA (0.9926)、STM32 (1.0000)、低功耗(1.0000)。由此可见,在电路与系统硕士学位论文中,更多的学生会选择将深度学习与卷积神经网络、特征提取相结合起来进行研究讨论,更加的符合当下硕士研究生在网络信息互通的时代中时刻关注前沿、主流的研究热点话题,更加印证人工智能的发展必然是大势所趋。

Table 3. 2015~2020 high-frequency keyword different matrix (partial)
表3. 2015~2020高频关键词相异矩阵(部分)
3.4. 社会网络分析
社会网络分析能够更加直观的观察到关键词与关键词之间的相关联程度,具体做法是将生成的高频关键词共词矩阵导入到COOC6.722软件中,设置好图谱节点大小和图谱线条粗细以及相关参数,绘制近6年我国电路与系统硕士学位论文高频关键词网络图谱(见图1)。图谱中共有35个节点即为35个高频关键词,节点的大小以及节点间的线条粗细反映关键词之间的关联度。在图中,卷积神经网络、深度学习和特征提取节点较大,且与周围节点之间的线条较粗,说明领域研究较为火热且联系紧密可以渗透到其他领域研究当中,并在其他领域有很多应用;FPGA节点最大说明在电路与系统硕士学位论文中研究最为频繁,功率放大器、CMOS等与其他领域联系较为稀疏,而处在边缘的毫米波和复杂网络说明该领域研究和其他研究热点相比较为独立。

Figure 1. High-frequency keyword network map of my country’s circuit and system master’s degree thesis in the past 6 years
图1. 近6年我国电路与系统专业硕士学位论文高频关键词网络图谱
3.5. 聚类分析
本文所使用的聚类类别是系统聚类,聚类分析是一种研究“物以类聚”的方法 [6]。在数据量特别大的情况下,聚类分析能够将数据归为许多类别,便于研究者更加直观的分析。根据前面对共词矩阵的详细分析我们知道,某几个关键词间的包容度越接近他们表示词间的联系性越强聚类划分也就越明显。具体做法是将生成的共词矩阵导入SPSS24.0软件中,选择系统聚类功能进行分析,并生成聚类分析谱系图(见图2)。从图中可以直观的观察到,近六年我国电路与系统专业硕士学位论文的研究热点可以大致分为6个类别,A类:遥感技术研究、B类:深度学习研究、C类:图像处理研究、D类:物联网研究、E类:FPGA研究、F类:锁相环领域研究。

Figure 2. High-frequency keyword clustering analysis of circuit and system master’s degree thesis
图2. 电路与系统硕士学位论文高频关键词聚类分析谱系图
基于聚类分析结果,结合近六年电路与系统专业硕士学位论文的研究情况,对六个主要研究主题进行详细解析。
(1) A类:遥感技术研究
遥感技术研究涵盖了2个关键词:变化检测和SAR图像。遥感技术开始于20世纪60年代,是利用人造卫星或其他类飞行器收集到的电辐射信息对地球生物资源判别分析的技术。到目前为止,遥感技术在农业、海洋、气象、军事等方向都有应用,逐渐深入到社会经济、生活、安全的各个方面,也成为综合国力评价的重要标志之一。
(2) B类:深度学习研究
深度学习研究领域涵盖了10个关键词:神经网络、遗传算法、复杂网络、特征提取、支持向量机、BP神经网络、人脸识别、人脸检测、深度学习和卷积神经网络。深度学习在自然语言处理、数据挖掘、目标检测等众多领域有重大的研究成果。现在,深度学习除了渗透到各个领域外还在一些传统方式的领域中运用取得了很好的应用效果,为人们的生活提供了极大的便利。随着新的深度学习算法不断萌生,许多高校硕士生都热衷于研究深度学习,未来对深度学习的研究以及它所涉及的学科还会不断研究下去。
(3) C类:图像处理研究
图像处理包括6个关键词:目标检测、图像分割、压缩感知、稀疏表示、小波变换和图像的融合表示。图像处理技术通过计算机应用程序进行图像的一系列处理,如图像增强、分割等。图像处理技术已广泛应用军事、生物医学、艺术、航天等领域。除此之外,图像处理技术与深度学习研究也有着紧密的结合,如人脸检测可以应用到车站、小区的门禁中,车牌识别可以应用到城市智慧交通系统中,工厂流水线做产品质量检测以及手机软件如美图秀秀、美颜相机等,图像处理早已深入我们生活的各个方面。
(4) D类:物联网研究
物联网涵盖了8个关键词:低功耗、无线传感器网络、嵌入式、物联网、Android、STM32、传感器、Zigbee。物联网是通过传感器设备采集与互联网相连接的技术。门禁系统中就应用到物联网关键技术RFID标签,还有嵌入式系统技术、智能技术等。自物联网列为国家新兴战略性产业之一后,对物联网的探索研究受到了全社会的密切关注。各大高校也因此积极融入到物联网技术的应用研究当中,并结合当下的人工智能实现如“智能家居”这样的应用实例。从聚类的结果我们也能明显的看出物联网与Android结合紧密,处在智能的时代,我们随时随地的通过移动端APP控制周围的器件,达到物物互联的智能效果。
(5) E类:FPGA研究
FPGA涵盖了5个关键词:LabView、FPGA、ARM、数据采集、DSP。近些年,随着科技的快速发展各类行业大规模的增加,迫于竞争的压力下对硬件的要求越来越苛刻,因此当下的通用处理器(CPU)不足以提供新型计算任务的能力。而此时FPGA这个概念的出现成为了大家研究学习的热潮,通过上述数据统计结果,FPGA与深度学习这两个关键字都是占据最高频次位置,由此可见FPGA是电路与系统专业研究的热点方向。但通过数据对比不难发现(见表4),从2018年开始FPGA不再是电路与系统专业的热门研究方向。由此可见,近几年随着深度学习、卷积神经网络这些新技术的大量出现,对于FPGA的研究则趋于饱和状态,而深度学习进入了大多数专业的研究范畴。

Table 4. Comparison of FPGA and deep learning frequency from 2015 to 2020
表4. 2015~2020年FPGA和深度学习频次对比
(6) F类:锁相环领域研究
在功率放大器电路设计这类当中主要涵盖的关键词有4个:锁相环、CMOS、毫米波、功率放大器。锁相环是自动频率控制和相位控制技术的融合,是对信号的解调、调频、调制、频率合成电路处理的技术,目前该技术在通信、计算机、红外、电视、工业等技术部门都有广泛的应用。像计算机各类钟频信号的供给和控制系统、飞机轮船的导航定位监视系统等都是离不开锁相环技术的应用。对于锁相环研究进展的好坏直接关系关系到我国整个电子行业的稳定与否,因此,对于锁相环的研究还需要各位专家学者、各类高校的共同努力。
3.6. 多维尺度分析
多维尺度分析(Multidimensional Scaling Analysis) [7] 也称为“相似度结构分析”,是一种探索性的数据分析方法,通过降维将含有复杂且量大的数据放缩到一个低维空间中,形成直观的低维空间图形,并用点在空间中表示变量之间是否存在潜在规律性联系 [8]。其主要目的是发现多个元素之间的相似性并做出可观的分析与解释。输出结果是一种以欧式距离为模型输出的知识图谱,通过计算公式如下:
(3)
可以看到欧式距离的实质就是在一、二维空间中两点间的距离。通过引用公式计算出高频关键词的距离值对其做可视化分析,位置的远近决定了词间的关联度,直观的呈现了各元素之间的关系。越相似的元素在空间位置上越紧密,越靠近坐标核心位置被关注和认知度高越高,相反,处在边缘位置的关键词说明研究主题范围较小或者正在转移这些主题研究。
将前面所获取到的相异矩阵导入到SPSS24.0中,通过选择“分析”、“标度”、“多维标度(ALSCAL)”项目后,选中除字符串类型的变量名称以外的所有数据变量,并对相关参数进行设置,如在“度量模型”中选择“Euclidean距离”,“正对称”为关键词的数据结构,基于聚类分析的结果,生成电路与系统专业硕士学位论文热点研究方向的知识谱图,以二维坐标平面图谱更加直观的方式呈现(见图3)。经观察,知识图谱中位置结构关系、关键词的聚集情况明显看出与聚类分析的归类结果基本一致。其中第三(部分)、四象限的高频关键词结构最为紧密 [9],物联网、Android、ZigBee、无线传感器网络无论做研究还是实践当中联系十分密切;深度学习、卷积神经网络、特征提取、神经网络也有此类的结论;进一步发现,第二象限中的关键词结构明显松散,这种现象说明一些研究领域有着较低内部关联度,也侧面反映了这些领域之间独立性较强。

Figure 3. High-frequency keyword knowledge spectrogram for master’s degree thesis in circuits and systems (derived excitation configuration, Euclidean distance model)
图3. 电路与系统硕士学位论文高频关键词知识谱图(派生激励配置、欧式距离模型)
4. 总结
利用共词分析、社会网络分析、多尺度分析等可视化分析方法,对2015~2020年间电路与系统硕士学位论文研究热点的分析发现,当前的研究热点主要分布在深度学习研究、FPGA研究、物联网研究和图像处理研究领域,其中FPGA为传统的热点研究主题。但近几年,国家很重视人工智能领域人才的培养,包括建设人工智能相关学科、促进人工智能领域本科生、研究生的培养,因此偏向人工领域的分支如深度学习、卷积神经网络,逐渐取代了传统的研究领域如FPGA成为最热门的研究方向。根据对全国电路与系统专业硕士学位论文3621篇的分析结果,对电路与系统硕士研究生培养具有非常大的参考价值,不仅为今后提供了明确的培养计划,还为学位论文的选题明确了具体的研究领域,更好为祖国科技的发展培养人才做基础。随着互联网时代的大力发展,信息闭塞已不存在,任何人都可以在手机电脑等智能终端时刻接收到来自国家的政策方针、教育的发展动向以及科学研究最前沿的发展趋向等事宜,对于研究生群体也可以随时随地的选择前沿的热点领域作为自己的热点研究方向。
此外,在现有的基础上,我们对宁夏大学电路与系统硕士学位论文热点也做了可视化分析,得出的结论与全国研究热点趋势相符。不足之处,本文只分析了高频关键词,还有不在范畴内的低频关键词、被数据清洗掉的关键词,可能在未来会成为最热门的研究主题。当然,在数据研究分析的过程中有一定的分析不到位等问题,针对这些问题今后将做进一步的完善。
致谢
首先,感谢郭中华老师从本课题研究开始到结束一路的悉心指导。在研究过程中不仅将出现的问题及时指出,还在遇到研究进展不顺的时候,郭老师总会给予鼓励。其次感谢我的室友和同门,在我遇到问题愁眉不展的时候,总会及时地安慰我并给予加油鼓劲。在这里,再次为帮助过我的老师和同学,表达真挚的敬意和谢忱。最后,感谢我的父母对我的理解和支持。
基金项目
基金项目:宁夏回族自治区教学工程项目,基于CDIO的“电路与系统”研究生人才培养模式研究与实践[YJG201818]。
NOTES
*通讯作者。