1. 引言
时代洪流把实证研究推向前沿,开展实证研究有利于提高研究的科学性,促进学科知识的完善和发展 [1] 。教育是国之大计,教育科学研究范式是影响教育研究质量的关键因素 [2] 。实证化是教育研究取得突破性进展的必要条件 [3] ,也是教育学走向科学的必要途径 [4] 。在教育领域推进实证研究,一方面可以促进基于证据的决策咨询,为教育政策制定提供科学依据;另一方面可以推进基于项目的教育改革,以项目为抓手,在一定时期内,针对难点、重点问题集中攻关 [5] 。
教育实证研究经历了一个多世纪的发展,已建立起相对科学与完善的体系。自19世纪30年代,孔德提出实证主义,到20世纪三十年代,实证主义把客观经验作为获取知识的唯一来源,定量研究(同“量化研究”)取得长足发展 [1] 。伴随着相对论和量子力学的发展,强调社会经验和逻辑,以及注重个人主观感受的后实证主义应运而生,定性研究(同“质性研究”)蓬勃发展。20世纪80年代起,学者们借鉴了后实证主义,开创了建构主义和注重行为效用的实用主义 [6] 。伴随着这些基础理论,教育实证研究也经历了以定量研究为主、定性和定量研究相互竞争、以及定性和定量研究并存的三个阶段。目前大部分学者认为实证研究包含定量研究、定性研究和混合研究 [7] [8] [9] 。无论是定性研究、定量研究,还是混合研究都需要对“数据”进行收集和分析,来获得对事物或关系确切的认识。实证研究通过对前人研究在不同情况下的复现,获得类似的研究结果,这种可以通过不断重复被验证的知识即为科学 [4] 。
改革开放后,我国教育实证研究逐渐受到重视。1980年,刘松涛提出“教育科学的生命在于教育实验” [10] ;叶澜等也提出“实证化是教育研究科学化的重要步骤” [3] ;后来的学者也不断提出教育研究需要建立在事实基础上,鼓励进行实证研究 [11] 。但是国内学者对实证研究的内涵和分类在很长一段时间内没有统一的界定和认识。例如,张慧和查强认为研究方法可以分为思辨研究、定量研究、定性研究和混合研究这四类,其中混合研究是综合运用思辨、定量或定性的研究方法 [12] 。高耀明和范围认为研究方法可以分为思辨研究、定量研究和定性研究三类 [13] 。徐辉和季诚钧从思维方式和研究方式这一角度提出研究方法可以分成定性和思辨、定量和实证 [14] 。2015年10月,由华东师范大学教育学部、北京师范大学教育学部、全国教育科学规划办和光明日报社教育研究中心联合主办的“全国首届教育实证研究论坛”在华东师范大学举行,大大推动了实证研究在中国教育研究领域的发展。2017年1月,《加强教育实证研究,促进研究范式转型的华东师大行动宣言》发布,进一步推动了基于事实和证据进行教育研究的新范式和新文化。迄今,教育实证研究论坛已经成功举办八届,进一步将新时代高水平教育实证研究持续推向深入。
尽管如此,在传统文化与思维方式等主观因素的制约下,以及实证研究论文审稿机制不完善等客观因素的限制下,我国教育研究目前仍以思辨研究为主,其中又以理论思辨为主 [4] [7] [15] 。例如,高耀明和范围通过对“高等教育领域”4253篇高被引论文(1979~2008)所使用的研究方法进行了分析,发现“思辨研究”占78.1%,其中阐述个人观点意见和使用二手数据阐释问题,是两类主要的思辨研究 [13] 。黄忠敬等也发现中国社会科学引文(C-SSCI)数据库收录的932篇学术论文(2010~2019)中思辨研究的比例为72.9%。伴随着对教育实证研究的重视,我国教育实证研究的发文量也呈逐年增长态势 [16] 。姚计海和王喜雪通过对5个教育期刊中的1073篇论文(2001~2011)的分析,发现实证研究占比呈缓慢增长趋势,到2011年实证研究文献占研究文献总量的20% ( [15] p. 22)。王兴宇分析了五个高等教育期刊中的4099篇文献(2012~2016),发现实证研究文献占比从2012年的18.8%上升到了2016年的24.4% [17] 。朱军文和马银琦以15本高水平教育期刊中的3808篇文献(2015~2019)为分析对象,发现我国教育实证研究论文占比持续增长,从2015年的34.4%提升至2019年的38.6% ( [18] p. 23)。虽然我国实证研究数量占比逐年增多,但和英文教育期刊相比,实证研究占比还有较大差距。例如,王树涛分析了教育领域十本SSCI期刊自2010至2019年,共4096篇同行评议文章,发现从实证研究平均占比79.9% [2] 。与此同时,我国教育实证研究还存在研究设计不严谨;研究步骤不明确;数据收集方法单一;数据分析深度不够(多以描述性统计为主);混合研究方法不受重视;新方法、新技术的引进速度慢等问题 [11] [19] 。
以往对教育实证研究发文数量趋势的研究,往往控制在小范围选定的教育期刊上,代表性上存在一定局限性。与此同时,以往研究对实证研究的判断标准,通常是基于论文与关键词库中关键词的匹配。换句话说,是计算机通过关键词判断一篇论文是否是实证研究,这样容易使实证研究占比的数值偏高。有鉴于此,本研究在以往研究的基础上,进一步扩充了实证研究关键词库,覆盖了目前教育研究领域的全部核心期刊与C-SSCI期刊(以下简称C刊),并在经过计算机关键词筛选后,对选定的实证研究的文献进行摘要阅读,提升实证研究的判断准确性。国标中认为摘要的具体内容包括研究目的、方法、结果、结论和其他这五个要素 [20] 。通过阅读摘要可以对整篇文章窥一斑而见全貌,从而更准确地判断文章是否属于实证研究。本研究以2012~2021年全部教育类核心期刊与C刊中的文献为研究对象,调查近10年我国教育领域实证研究的发展趋势,具体研究问题如下:
1) 2012~2021年期间,我国教育研究领域的高水平期刊(核心期刊与C刊)中,实证研究数量占比是如何变化的?
2) 2012~2021年期间,我国教育研究领域的高水平期刊(核心期刊与C刊)中,依据文献摘要判断实证研究属性的效果如何?
3) 对比2012~2016与2016~2021两个时间阶段,我国教育领域实证研究的数量与摘要书写的规范性方面是否存在差异?
2. 研究方法
2.1. 研究样本的检索与筛选
(1) 期刊筛选
本研究以2012~2021年教育研究领域的“中文核心期刊要目总览(简称核心)”和“中文社会科学引文索引(CSSCI)”收录的期刊文献为研究对象。文献筛选过程分为两步,第一步以2012~2021年“中文核心期刊要目总览”和“中文社会科学引文索引(CSSCI)”收录的110本教育类核心期刊与41本教育类C-刊为群体,筛选符合要求的期刊,选择标准如下:
a) 期刊在2012~2021年连续十年都被纳入“中文核心期刊要目总览”或“中文社会科学引文索引”;
b) 期刊所属领域是教育学领域(不包含体育学);
c) 期刊年均发文量不存在异常值(即小于总年均发文量四分位数的1.5倍)。
使用以上述标准为依据进行期刊筛选,共得到47本期刊。具体筛选流程见图1:2012年至2021年,“中文核心期刊要目总览”共有4个版本,110本教育类期刊;“中文社会科学引文索引”共有5个版本,42本教育类期刊;同时属于两个数据库的教育类期刊数量为41本。
第一轮筛选应用的标准为:在2012~2021年连续十年都纳入“中文核心期刊要目总览”或“中文社会科学引文索引”。连续10年均纳入上述两个期刊数据库的教育类期刊数量为59本。其中“中文核心期刊要目总览”的教育类期刊数量为56本;“中文社会科学引文索引”的教育类期刊数量为30本。同时属于两个数据库的教育类期刊数量为27本。第二轮筛选应用的标准为:期刊年均发文数量不超过总年均发文量的上四分位数的1.5倍。第一轮筛选出的59本教育类期刊在2012~2022年的总发文量为199,474篇,绝大多数期刊年均发文量为286~394篇。部分期刊的年均发文量远高于异常值估计(即上四分位数的1.5倍),通过对比这些期刊的类型(例如月刊、季刊、周刊等)以及期刊编辑部工作人员数量,共有12个期刊发文量疑似异常,没有纳入此次研究,剩余47本期刊为本研究的研究对象。其中“中文核心期刊要目总览”的教育类期刊数量为44本;“中文社会科学引文索引”的教育类期刊数量为28本。同时属于两个数据库的教育类期刊数量为27本。
入选的47本教育类期刊中,基于山东理工大学的期刊分类标准,《教育研究》为教育类排名第一的期刊,其余在一区的期刊为11本,二区期刊12本,三区期刊4本。在发文刊次上,半月刊3本,月刊24本,双月刊19本,季刊1本。在稿件接收范围方面,没有明确要求接收稿件范围的期刊有36本,占比76.6%。对稿件接受范围有要求,但要求不清晰的期刊有6本,占比12.8%。例如,《北京大学教育评论》要求“研究论文必须有创新性,内容充实完整,研究快报必须含有首创性成果,研究简报着重要求创新性,文献综述应由该领域内知名专家结合本人近年研究成果完成,要求有较强的前瞻性和指导性”;有明确稿件接收范围要求的期刊有5本,占比10.6%,例如,《教育与经济》的接收稿件范围为教育经济学研究的基本问题及我刊每年发布的“重点选题”等(详见官网)。在期刊投稿过程中,47本期刊的投稿界面均未对稿件类型进行区分(例如综述研究,实证研究等),具体结果见附录。
(2) 实证研究文献筛选
从2012到2021年,上述47本期刊总发文量为97,215篇,从中筛选实证研究文献的标准如下:
a) 文献发文时间在2012年1月1日~2021年12月31日。
b) 文献主题包含以下任意关键词:“系统综述、元分析、实证、量化/定量、质性/定性、调查/调研、实验、案例/个案、人类学、民族/人种志、扎根理论、现象学、叙事、田野调查、内容/文本、口述、抽样/样本、访谈、问卷/量表、数据、编码、描述、比较、相关、回归、因果、影响、中介、调节、SPSS、检验/评测”实证研究关键词(关键词分类标准见表1)。

Figure 1. Flow chart of periodical screening
图1. 期刊筛选流程图

Table 1. Keyword search directory for empirical research in education
表1. 教育实证研究关键词搜索目录
以“中国知网”和“万方数据库”作为检索资源(包含了47本期刊在2012~2021年间全部发表的文献),使用上述两条筛选标准分别检索每一本期刊中的实证研究文献,并经过四位研究者的交叉检验验证,共得到35,784篇文献,占总发文量的36.81%。47本期刊的实证研究数量范围是8.65%~66.82% (详细情况见附录)。
2.2. 数据分析过程
本研究主要对样本期刊实证研究论文数量、实证研究论文占比、以及实证研究的摘要内容进行分析与描述统计,得到近10年教育类期刊实证研究论文占比及其年度分布,并探索通过关键词检索和阅读摘要来判断实证研究的准确性。47本期刊在2012~2021年期间发表的实证研究文献的数据均有“中国知网”和“万方数据库”以查新(引文格式)形式导出,数据包括每篇文献的作者、题名、文献来源、出版年份、出版卷、出版期次、所在页码和摘要。进行摘要阅读的文献则从全部35,784篇文献中,使用系统随机方式分两次各提取10%的文献,共记7183篇文献。提取出的文献使用Excel进行管理和阅读,共四位研究者参与阅读题目和摘要,以判断文献是否属于实证研究,另外两名研究者随机抽取了其中10%的文献交叉检查,除无法判断是否为实证研究的摘要外,一致率为100%。通过标题和摘要无法判断是否为实证研究的文献,研究人员则通过阅读全文来进一步判断。
3. 研究结果
3.1. 教育实证研究年发文量占比在十年间的变化:关键词分析结果
从2012年~2021年,实证研究平均占比整体呈上升趋势,从2012年的34.94%到2021年46.22%的,且期刊间的差异较大。其中,7本期刊在2012至2021年,实证研究发文占比上呈明显上升趋势,且实证研究占比均值超过60%。以实证研究占比最高的《远程教育杂志》为例,实证研究占比从2012年的47.54%上升至2021年的85.29%。18本期刊实证研究年发文量占比平均在40%~60%之间,且整体呈上升趋势,以《民族教育研究》为例,实证研究年发文量占比从2012年的34.48%上升到2021年的51.05%。20本期刊实证研究年发文量占比的均值在20%~40%之间,整体上也呈现上升趋势。另外,《清华大学教育研究》和《比较教育研究》年实证研究年发文量占比变化幅度较稳定,基本保持在30%到40%之间。有两本期刊,《中国高等教育》和《历史教学》的实证研究占比在20%以下,其中《中国高等教育》的实证研究年发文量占比呈下降趋势。
3.2. 教育实证研究的发文量:摘要分析结果
每本期刊中提取出来的阅读摘要的实证研究数量见附录。首先,在35,784篇通过关键词检索出的实证研究中,系统综述类研究(包含定性系统综述与元分析)共有199篇。由于系统综述类研究通常价值较高且数量稀少,结果单独呈现在这里。其中,摘要内容清晰明确,可以确定为系统综述的文献数量为136篇,不属于系统综述的文献为52篇。其余11篇文献的摘要在阅读后无法判断是否为系统综述研究,通过全文阅读后,其中3篇属于系统综述研究。因此,最终确定为系统综述的文献共139篇,约占实证研究文献数量的0.4%。
第一轮通过系统随机方式提取了3585篇实证研究文献(10.02%),每本期刊提取文献的数量见附录。通过阅读这3585篇文献的题目和摘要,研究者发现,摘要内容清晰明确,可准确判断研究类型的文献为3369 (93.97%)篇,无法通过摘要判断研究类型的文献为216 (6.03%)篇。摘要清晰的3369篇文献中,实证研究为1502 (44.58%)篇,非实证研究为1867 (55.42%)篇。无法通过阅读摘要进行判断的216篇文献中,原文确定是实证研究的数量为77 (35.65%)篇,非实证研究的数量为139 (64.35%)篇。最终通过摘要和原文阅读,实证研究合计1579 (44.04%)篇。结果详见表2。
第二轮采用系统随机方式在余下的文献中再抽取3598篇(10.05%)。发现摘要内容清晰明确,可准确判断研究类型的文献为3414 (94.89%)篇,其中实证研究文1412篇(41.36%),非实证研究2002篇(58.64%)。无法通过阅读摘要进行判断的185篇文献中,原文确定为实证研究的数量为79 (42.70%)篇,非实证研究数量为105篇 (56.76%)。最终通过摘要和原文阅读,实证研究合计1488 (41.44%)篇。结果详见表2。
3.3. 2012~2016年与2017~2021年实证研究发文数量对比
自2016年实证研究开始受到更为广泛的关注,通过对比两轮系统随机抽取的文献中,2012~2016年的实证研究数量与2017~2021年的实证研究数量,可以看出其中是否存在差异,同时也是对系统随机抽样的交叉检验。结果发现,两轮抽取的7183篇文献中,2012~2016年产出的文献共3383篇,2017~2021年产出的文献共3800篇。2012~2016年的3383文章中,摘要内容清晰明确,可准确判断研究类型的文献为3222 (95.24%)篇。其中实证研究文献1396 (43.33%)篇,非实证研究文献1826 (56.67%)篇。无法通过阅读摘要进行判断的161篇文献中,原文确定为实证研究的64 (39.75%)篇,非实证研究97 (60.25%)篇。实证研究总计1460 (43.16%)篇。
2017~2021年的3800篇文献中,摘要内容清晰明确,可准确判断研究类型的文献为3561 (93.71%)篇,其中实证研究文献1518篇(42.63%),非实证研究文献2043篇(57.37%)。无法通过阅读摘要进行判断的239篇文献中,原文确定为实证研究的92 (38.49%)篇,非实证研究147篇(61.51%)。实证研究总计1488 (42.37%)篇。结果详见表2与图2。交叉检验中文献数量与抽取过程中完全一致。

Table 2. Results of two rounds of screening and 2012~2016 and 2017~2021 article types
表2. 两轮筛选及2012~2016和2017~2021文章类型结果统计
3.4. 教育实证研究的实际发文量估算
两轮系统随机选择共抽取了7183篇文献,第一轮通过关键词库检索到的实证研究共3585篇,最终通过摘要和原文确定为实证研究的共1579篇(44.04%);第二轮通过关键词库检索到的实证研究共3598篇,最终通过摘要和原文确定为实证研究的共1488篇(41.44%),两轮抽取结果并未发现较大差异,实证研究占比相对稳定。将7183篇文章分为2012~2016年和2017~2021年两个时间段,结果显示2012~2016年通过关键词库检索到的实证研究共3383篇文章,最终通过摘要和原文确定为实证研究的文献为1460篇(43.16%);2017~2021年通过关的3800篇文献中,最终确定为实证研究的1488篇(42.37%)。在实证研究占比方面两个时间段也保持相对稳定。在全部7183篇通过关键词库检索出来的实证研究中,共有3070篇文献最终确定为实证研究,占比42.7%。因此,在2012~2021的10年间,通过关键词检索到的实证研究数量与实际数量存在较大差异,实证研究实际占比估计在15.7%左右(36.8% * 42.7% = 15.7%)。

Figure 2. The two rounds of screening, the total number of included articles and the total number of empirical studies in the last five years
图2. 两轮筛选和前后五年纳入文章总量及实证研究总量
3.5. 修正后的2012~2016年和2017~2021年教育期刊实证研究发文量对比
从2012~2016年,教育期刊实证研究平均占比呈上升趋势,从2012年的14.9%增长到2016年的17.8%,均值16.6%,涨幅2.9%。2017~2021年,实证研究平均占比从17.8%增长到2021年的19.7%,均值19.0%,涨幅1.9%。由此可见,从2012~2021年,实证研究的发文量占比一直在小幅提升,但2017~2021年的实证研究涨幅略低于2012~2016年。
在47本教育期刊中,15本期刊在2012~2016年实证研究发文量占比和2017~2021年相比,有明显的上升趋势,涨幅超过3%,其中《开放教育研究》实证研究年发文量占比从2012~2016年的19.5%上升至2017~2021年的27.0%,上升了7.5%。有25本期刊在2012~2016年实证研究发文量占比和2017~2021年相比有小幅上升(低于3%),以《教育发展研究》为例,实证研究年发文量占比从2012~2016年的11.5%上升至2017~2021年的13.7%,上升了2.2%;有7本期刊在2012~2016年实证研究发文量占比和2017~2021年相比有下降趋势,下降范围在0.20%到3.2%之间,以《中国特殊教育》为例,实证研究年发文量占比从2012~2016年的29.2%下降至2017~2021年的28.2%,下降了1.0%。
4. 讨论
4.1. 教育实证研究数量在2012~2021年呈现缓慢上升趋势
通过使用实证研究关键词库检索,47本教育期刊实证研究平均占比逐年上升,从2012年的34.9%到2021年46.2%的。这与之前的研究结果基本一致。例如,朱军文和马银琦通过对样本期刊进行统计发现实证研究占比总体上每年稳步增长,从2015年的34.4%上升至2019年的38.6% [18] 。张慧和查强通过对职业教育CSSCI期刊进行文献计量分析,发现总体上定量研究呈上升趋势,但变化幅度不大,而定性研究变化较大,从2012年的0%上升到2016年的46.7% [12] 。通过对比本研究与以往研究的结果,也能发现以往研究在统计实证研究数量时,较多使用实证研究关键词进行检索和统计。
尽管如此,当阅读使用关键词检索出来的实证研究的摘要时,发现其中只有约42.7%的研究可以确定为实证研究。而其余57.3%的非实证研究,通常只是呈现了实证研究的关键词,文章仍是以思辨为主,不提供实证证据。基于这一结果,我国2012~2021年教育实证研究实际占比可能低于15.7%,这意味着教育实证研究的数量可能远低于之前研究提供的数据,实证研究仍旧没有成为教育研究的可靠组成部分。
4.2. 通过文献摘要能够更为准确地判断研究类型
94.4%的文献摘要结构清晰,能够通过阅读摘要较为准确地判断文章是否为实证研究,这说明绝大多数研究的摘要能较好的反映文章的研究问题、方法和结果。龙娅丽通过对200篇论文摘要进行质量分析得出核心期刊的摘要写作质量普遍高于非核心期刊的质量,质量较高( [21] p. 11)。5.6%的文章摘要存在内容模糊不清或者不全面等问题。例如结构要素残缺不全、重复题目或标题等,研究目的不明确、研究结果直接作为摘要内容、省略研究结论等 [21] [22] 。存在上述现象可能是作者对摘要的重视程度不够,编辑的业务水平不高,或者对稿件摘要的规范化要求管理较松等原因 [23] 。
4.3. 实证研究在2016年后的增长没有明显变化
2012~2016年教育实证研究增幅为2.9%,2017~202年的增幅为1.9%,没有出现明显变化。尽管自2015年以来,国内教育实证研究迎来了强大的推动力,但由于教育思辨研究的影响根深蒂固,加之疫情的缘故,很多实证研究难以实施。至2021年低,教育实证研究的数量并未发生预期中的明显升高,教育研究实证化的道路在数量上仍然任重道远。与此同时,教育实证研究的审查评价的标准与规范还没有完全建立起来,由此导致的实证研究质量问题也值得进一步关注。例如,钟柏昌发现“教育实证研究优秀成果奖”的40篇获奖论文,存在数据收集方法简单化与单一化、定性研究“标签化”、“重调查轻实验”、“统计主义”等失“真”现象 [24] 。张和平通过对30位教育核心期刊编辑座谈发言的文本分析发现,相当数量的研究存在选题缺乏理论或实践意义,研究过程缺乏理论视角或分析框架,研究数据质量不高或处理不科学,研究方法选用不当或运用不规范等质量问题 [25] 。这些问题的原因可以归结为利益驱动、缺乏理性精神、权威崇拜的消极影响、问题意识匮乏、数据获取缺陷以及对数据的错误使用、社会科学研究方法的滞后等 [26] 。
5. 结论与建议
基于高质量的评价方法,包括大量样本的保证与严谨评价标准的选定,本文提供了近年来更全面、可信的我国教育实证研究现状反馈。根据研究结果可作出以下重要的结论判断:首先,我国教育实证研究在数量上仍旧欠缺,还无法有效推动基于证据的教育政策拟定。并且由于国际教育研究进行实证为基础的学术对话,中文实证研究持续的数量缺乏可能导致我国在国际话语权不够充足。其次,无论评价整体期刊还是某一文献,对比我国实证研究之间的质量仍存在参差,例如部分标注为实证研究的文献实不属于实证研究,或不符合国际通用标准。该结论也侧面反映,学界对实证研究的理论与实践目前没有达成共识,也仍缺乏清晰统一的评价标准;最后,从中文教育研究中辨别实证研究的角度,摘要分析相较于以往的关键词分析,结果更加有效可信。因此,过去基于关键词分析的实证研究数据结果能够被迭代更新。
基于上述研究发现,本研究认为,提高教育实证研究数量和提升实证研究在教育领域中的受重视程度,仍旧需要更为有效的方式与方法。首先,促进我国教育实证研究的快速发展进而推动教育政策的循证化,关键在于从政策导向方面认可实证研究在教育研究领域的重要意义,积极倡导基于实证研究的教育政策制定与实施;其次,从教育研究实践方面,扩大期刊对实证研究发表的接受程度与发文比例,同时建立更为完善的投稿机制,包括明确期刊稿件接受范围和投稿的研究类型,建立合理的实证研究审核与评价的标准,并进一步规范同行评议的审核机制。有鉴于此,未来研究可以关注教育实证研究的评审规则与标准的建立,以及基于实证的教育政策的评估,从多个角度切实促进实证研究的推广与提升,为我国教育实证研究的规范化发展提供理论与实践依据。
基金项目
2022年国家自然科学基金青年科学基金项目“区域经济社会文化画像下的教育资源精准分配研究——基于地理信息系统的大数据分析”(编号:62107004)。
2023年广东省教育科学规划课题(高等教育专项)“基于师生双向评价的高等教育课程教学质量评估工具开发与验证”(2023GXJK677)。
2023广东省教育科学十四五规划项目“核心素养导向的高等师范院校职前科学教师培养研究”(编号:2022GXJK420)。
附录期刊描述性统计结果表


NOTES
*通讯作者。