1. 引言
ChatGPT自2022年底面世以来,以其强大的内容生成能力掀起了教育界、学术界的浪潮[1]。2017年国务院发布《新一代人工智能发展规划》中指出要普及人工智能教育[2]。ChatGPT作为新一代人工智能技术,其对教育产生的影响、促成的教育变革以及可能出现的风险等问题在国内教育领域获得了较高的关注度,相关研究成果不断出现。随着ChatGPT等生成式人工智能的逐步应用,国家网信办公布《生成式人工智能服务暂行办法》,但应该采取何种方式进行规范和引导正逐渐成为重要的研究问题[3]。目前对ChatGPT与教育结合的研究热度较高,但缺乏对已有文献的梳理。因此有必要对ChatGPT在教育领域的研究现状进行梳理并分析热点趋势,以期为后续ChatGPT对教育教学的研究提供借鉴和思考。同时作为未来的信息技术教师,使用ChatGPT等人工智能技术辅助教学也应全面的了解ChatGPT在教育教学应用中的现状以及应规避的风险。
2. 数据来源与研究方法
2.1. 数据来源
以中国知网作为研究的数据源,通过“中国知网”–“期刊”–“高级检索”的路径,检索条件设置为(主题 = ChatGPT) AND (主题 = 教育),文献类型选择学术期刊,检索截止日期为2024年5月1日,共获取552篇文献。人工剔除与主题联系不紧密,国外教育研究等无关文献,获得有效样本458篇。
2.2. 研究方法
传统的文献研究法在直观清晰的展示前人研究成果上存在一定的不足之处,因此采用CiteSpace6.3.R1可视化软件对文献进行客观、全面的分析。将知网检索到的458篇文献导出为Refworks格式,随后在CiteSpace软件中进行CNKI格式转换。在节点类型中分别勾选作者、机构、关键词进行共线分析以及关键词聚类分析。
3. 研究结果与数据分析
3.1. 研究时间分布特征
从国内ChatGPT在教育领域研究成果的时间分布看,2023年1月10日《北京大学教育评论》这一刊物发表了《教育的逻辑及人工智能的教育诱惑》、《机器学习时代的人类学习——ChatGPT引发的教育哲学反思》、《ChatGPT和人工智能:从基本原理到教育应用》。这三篇可视作国内ChatGPT在教育领域研究的最早成果。截至2024年4月底,国内ChatGPT在教育领域研究月均发文量为34篇。纵观国内ChatGPT在教育领域的发文时间来看,我国ChatGPT在教育领域研究始于2023年初,并迅速崭露头角,现已成为备受瞩目的研究热点。
3.2. 作者合作网络共线分析
ChatGPT在各行各业迅速发展,目前越来越多的研究者将ChatGPT运用到教育行业。从图1作者共线网络图谱可知,作者节点数N为83,连接数E为36,连线越粗,合作越多,字体越大,发文量越多。最大发文量为于浩5篇。根据普赖斯定律,核心作者的发文量标准计算公式为m = 0.749 (nmax 1/2),而nmax为所统计的作者中的最高发文量为5,因此计算出m为1.67,则表明ChatGPT在教育领域的研究的核心作者最低发文量为2篇。焦建利、戴岭4篇,其次为祝智庭、饶高琦、周洪宇等作者发文量为3篇,他们是ChatGPT在教育领域研究的核心作者。国内ChatGPT研究处于起步阶段,存在一定的团队合作,但是我国ChatGPT在教育领域研究尚未形成核心作者群。
Figure 1. Collaborating network collinearity analysis diagram of the author
图1. 作者合作网络共线分析图
3.3. 机构共线分析
为确保数据分析的准确性,参看前面研究者的做法[4],将二级学院或系所进一步归纳整理到相应机构单位。机构发文量由高到低依次为华东师范大学19篇,北京师范大学16篇,北京语言大学13篇,华中师范大学11篇,南京师范大学8篇,陕西师范大学7篇,江苏师范大学7篇。由此可知发文量较多的机构以师范类高校为主。从整体来看发文机构涵盖面较小,由图2研究机构共线知识图谱可知,华东师范大学、北京师范大学、华中师范大学、陕西师范大学等部署师范院校是我国ChatGPT在教育领域研究的主要研究地。图谱中连线数为64,连线比较细,且网络密度Density为0.016,网络结构稀疏,由此可知院校之间存在一定的团队合作但机构间深度交流少。从地域分布来看,发文量比较集中于发达地区,如北京、上海、武汉、南京等城市。但是大多属于同校或同地域合作,不易于信息的跨区域流动和协同创新。
Figure 2. Collinear analysis diagram of research institutions
图2. 研究机构共线分析图
3.4. 关键词共线分析
使用CiteSpace构建关键词共线图谱,如图3所示。关键词词性和中心性如表1所示。在关键词共线知识图谱中,连线较多、密度较大,关键词之间的联系较强。其中,人工智能这一关键词一骑绝尘,以138的频次高居第一。同时也可以关注到,研究者们在ChatGPT兴起的时候,首先关注到的是高等教育阶段,在基础教育和职业教育阶段涉及较少。在学科领域中,主要涉及医学教育、外语教育和教育技术学领域。因此,作为教育技术研究者与未来的信息技术教师,学会使用ChatGPT并应用到中小学教学中有一定的教学前景和职业发展需求。当某关键词的中介中心性达到或超过0.1的阈值时,这标志着该关键词在特定的时间段内已引起了大量研究者的深切关注和深入探讨。从中心性来看,数字素养和教育生态的频数较低,但中心性较高,未来可持续关注数字素养和教育生态的相关研究。
Figure 3. Keyword collinearity analysis chart
图3. 关键词共线分析图
Table 1. Keyword frequency and centrality statistics
表1. 关键词词频和中心性情况统计
序号 |
频数 |
中心性 |
关键词 |
序号 |
频数 |
中心性 |
关键词 |
1 |
138 |
0.61 |
人工智能 |
11 |
7 |
0 |
教学变革 |
2 |
25 |
0.08 |
高等教育 |
12 |
7 |
0 |
高校 |
3 |
19 |
0.03 |
教育 |
13 |
6 |
0.17 |
教育技术 |
4 |
14 |
0.19 |
伦理风险 |
14 |
6 |
0.26 |
挑战 |
5 |
11 |
0 |
人机协同 |
15 |
6 |
0.15 |
职业教育 |
6 |
9 |
0.15 |
医学教育 |
16 |
6 |
0.05 |
未来教育 |
7 |
9 |
0.13 |
应对策略 |
17 |
6 |
0.03 |
大学生 |
8 |
8 |
0.05 |
教育变革 |
18 |
6 |
0 |
基础教育 |
9 |
7 |
0 |
教学 |
19 |
5 |
0.74 |
ChatGPT |
10 |
7 |
0.64 |
数字素养 |
20 |
5 |
0.50 |
教育生态 |
3.5. 关键词聚类分析
在关键词共现关系网络的基础上对458篇文献的关键词进行聚类,共得到10个聚类,如图4所示。根据聚类结果显示,Modularity (Q值) = 0.8127,Q值大于0.3,则说明关键词聚类结构显著,轮廓值为0.9594,大于0.7,说明聚类结果可靠合理[5]。如图4所示,关键词聚类知识图谱展示了#0人工智能,#1教育变革,#2应对策略,#3医学教育,#4复合脑,#5风险挑战,#6体育教育,#7教育,#8学术伦理,#9人机协同智商,共10个聚类。序号越小表示在该聚类中包含的关键词越多。在聚类分析的基础上,进一步导出关键词聚类表,如表2所示。
聚类#0人工智能中主要包含个性化学习、基础教育、学校教育、大学生等关键词。由此发现,在人工智能运用于教学的过程中,与个性化学习联系密切。在基础教育与高等教育均有所涉猎,结合关键词共线中关键词出现的频率来看,在高等教育的应用较多。在职业教育的过程中,较少的涉及运用人工智能辅助教学。高等教育教学既要发挥技术优势,也要保持教育初心,坚持立德树人,避免人工智能对人的“物化”和“异化”[6]。
聚类#1教育变革中主要包含挑战、信息技术、教学模式、教师等关键词。随着数字化转型和教育数字化的不断推进,信息技术正不断的应用于教育改革中辅助人才培养。通过技术的手段,如AIGC类工具促进学生素养的提升,促进教学模式的变革。ChatGPT飞速发展引发全球教育工作者普遍忧虑的是,学生可能使用ChatGPT代写作业,由此引发学术不端的概率会大幅度增加。因此学生和老师都要学习驾驭ChatGPT,利用其增效减负助推教育的数字化转型[7]。ChatGPT技术可能带来教育变革有改善教学管理、改进传统教学方式、提升学习体验、提高学习效率[8]。教师及学校领导在ChatGPT应用于课堂教学起着重要作用,在教育创新的同时也应把握好度的问题从而更好地促进教与学。
聚类#2应对策略主要包含外语教学、高校、潜在风险、智慧教育等关键词。杨宗凯等人从思想认识、应用研究、学科建设、自主研发等四个方面提出应对策略[9]。张震宇等人认为ChatGPT在外语学习中阻碍了批判性思维的发展,从人文素养、评价方式、智慧教育等方面给出提升批判性思维的培养策略[10]。
聚类#3医学教育包含医学生、伦理风险、风险、意识形态等关键词。ChatGPT在医学教育领域,辅助医学生临床问诊、提供医学扩展信息从而提高医学生的自学能力[11]。在临床护理领域,可减少护士的重复性工作,缩短时间成本[12]。ChatGPT与元宇宙、虚拟现实等技术相结合,可以创造沉浸式医学教育体验。同时还可作为虚拟导师,辅助答疑,从而提高医学生的学习效果[13]。
聚类#4复合脑主要包含算法思维、重构主义、新知识观、学习评价等关键词。生成式AI产品具有相似的算法逻辑思维。当个体与该类产品建立联系以后,这类产品就可以作为个体的外脑,并与内脑构成复合脑。学校教育需要形成“思维比知道重要、问题比答案重要、逻辑比罗列重要”的学习评价新思维[14]。回归知识观与重构知识观是智能时代知识观变化的双向趋势,未来有望以“复合脑”的方式进行人机合作式学习[15]。
聚类#5风险挑战主要包含人机共教、教育创新、教育技术、数字素养等关键词。ChatGPT到底是教育的“阿拉丁神灯”还是“潘多拉魔盒”,在ChatGPT赋能教学创新的同时,也要规避其可能引发的教育风险[16]。ChatGPT到底是学校教育的朋友还是学生和老师的敌人,取决于它可以帮助我们做什么[17]。作为教育技术的学习者和研究者,我们更应学会使用技术手段应用于教育。因此,面临ChatGPT带来的风险挑战,应将技术变成教育的铺路石,教会学生合理使用技术促进个性化学习,跨越数字鸿沟,提高数字素养。
聚类#6体育教育主要包含未来教育、主体性、主体教育、人工智能依赖等关键词。ChatGPT等人工智能将在体育教学、训练、竞赛和科研等方面有着良好的应用前景,但也伴随着技术可信度低、技术依赖和学术造假等风险[18]。针对学生实际,创建合适的训练计划,再把训练问题反馈给ChatGPT,ChatGPT再对计划进行调整,从而建立闭环评价反馈系统[19]。但值得注意的是,这并不是一把“万能钥匙”,教师应警惕其造成的人工智能依赖[20]。
聚类#7教育主要包含教育教学、影响、反思、应用等关键词。这些关键词也是教育领域当中老生常谈的话题,在应用ChatGPT等人工智能手段影响教学的同时,反思其利于弊,改进教学,促进学生德智体美劳的全面发展仍是我们不容忽视的事情。ChatGPT与教育是知识革命还是教育异化,未来应根据情境需要进行辩证性行动,发挥ChatGPT对教育生态的正向支持功能[21]。
聚类#8学术伦理主要包含学术规范、深度学习、学术制度、教育科研等关键词。ChatGPT可能引发的学术伦理有:主题伦理,学生对其产生依赖,习惯于被动接受,逐渐放弃自主思考;关系伦理,教师权威与师生交往互动的弱化,降低学习体验感;算法伦理,对于ChatGPT给出的答案就像“技术黑箱”,可能会生成虚假的学术文本从而误导使用者;资源伦理,生成的作业无法反映学习者实际的学习水平,对其他同学不公,数字鸿沟带来的城乡差异也在一定程度上影响了教育公平[22]。
聚类#9人机协同智商主要包含google效应、知识观、脑科学、教育评价等关键词。在AIGC高速发展的今天,人机协同将成为数字化教育资源开发的新范式[23]。新旧知识观的双相变化将更好地促进人类成为AI的领导者,发挥高级创新能力,与AI一起形成创新合作团队。研究生可通过人机协同写作,分析ChatGPT生成内容的质量并评价[24]。与此同时,教师应强调学术规范。
Figure 4. Keyword clustering analysis chart
图4. 关键词聚类分析图
Table 2. Keyword clustering table
表2. 关键词聚类表
聚类号 |
大小 |
轮廓值 |
聚类标识词 |
对数似然标签值最大的5个关键词 |
#0 |
19 |
1 |
人工智能 |
人工智能(15.26);个性化学习(7.95);基础教育(5.95);学校教育(3.96);大学生(3.96) |
#1 |
14 |
1 |
教育变革 |
教育变革(14.08);挑战(9.78);信息技术(9.35);教学模式(9.35);教师(9.35) |
#2 |
14 |
1 |
应对策略 |
应对策略(20.74);外语教学(12.99);高校(8.73); 潜在风险(8.73);智慧教育(8.63) |
#3 |
12 |
0.879 |
医学教育 |
医学教育(20.24);医学生(10.03);伦理风险(8.71);风险(6.38);意识形态(6.38) |
#4 |
11 |
0.976 |
复合脑 |
复合脑(17.95);算法思维(11.89);重构主义(11.89);新知识观(11.89);学习评价(5.91) |
#5 |
10 |
0.860 |
风险挑战 |
风险挑战(12.36);人机共教(12.36);教育创新(12.36);教育技术(12.36);数字素养(8.64) |
#6 |
10 |
0.919 |
体育教育 |
体育教育(11.61);未来教育(7.9);主体性(7.9);主体教育(5.77);人工智能依赖(5.77) |
#7 |
8 |
0.959 |
教育教学 |
教育(17.1);教育教学(11.34);影响(11.34);反思(11.34);应用(7.64) |
#8 |
6 |
0.966 |
学术伦理 |
学术伦理(14.24);学术规范(14.24);深度学习(7.06);学术制度(7.06);教育科研(7.06) |
#9 |
5 |
0.993 |
人机协同智商 |
人机协同智商(8.8);google效应(8.8);知识观(8.8);脑科学(8.8);教育评价(8.8) |
4. 研究结论与未来展望
4.1. 研究结论
使用CiteSpace6.3.R1可视化分析工具,选取2023年到2024年5月1日中国知网收录的458篇文献作为数据源,从作者合作共线、研究机构共线、关键词共线、关键词聚类等维度进行可视化分析。
从研究时间分布来看,最早在2023年1月10日,在《北京大学教育评论》这一刊物发表的三篇文章是国内ChatGPT在教育领域研究的最早成果。这三篇文章均来源于高校,均谈到随着ChatGPT的来临,教育面临诸多挑战。我国ChatGPT在教育领域研究始于2023年初,并迅速崭露头角,现已成为备受瞩目的研究热点。
从研究作者来看,最大发文量为5篇,目前ChatGPT在教育领域存在一定的研究者进行研究合作,但是并没有形成研究合作团队。其发文量最多的作者于浩来自陕西师范大学,该学者一般为同校合作或与西北大学合作。其主要的研究关注点为ChatGPT给教育带来的挑战和机遇,以及如何利用ChatGPT赋能教育教学。其发文量较多的其他作者同样来源于高校,都是从理论层面关注ChatGPT在教育领域的应用,缺乏实证方面的研究。
从研究团队来看,研究的主力机构有华东师范大学、北京语言大学、华中师范大学、北京师范大学、南京师范大学、陕西师范大学、西南大学等师范类高校。研究主力机构之间的合作大多为同校合作,也存在一定的校校合作。在校校合作中,发达地区的高校合作多文章产量高。虽和西部高校如新疆师范大学、西北大学等有合作,但合作较少,不利于教育信息的跨区域交流和协同创新。其次研究机构中存在少量医学类学校与职业技术学院。缺乏教育研究院与基础教育阶段的研究。在高等教育的研究中,研究涉及的学科门类十分有限,缺乏ChatGPT在更多学科领域的应用探讨。随着ChatGPT在教育领域应用的推进,未来期待不同的学习阶段和不同学科利用AIGC等人工智能技术辅助教学,促进学生学习的全面发展。
从ChatGPT在教育领域的研究热点来看,研究热点包含人工智能、教育变革、应对策略、医学教育、复合脑、风险挑战、体育教育、教育、学术伦理、人机协同智商等。人工智能是频数最高,中心性较高的关键词。从关键词聚类可发现,ChatGPT在医学教育和体育教育这两个学科门类有着较多的研究。面对ChatGPT带给教育的挑战,许多学者担心学术伦理问题。但更多学者保持积极的态度,指出ChatGPT赋能教育的可行性并提出解决路径如何去规避ChatGPT带来的风险。
4.2. 未来展望
4.2.1. 拓宽ChatGPT在教育领域的应用范围
目前ChatGPT在教育领域的应用主要集中于高等教育阶段,研究机构主要以师范类高校为主。在高等教育阶段,主要涉及医学教育、教育技术学、体育教育等,较少的涉及到文学、数学、物理、化学、历史、地理等学科。通过对文献研读发现,在高等教育阶段不论是医学教育、外语教育还是体育教学,许多文章提到ChatGPT的黑箱问题,给出结果却没有给出思考过程,一方面不利于学生批判性思维的培养,另一方面如产生错误建议或决策,那么在确定责任和纠纷时可能会造成一定的风险或伦理问题。
在教育数字化转型的新时代,ChatGPT在基础教育阶段能否促进学生的学习以及学习的伦理问题还有待进一步的研究。ChatGPT能促进大学生的个性化学习,提高大学生的问题解决能力。但是在中小学阶段,还需要中小学老师以及教研员等从事教学的专家利用人工智能等技术手段,进一步探讨ChatGPT在基础教育中的实际用途。
4.2.2. 加强ChatGPT在教育领域的实证研究
ChatGPT在教育领域研究方法方面,现有的研究主要采用思辨和定性研究方法,从理论设想层面进行探讨ChatGPT在教育领域的应用挑战、技术伦理问题等。运用实证和量化研究方法较少,缺乏科学数据的支撑。未来可以多采用案例分析、深度访谈等质性分析的研究方法,与量化研究方法如问卷调查、大数据分析、实验法等相结合,增强研究结果可信度,增加ChatGPT在教育领域的应用研究。