机器学习在教育研究中的应用探索——基于对21篇文献的系统综述
Application of Machine Learning in Educational Research—Based on a Systematic Review on 21 Literatures
DOI: 10.12677/ces.2025.136485, PDF, HTML, XML,   
作者: 吴天同:北京师范大学教育学部,北京;杨 洋*:北京师范大学人文和社会科学高等研究院教育科技中心,广东 珠海
关键词: 机器学习科学教育数据挖掘神经网络决策树Machine Learning Science Education Data Mining Neural Network Decision Tree
摘要: 随着教育信息化和大数据时代的到来,机器学习成为教育研究和实践领域的一项热门技术。国内外有相当数量的研究关注了机器学习对于教育的支持,积累了大量的实证研究,以及对实证研究的综述研究。有鉴于此,研究采用系统综述报告规范(PRISMA),对机器学习在教育领域的21篇综述进行了系统性文献综述,总结了机器学习在教育领域的应用场景,即教育数据预测和辅助评价,和常用算法,包括决策树、人工神经网络、支持向量机、朴素贝叶斯等,并提出了未来可能的研究趋势,机器学习将会在更广泛的教育领域使用更创新的算法。研究有助于教育研究领域方法的更新,并为教育研究者与一线教师提供教学支持。
Abstract: Machine learning has become a popular technology in educational research and practice with emergence of education informatization and the “Big Data” era. A considerable number of domestic and international studies have focused on machine learning in supporting education, accumulating a large amount of empirical research as well as reviews. Therefore, this study adopted PRISMA to conduct a systematic literature review of 21 reviews on machine learning in education. It summarized the application scenarios of machine learning in education, including educational data prediction and automatic evaluation, and commonly used algorithms, including decision trees, artificial neural networks, support vector machines, Naive Bayes etc. This study proposed research trends in the future, indicating that machine learning will employ more innovative algorithms in a wider range of educational fields. The findings of this study could help to broaden the methods in educational research and provide support for teaching and learning.
文章引用:吴天同, 杨洋. 机器学习在教育研究中的应用探索——基于对21篇文献的系统综述[J]. 创新教育研究, 2025, 13(6): 633-649. https://doi.org/10.12677/ces.2025.136485

1. 引言

机器学习是使用计算机模拟人类的学习活动,研究计算机如何识别现有知识、获取新知识、不断改善性能和实现自身完善的方法[1],也是一种从海量数据中学习模式和规律,挖掘潜在信息,并用于解决分类、回归、聚类等问题的技术[2],它可以从观测数据出发寻找规律,对未来或无法观测的数据进行预测[3]

机器学习的发展大致分为四个阶段:1) 自适应系统的效率和执行力提升阶段(1950~1960);2) 模拟人类的概念学习阶段(1960~1970);3) 学习概念理论成形阶段(1970~1980);4) 高速发展阶段(1986年至今) [4]。机器学习分为监督学习、半监督学习和无监督学习。有监督学习采用已标识数据进行算法迭代,无监督学习使用未标识数据进行迭代,而半监督学习则综合利用少量已标识数据和大量未标识数据来进行模型的学习和训练[5]。训练好的模型可以自行对数据进行分析,提高工作效率,减少人为错误的可能性,还可以发现隐藏在数据中的复杂关系和模式,因此机器学习在科学研究和数据分析中具有重要作用。

机器学习作为大数据时代下的热门方法,在教学与教育研究中有着巨大的潜力[6]。机器学习在教育领域的应用体现在教、学、研三个方面。在“教”上,机器学习可以对学习者的知识获取、技能发展和学习收获进行自动化测评,如Kinnebrew和Biswas [7]使用机器学习自动生成对学生学习行为的测评与比较。在“学”上,机器学习通过分析学生行为,为学生提供个性化学习服务,如Wen和Rosé [8]通过机器学习对学生在线学习的点击流进行分析,并建立学生行为模型,为学生搜索信息和在线学习提供更有效的个性化支持。在“研”上,机器学习能够识别教育问题的影响因素,支持教育研究发展。例如Thammasiri等[9]使用机器学习预测和识别七年级学生辍学的原因与可能性,在此基础上可以开发有效的干预方法来减少学生的辍学率。

我国对机器学习在教育领域的应用和研究自2017年起高速发展,中文文献数据库(中国知网、万方数据和维普数据)的可视化分析(见图1)显示,“机器学习”和“教育”的结合已成为国内的热点研究话题,在线学习、智能教育和学习分析等都是高频研究领域,深度学习和随机森林等机器学习模型也被广泛提及。机器学习在教育领域已经积累了大量的研究文献,对这些文献进行系统性综述对于推动未来研究是十分必要的。

系统性文献综述是全面准确地掌握某一研究主题的发现和规律,并检验研究结论的标准化文献研究方法[10]。机器学习在教育领域的综述研究数量也逐年增长,截止到2024年4月,共出现了21篇不同类型的综述。机器学习在教育领域的研究综述数量快速增长,使得对综述研究的系统性综述成为必要。系统综述之前的综述研究,能够更好地了解机器学习在教育中的应用情况、潜力和未来发展,本研究通过对以往综述性研究的综述,以期回答以下三个研究问题:

1) 机器学习主要应用于哪些教育研究的领域,主要用于解决怎样的问题?

2) 应用于教育研究领域的机器学习算法都是怎样的?

3) 未来机器学习在教育研究中的潜力和发展趋势是怎样的?

通过回答上述研究问题,能够深入理解机器学习在教育研究中的应用领域、能够解决的问题、算法原理和适用性,帮助研究者和教育工作者了解机器学习在教育研究中的潜力和发展趋势,发现研究热点

Figure 1. Domestic research situation

1. 国内研究情况

和研究方向。与此同时,通过总结应用机器学习来提高学习效果和教学质量的有效方法和策略,也能够为教育实践提供指导,为教育技术的发展提供借鉴和启示,推动教育技术的创新和应用。

2. 研究设计

2.1. 研究方法

本研究采用系统性文献综述,探究机器学习在教育研究中的现状与趋势。研究过程遵循国际上开展系统文献综述所采用的通用流程,即系统综述和元分析优先报告的条目[11],包括:1) 建立检索词并选择数据库;2) 指定检索文献的标准;3) 根据标题、摘要和全文筛选文献;4) 对筛选的文献进行编码和分析;5) 呈现综述结果[10]

2.2. 数据筛选

本研究关注机器学习在教育研究领域的中英文文献,因此纳入检索的数据库包括EBSCO、Google Scholar、CNKI、维普和万方数据。检索关键词库包括“machine learning”“education”“review”“meta-analysis”、“机器学习”“教育”“综述”“元分析”及其同义表述如“learning”“overview”等(详见表1),使用上述关键词共检索到10,002篇文献。文献排除与纳入的标准包括:① 综述性研究;② 教育领域的研究;③ 机器学习在教育领域的研究;④ 近十年的研究(2014年后)。文献检索与筛选详细流程见图2。排除9927篇不是机器学习在教育研究领域应用的文献,15篇没有真正使用机器学习的文献,以及27篇不属于综述性研究的文献,余下33篇与本研究密切相关的研究文献,其中有4篇文献无法获取。最后纳入研究的29篇文献中,有7篇研究关注的是机器学习算法的教学,1篇研究仅使用了机器学习的概念,均与本研究的主题不符。因此,最终纳入21篇关于机器学习在教育领域的综述研究进行分析。

2.3. 数据提取(文献编码)与数据分析

数据编码与提取表详见表2表3。每一篇文献的编码内容包括引用、文献覆盖时间、综述类型、纳入文献数量、纳入文献种类、是否进行了文献质量评价、研究主题、机器学习算法和研究结果。其中文献覆盖时间是指综述了什么时间段的研究,综述类别包括范围综述、系统性综述与元分析,纳入文献数量是指研究最终纳入的文献数量,纳入文献种类包括会议论文、期刊论文、书籍章节和报告。

数据编码和提取完成后,对结果进行了描述性统计,频率统计和结果合成。描述性统计呈现了纳入综述的基本信息,例如研究时间和研究主题;频率统计包括对纳入文献的数量,以及机器学习算法的频率统计。结果合成是将21篇综述的研究发现进行精炼与呈现。

Table 1. Keyword selection

1. 关键词选择

关键词类别

英文关键词

中文关键词

研究主题

Machine learning, AI, Big data, Data mining, Neural network

机器学习、人工智能、大数据、 数据挖掘、神经网络

研究领域

Education, Students, School, Assessment

教育,学生,学校,评估

研究类型

Review, Systematic-Review, Meta-analysis, Overview

综述、系统综述、元分析

Figure 2. Selection of included literature

2. 纳入文献选择

Table 2. Descriptive statistics

2. 描述性统计

基本信息

纳入文献

研究结果

作者年份

综述

类别

覆盖

年份

数量

种类

质量

评价

主题

算法

Halde

(2016)

范围

综述

会议

期刊

预测成绩、辍学率、就业

线性回归、逻辑回归、神经网络、决策树、朴素贝叶斯、支持向量机

1. 机器学习预测分析在教育领域的应用:同前

2. 常用算法:同前。

3. 在预测时常考虑的特征有:学生的学习技巧/心理特征/动机水平/注意力水平/时间管理技巧/信息加工能力/考试技巧。

Urbina & Calleja

(2017)

系统性文献综述

03~14

18

期刊

会议

预测学生成绩、表现、学习需求

人工神经网络(7)、决策树(6)、K最近邻(2)、逻辑回归(2)、支持向量机(1)、朴素贝叶斯(7)、数据挖掘(2)

1. 使用机器学习进行教育数据分析的步骤:数据收集、数据预处理、特征筛选、应用机器学习算法。

2. 常用算法:同前。

3. 机器学习方法在解决或自动化教育中不同任务方面的成功应用:同前。

Kučak, Juričić & Đambić

(2018)

系统性文献综述

06~17

67

期刊

会议

预测学生辍学率、学习需求、自动化评价

1. 机器学习在教育领域的应用有:同前。

2. 应用趋势分别是:发现学生弱点并提出改进方法、提供关于学生的学习情况与学习进展的反馈、提供学生目前需要的支持、识别有辍学风险的学生并提供帮助。

Dalipi , Imran & Kastrati

(2018)

范围

综述

13~17

25

会议

期刊

预测学生辍学率

贝叶斯(3)、支持向量机(5)、自然语言处理(3)、神经网络(3)、决策树(5)、逻辑回归(10)、隐马尔可夫模型(2)

1. 应用的机器学习技术有:同前。

2. 可能导致学生在MOOC中辍学的因素有:学生学习动机缺失、缺乏时间、背景知识和技能不足、课程本身的因素、隐藏的消费成本。

3. 使用机器学习技术进行MOOC辍学预测的挑战有:缺乏足够的样本数据、数据结构混乱、数据差异大、数据不平衡、缺乏衡量学生点击流的标准格式。解决方法:将点击流数据标准化、直接从学生处收集数据、结合其他特征进行预测、讲师参与系统干预。

余明华,冯翔&祝智庭(2018)

范围

综述

10~16

20

会议

期刊

预测学生表现、辍学率、学习需求

过滤算法(1)、贝叶斯(2)、线性回归(2)、逻辑回归(7)、决策树(2)、神经网络(2)、支持向量机(2)、K最近邻(1)、随机森林(1)、遗传程序算法(1)、关联规则挖掘(1)

1. 机器学习在教育领域的应用有:同前。

2. 在教育领域使用的机器学习算法有:同前。

3. 机器学习应用于智慧教育的建议有:机器学习与智慧教育的跨界融合、教育大数据治理、数据标准化、提升教师素养、提高教师参与。

Korkmaz & Correia

(2019)

范围

综述

07~17

74

会议

期刊

书籍

报告

预测学生学习需求、评价学生学习情况

贝叶斯方法(10)、向量方法(39)、决策树方法(20)、逻辑回归(6)、学习分析(20)、数据挖掘(23)、文献综述(5)

1. 2007至2017年间发表的使用机器学习研究教育的论文的趋势:一半以上的研究在2015至2017年间,美国最为活跃,其次是英国、澳大利亚和西班牙。74项研究中有6项是基于现有框架来开发新算法,其余是使用了已有的算法,其中决策树占比最高。

2. 未来研究该主题的方向有:自动化、认知过程评估、预测、智能辅导系统。

3. 对未来研究的建议:多使用大数据进行分析、研究人员应用机器学习的水平需要提升、创造新的算法。

Tamada,Magalhães & Lima

(2019)

系统性文献综述

15~18

13

会议

期刊

预测学生辍学率

深度学习(2)、决策树(2)、梯度提升(1)、K最近邻(1)、逻辑回归(4)、长短期记忆(2)、朴素贝叶斯(1)、神经网络(2)、随机森林(3)、支持向量机(4)、递归神经网络(2)

1. 提出了减少辍学的解决方案的文献有十三篇。

2. 用于预测辍学风险的机器学习技术有:同前。

3. 被评估课程的数据库样本:慕课、Moodle平台。

4. 使用机器学习技术避免学生辍学的解决方案有:开发系统(能够获得即时的教学干预反馈)、每周产生预测模型,基于此提出指导和干预。

Rastrollo, Gómez & Durán

(2020)

系统性文献综述

04~19

64

会议

期刊

书籍

预测学生辍学率

集成学习(4)、人工神经网络(19)、深度学习(3)、决策树(15)、协同过滤(14)、数据挖掘(6)、K最近邻(8)、逻辑回归(10)、矩阵分解(7)、支持向量机(22)、朴素贝叶斯(12)、随机森林(11)、其他(9)

1. 常用算法:同前。

2. 最广泛使用的是支持向量机、决策树、朴素贝叶斯、随机森林;开始兴起的是合作过滤算法;神经网络建议应用于其他教育领域,而非预测学生表现。

3. 使用这些算法进行预测的目标有:学生辍学率、学生表现、推荐活动和学习资源、学生的知识水平。

Zhai et al.

(2020)

系统性文献综述

08~18

49

会议

期刊

自动评价

神经网络(1)、回归(13)、支持向量机(9)、顺序最小优化(6)、决策树(7)、贝叶斯(6)、其他(7)

1. 应用于不同教育领域:物理学、化学、普通科学、计算机科学、医学、地球科学、生命科学。研究样本:中学以上学生、中学生、小学生。

2. 机器学习算法的技术特征:监督式学习、无监督学习和半监督学习。算法都有:同前。

3. 算法评估:自验证、交叉验证、分割验证。参数:准确性、精度、灵敏度、特异性、F值和正值度量。

4. 科学教学潜力:科学探究、知识激活与建构、与导师互动、讨论或论证、游戏。

Cardona et al.

(2020)

系统性文献综述

10~18

19

会议

期刊

预测学生未来发展

神经网络(10)、决策树(13)、逻辑回归(7)、支持向量机(7)、K最近邻(4)、随机森林(4)、朴素贝叶斯(2)、贝叶斯信念网络(4)、提升树(1)、分解机(1)、信息融合(1)、随机梯度下降(1)

1. 常用算法:同前。

2. 效果更好的算法:决策树、朴素贝叶斯和神经网络。

3. 影响预测的因素有:GPA、高中、城市、住院情况、母亲的教育水平、奖学金、助学贷款、获得的学分数、学期长短、学习动机、首选学习地点、饮酒习惯、吸烟习惯、上课出席情况、婚姻状况、住房状况、年龄、挂科情况、性别、兼职情况、学费。

4. 预测学生保留率面临的挑战有:使用集成算法的研究少;没有一个普遍适用的预测保留率的因素清单。

Albreiki,Zaki&Alashwal

(2021)

系统性文献综述

09~21

78

会议

期刊

书籍

预测学生表现、辍学率

朴素贝叶斯(13)、随机森林(3)、支持向量机(18)、逻辑回归(15)、深度学习(7)、决策树(18)、人工神经网络(8)、K最近邻(7)

1. 该领域关注的研究问题有:同前。

2. 在预测风险学生表现时,常采用的特征向量为社会人口特征、教学效果、学生互动、学生活动日志等。在预测有辍学风险的学生时常采用的特征向量为风险学生的早期表现、GPA、学习者特征和学生无法毕业的可能性。

Blessing et al.

(2021)

系统性文献综述

11~19

34

会议

期刊

书籍

自动评价

支持向量机、人工神经网络、回归、决策树

1. 常用算法:同前;自然语言处理方法:词源化和词干提取、禁用词、词性标记、语义角色标注。

2. 自动评分系统的常用功能:语法功能、词汇功能、语义功能。

Luan & Tsai

(2021)

系统性文献综述

16~20

40

期刊

预测学生表现、评价学生学习情况

K最近邻(8)、朴素贝叶斯(10)、回归(13)、随机森林(13)、人工神经网络(14)、决策树(15)、支持向量机(17)、其他(39)

1. 主要目的:诊断、预测、治疗或干预、预防和建议。

2. 数据环境:在线学习、课堂学习和混合学习;应用领域:计算机科学、STEM、社会科学和融合领域;数据来源:学习日志、学习调查记录和教育机构数据库。样本差异:人口统计学差异、学术差异、认知差异、情感差异、行为差异、受到的教学的差异。

3. 结果:同前。算法:同前;参数:准确率、精密度、召回率/灵敏度、F1得分、AUC和ROC;验证方法:自验证、分割验证、交叉验证。

4. 拥有的显著关系:样本量与数据收集环境、研究领域与数据来源、自验证与交叉验证。

Baashar et al.

(2021)

系统性文献综述

15~19

30

期刊

会议

预测学生表现

决策树(5)、K最近邻(5)、朴素贝叶斯(5)、人工神经网络(9)、支持向量机(6)

1. 预测学生成绩的属性:人口统计学特征、学术、内部评估、交流、行为、心理学、家庭。

2. 常用算法:同前。

3. 模型精度最高的是人工神经网络,达到了98.3%。

Sekeroglu et al.

(2021)

系统性文献综述

10~20

29

期刊

会议

预测学生表现、辍学率

人工神经网络(7)、深度神经网络(4)、决策树(8)、随机森林(10)、线性回归(1)、逻辑回归(3)、支持向量机(7)

1. 常用机器学习算法:同前。

2. 常见的评估指标:精度、F1得分、召回率、特异性、精度;验证策略:数据挖掘、交叉验证。

Moonsamy et al.

(2021)

元分析

10~20

11

期刊

预测学生表现

神经网络(3)、决策树(5)、支持向量机(1)、贝叶斯(4)、逻辑回归(1)、关联规则(1)

1. 预测学生在计算机编程中的表现时,不同教育数据收集方法的性能:最低性能为10%,最高为36%,混合性能为24%。附有不同研究的综合性能图。

Zhai, Shi & Nehm

(2021)

元分析

10~20

110

期刊

会议

自动评价

人工神经网络、决策树、朴素贝叶斯、分类树、回归、支持向量机

1. 影响评分的因素:评估外部特征、评估内部特征、受检者特征、机器训练和验证方法、具体技术特点。

2. 人机评分协议的异质性:人类和机器的评分差异。

3.哪些因素对异质性有影响:算法、学科领域、评估格式、结构、学校水平和监督类型。

Fahd et al.

(2022)

元分析

10~20

89

期刊

会议

报告

自动评价

反向传播(1)、神经网络(1)、决策树(4)、支持向量机(1)、朴素贝叶斯(3)、多层感知机(1)、逻辑回归(1)、回归树(1)、贝叶斯网络(1)、关联规则(1)

1. 对纳入研究的数据集的分析:人口统计学特征是常用特征。

2. 不同机器学习方法的使用模式:同时88%的研究在算法上都选择使用了监督学习,78%的研究使用机器学习进行分类研究。

3. 常用算法:同前。

Alhothali et al.

(2022)

系统性文献综述

17~21

67

期刊

会议

预测学生表现、未来发展

概率模型(4)、线性模型(9)、集成方法(10)、基于树的模型(14)、基于规则的模型(3)、基于实例的学习模型(2)、神经网络(4)、深度神经网络(21)、序列模型(1)、其他(7)

1. 流程:数据收集、特征向量的选择、机器学习模型的选择、输出预测结果。

2. 预测变量:人口统计信息、学术背景、课程信息、课中信息、课后数据。

3. 成果:同前

4. 常用算法:同前。

Trivedi

(2022)

系统性文献综述

17~22

19

期刊

会议

预测学生辍学率

决策树(1)、贝叶斯网络(1)、支持向量机(9)、K最近邻(1)、逻辑回归(3)、神经网络(4)、深度神经网络(1)

1. 机器学习技术:同前。

2. 影响因素:学位、性别、年龄、ACT英语成绩、ACT数学成绩、ACT阅读成绩、ACT综合成绩、高中GPA、大学GPA、工作计划。

Issah et al.

(2023)

系统性文献综述

16~22

84

期刊

会议

书籍

预测学生表现

决策树(14)、随机森林(3)、朴素贝叶斯(12)、逻辑\线性回归(11)、支持向量机(9)、人工神经网络(10)、K最近邻(2)继承算法(10)、其他(13)

1. 经常被使用的特征:学术特征、表现特征、人口统计学特征、行为、心理、家庭背景和学校环境。

2. 机器学习算法:同前。

3. 最有效的特征:学业成绩、人格特征。

Table 3. Research classification

3. 研究分类

预测

预测学生表现

预测学生成绩

Halde (2016); Albreiki,Zaki & Alashwal (2021); Baashar et al. (2021); Urbina & Calleja (2017); Alhothali et al. (2022)

预测学生学业表现

Urbina & Calleja (2017); 余明华,冯翔&祝智庭(2018); Luan & Tsai (2021); Sekeroglu et al. (2021); Moonsamy et al. (2021); Issah et al. (2023)

预测学生辍学率

预测学生MOOK辍学率/预测学生课程保留率

Halde (2016); Dalipi, Imran & Kastrati (2018); Trivedi (2022); Rastrollo, Gómez & Durán (2020); Tamada,Magalhães & Lima (2019)

预警学生失学风险,补救学生风险行为

Albreiki,Zaki & Alashwal (2021); 余明华,冯翔&祝智庭(2018); Sekeroglu et al. (2021); Kučak, Juričić & Đambić (2018); Alhothali et al. (2022)

预测学生的未来发展

预测学生毕业率

Cardona et al. (2020); Alhothali et al. (2022)

预测学生就业率

Halde(2016)

预测学生学习需求

提供个性化学习资源

Urbina & Calleja (2017); 余明华,冯翔&祝智庭(2018); Kučak, Juričić & Đambić (2018)

智能辅导系统

Korkmaz & Correia (2019)

评价

评价学生学习情况

学习过程评估

Korkmaz & Correia (2019); Luan & Tsai (2021)

学生建模

余明华,冯翔&祝智庭(2018)

自动评价

辅助测试/自动化评估/文本分析

Kučak, Juričić & Đambić (2018); Blessing et al. (2021); Zhai et al. (2020); Zhai,Shi & Nehm (2021); Fahd et al. (2022)

3. 研究结果

3.1. 描述性统计与频率统计结果

在21篇综述中,有4篇范围综述,3篇元分析,和14篇系统性综述。综述中的研究均来自2003至2022这二十年间,其中又以2010年后的研究为主;多数综述都选择了至少五个数据库,其中IEEE、Google Scholar、Web of Science、ACM Digital Library、ERIC最常出现;综述的文献纳入数量在11~110篇之间,平均47篇;种类包括会议论文、期刊论文、书籍章节和报告四种类型;大部分综述(16篇)没有进行纳入文献的质量评价。综述主题包括使用机器学习在教育领域进行预测和评价。在机器学习的算法使用频率方面,支持向量机最高,为174次,神经网络、决策树、逻辑回归和贝叶斯算法的出现频次也较高,分别是131、128、117和94次。信息融合、协同过滤、顺序最小优化、关联规则挖掘等算法使用频率相对较低。

3.2. 机器学习在教育研究中的应用

机器学习在教育研究中的应用可以分为预测和评价两大类。绝大多数综述关注使用机器学习的预测功能,预测可以分为预测学生表现、辍学率、未来发展、和学习需求;评价可以分为评价学生学习情况和自动评价。预测类研究通过对学生未来情况的预测,及时进行适当干预或者提供个性化的学习资源;而评价研究关注学生的实时表现,呈现学生在学习过程中的认知误区并及时纠正,还可以辅助教师进行自动评价。

预测类综述始自Halde [12]对高等教育中课程保留率、成绩与就业率的预测研究的总结。综述指出预测上述变量时常用的因素包括学生的学习技巧、学生的心理特征、学生的动机水平、学生的注意力水平、学生的时间管理技巧、学生的信息加工能力和学生的考试技巧。在预测学生表现方面,部分综述研究关注预测学生成绩的领域,如作业成绩、期中或期末成绩等。也有一些综述关注成绩预测常采用的数据集的特点,如Baashar等[13]指出预测学生成绩的常用数据属性有人口统计学特征、学术特征、行为、家庭等特征,精度最高的模型是人工神经网络,高达98.3%。而Albreiki等[14]综述发现很多研究使用PISA数据集的数据进行成绩预测。

其它综述关注更广义的学生表现,包括预测学生的出勤率、作业完成率等。Urbina和Calleja [15]总结出该方向使用机器学习进行教育数据分析的步骤是数据收集、数据预处理、特征筛选、应用机器学习算法。余明华等[16]指出相关研究主要考虑的影响因素包括人口特征、分数(平时测验和最终成绩)、学生学档、多模能力、学生参与、活动的注册和参与以及情绪情感状态等。而Issah等[17]的综述认为在相关研究的数据分析中最有效的特征是学业成绩和人格特征。Luan和Tsai [18]的综述也关注的数据集的特征,他们发现很多研究的数据来源为学习平台的学习日志、学习调查记录和专门教育机构的数据库,此综述还发现相关研究关注的学科多为计算机科学、STEM、社会科学和融合领域。也有一些综述总结了该领域使用算法的特点,如Sekeroglu等[19]指出机器学习的常用验证策略有数据挖掘和交叉验证。Moonsamy等[20]关注不同方法在预测学生在计算机编程中的表现时的性能,其中最低性能为10%,最高为36%,混合使用的性能为24%。

预测学生的辍学率也是机器学习在教育中的热点研究领域,其又可细分为两个方面,一是预测MOOC课程的辍学率或保有率,Dalipi等[21]的综述提出可能导致学生在MOOC中辍学的因素有学生学习动机缺失、缺乏时间、背景知识和技能不足、课程本身的因素和隐藏的消费成本。Trivedi [22]提出了更多的影响因素,包括学位、性别、年龄、ACT成绩、高中GPA、大学GPA和工作计划。Rastrollo等[23]总结得到该方向最广泛使用的算法是支持向量机、决策树、朴素贝叶斯、随机森林。该研究领域的另一个方向为预警学生失学风险,即对有可能发生辍学行为的学生进行提前预警,并进行及时的补救。Kučak等[24]认为通过及早识别风险学生,可以让学校提前干预。Albreiki等[14]也指出在课程的早期阶段进行辍学预测让教师提供早期干预更具有可行性。Tamada等[25]综述指出使用机器学习技术避免学生辍学的方法有开发教学干预反馈系统和每周产生预测模型,基于此提出指导和干预。余明华等[16]的研究关注相关研究使用的数据,他们指出人口统计和学习成绩是预测学生失学风险的重要数据。Sekeroglu等[19]总结出该领域研究中对机器学习模型的常见的评估指标有精度、F1得分、召回率、特异性、精度。

预测学生的未来发展是指预测学生的毕业率和就业去向。这类研究主要关注高等教育,通过对大学生的特征数据分析来判断他们学位证书的取得情况以及毕业之后的就业情况。在对数据集特征的总结中,Alhothali等[26]的综述总结的常用特征有人口统计信息、学术背景、课程信息、课中信息和课后数据。Cardona等[27]的综述总结了更多的特征,包括GPA、高中、所在城市、住院情况、学期长短、学习动机、饮酒习惯、吸烟习惯、上课出席情况、婚姻状况、年龄、挂科情况、性别等。关注学生就业相关的研究较少,Donaldson [28]根据学生在大学中的成绩表现和人口统计学信息构建学生就业去向预测模型,这一模型对学生在未来招聘中的职业去向的预测准确率达到了83.33%,该研究可以用于预测容易在招聘中失败的学生,以便学校和教师及时提供支持。

机器学习还可以用来预测学生的学习需求,余明华等[16]的综述指出该领域最大的特征是通过分析学习者的行为,来预测学习者的表现和兴趣,并生成个性化推荐。Korkmaz等[29]提出智能辅导系统的内容包括“学习进度模型”和“推理引擎”,系统对学习进度做出决策,并将数据发送到引擎,为学习者提供最有效的学习路径。

机器学习在教育评价方面的应用包括评价学生学习情况和自动评价技术,前者又包括对学习过程的评估和对学生知识和行为的建模。Korkmaz等[29]认为学习过程评估是未来的重要研究方向。学习过程评估着眼于学生和在线学习系统的交互行为,通过对学生过程行为的分析纠正学生的学习误区,监控学习者的知识获取程度,技能发展水平和学习结果。在行为建模上,余明华等[16]指出学生建模是创建和维护学生模型模块的过程,旨在对学生的误解和次优表现做出假设,以便教师能够指出并建议修正。这类评价针对学生的学习数据进行实时分析,从而学生通过学习构建的知识框架,以及识别在学习过程中出现的知识误区,进行及时的干预。

在使用机器学习辅助教师对学生进行自动评价方面,Kučak等[24]的综述中提出采用机器学习进行评估可以消除人类偏见,为教师提供关于学生学习的反馈,包括他们需要的支持以及在学习目标方面取得的进展。Zhai等[30]指出机器学习算法可以允许教师使用更为复杂的评估方法,由教师规定编码,机器实现自动化,并提出这一方法的教学潜力有进行科学探究、知识激活与建构、与导师互动讨论或论证、进行学习游戏。在自动评价中,影响人机评分协议的因素都有评估外部特征、评估内部特征、受检者特征、机器训练和验证方法[31]。自动评分系统的常用功能有语法功能、词汇功能和语义功能[32]。Fahd等[33]对纳入研究的数据集进行总结得到人口统计学特征是常用特征。由于这种自动化评估经常需要对大片文本进行分析,因此有关文本的分析也是这类研究的重要关注点。

3.3. 机器学习在教育研究中的算法

机器学习在教育研究中的常见算法包括朴素贝叶斯算法、决策书、支持向量机、回归、k最近邻、人工神经网络、以及上述算法的集成方法(详细图示见表4)。

3.3.1. 朴素贝叶斯算法

朴素贝叶斯算法以特征条件独立假设为数学基础,即进行训练的数据的不同特征之间不会互相影响。如将数据集的四个不同属性分开进行处理和训练,得到训练结果模型后,再将未知类别的数据输入模型,得到分类结果。贝叶斯网络又称信念网络,是一种基于朴素贝叶斯算法的概率图型模型,由代表随机变

Table 4. Common algorithms

4. 常见算法

朴素贝叶斯

决策树

支持向量机

线性回归与逻辑回归

K最近邻

人工神经网络

集成方法

其他

协同过滤、顺序最小优化、关联规则挖掘、因子分解机

量的结点(图中的圆圈)及连接这些结点的有向边(代表结点间的相互关系)构成,不相连的变量则相互独立。两种方法既可用于回归问题也可用于分类问题,如Makhtar和Nawang [34]的一项研究中使用朴素贝叶斯方法解决回归问题,根据学生的早期表现来预测学生成绩,准确率能够达到73.4%。Miranda和Guzman [35]发现最能导致高校学生辍学的变量是社会经济原因和大学入学分数,其中使用贝叶斯网络判断的准确率为76%,这里解决的是分类问题。隐马尔可夫模型是一种特殊的贝叶斯网络,主要用于时序数据(按照时间顺序记录的数据列)建模,可以针对教学过程进行预测和分析。Balakrishnan和Coetzee [36]使用隐马尔可夫模型对学生在MOOC课程中的过程记录进行分析,推断出可能中断课程学习的学生特征都有:不经常查看课程进度、发帖少、不完整观看讲座视频等。

3.3.2. 决策树

决策树基于人们利用选择做出决策的过程。决策树处理离散数据时生成分类树,而处理连续数据时生成回归树,因此决策树可以处理分类问题与回归问题。Hussain和Khan [37]使用标记好标签的学生学术历史数据(选取了30个最优属性)同时训练了回归模型和决策树分类模型,来预测学生的分数,两种模型最终得到的预测结果都比较良好。随机森林属于集成学习,以决策树为基本单元,当进行分类时,森林中的每棵决策树都会产生一个分类结果,最后结果最多的类别就是最终的预测结果。随机森林可以用于预测学生的学习表现,例如Kaunang [38]同时使用随机森林和决策树来分析教育数据,创建学生学习成绩的预测模型,结果发现决策树得到的结果优于随机森林,这也能解释为什么在教育领域的研究中决策树算法被应用的频率更高。

3.3.3. 支持向量机

支持向量机用一个平面分割数据样本,当两个不同样本处在距离这个平面最远的状态时,则认为这个分类是最优解。在线性可分时,两类数据样本直接被平面分割;在线性不可分时,则加入中间变量,使用非线性映射将数据样本映射到另一个空间使其线性可分。例如,Sixhaxa等[39]使用了五种机器学习模型来预测学生的表现,发现学生的行为特征和学习成绩之间存在很强的相关性,其中支持向量机具有最高的预测准确率,为81.67%。

3.3.4. 线性回归与逻辑回归

线性回归用于预测自变量和因变量之间的关系,可以预测学生的未来发展和表现。例如,Oyerinde和Chia [40]使用多个线性回归模型对大学生的学业成绩进行预测,从而增强了教育教学中对知识的管理和教师对学习的交付。逻辑回归常用于解决二分类问题,根据数据点和S型曲线两端的拟合情况进行问题解决。Hashim等[41]比较了几种机器学习算法在预测学生期末考试成绩方面的性能,发现逻辑回归在预测学生期末成绩方面最为准确。

3.3.5. k最近邻

k最近邻指每个样本都可以用它最接近的k个邻居来代表,即一个样本在特征空间中与k个最相邻的样本属于同一个类别,并具有共同的特性。因此k最近邻在决策时,只与极少量的相邻样本有关。Turabieh等[42]使用学生的学术数据、虚拟课程和电子学系日志文件等数据,选用了不同的分类器(包含k最近邻)来配合预测学生表现,其中k最近邻算法准确率达到了88%。

3.3.6. 人工神经网络

人工神经网络从信息处理角度对人脑神经元网络进行抽象,建立分布式并行信息处理的算法模型。BP神经网络算法是目前神经网络算法中非常成功的一类,它由一层一层的节点构成,数据在层级之间传递处理,该算法可以根据训练得到的结果与预想结果进行误差分析,修正权值和阈值。在这个过程中整个神经网络不断进行学习,直到输出误差达到预期的结果。人工神经网络可用于预测也可用于评估,Lau等[43]将常规统计分析与神经网络建模相结合,来预测学生表现,最终神经网络模型实现了84.8%的预测准确率。深度学习源于人工神经网络的研究,也被称为深度神经网络,它打破了传统神经网络对层数的限制,可根据设计者需要选择网络层数。深度学习可以逐步构建单层神经元,每次只训练单层神经网络,最后构建完成再对整体网络进行调试,一定程度上解决了人工神经网络中容易出现的过拟合问题。Yousafzai等[44]使用了深度神经网络模型中的长短期记忆网络从历史数据中有效的预测学生的成绩,最后的准确率高达90.16%。

3.3.7. 集成方法

集成学习通过训练多个模型解决相同的问题,并将它们结合起来以获得更好的结果。集成算法也可以理解为混合算法,采用多种算法逻辑来进行数据分析,能融合多种算法的优势。Adejo和Connolly [45]将三种模型(决策树、人工神经网络和支持向量机)进行集成,对西苏格兰大学的141名学习者的数据进行分析,这项研究发现使用异构集成技术的方法在预测学生表现方面的性能要优于单单使用一种方法,该集成模型能正确预测约80%的学生成绩。

综上,机器学习在教育研究中的常见算法各有优缺点。朴素贝叶斯算法简单高效,但特征独立假设常与实际不符;决策树可解释性强,但易过拟合;支持向量机泛化能力佳,但对参数敏感且计算复杂度高;线性回归与逻辑回归易理解和应用,但线性回归对非线性关系拟合差;k最近邻无需训练,但计算资源消耗大;人工神经网络及深度学习能处理复杂模式和大规模数据,但易过拟合且训练过程复杂;集成方法融合多种算法优势,但构建难度大。例如,朴素贝叶斯可用于预测学生成绩,但在多学科关联分析时准确性受限;决策树能预测学生分数,但数据变化可能导致树结构不稳定;支持向量机在分析学生行为与成绩关联时表现出色,但大规模数据处理耗时。未来需结合教育实际,深入研究算法优化与创新,以更好地推动机器学习在教育领域的应用。

3.4. 机器学习在教育领域的未来研究趋势

机器学习在教育领域的应用范围在逐渐扩大,算法模型种类也在逐渐增加。在未来的研究中,机器学习将用于解决更多的教育问题,机器学习的算法模型也将进一步优化。

3.4.1. 机器学习在教育研究中的应用会越来越广泛

在机器学习的预测研究上,很多研究停留在提供预测结果,但没有进一步形成解决方案,因此如何对预测结果进行智能反馈是亟待补充的研究领域。在此之上,多种类预测结果的整合和分析,助力建设相对完整的智能教学体系,提升数字化教学水平,也是该领域未来研究的焦点。在机器学习的评价研究方面,使用机器学习辅助人工评价,以及自动评价的准确率是当前研究的主要内容。提升自动评价的准确和精确程度,建立更可靠有效的学习分析模型是未来研究所面临的挑战。除此之外,机器学习在教育领域的研究主要关注高等教育和MOOC等在线学习平台,对中小学教育和线下教学关注较少。因此,未来也需要大量在基础教育中应用机器学习的研究。

3.4.2. 进一步优化机器学习算法

机器学习在教育领域的研究更倾向使用经典算法。Korkmaz和Correia [29]综述的74项研究中只有6项开发了新的算法。机器学习的算法正在飞速地更新迭代,如Ororbia和Kifer [46]基于人工神经网络提出了新的算法框架,其灵感来自于大脑中的预测加工理论,研究者让模型中的人工神经元像人脑神经元一样可以预测相邻的神经元会做什么,并根据预测与现实的匹配程度来调整它们的参数,最终得到的模型在几个基准数据集和指标上表现良好。除了算法优化外,研究流程和模型训练也可以进行改进,例如在线数据收集面临数据结构混乱、数据差异大、缺乏衡量数据的标准格式等,可以优化数据清洗环节,人工填补数据,或改进在线平台收集数据的方式,让获得的数据更加标准。模型训练方面,很多研究缺少精确度判断的环节,判断精确度有准确率、精密度、F1得分等多种评估指标,可以增加评估环节。

未来机器学习在教育研究将更广泛深入,助力教育提升,但面临诸多挑战。数据隐私和伦理问题突出,需开发符合伦理的数据处理方法,保障数据使用的透明性和合规性。算法可解释性需提高,开发能直观解释的算法,让教育者理解模型决策。技术要与教育实践结合,与教育工作者合作,开发满足实际需求的工具,推动机器学习在教育领域可持续发展和广泛落地。

4. 研究的不足以及未来建议

本综述对机器学习在教育领域的应用现状进行了广泛而简单的总结,作为对综述的综述研究,相较于普通的文献综述来说,本研究的覆盖面更广,但在细节上的处理会相对模糊,不能对每个领域的研究展开深入的总结。在研究的问题上,更关注机器学习的使用领域和相关算法,并没有关注算法的准确性等其他内容,在之后的研究中可以对没有关注到的领域进行进一步总结。在纳入文献方面,加强对纳入文献的质量评价,并尽可能纳入一些高质量的原始研究进行分析。对该领域未来的建议中,本研究认为:1) 教育研究者可以进行机器学习在教育各种领域的更多尝试,让机器真正辅助教学和教育研究;2) 被试范围可以扩大,关注基础教育数据的分析;3) 关注更创新的机器学习算法,尝试用更多不同算法来解决教育问题;4) 关注更多新兴的应用领域,例如,元宇宙教育、人工智能伦理教育等,并对中小学教育和线下教学进行更深入的探讨。

NOTES

*通讯作者。

参考文献

[1] 陈凯, 朱钰. 机器学习及其相关算法综述[J]. 统计与信息论坛, 2007(5): 105-112.
[2] 田世杰, 张一名. 机器学习算法及其应用综述[J]. 软件, 2023, 44(7): 70-75.
[3] 祁亨年. 支持向量机及其应用研究综述[J]. 计算机工程, 2004(10): 6-9.
[4] 周昀锴. 机器学习及其相关算法简介[J]. 科技传播, 2019, 11(6): 153-154, 165.
[5] 陈康, 向勇, 喻超. 大数据时代机器学习的新趋势[J]. 电信科学, 2012, 28(12): 88-95.
[6] Alenezi, H.S. and Faisal, M.H. (2020) Utilizing Crowdsourcing and Machine Learning in Education: Literature Review. Education and Information Technologies, 25, 2971-2986.
https://doi.org/10.1007/s10639-020-10102-w
[7] Kinnebrew, J.S. and Biswas, G. (2012) Identifying Learning Behaviors by Contextualizing Differential Sequence Mining with Action Features and Performance Evolution. The 5th International Conference on Educational Data Mining, Chania, 19-21 June 2012, 57-64.
[8] Wen, M. and Rose, C.P. (2014) Identifying Latent Study Habits by Mining Learner Behavior Patterns in Massive Open Online Courses. Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management, Shanghai, 3-7 November 2014, 1983-1986.
https://doi.org/10.1145/2661829.2662033
[9] Thammasiri, D., Delen, D., Meesad, P. and Kasap, N. (2014) A Critical Assessment of Imbalanced Class Distribution Problem: The Case of Predicting Freshmen Student Attrition. Expert Systems with Applications, 41, 321-330.
https://doi.org/10.1016/j.eswa.2013.07.046
[10] 黄甫全, 游景如, 涂丽娜, 等. 系统性文献综述法: 案例、步骤与价值[J]. 电化教育研究, 2017, 38(11): 11-18, 25.
[11] Moher, D., Shamseer, L., Clarke, M., Ghersi, D., Liberati, A., Petticrew, M., et al. (2015) Preferred Reporting Items for Systematic Review and Meta-Analysis Protocols (PRISMA-P) 2015 Statement. Systematic Reviews, 4, Article No. 1.
https://doi.org/10.1186/2046-4053-4-1
[12] Halde, R.R. (2016) Application of Machine Learning Algorithms for Betterment in Education System. 2016 International Conference on Automatic Control and Dynamic Optimization Techniques (ICACDOT), Pune, 9-10 September 2016, 1110-1114.
https://doi.org/10.1109/icacdot.2016.7877759
[13] Baashar, Y., Alkawsi, G., Ali, N., Alhussian, H. and Bahbouh, H.T. (2021) Predicting Student’s Performance Using Machine Learning Methods: A Systematic Literature Review. 2021 International Conference on Computer & Information Sciences (ICCOINS), Kuching, 13-15 July 2021, 357-362.
https://doi.org/10.1109/iccoins49721.2021.9497185
[14] Albreiki, B., Zaki, N. and Alashwal, H. (2021) A Systematic Literature Review of Student’ Performance Prediction Using Machine Learning Techniques. Education Sciences, 11, Article 552.
https://doi.org/10.3390/educsci11090552
[15] Urbina Nájera, A.B. and De la Calleja Mora, J. (2017) Brief Review of Educational Applications Using Data Mining and Machine Learning. Revista Electrónica de Investigación Educativa, 19, 84-96.
https://doi.org/10.24320/redie.2017.19.4.1305
[16] 余明华, 冯翔, 祝智庭. 人工智能视域下机器学习的教育应用与创新探索[J]. 大数据时代, 2018(1): 64-73.
[17] Issah, I., Appiah, O., Appiahene, P. and Inusah, F. (2023) A Systematic Review of the Literature on Machine Learning Application of Determining the Attributes Influencing Academic Performance. Decision Analytics Journal, 7, Article ID: 100204.
https://doi.org/10.1016/j.dajour.2023.100204
[18] Luan, H. and Tsai, C.C. (2021) A Review of Using Machine Learning Approaches for Precision Education. Educational Technology & Society, 24, 250-266.
[19] Sekeroglu, B., Abiyev, R., Ilhan, A., Arslan, M. and Idoko, J.B. (2021) Systematic Literature Review on Machine Learning and Student Performance Prediction: Critical Gaps and Possible Remedies. Applied Sciences, 11, Article 10907.
https://doi.org/10.3390/app112210907
[20] Moonsamy, D., Naicker, N., T., T. and E., R. (2021) A Meta-Analysis of Educational Data Mining for Predicting Students Performance in Programming. International Journal of Advanced Computer Science and Applications, 12, 97-104.
https://doi.org/10.14569/ijacsa.2021.0120213
[21] Dalipi, F., Imran, A.S. and Kastrati, Z. (2018. MOOC Dropout Prediction Using Machine Learning Techniques: Review and Research Challenges. 2018 IEEE Global Engineering Education Conference (EDUCON), Santa Cruz de Tenerife, 17-20 April 2018, 1007-1014.
https://doi.org/10.1109/educon.2018.8363340
[22] Trivedi, S. (2022) Improving Students’ Retention Using Machine Learning: Impacts and Implications. ScienceOpen.
https://doi.org/10.14293/S2199-1006.1.SOR-.PPZMB0B.v1
[23] Rastrollo-Guerrero, J.L., Gómez-Pulido, J.A. and Durán-Domínguez, A. (2020) Analyzing and Predicting Students’ Performance by Means of Machine Learning: A Review. Applied Sciences, 10, Article 1042.
https://doi.org/10.3390/app10031042
[24] Kucak, D., Juricic, V. and Dambic, G. (2018) Machine Learning in Education—A Survey of Current Research Trends. In: Katalinic, B., Ed., DAAAM Proceedings, DAAAM International Vienna, 0406-0410.
https://doi.org/10.2507/29th.daaam.proceedings.059
[25] Tamada, M.M., Netto, J.F.D.M. and de Lima, D.P.R. (2019) Predicting and Reducing Dropout in Virtual Learning Using Machine Learning Techniques: A Systematic Review. 2019 IEEE Frontiers in Education Conference (FIE), Covington, 16-19 October 2019, 1-9.
https://doi.org/10.1109/fie43999.2019.9028545
[26] Alhothali, A., Albsisi, M., Assalahi, H. and Aldosemani, T. (2022) Predicting Student Outcomes in Online Courses Using Machine Learning Techniques: A Review. Sustainability, 14, Article 6199.
https://doi.org/10.3390/su14106199
[27] Cardona, T., Cudney, E.A., Hoerl, R. and Snyder, J. (2020) Data Mining and Machine Learning Retention Models in Higher Education. Journal of College Student Retention: Research, Theory & Practice, 25, 51-75.
https://doi.org/10.1177/1521025120964920
[28] Educause Learning Initiative (2010) Things You Should Know about Analytics. ELI 7 Things You Should Know, 7.
[29] Korkmaz, C. and Correia, A. (2019) A Review of Research on Machine Learning in Educational Technology. Educational Media International, 56, 250-267.
https://doi.org/10.1080/09523987.2019.1669875
[30] Zhai, X., Yin, Y., Pellegrino, J.W., Haudek, K.C. and Shi, L. (2020) Applying Machine Learning in Science Assessment: A Systematic Review. Studies in Science Education, 56, 111-151.
https://doi.org/10.1080/03057267.2020.1735757
[31] Zhai, X., Shi, L. and Nehm, R.H. (2020) A Meta-Analysis of Machine Learning-Based Science Assessments: Factors Impacting Machine-Human Score Agreements. Journal of Science Education and Technology, 30, 361-379.
https://doi.org/10.1007/s10956-020-09875-z
[32] Blessing, G., Azeta, A., Misra, S., et al. (2021) A Machine Learning Prediction of Automatic Text Based Assessment for Open and Distance Learning: A Comprehensive Review. In: Abraham, A., Haqiq, A., Muda, A.K. and Gandhi, N., Eds., Innovations in Bio-Inspired Computing and Applications, Springer, 369-380.
[33] Fahd, K., Venkatraman, S., Miah, S.J., et al. (2022) Application of Machine Learning in Higher Education to Assess Student Academic Performance, At-Risk, and Attrition: A Meta-Analysis of Literature. Education and Information Technologies, 27, 3743-3775.
[34] Makhtar, M., Nawang, H. and Wan Shamsuddin, S.N.O.R. (2017) Analysis on Students Performance Using Naïve Bayes Classifier. Journal of Theoretical & Applied Information Technology, 95, 3993-4000.
[35] Miranda, M.A. and Guzmán, J. (2017) Análisis de la Deserción de Estudiantes Universitarios usando Técnicas de Minería de Datos. Formación universitaria, 10, 61-68.
https://doi.org/10.4067/s0718-50062017000300007
[36] Balakrishnan, G. and Coetzee, D. (2013) Predicting Student Retention in Massive Open Online Courses Using Hidden Markov Models. Electrical Engineering and Computer Sciences University of California at Berkeley, 53, 57-58.
[37] Hussain, S. and Khan, M.Q. (2021) Student-Performulator: Predicting Students’ Academic Performance at Secondary and Intermediate Level Using Machine Learning. Annals of Data Science, 10, 637-655.
https://doi.org/10.1007/s40745-021-00341-0
[38] Kaunang, F.J. and Rotikan, R. (2018) Students’ Academic Performance Prediction Using Data Mining. 2018 Third International Conference on Informatics and Computing (ICIC), Palembang, 17-18 October 2018, 1-5.
https://doi.org/10.1109/iac.2018.8780547
[39] Sixhaxa, K., Jadhav, A. and Ajoodha, R. (2022) Predicting Students Performance in Exams Using Machine Learning Techniques. 2022 12th International Conference on Cloud Computing, Data Science & Engineering (Confluence), Noida, 27-28 January 2022, 635-640.
https://doi.org/10.1109/confluence52989.2022.9734218
[40] O., O. and P., C. (2017) Predicting Students’ Academic Performances—A Learning Analytics Approach Using Multiple Linear Regression. International Journal of Computer Applications, 157, 37-44.
https://doi.org/10.5120/ijca2017912671
[41] Salah Hashim, A., Akeel Awadh, W. and Khalaf Hamoud, A. (2020) Student Performance Prediction Model Based on Supervised Machine Learning Algorithms. IOP Conference Series: Materials Science and Engineering, 928, Article ID: 032019.
https://doi.org/10.1088/1757-899x/928/3/032019
[42] Turabieh, H. (2019) Hybrid Machine Learning Classifiers to Predict Student Performance. 2019 2nd International Conference on new Trends in Computing Sciences (ICTCS), Amman, 9-11 October 2019, 1-6.
https://doi.org/10.1109/ictcs.2019.8923093
[43] Lau, E.T., Sun, L. and Yang, Q. (2019) Modelling, Prediction and Classification of Student Academic Performance Using Artificial Neural Networks. SN Applied Sciences, 1, Article No. 982.
https://doi.org/10.1007/s42452-019-0884-7
[44] Yousafzai, B.K., Khan, S.A., Rahman, T., Khan, I., Ullah, I., Ur Rehman, A., et al. (2021) Student-Performulator: Student Academic Performance Using Hybrid Deep Neural Network. Sustainability, 13, Article 9775.
https://doi.org/10.3390/su13179775
[45] Adejo, O.W. and Connolly, T. (2018) Predicting Student Academic Performance Using Multi-Model Heterogeneous Ensemble Approach. Journal of Applied Research in Higher Education, 10, 61-75.
https://doi.org/10.1108/jarhe-09-2017-0113
[46] Ororbia, A. and Kifer, D. (2022) The Neural Coding Framework for Learning Generative Models. Nature Communications, 13, Article No. 2064.
https://doi.org/10.1038/s41467-022-29632-7