1. 引言
随着教育信息化发展的不断深入,教育对教学技术的要求越来越高。VR技术作为新型技术手段,可以广泛应用于基础教育中的虚拟学习环境构建,将其与实验教学深度融合打破了固有传统的实验教学,极大的激发了学生的学习兴趣、探究能力及学业成绩。
实验教学是中小学生进行学科教育的有效策略,也是实践性教学的一种组织形式。它指的是学生利用仪器设备,在人为控制条件下,引起实验对象的变化,通过观察、测定和分析,获得知识与发展能力。实验教学在中小学基础课和专业课中广泛应用,目的在于着重于培养学生正确使用仪器设备,进行测试、调整、分析、综合和设计实验方案、编写实验报告等能力 [1] 。
近年来,我国教育充分利用教育数字化转型契机,精准实施了一系列“互联网 + 教育”改革方案 [2] 。Web3.0时代下的“互联网 + 教育”的发展机遇与挑战并存,随着时代的发展,数字化技术不断革新,新的设计观念、思想、方法和手段不断涌现。传统的实验教学环节受到多个方面制约,教学内容及资源更新缓慢脱轨于时代需求,传统的实验教学内容已经不能适应当今的人才培养及学科发展 [3] ,数字赋能的“虚拟现实 + 教育”应运而生。
虚拟现实(virtual reality, VR)技术,又称虚拟仿真技术,是一种新兴的人机交互技术,它利用计算机和相应的应用软件构建一个逼真的、虚拟的世界,能让人身临其境,融入逼真的“情景”中去感受、体验“虚拟的”真实培训场景,带给学者沉浸感十足的体验 [4] 。在教育数字化战略行动背景下,我国虚拟仿真技术与教育不断融合发展,在赋能教育数字化变革、促进教育公平、改善教学效果等方面做出了突出贡献。教育部《关于2017~2020年开展示范性虚拟仿真实验教学项目建设的通知》(教高厅[2017]4号)和教育部《关于开展国家虚拟仿真实验教学项目建设工作的通知》(教高函[2018]5号)明确指出要大力发展国家虚拟仿真实验教学项目。2015年我国首次从国家层面强调STEM (科学Science,技术Technolog,工程Engineering,数学Mathematics)教育对提升人才竞争力的重要性,教育研究者结合学科课程独有的育人价值,积极探素STEM教育的本土化发展之路 [5] ,已有大量研究表明,已经开发的基于STEM的虚拟实验室的实施可以提高学生的科学素养 [6] 。
2. 研究目的
我们需要进行教育产品的用户体验测评,在一项题为“虚拟现实融入实验教学”的课题准备前,需要充分明确虚实结合实验教学对科学教育的影响,同时需要完善先前综述文章的一些局限性,以下是研究目标。
目标一:探究基于虚实结合的实验教学方式相较于单独的虚拟或真实实验教学方式在中小学科学教育环境中的整体有效性。
目标二:在基于虚实结合的实验教学设计原则结果下,研究人员对研究编码了11个调节变量进行亚组分析,试图更好的完善目标一。1) 虚实结合、单独虚拟、单独真实条件下的实验教学差异;2) 虚实结合顺序上的差异;3) 虚拟现实设备类型的差异;4) 实验干预时长的差异;5) 知识领域的差异;6) 影响内容上的差异;7) 不同年龄段的差异;8) 测量时效性的差异;9) 教学情景下教师的可用性。
3. 研究方法
元分析被定义为对来自个别研究的大量分析结果进行统计分析,以整合研究结果 [7] 。研究人员开展的元分析过程是在遵循系统性综述和元分析指导准则PRISMA的框架的进行的。
3.1. 文献查找和搜索策略
研究从两个英文数据库和一个中文数据库进行综合查找,这三个数据库都属于国际权威数据库,分别是Web of Science core、Science Direct和中国国家知识基础设施(CNKI),查找工作由三名研究者共同展开,时间跨度自研究立项开始截止到2023年3月28日。采用以下主题词检索:虚拟现实、虚拟实验、实验教学,虚实结合,VR, virtual reality, virtual manipulative, virtual laboratory, virtual instrument, AND, physical experiment, physical manipulative, laboratory, And, hands-on, teaching, education, learning, Blended Experiment, science education。中文数据库内分别使用虚拟现实结合实验教学和虚实结合教学进行主题搜索,英文数据库内的主题词组合策略见图1。
Figure 1. The English database uses Boolean operators “OR” (inside the box) and “AND” (between the boxes)
图1. 主题词组合策略英文数据库采用布尔运算符“OR”(方框内)和“AND”(方框间)
此外通过其他渠道进行了查找,根据已有文献的参考文献进行了反向搜索,并由第一作者通过通讯群组联系虚拟现实技术领域内的专家进行查找考证。最终得到文献3358篇,其中三大数据库查得3237篇,其中Web of Science core 1318篇,Science Direct 1832篇,中国国家知识基础设施(CNKI) 87篇,其他渠道查找文献121篇。
3.2. 文献纳入和排除标准
根据研究主题和工作流程确定了文献选择标准。1) 研究设计必须是实验或者准实验研究;2) 研究必须是基础教育(K-12)阶段和物理学科范畴内的实验教学,且必须虚实结合;3) 必须具备开展元分析所需的完整数据,如实验组和控制组各自效应值的平均数、标准差和样本量,或者可以表征标准化均数(Standardized Mean Difference,简称SMD)的d值(Cohen’s d)、g值(Hedges’s g)等;4) 在同行评审期刊上发表的全文文献;5) 实验组和对照组在内的实验参与者人数在10人以上;6) 文献以中文或英文发表;7) 实验组和控制组随机分配或可说明参与者之间的等质性。
首次检索的文献用Zotero文献管理软件保存操作,通过删减剔除后,共有11项实验和准实验研究(其中英文文献6篇,中文文献5篇)被纳入到元分析当中,文献检索筛选流程见图2。
3.3. 文献质量评估和风险偏倚
为了保证研究结果的有效性,需要基于针对随机对照组实研究开发的Cochrane风险评估工具Cochrane Collaboration Risk of Bias Tool对纳入文献的质量进行评估,质量评估由两位研究者分别独立制作风险评估表进行,项目包括随机分配、分配隐藏、盲法(受试者,研究者、评估者)、数据缺失(脱落案例)、选择性报告和其他偏倚(期刊质量、利益冲突、样本量小、基线非均衡),通过判断每个域的高风险、低风险或不清楚风险,确定单项研究的质量。
最终评估结果显示了2项研究存在高偏倚风险,原因是其中一项研究样本量过低,而另一项研究有较高的选择性报告风险。除此之外未发现其他潜在的偏倚风险。经过专家评估和小组会谈决定不排除2篇高风险文章。在盲法方面,虚拟现实实验教学与传统实验教学形式差异较大,受试参与者盲法存在客观困难。
3.4. 特征数据提取与编码
两位研究者独立进行了信息提取与编码工作,纳入分析的11项研究包含总样本量1211人,其中实验组446人,对照组637人。研究对象来自中国、土耳其和芬兰等七个国家,五项研究发表于2013年或2012年以前,占51.67%。七项研究发表于2013年或2013年以后,占58.33%。
纳入文献编码内容包括:1) 一般信息即作者名、国别、发表年份;2) 实验方式识别记号;3) 样本抽取方式;4) 测量变量即知识成绩、任务能力、兴趣;5) 因变量测量时机即未延后、延后;6) 学段即小学、初中、高中;7) 干预持续时间;8) 干预总时长;9) 领域即电路、其他;10) 实验组教学方式;11) 控制组教学方式;12) 样本数;13) 虚拟现实类型即计算机3D桌面型虚拟现实(Desktop VR)、计算机2D桌面型虚拟现实(Desktop VR);14) g值(Hedges’g)。两位研究者编码的一致性系数Cohen Kappa = 0.930,说明特征值编码结果可信。对于编码结果不一致的项目,一位专家和两位研究者一起讨论确定了每一个项目的最终编码类别。由于同一篇文献存在多个实验组对照组的研究,或者在不同时间点进行了多次实验结果的测量,因此11项研究文献的编码结果一共产生34个独立的效应值,编码后实验组和控制组总样本数N = 3367,见表1。
Table 1. Summary of eigenvalue coding for included literatures [8] - [18]
表1. 纳入文献特征值编码汇总表 [8] - [18]
3.5. 结果归纳
研究人员从11项纳入文献中获得34个虚实结合实验教学影响中小学生物理科学学习效应量,影响主要集中在任务能力(两项研究4个效应量),学习绩效(11项研究27个效应量),学习兴趣(两项研究3个效应量)三个方面。由于影响学生学习结果因素的多元和复杂,不同研究所处的背景和地域存在较大差异,根据研究间具有实质性差异的大小,对学习绩效和任务能力采用随机效应模型分析,对学习兴趣采用固定效应模型分析。
相较于Cohen’s d值,Hedges’s g值可以在样本量小于20项研究的时候更好的统计偏差,所以研究人员采用Hedges’s g来表征标准化均值差 [19] 。效应值g的绝对值等于0.1、0.2、0.5、0.8、1.2、2.0分别代表效应值的水平达到极小、小、中等、大、极大、巨大 [20] 。
其中,正的效应值g代表实验组的影响效果好于控制组,负的效应值g代表实验组的影响效果不及控制组 [23] 。结果显示,虚实结合实验教学相较于单独的真实或虚拟实验教学对中小学生物理科学学习具有积极影响,其中虚实结合实验教学对于学习绩效的影响效果最佳,Hedges’g = 0.80,95% CI (0.55, 1.04),P < 0.0001。元分析森林图见图3。其次分别是学习兴趣Hedges’g = 0.59,95% CI (0.29, 0.89),P = 0.0001。任务能力Hedges’g = 0.49,95% CI (0.29, 0.89),P = 0.04。由于任务能力和学习兴趣纳入文献的样本量和效应量过低,接下来主要对学习绩效的影响效果进行分析。
Figure 3. Effect of forest map virtual-reality combined experiment teaching on physical science learning performance in primary and secondary schools
图3. 森林图虚实结合实验教学对中小学物理科学学习绩效的影响
3.6. 发表偏倚检验
由于系统综述和元分析是基于已经发表的研究结果,可能会存在夸大效应量的情况,这个时候就产生了发表偏倚。发表偏倚(Publication Bias)是指已经发表的研究文献不能够代表研究总体的实际状况而引发的偏差 [21] 。因为较大的发表偏倚将不利于元分析的结果的有效性,对纳入的原始文献大于10篇时,进行发表偏倚分析显得必要。研究人员使用定性的漏斗图法(Funnel Pot)和定量的Egger回归法检验发表偏倚。根据Cochrane Handbook,当纳入的原始文献不存在较大的发表偏倚时,基于原始文献效应值绘制的漏斗图呈现为左右较为对称的倒立型漏斗形状,见图4。研究人员纳入11篇文献的效应值所形成的漏斗图以g = 0.800为对称轴左右分布基本均匀,证明纳入原始文献的发表偏倚处在可接受范围,同时为了减少最终纳入论文样本的发表偏倚,我们不仅考虑了本次审查的期刊文章,还考虑了书籍章节、论文和同行评审的会议记录,以此来确保最终纳入文献的稳定性。
Figure 4. Shows a biased funnel diagram
图4. 发表偏倚漏斗图
4. 研究分析
据元分析统计过程要求,研究人员首先对影响学习绩效的27个效应值进行了合并,然后在异质性检验的基础上开展了调节效应分析。
4.1. 敏感性与结果分析
27个效应量中,于洪涛(2007)所占权重最大,为4.3%,因此选择该效应量作敏感性分析。剔除效应量前后的整体效应值介于0.80 [0.55, 1.04]~0.82 [0.57, 1.08]之间,显示极小的变化差异,表明元分析估计结果未受极端值的影响,具有较高的稳定性。
为了实现元分析的目标一,即探究基于虚实结合的实验教学相较于单独的虚拟或真实实验教学在中小学科学教育环境中的整体有效性。采用随机效应模型将27个独立的效应值进行合并,实验组和控制组的样本总数为3367,以此来比较虚实结合实验教学与单独的虚拟或真实实验教学方式在影响学生学习绩效上的差异。结果显示,27个独立的效应值当中,有25个效应值具有显著的正向效应(P < 0.00001),表明在这部分研究中虚实结合实验教学方式影响学生学习绩效的程度显著优于单独的虚拟或真实实验教学方式。2个效应值具有显著的负向效应(P < 0.00001),表明在这些研究当中虚实结合实验教学方式影响学生学习绩效的程度显著不及单独的虚拟或真实实验教学方式。合并后得到整体的效应值为g = 0.80,CI = [0.55, 1.04],P < 0.00001,显示在总体上虚实结合实验教学方式影响学生学习绩效的程度显著优于单独的虚拟或真实实验教学方式。
研究人员可知结果中的I2代表着由效应值的真实差异所造成的变异占总变异的比重,若当I2 ≤ 24%时研究不存在异质性;若当25% ≤ I2 ≤ 49%时研究异质性较低;若当50% ≤ I2 ≤ 74%时研究具有轻度异质性;当I2 ≥ 75%时研究显示高异质性水平(Higgins et al., 2003)。I2 = 86%具有较大的异质性,即存在潜在的调节变量,需进行调节效应分析。
4.2. 亚组分析
结合纳入文献特征值编码汇总表,研究人员根据学段(年龄),实验组教学方式,控制组教学方式,虚拟现实类型,干预持续时间,干预总时长,以及科学领域这七类特征进行亚组分析,结果见表2。
Table 2. Summary of subgroup analysis results
表2. 亚组分析结果汇总
相较于12岁以上(Hedges’g = 0.70, P < 0.01)的学生,12岁及以下(Hedges’g = 1.0, P < 0.01)的学生进行虚实结合实验教学效果更佳。1) 虚实结合教学顺序方面,先进行虚拟实验再进行真实实验(Hedges’g = 1.33, P < 0.01)的效果优于虚拟实验和真实实验同时进行(Hedges’g = 0.92, P < 0.01)的效果,而先进行真实实验再进行虚拟实验(Hedges’g = 0.48, P = 0.63)的效果差异不具备统计学意义;2) 单独的虚拟或真实实验方式方面,单独的真实实验(Hedges’g = 0.84, P < 0.01)效果优于单独的虚拟实验(Hedges’g = 0.72, P < 0.01),但差异不大;3) 虚拟现实设备类型方面,3D (Hedges’g = 0.93, P < 0.01)的计算机仿真实验效果优于2D (Hedges’g = 0.47, P = 0.03)的计算机实验效果;4) 干预持续时间方面的效果差异不具备统计学意义(P = 0.47);5) 干预总时长方面,虚实结合教学10小时以下(Hedges’g = 1.19, P < 0.01)的学习效果优于虚实结合教学10小时及以上(Hedges’g = 0.35, P < 0.01)的学习效果;6) 物理科学领域方面,电路知识相较于其他知识的学习效果差异不具备统计学意义(P = 0.10)。
5. 结论
整体上,基于虚实结合的实验教学方式对中小学生科学教育的积极影响高于单独的虚拟或真实实验教学方式(总效应值:g = 0.80),其有利于中小学生科学教育的有效性得到确认。调节效应分析结果表明,虚实结合顺序和学习时长在虚实结合实验教学对中小学生科学教育影响中发挥着重要调节作用,效应值分别为g = 1.33和g = 1.19,而测量方式、学段、实验干预持续时间、控制组教学方式、 效应值所属领域、沉浸式虚拟现实类型等变量均存在不同的调节效应。
这篇系统综述强调了现有研究机构的差距,并为未来的研究提出了新的途径。除了强调需要更严格的数理学方法论研究之外,还应该使用其他系统性方法,比如DeFT框架进行多重表示学习来进一步研究虚拟实验与真实实验的融合,以便更系统地确定它们如何影响中小学生的科学教育过程 [22] 。
这篇元分析为中小学科学教师提供了教育技术发展新周期下的科学教育方法,可以帮助对相应的课程设计提供有用信息,并提倡用虚拟和真实的实验来协调学习,而不是简单的用虚拟的实验来代替真实的实验。