1. 引言
大数据时代背景下,各行各业都越来越重视数据管理和分析,尤其是预防医学专业所在的公共卫生领域。掌握先进的数据处理技术,不仅是为了完成大数据时代的数据分析任务,更是为了响应国家“新医科”建设,培养社会需要的高质量应用型公共卫生人才。R语言作为一款免费开源的软件,几乎可以完成任何类型的数据分析工作,并且有高水平的绘图功能,在数据分析领域已经被广泛使用 [1] 。随着R语言的快速发展,许多专属公共卫生领域的程序包应运而生,如运用R语言分析影响人群健康的危险因素 [2] 、通过机器学习对不良健康结局进行预测等 [3] ,这都将极大地提高分析复杂医学数据的效率。然而,R语言作为一门编程语言,对于医学生而言存在一定的学习难度。因此,为全面了解R语言在我国高校预防医学专业教学中的应用现状,本研究选取我国开设预防医学专业的高校作为研究现场,对学生学习R语言的情况以及高校R语言课程的开课情况进行调研,针对当前预防医学专业R语言教学中存在的问题与不足提出改进建议,以期为我国高校预防医学专业教学改革提供基础数据和思路参考。
2. 研究方法
2.1. 研究对象选择
本研究的目标院校为参与第四轮公共卫生与预防医学学科评估并取得评级的院校,共37所。采用无放回随机抽样的方式选择6所高校作为备选调研高校,并且需满足备选高校的评级结果各不相同。最终的抽样结果按照评估等级以大写字母编号排序如下:A大学(A+)、B大学(A−)、C大学(B+)、D大学(B−)、E大学(C+)、F大学(C)。本研究的备选研究对象为上述6所高校预防医学专业的本科生、硕士研究生和博士研究生。
2.2. 问卷设计
本研究依托“问卷星”平台,自行设计了“R语言在我国高校预防医学专业教学中的应用现状”调查问卷,问卷问题主要涵盖:研究对象的基本信息、R语言使用情况、R语言学习情况、R语言课程开展情况、对R语言课程的反馈等5个方面的调研内容,共计19个题目(表1)。

Table 1. The content of questionnaire
表1. 问卷调查内容
2.3. 数据收集与分析
本研究于2022年9月1日~2023年6月30日期间,通过微信、QQ等社交媒体向6所高校预防医学专业的本科生、硕士研究生和博士研究生发放调查问卷,问卷均采取不记名的形式填写。借助“问卷星”平台回收并导出调查问卷。采用R 4.2.2软件对调查问卷结果进行整理和分析。
3. 研究结果
3.1. 研究对象基本信息
本研究共计回收有效问卷425份,其中来自本科生的问卷262份,硕士研究生的问卷132份,博士研究生的问卷31份。研究对象的基本信息如表2所示。从研究对象所在学校来看,425名医学生中半数以上来自评级为B+的C大学,占全体学生的53.6%。从研究对象所在专业来看,绝大多数学生就读于预防医学、流行病与卫生统计学、公共卫生等公共卫生领域相关专业(97.9%);其中,本科生大多就读于预防医学专业(95.4%),硕士研究生主要就读于流行病与卫生统计学专业(44.7%)和公共卫生专业(25.8%),博士研究生主要就读于流行病与卫生统计学专业(74.2%)。

Table 2. Basic information on the subjects
表2. 研究对象的基本信息
3.2. R语言的使用现状
不同教育阶段的医学生使用R语言进行统计分析的情况如表3所示。在所有研究对象中,有372人听说过R语言,占总人数的87.5%。在这372人中,62.4%的学生使用过R语言。进一步在使用过R语言的学生中调查得知,仅有36.7%的学生表示最常用的统计软件是R语言;其中,硕士研究生、博士研究生R语言的使用率较高,分别占其总数的65.8%和61.3%,而本科生R语言的使用率较低,仅占本科生总数的21.4%。从使用R语言的时间来看,学生整体使用R语言的时间较长,使用时间在1年以上者超过半数(55.8%);其中,硕士研究生、博士研究生R语言使用时间的分布与整体的分布相似,而大多数本科生使用R语言的时间不超过一年(64.3%)。

Figure 1. The reasons why students choose R language and why they do not choose R language
图1. 学生选择R语言的原因和没有选择R语言的原因
对不同教育阶段学生回答的有关“选择/没有选择R语言的原因”问卷调查数据进行比较,发现硕士、博士研究生选择R语言的原因排名前三位的均是“软件开源且免费易获得”、“较为全面可以分析各种类型的数据”和“绘图精美”;反之,本科生没有选择R语言的原因排名前三位的是“没有了解过R语言”、“目前学习阶段暂时不需要使用统计分析软件”和“R语言学习有困难未得到解决导致停滞不前”(图1)。
对不同教育阶段学生回答的有关“使用R语言进行的操作”问卷调查数据进行比较,可知本科生、硕士研究生和博士研究生使用R语言最常进行的操作前三名均是“统计分析”、“R语言绘图”和“数据清洗及处理”,上述三个方面的操作都是开展医学数据分析过程中必不可少的环节(图2)。

Figure 2. Operations performed in R language
图2. 使用R语言进行的操作
3.3. R语言的学习现状
为了解医学生学习R语言的情况,本研究对调查问卷第6题“您目前最常用的统计分析软件是什么”中回答“R语言”的156名学生进一步调查了R语言的学习途径、自我评价R语言的学习难度,以及自我评价对R语言的熟悉程度等情况(图3)。在R语言的学习途径上,排名前三位的学习途径是“根据购得书本自学”、“通过查询国内外论坛自学”和“向同学请教”,仅有16.8%的学生通过学校开设的R语言课程学习。在R语言的学习难度上,65.4%的学生认为R语言的学习难度在中等及以上;其中,40.4%的学生认为R语言的学习较为困难。在综合评价对R语言的熟悉程度上,69.2%的学生自我评价对R语言的熟悉程度适中(4~7分),17.9%的学生自我评价对R语言的较为熟悉(8~10分),而12.8%的学生自我评价对R语言的不太熟悉(0~3分)。

Figure 3. The situation of learning R language
图3. R语言的学习情况
3.4. R语言课程的开展情况
为了解R语言在医学专业教学中的应用情况,本研究调查了高校R语言相关课程的开设情况和不同教育阶段的学生的参与情况,调查结果如表4所示。参与本次调查的6所高校中,仅有B大学和C大学开设了面向医学生的R语言课程(两所大学参与调查的人数占比为59.5%)。在两所高校共253名学生中,有58.9%的人了解本校开设的R语言课程。其中,77.9%的人上过本校开设的R语言课程;上过相关课程的本科生、硕士研究生和博士研究生分别占其总数的66.7%、83.5%和84.2%。从学生参与过的R语言课程形式来看,相关问题划分为“授课形式”、“授课语言”和“课程属性”三个小题,该问题共回收问卷354条,其中本科生105条、硕士研究生201条,博士研究生48条。硕士研究生和博士研究生参与的R语言课程中,授课形式大多数为“线上与线下相结合”,授课语言基本为“中文授课”,课程属性大多数为“理论与实践课程相结合”;而本科生参与的R语言课程仅在授课形式的分布上与研究生不同,多数为“仅线下授课”。从R语言课程内容设置来看,49.2%的学生认为课程所覆盖的知识点有用,17.8%的学生认为非常有用。

Table 4. The situation of R language courses
表4. R语言课程的开展情况
3.5. 学生对R语言课程的反馈情况
为进一步了解医学生对R语言课程的需求以完善教学安排,本研究对所有参与问卷调查的学生收集了对R语言课程的课程形式和教学内容等方面的意见和建议,研究结果如表5所示。从希望的R语言课程形式方面来看,本题共回收问卷414条,其中本科生318条、硕士研究生75条、博士研究生21条。在授课语言上,多数学生仍建议采用中文授课;但考虑到R语言的操作界面和程序编写均使用英文完成,部分学生建议以中英文相结合的形式来授课。在授课形式上,教师讲解结合实际操作是学生普遍希望的授课形式。在课程属性上,学生大多支持在教学时将理论知识与实践操作相结合。从希望的R语言课程教学内容方面来看,本题共回收问卷1801条,其中本科生1125条、硕士研究生549条,博士研究生127条。不同教育阶段的学生希望的R语言课程教学内容前三名均是“统计分析”、“R语言绘图”和“数据清洗及处理”,该结果与前述学生使用R语言最常进行的操作前三名一致。此外,一部分学生希望增加机器学习、代码改良、R包撰写等高阶内容的教学。问卷最后,本研究向全体参与问卷填写的学生调查了是否会向其他同学推荐使用R语言。调查结果发现,超九成的学生表示会向周围的同学推荐使用R语言进行统计分析(92.5%)。

Table 5. The feedback on R language courses
表5. 学生对R语言课程的反馈情况
4. 讨论
为进一步提高统计软件教学与医学专业课程教学的融合,本研究对R语言在全国6所高校的医学专业教学中的应用进行初步探究。就高校R语言课程教学情况来看,尽管6所高校中仅有2所开设有面向预防医学专业学生的R语言课程,但学生对本校R语言课程的整体满意度较高。就学生使用和学习R语言的情况来看,学生对运用R语言开展统计分析有较高的需求,使用R语言的时间也较长;认为R语言能满足其完成主要的统计分析工作。然而,多数学生也表示R语言的学习难度较大,运用R语言处理医学复杂数据时还未达到非常熟练的程度。
综上所述,本研究经调研发现R语言与我国预防医学专业教学的融合度相对欠缺。教学改革是不断探索、坚持改进的动态过程,我国高校可基于目前存在的不足优化预防医学专业教学改革方向,针对预防医学专业学生开设R语言相关课程,并进一步对课程内容、教学方法进行调整和创新,以更好适应新时代背景下预防医学专业发展的需求,培养素质高、能力强的应用型医学人才。
4.1. 以学生需求为基础,科学开设R语言相关课程
调查结果表明,高校预防医学专业学生对R语言的使用需求较高。因此,有必要开设关于处理医学复杂数据的R语言课程。但由于不同教育阶段的学生需要掌握的医学专业知识程度各不相同,教学大纲要求其具备的统计分析能力也有所差别。为此,应针对不同教育阶段的学生开设符合其需求和教学要求的R语言课程 [4] 。本科阶段一般要求掌握扎实的医学基本知识并具有数理统计及计算机应用的基本能力;因此,可为本科生开设R语言课程基础班,重点讲解数据结构、数据的清洗及处理、基本统计分析方法的R语言实现等内容,为以后开展复杂的医学研究奠定统计软件基础。硕士、博士研究生阶段通常要求掌握系统的专业知识并能够独立从事科学研究工作;因此,包括R语言绘图、复杂统计分析方法的R语言实现、空间信息数据处理,以及流行病学研究R语言实战等内容的进阶班更适合硕士、博士研究生学习。
4.2. 以专业问题为导向,合理应用案例式教学
以往的教学大多只是简单地用模拟数据进行案例讲解,这种教学方式下学生的学习兴趣和积极性不强,教学效果不如预期。为此,基于当前热门的预防医学研究话题来构建各种教学情境 [5] ,各个环节的课程内容都以解决具体问题作为教学的出发点,能够引导学生形成完整的分析思路,并且掌握使用R语言进行数据分析的方法和技巧,提升实际操作能力。
4.3. 以实践操作为抓手,培养学生自主学习能力
受到空间和时间的限制,很多统计软件类课程采用的是先理论课讲解知识,后实验课动手操作的方式,若理论课和实验课的安排不紧凑,往往出现学生上实验课时已对理论知识印象不深的情况,导致教学效果大打折扣。为此,采用理论与实践一体化的教学方式 [6] ,教师先讲授R语言理论知识,然后在进行案例讲解的时候,学生可以跟随教师的讲解进行上机操作,直接在实践中巩固所学的理论知识,并加深对医学专业知识的理解和运用。同时,学生在上机操作过程中遇到不懂的问题可以及时与老师沟通,从而更加激发学生学习R语言的主动性,提高学习效率。
5. 结语
大数据时代背景下,将R语言与预防医学专业课程相融合是各大高校深化教育改革,培养应用型公共卫生人才的重要路径。本研究全面分析了R语言在我国高校预防医学专业教学中的应用现状,并就其中发现的问题对教学模式提出改进建议,以期为深入开展预防医学专业教学改革提供参考。
基金项目
中山大学教学质量与教学改革工程建设项目《R语言在我国高校预防医学专业教学中的应用现状研究》。
NOTES
*第一作者。
#通讯作者