1. 引言
“机器学习”已逐渐成为许多高等学校本科专业基础课程中不可或缺的一环[1]。这门课程不仅为学生揭示了人工智能的奥秘,更致力于培养他们运用这一先进技术解决实际问题的能力。在当今这个技术日新月异的时代,掌握“机器学习”的知识无疑为学生的未来发展奠定坚实的基础[2]。
“机器学习”课程的核心目标是使学生在现有的技术背景下,熟悉并理解人工智能的各项基础知识[3]。这包括但不限于算法原理、模型构建、数据处理等关键内容。通过这些知识的系统学习,学生们将能够深入理解机器学习的内涵和实质,为未来的应用打下坚实的理论基础。
除了理论知识的传授,“机器学习”课程还强调学生的实践技能的培养[4]。课程设置了丰富的实验环节和项目实践,让学生在动手操作的过程中巩固所学知识,提高编程能力和动手能力[5]。例如,通过搭建一个简单的分类模型,学生可以亲身体验从数据收集、预处理、模型训练到结果评估的整个过程,从而加深对机器学习流程的理解。
此外,“机器学习”课程还注重培养学生的自主学习和独立分析、解决问题的能力[6] [7]。随着技术的不断发展,新的算法和模型层出不穷,学生需要具备一定的自主学习能力,以便及时跟进最新的技术动态。同时,面对复杂多变的问题,学生需要运用所学知识进行独立分析,提出解决方案,并在实践中不断优化和完善。这种能力的培养对于提高学生的综合素质和竞争力具有重要意义。
机器学习有丰富的案例,举例如下:(1) 手写数字识别(MNIST数据集)。这是机器学习领域最经典的入门案例之一,主要通过识别手写数字来介绍分类算法的基本概念。使用经典的机器学习算法(如K近邻、支持向量机、神经网络等)对MNIST数据集中的手写数字进行分类[8]。(2) 鸢尾花数据集(Iris数据集)。鸢尾花数据集是机器学习中经典的多类分类问题,用于介绍如何应用监督学习算法进行分类。通过对鸢尾花的特征(如花瓣长度、花瓣宽度等)进行建模,预测花卉的品种[9]。(3) 房价预测(波士顿房价数据集)。这个经典的回归问题案例使用波士顿房价数据集,目标是根据各种特征(如房屋大小、犯罪率、学校质量等)预测房屋的市场价值。通过回归算法预测房价[10]。(4) 电影推荐系统(协同过滤)。推荐系统是机器学习中的一个热门应用,协同过滤方法(基于用户和物品的协同过滤)是最常见的推荐算法之一。通过用户的评分数据,预测用户对未观看电影的兴趣,推荐电影[11]。(5) 图像分类(CIFAR-10数据集)。CIFAR-10数据集是机器学习中经典的图像分类问题,包含10个不同类别的图像(如飞机、汽车、鸟、猫等)。通过深度学习(如卷积神经网络,CNN)对图像进行分类[12]。(6) K-均值聚类。K-均值聚类是一个经典的无监督学习案例,目标是将数据集中的样本分成多个簇。根据样本之间的相似度将数据分为K个簇,学习如何选择K值,并优化聚类结果[13]。(7) 垃圾邮件分类。垃圾邮件分类是一个典型的二分类问题,目的是区分垃圾邮件与非垃圾邮件。构建一个分类模型,根据邮件的内容判断其是否为垃圾邮件[14]。(8) 异常检测。异常检测用于识别与正常模式不同的数据点,广泛应用于金融欺诈检测、网络安全等领域。根据正常数据的模式,识别出与之不匹配的异常数据点[15]。
值得一提的是,“机器学习”课程的内容更新速度非常快。为了紧跟时代的步伐,课程团队会定期更新教学内容和实验案例,确保学生所学知识的时效性和实用性[16]。这种快速更新的特点也要求学生具备一定的学习能力和适应能力,以便在日新月异的技术环境中保持竞争力。
机器学习教学改革在当前社会具有重要意义,主要体现在以下几个方面:随着人工智能(AI)和大数据技术的迅速发展,机器学习作为其核心技术,已经在各行各业产生深远影响。通过改革机器学习教学,可以帮助学生掌握前沿技术,培养创新型人才,满足社会对高素质科技人才的需求。机器学习应用广泛,从金融、医疗到制造业等多个行业都离不开这一技术。通过改革教育,培养更多具备机器学习能力的人才,可以为社会提供创新动力,推动各行各业的数字化转型和智能化升级,从而促进经济的高质量发展。机器学习不仅涉及计算机科学,还与统计学、数学、工程学等多个学科交叉融合。教学改革可以鼓励跨学科思维,培养复合型、跨领域的人才,推动社会整体科技创新能力的提升。图1是机器学习教学改革对社会的重要性的示意图。
Figure 1. The importance of machine learning education reform for society
图1. 机器学习教学改革对社会的重要意义
2. 问卷设计与调查结果
本文的调查问卷数据来源于两个机器学习教学班。其中男生53人,女生26人。大多数学生年龄在20~22岁。有4个学生年龄在19岁以下。图2是调查问卷的性别和年龄分布。
为了深入了解学生对课程内容的掌握情况、学习态度和教学效果,本文精心设计了一套全面而细致的调查问卷。问卷内容涵盖了学生对课堂讲解的理解程度、对作业和考试的看法、对教学方法和学习资源的评价等多个方面。为了确保问卷的科学性和有效性,我们特别采用了量化评分的方法,每个问题均设有0~10分的分值范围,以便更精确地反映学生的真实感受。经过一段时间的收集和整理,我们得到了大量宝贵的调查数据。下表给出了调查问卷中部分问题的平均值以及标准差。同时,学生们也提出了一些有益的建议和意见,如增加课堂互动、提供更多学习资源等。通过本次问卷调查,我们获得了大量的数据和反馈。这些数据不仅为我们评估教学效果和改进教学方法提供了有力的支持,还为我们深入了解学生的学习需求和特点提供了重要的参考。
Figure 2. Gender and age distribution of survey questionnaire
图2. 调查问卷的性别和年龄分布
第4~10题,主要考察与机器学习课程目标相关的问题,包括线性模型、基本原理、系统设计、python编程、数据获取和预处理、机器学习可视化技术、评价指标等教学目标是否完成。分数的取值范围为0~10分,10分代表目标完全达到,0分代表完全未达到。第11~19题,主要为考察与机器学习课程内容相关的问题,包括课程难易度、课程是否合理、作业难易度、实验课难易度、老师整体评价、讲课速度、理论部分评价、实验部分评价等。第20~24题,主要反映学生的兴趣,包括vs code的体验、对课外资源是否感兴趣、对机器学习是否感兴趣、对深度学习是否感兴趣、对循环和卷积神经网络是否理解等问题。表1是调查问卷结果数据。
Table 1. System resulting data of standard experiment
表1. 标准试验系统结果数据
问题 |
均值 |
标准差 |
4、对于“掌握线性模型的基本原理”这一目标,你认为你通过本课程是否实现? |
7.82 |
2.62 |
5、对于“掌握神经网络和深度学习的基本原理”这一目标,你认为你通过本课程是否实现? |
7.62 |
2.56 |
6、对于“具备一般深度学习系统的分析和设计能力”这一目标,你认为你通过本课程是否实现? |
5.75 |
2.45 |
7、对于“学会使用例如Python等编程工具训练模型”这一目标,你认为你通过本课程是否实现? |
6.05 |
2.43 |
8、对于“掌握与深度学习相关的数据获取、预处理”这一目标,你认为你通过本课程是否实现? |
6.91 |
2.49 |
9、对于“掌握机器学习有关的可视化技术”这一目标,你认为你通过本课程是否实现? |
5.95 |
2.51 |
10、对于“掌握机器学习模型的评价指标”这一目标,你认为你通过本课程是否实现? |
6.95 |
2.51 |
11、课程难易度? |
8.44 |
1.75 |
12、您觉得本课程内容安排是否合理? |
6.38 |
2.68 |
13、日常作业难易度? |
6.77 |
1.91 |
14、实验课程作业难易度? |
7.10 |
1.88 |
15、老师整体授课评价? |
8.53 |
1.80 |
16、您觉得本课程讲授速度是否合理? |
6.15 |
1.51 |
17、对于目前推导和理论部分的评价 |
7.35 |
2.17 |
18、对于目前代码演示和实践讲解的评价 |
7.46 |
2.16 |
19、您是希望更多实践和代码还是更多理论分析? |
6.89 |
2.35 |
20、您认为基于vs code的深度学习实践体验如何? |
6.80 |
2.22 |
21、您认为课程提供的课外学习资源如相关链接、网站、资料的帮助程度 |
6.82 |
2.30 |
22、您对机器学习课程是否感兴趣? |
6.03 |
2.65 |
23、您对深度学习和神经网络是否感兴趣? |
5.94 |
2.67 |
24、您是否完全理解了循环神经网络和卷积神经网络? |
5.63 |
2.27 |
3. 机器学习教学中存在的问题
3.1. 深度学习系统的分析和设计能力不足
在调查问卷中,第6个问题聚焦于评估他们对掌握一般深度学习系统分析与设计能力的情况。经过仔细的数据分析和反馈整理,我们发现大多数同学在这一目标上并未能很好地实现(该问题均值是5.75分,分数明显偏低)。深度学习作为人工智能领域的一个重要分支,涉及到复杂的神经网络结构和算法。掌握其分析和设计能力,不仅要求学生具备扎实的数学基础,如线性代数、概率论等,还需要他们熟练掌握编程语言,如Python,并了解相关的深度学习框架,如TensorFlow或PyTorch。在实践经验方面,由于深度学习系统的复杂性和计算资源的限制,许多学生难以获得足够的实践机会。他们往往只能在课堂上进行一些简单的实验,而无法真正接触到实际项目中的深度学习系统。这种缺乏实践经验的情况,使得他们在面对真实问题时,往往显得力不从心。
3.2. 机器学习有关的可视化技术训练不足
在调查问卷中,我们特别关注了第9个问题,它聚焦于学生对于机器学习相关可视化技术的理解和应用。调查结果显示(分值仅为5.95分,明显偏低),大部分学生在这一领域表现出明显的不足,未能充分掌握机器学习可视化的核心技能。机器学习可视化技术。是一种通过图形、图像和动画等视觉元素来展示机器学习过程和结果的技术。它不仅有助于用户直观地理解复杂的算法和数据,还能帮助研究人员更有效地调试和优化模型。调查结果显示,许多学生在这一领域的知识储备和实践经验相对匮乏。这可能是由于多种原因造成的。从调查问卷的结果可以看出,学生对于机器学习相关可视化技术的掌握情况不容乐观。为了应对这一挑战,我们需要加强教育和培训、注重实践技能的培养,并积极学习和探索这一领域的最新研究成果和技术进展。只有这样,我们才能更好地应对未来数据驱动时代带来的挑战和机遇。
3.3. 课程难度较大
调查问卷的第11个问题(平均分数为8.44分,分数偏高)直接揭示了当前机器学习课程教学中存在的一个显著问题——课程的难度较大,导致学生普遍感到学习压力。调查结果显示,许多学生反映无法理解教材中的公式和算法。这并非个案,而是一个普遍现象。机器学习作为一门融合了数学、统计学、计算机科学等多个领域的交叉学科,其知识体系本身就具有相当的深度和广度。尤其是那些涉及复杂数学模型的公式和算法,往往让初学者感到望而却步。除了公式和算法外,教材中的一些概念也较难理解。例如,正则化、过拟合、欠拟合等概念,虽然在机器学习中具有极其重要的地位,但由于其抽象性和复杂性,往往让初学者感到困惑。这些概念的理解需要建立在一定的数学和统计学基础上,而对于那些基础知识薄弱的学生来说,这无疑是一个巨大的障碍。
3.4. 学生对深度学习和神经网络不感兴趣
第23个问题(平均分数为5.94,分数偏低)直接触及了当前学生对于深度学习和神经网络这一前沿科技领域的兴趣程度。经过详尽的数据分析和对比,我们发现了一个现象:尽管深度学习和神经网络在各行各业中扮演着日益重要的角色,但学生们对这一领域的兴趣却普遍偏低。深度学习是机器学习领域的一个分支,它模拟人类大脑的工作方式,通过构建神经网络来识别数据中的复杂模式。这种技术已经在图像识别、自然语言处理、自动驾驶等多个领域取得了显著的成果。然而,当我们仔细审视调查问卷的结果时,却发现许多学生对于这一前沿技术显得漠不关心。首先,不得不提的是这一领域的专业性和复杂性。深度学习和神经网络涉及到大量的数学知识和编程技能,对于初学者来说,门槛相对较高。此外,缺乏实践机会和真实场景的应用也是导致学生们兴趣缺失的一个重要原因。许多学生表示,虽然他们听说过这些概念,但由于缺乏实际操作的机会,很难深入理解其背后的原理和应用。
4. 改进措施
在当今日新月异的科技时代,机器学习已成为推动科技发展的重要引擎。然而,对于许多初学者和正在寻求深入理解的学生来说,机器学习课程往往显得复杂且难以捉摸。针对调查中发现的问题,本文旨在提出一系列改进措施,以期更好地促进机器学习课程的教学效果,帮助学生更好地掌握和应用这一技术。图3是机器学习课程的一些改进措施的示意图。
4.1. 加强深度学习系统设计的实践教学环节
当前,许多机器学习课程在理论教学上做得相当出色,但在实践教学方面却显得相对薄弱。根据实践教学和理论教学相互协调的理论[17],为了使学生能够真正掌握深度学习系统的设计和实现,我们需要引入更多的实验课程和项目实践。通过亲手搭建、调试和优化深度学习模型,学生可以更深入地理解其背后的原理,提高解决问题的能力。例如,我们可以引入如下教学案例,来加强深度学习系统的实践教学环节。让学生实现一个基于卷积神经网络(CNN)的火灾识别模型,项目流程可以如下:从公开的火灾数据集或实际收集火灾视频、图像。对数据进行标注,将图像分为火灾和非火灾类别。设计一个基于CNN的简单火灾分类器,使用多个卷积层和池化层提取图像特征。进行模型训练,调整超参数,优化模型。使用测试集对训练好的模型进行评估,分析其准确率、召回率等指标。将训练好的模型部署在一个实时视频流上,监测图像中是否出现火灾迹象,进行火灾预警。
4.2. 加强有关机器学习的可视化技术的相关教学内容
可视化技术能够将复杂的机器学习算法和模型以直观、易懂的方式呈现出来,帮助学生更好地理解和掌握知识。例如,我们可以引入TensorBoard等可视化工具,让学生能够实时观察模型的训练过程,分析模型的表现和潜在问题。这样的教学方式不仅有助于学生掌握机器学习的理论知识,还能提高他们对实际应用的理解能力。
4.3. 以可视化的方式解释机器学习课程中存在的复杂概念
许多学生在初次接触机器学习时,往往会感到困惑和迷茫。根据可视化教学理论[18],为了帮助他们更好地理解课程内容,我们可以采用更生动、具体的例子和比喻来解释复杂的概念。此外,我们还可以引入更多的图形、图表和动画等可视化元素,将抽象的概念具象化,帮助学生更好地掌握和理解。以回归分析这一概念为例。回归分析的目标是根据输入特征预测一个连续的数值输出。通过散点图表示数据点,并绘制回归模型的拟合曲线,帮助学生理解回归模型如何在数据中寻找最佳的拟合趋势。假设我们有一组关于房价的数据,特征是房子的面积,目标是预测房子的价格。通过散点图显示数据点后,拟合回归直线可以直观展示面积与房价之间的关系。通过这种可视化,学生可以更容易理解回归模型如何通过拟合直线或曲线,来捕捉输入特征与输出目标之间的关系。
4.4. 增加更多有关机器学习和深度学习相关的实际应用案例
机器学习不仅仅是一种理论技术,更是一种具有广泛应用前景的实践技术。根据实际案例教学的相关理论[19],通过引入更多的实际应用案例,我们可以使学生更直观地了解机器学习技术的价值和意义,提高他们对该课程的兴趣和动力。这些案例可以涵盖各个行业和领域,包括图像识别、自然语言处理、推荐系统等等。通过分析和讨论这些案例,学生可以更深入地了解机器学习技术的应用场景和实现方法,为未来的学习和研究打下坚实的基础。
Figure 3. Improvements in machine learning teaching
图3. 机器学习教学的改进措施
5. 总结
综上所述,针对机器学习课程存在的若干问题,我们需要采取一系列改进措施来提高课程的教学效果。这些措施包括加强实践教学环节、增加可视化技术相关教学内容、以更通俗易懂的方式解释复杂概念以及增加实际应用案例等。通过这些措施的实施,我们可以帮助学生更好地掌握和应用机器学习技术,为未来的学习和职业发展打下坚实的基础。
基金项目
重庆市教育委员会高等教育教学改革研究项目“新工科背景下网络安全产业学院建设研究”(一般项目,编号:356)。重庆市自然科学基金(批准号:2024NSCQ-LZX0121)。重庆市万州区科技计划项目(编号:wzstc-20240014)。