1. 《多元统计分析》课程的特点及教研现状
1.1. 《多元统计分析》课程特点
《多元统计分析》是高校统计学专业的核心课程,在统计学科大厦中占据举足轻重的地位,是数据科学领域不可或缺的基础支柱,对于锻炼学生的数理逻辑能力、统计思维及数据分析能力具有无可替代的价值。此外,该课程在人工智能探索、农业数据深度挖掘、气象预测分析、经济趋势把握、环境保护策略制定及可持续发展路径规划等多个领域均发挥着至关重要的作用。在解决实际问题时,多元统计分析不仅为模型构建与算法设计提供了坚实的理论基础,还助力专业人士探索出更加高效、环保的解题之道。因此,深入掌握《多元统计分析》不仅能够极大丰富学生的理论素养与实践技能,更为其未来职业生涯的广阔发展铺设了坚实的基石。总的来说《多元统计分析》是一门理论性与应用性结合紧密的课程,在教学中将原理方法与各领域实际问题紧密结合,学生所学的知识才能得以理解和巩固。
1.2. 《多元统计分析》课程的教研现状
在传统教学中,多元统计分析存在着一些教学痛点,比如重理论,轻实践,对教材中复杂晦涩的数学理论,教师采用“满堂灌”的方式教学,导致大多数学生对课程的目标和意义不明确,逐渐失去学习兴趣。为了改变这种局面,近年来关于多元统计的课程教学研究,很多一线教师进行了探索和实践。张卫东[1]以学生为中心,应用案例教学方法,通过对各行业真实数据的思考、识别、分析、研究和讨论,不仅加深了学生对多元统计方法理论的理解,还促进了理论知识与实践操作的无缝对接,真正实现“学以致用”。尤为重要的是,这些生动案例让学生直观感受到我国各行业的发展现状与重大成就,激励他们更好地融入国家发展大局,为国家的经济增长、科技创新、农业现代化及资源可持续利用等领域贡献青春力量,成为推动社会进步的新鲜血液。张弟等学者[2]对《多元统计分析与R语言建模》提出了案例驱动 + 课程思政的教学探索,通过引入国内学者的学术贡献、国家GDP数据、“狼来了”寓言故事、幸福感预测、法律案件分析和文化特色调查研究等项目寻找与课程思政的契合点,并锻炼学生的综合实践能力,提高教师的课程思政理念自觉性。关静[3]以立德树人为宗旨,在讲授主成分分析法、Fisher判别法和典型相关时,融入学生成绩分析和公司为新员工分配工作方案等案例数据,以此使学生明确个人奋斗目标和职业发展方向,并在学生中得到积极反馈。从以上几篇文献可以发现《多元统计分析》课程与实际生产、生活联系非常紧密,它具备实施思政教学的天然优势。
1.3. “链条式”思政的背景、含义和教研现状
习近平总书记在2016年12月召开的全国高校思想政治工作会议上强调强调,高校思想政治工作关系高校培养什么样的人、如何培养人以及为谁培养人这个根本问题。要坚持把立德树人作为中心环节,把思想政治工作贯穿教育教学全过程,实现全程育人、全方位育人,努力开创我国高等教育事业发展新局面[4]。张荣香等人[5]以物理光学课程为例,提出“链条式”思政教学模式,这种教学模式针对不同教学环节的特点,精准锻造不同功能的链环。从多个方面融入不同特色的思政元素,形成环环相连、步步咬合的全面育人体系。并且每一链环均制定精准的育人目标,使课程每一链环都成为滴灌式育人的重要阵地。“链条式”思政教学从时间,空间多个维度挖掘课程思政元素,增强课程思政实施效果,是实现全过程育人和全方位育人的重要途径[6]。
本论文基于高惠璇的《应用多元统计分析》教材[7]和李高荣等编写的《多元统计分析》教材[8]开展案例教学并通过教师引领、学生为中心、重塑内容和课程评价等链环构建“链条式”思政教学方案,对“链条式”思政和案例教学的结合进行探索与改革。
2. “链条式”思政 + 案例教学实践
2.1. 不同教学模块下思政案例库建设
不同教学模块的教学内容不同,蕴含着不同的思政元素,根据不同教学内容,设置不同的育人目标,引入思政案例并深度挖掘思政元素,分类实施课程思政,保证全方位育人功能的实现。结合教材,我们提炼出教学模块,见表1,针对每一个教学模块,制定了相应的思政目标,进行了案例库的建设。
Table 1. The ideological and political education goals and case libraries of each teaching module
表1. 各教学模块的思政目标和案例库
模块 |
教学内容 |
思政目标 |
案例库建设思路 |
一 |
多元统计发展与数据可视化 |
家国情怀 |
重要的统计学家的奠基性工作; 用可视化手段呈现中国的经济数据、科技创新数据、农业数据、气象数据和环境数据,了解构建新质生产力的努力方向 |
二 |
多元统计抽样理论 |
科学精神 |
介绍许宝騄和国内统计学者在多元统计理论研究上的贡献; 收集全国各区域的就业数据、科技创新数据、农业发展状况和环境治理现状数据,应用多元假设检验探讨这些问题 |
三 |
分类方法(聚类分析和判别分析) |
科学的研究方法和理性思维 |
收集内地31个省份的科技创新案例数据;重点城市的气象数据;农产品产量数据;污染排放和治理数据。应用聚类分析方法对这些数据进行聚类分析,并根据判别分析方法验证分类的效果。培养学生理性分析数据,并应用科学的研究方法了解中国各区域各领域的发展不平衡性,为自己未来的职业生涯做准备 |
四 |
降维方法(主成分分析、因子分析、对应分析、典型相关分析) |
抓住事物的主要矛盾,提高解决问题的效率 |
通过主成分分析重新审视上述案例的聚类分析,利用主要特征对各地区进行分类;收集一些图像数据,展示主成分分析在图像处理中的应用;收集学生学习成绩和实践成绩,建立学生发展档案,提取潜在因子,了解学生的兴趣,更准确地实施因材施教;通过对应分析揭示上述案例中不同地区和重要指标之间的内在联系;通过典型相关分析了解不同组别的指标之间的相关性 |
2.2. 不同教学环节下思政案例库建设
不同的教学环节承担着不同的育人功能,通过教师引领、学生为中心(课前、课中、课后)、重塑内容和课程评价等环节使“链条式”课程思政育人模式落地生效,在案例分析过程中体会专业的实用性,培养学生德才兼备的品格、学以致用的意识和科技创新的能力。
教师是课程思政建设的主力军,因此“链条式”课程思政育人模式的第一链环是教师引领育人,它是整个链条的基础和前提。教师要以“政治素质强、教育站位高、国际视野宽、五术要求精”的中国金师为方向,以《新时代高校教师职业行为十项准则》为行为规范,时刻审视自己的行为,在日常的点滴中影响学生,做好学生的引路人,引领学生形成正确的三观,并具备责任心和职业素养意识,这一点是贯穿于学生的整个大学生涯而不仅限于某个学期。
学生是课程思政育人的主体对象,通过课前的知识点预习和相关资料查阅,养成良好的学习习惯,再到课堂上的理论知识点深度学习、案例分析参与和讨论逐步培养独立思考精神和合作精神,最后在课后的复习巩固和案例实操与成果展示中,培养学生自主学习的品质和实践探索的精神。在整个学习环节中,教师监督学生,确保每一个环节的真正参与,完成全过程育人。
在教学内容上,通过教学模块的划分和各领域案例融入形成多层次、多视角的课程内容体系。整体上,多元统计分析按照章节教学特点和方法原理划分为四大模块:重实践的可视化模块、强基础的多元统计理论模块、理论和实践相结合的分类方法模块和降维方法模块,在每一个模块介绍统计学家的故事,激励学生树立远大理想,介绍学科经典文献和最新成果开拓学生视野,融入经济、农业、科技创新等关系国家民生大计的宏观数据,鼓励学生应用所学专业知识为国家贡献力量。通过这些举措,使课堂内容更加鲜活,实现内容育人。
在课程评价方面,通过笔试考试、课堂表现与课后作业和案例分析实践活动相结合的方式,全面考核学生的综合水平,使得最终成绩能够反映出学生的数理基础、创新思维和实践应用能力。
2.3. 具体实施路径
下面我们对“链条式”思政和案例分析在各模块的具体实施进行详细说明。
第一模块的学习中,首先对多元统计发展历史、多元统计在各行业数据分析中的应用以及老一辈统计学家,如许宝騄先生在多元统计中做出的工作进行展示,培养同学们的爱国情怀和专业认同感,使同学们树立报效国家的远大理想。其次,应用可视化中的轮廓图、雷达图和调和曲线图直观展示各城市的气象指标,和各城市工业废气、生活废气中污染物的含量,旨在培养同学们爱护环境的意识,播下可持续发展的思想种子。
Table 2. Regional differences in agricultural product output
表2. 农产品产量的区域差异性
农产品 |
区域1 |
区域2 |
区域1均值 |
区域2均值 |
区域1与区域2的差 |
显著性p值 |
烟叶 |
东北 |
西南 |
1.9 |
26.08 |
−24.18 |
0.040** |
中南部 |
西南 |
8.9 |
26.08 |
−17.18 |
0.076* |
华东 |
西南 |
3.667 |
26.08 |
−22.413 |
0.023** |
华北 |
西南 |
0.22 |
26.08 |
−25.86 |
0.013** |
西北 |
西南 |
1.475 |
26.08 |
−24.605 |
0.025** |
茶叶 |
华北 |
西南 |
0.067 |
24.92 |
−24.853 |
0.060* |
“*”表示显著性水平为0.1时,差异是显著的;“**”表示显著性水平为0.05时,差异是显著的。
在第二个模块中学习多元统计推断理论,在课堂上讲授多元数据的均值检验的同时,为学生拓展高维数据的假设检验,了解Hotelling T2检验方法的最新研究进展,激发学生参与科学研究的热情,通过文献阅读和解读,培养学生的科学研究精神。另外在学习多元方差分析时,对不同地区各行业的就业人数的案例数据进行差异性分析,展示区域之间的差异以及行业之间的差异。并安排一节案例分析课,让学生从我国各城市气象数据和农产品产量数据中任选一个进行差异性分析,学生对农产品产量进行区域差异分析得到的部分结果见表2:可以看出在茶叶和烟叶生产中,西南地区显著地高于其他地区产量,且获得了定量的结果。学生在案例分析中体会到多元统计分析在农业数据分析中的应用。
Figure 1. Classification results based on the average linkage method
图1. 基于类平均法的分类结果
Figure 2. Elbow chart
图2. 手肘图
在第三个模块中,学习系统聚类法和判别分析法,在课堂上引用了内地31个省份的规模以上企业的创新数据,应用系统聚类分析方法的类平均法,将这些省份分成了四个类别:广东(1),江苏、浙江、山东(2),上海(3),其余省(4) (见图1),另外应用快速聚类法结合手肘图(见图2)对31个省份分成了3个类:江苏,广东为一类(1),上海为一类(3),剩余省为一类(2) (见图3),并应用判别分析方法对各种分类方法的准确度进行验证,类平均法的准确度为83.9%,快速聚类法的分类准确度为90.3%。在学生的案例分析活动中,学生应用聚类分析和判别分析研究了基于农产品产量和气象数据对各地区的分类,练习通过手肘图来确定分类数,并应用判别分析进行了检验。在本模块的课堂案例学习中,一方面让同学们认识到在当今世界百年未有之大变局中,中国要想立于世界不败之地,必须加大科技创新投入力度,激励学生们应用所学专业知识积极参与到科技创新和学科竞赛中,另一方面通过系统聚类法和快速聚类法的讲解和案例分析培养学生发现问题和解决问题的科研素养和综合实践精神,通过聚类分析和判别分析的综合应用培养学生严谨的科学思维和精益求精的科学态度。
Figure 3. Classification results based on fast clustering method
图3. 基于快速聚类法的分类结果
在第四个模块中学习主成分分析、因子分析、对应分析和典型相关分析。主成分分析通过信息提取得到变差最大的方向上的综合变量,在课堂上应用主成分得分继续基于科技创新数据对各区域进行分类,分类结果见图4:1代表广东和江苏,2代表浙江、山东和上海,3代表其余省。应用判别分析检验得到的分类准确度为96.8%。可以发现通过主成分的提取,减少了变量之间线性相关的干扰,能够得到更高的分类准确度。在因子分析中,基于科技创新数据进行潜在因子的提取,通过计算因子载荷矩阵可以发现14个变量最终归纳成两个潜在因子,第一个因子在RD人员数,内部支出,外部支出,项目数,项目经费支出,机构数,机构人员数,机构经费支出,新产品销售收入,专利申请数,发明专利数等变量上具有较高的载荷,命名为科技创新总量因子,第二个因子在引进技术经费支出,消化吸收经费支出,购买国内技术经费支出上具有较高的载荷,命名为技术经费支出因子,然后根据因子得分对各地区进行了排序,分析各个地区在不同潜在因子上的表现。在对应分析教学中,基于对应分析理论研究全国10个省的农村消费情况[6],分析了不同地区在不同消费类别上的内在联系,在典型相关分析中对31个省的主要粮食产量指标和农业机械化指标,进行了典型变量的提取和典型相关分析,并得到农业机械化组的典型变量对小麦和玉米有较强的预测能力,主要粮食产量组典型变量对农业机械化组大部分变量都有预测能力等结论。
Figure 4. Classification results based on PCA
图4. 基于主成分的分类结果
Figure 5. Classification results based on PCA for industrial sector
图5. 对工业部门基于主成分的分类结果
在这个模块的教学过程中,一方面引导学生在研究一个错综复杂的实际问题时,要善于把握主要矛盾,提取主要的信息,利用主要信息分析样本之间的差异和相似性,以及变量之间的内在联系,另一方面让学生了解农业发展现状,引导同学们在乡村振兴上贡献自己的力量。在学生的案例分析活动中,他们主要比较了基于主成分得分的聚类和基于原变量的聚类分析,一名同学基于冶金、电力、煤炭、化学、机械、建材、森工、食品、纺织、缝纫、皮革、造纸以及文教艺术用品13个工业部门对年末固定资产净值、职工人数、工业总值、全员劳动生产率、百元固定原资产值实现产值、资金利税率、标准燃料消耗量以及能源利用效果,进行了主成分提取和聚类分析,并比较了基于主成分的分类结果(见图5)和基于原始变量的分类结果(见图6),应用判别分析验证了分类准确度,发现基于主成分的分类正确率为92.3%,高于基于原始变量的正确率(53.8%)。其中基于主成分对各行业发展现状的具体分类情况为:食品是第1类;机械是第2类,电力、煤炭和建材是第3类;冶金、化学、森工、纺织、皮革、造纸和文教艺术用品是第4类。在这个实践活动中,学生了解了各行业的发展水平,体会到提取主要信息的必要性,并培养了学生综合利用所学知识,解决问题的实践能力。
Figure 6. Classification results based on original variable for industrial sector
图6. 对工业部门基于原始变量的分类结果
2.4. 考核评价
基于以上的教学设计,笔者将从以下几个方面开展课程评价:闭卷考试(60%)围绕着课程的基础知识和计算方法,督促学生认真学习理论知识,习得多元统计思维,奠定坚实的多元统计基础;课后作业(30%)包括教材的基本习题,文献阅读总结和思考题,让学生巩固基础理论的同时拓宽专业知识及应用。案例分析实践活动(10%)鼓励以小组合作形式完成,锻炼学生的实践能力、创新能力、语言表达能力和团队合作意识。
3. “链条式”思政 + 案例教学的实践效果
针对以上提出的“链条式”思政和案例分析相结合的教学方法,笔者进行了效果分析。我们对实施本文提出的教学改革之前的2021级学生和改革后的2022级学生进行了比较,见表3。首先从课堂上学生的表现来看,与2021级相比,2022级同学的学习兴趣普遍有所提升,有4名同学勇于分享案例分析结果。其次与2021级学生的期末考试成绩做了比较,见表3,可以看出2022级的卷面及格率和卷面平均分,都有明显的提高,标准差有所下降,表明大多数同学在理论学习中有收获。另外在2022级学生的考核评价中,我们增加了10%的过程性考核(即案例分析实践活动),更加注重学生的实践能力的评价,这样,大多数学生均取得不错的总评成绩。最后,在结课后,有一些同学愿意主动阅读与多元统计方法有关的科技文献,尝试发表学术论文,表明本文提出的教学改革在科技创新方面也产生了积极的效应。
Table 3. Comparison of teaching effect
表3. 教学效果比较
年级 |
卷面平均分 |
卷面标准差 |
卷面及格率 |
总评平均分 |
总评及格率 |
2021级 |
68.3 |
21.1 |
63.2% |
75.5 |
89.5% |
2022级 |
79.0 |
14.3 |
89.7% |
85.2 |
100% |
4. 总结
本论文探索了案例分析在多元统计分析各个教学模块和教学环节中的应用,并将各模块和各环节下挖掘出的思政元素用“链条”将他们链接起来,实现了全过程育人和全方位育人。在这个教学改革过程中,学生们既学到了专业知识和技能,又积极投入到实践中,践行了学以致用,并且通过各行业的宏观数据的研究和分析激发了学生的爱国情怀,引导他们为中国的高质量发展贡献力量。
基金项目
北京信息科技大学2023年校级教学改革项目:基于模块化和案例的《多元统计分析》教学探索,5112310826;北京信息科技大学2024年研究生课程思政项目:思政“微故事”融入高等数理统计的教学模式探索,2024PYSZ04。