1. 引言
在新文科建设深化推进的背景下,面向应用型人才培养目标,概率论与数理统计在财经类院校课程体系中的地位日益凸显。概率论与数理统计课程具有双重价值:其一,作为学科基础课,为后续开设的计量经济学、金融风险管理、市场调研与数据分析等财经类专业课程提供重要的理论知识与概率统计思维,帮助学生构建连贯、系统的专业知识框架;其二,聚焦人才能力的培养,通过课程的理论推导与实践应用的结合,培养学生的逻辑思维、推理论证与批判性思辨能力,同时加强其创新实践意识,使学生具备运用概率统计的基本思想、方法与模型解决实际问题的核心能力,进而提升学生数学素养与专业技能。
概率论与数理统计的内容包括概率论和数理统计两部分内容,概率论是通过定义样本空间、随机变量、分布函数、期望、方差等一套公理化的语言和工具描述和度量“不确定性”,将“不确定性”转化为可计算的数学对象,即为“不确定性”本身建立一套严谨的数学模型;数理统计则是通过参数估计、假设检验、回归分析等一系列方法,在不确定性下,通过样本数据来推断总体的信息,即为其推断的可靠性提供度量。
鉴于概率论与数理统计的内容与以往的数学课程,如微积分、线性代数,有较大区别,学习方法方面也有本质的不同。以往的数学以确定性研究对象推导为核心,学习可通过公式强化、习题练习形成固定范式;而概率论与数理统计研究随机现象,需结合数据与模型,学习上需要突破确定性思维,建立概率直觉、模型抽象、数据验证的路径,依赖案例和实验来培养统计思维。
概率论与数理统计的传统教学模式往往偏重于对知识内容的理论解释,学生在学习过程中经常因知识的繁琐、概率模型的抽象复杂,导致所学的内容不成体系,模型不能具象,动手实践能力缺乏,概率统计思维难以达成,所学知识也很难应用到实际问题中。随着高等教育的大众化,我们不得不承认,大多数新一代的学生在数学基础和学习品质方面较以往的学生有较大差距,这使得我们以往的教学内容、教学方法和教学要求都受到了前所未有的挑战。
概率论与数理统计的教学改革是国内外学者持续关注的议题。国外研究,如Garfield与Ben-Zvi进行了开创性工作,奠定了统计思维培养的理论基础,并强调通过模拟活动让学生主动建构知识[1]。国内研究在此基础上不断深化,近年来集中体现在计算机技术与教学的深度融合:一方面,计算机辅助教学与模拟实验的应用,参看[2];另一方面,构建的基于知识图谱的混合式教学模式,为个性化与增强型教学提供了新范式,参看[3]。同时,在大数据时代背景下,课程改革更被赋予了对接前沿数据科学实践的新内涵[4] [5]。现有研究仍有两方面需要完善:其一,一些技术应用以教师演示为中心,学生自主探究参与性设计不足;其二,教学实践与学习理论(如建构主义)的系统性联结比较薄弱,未能形成促进学生主动完成知识建构的有效路径。
下面针对笔者所在院校概率论与数理统计课程的教学现状,从教师主导性和调动学生主体性方面进行一些教学创新探索,以建构主义理论为框架,将“5W + H”思辨导学、AI动态可视化与Excel深度模拟实验三者有机整合。让学生灵活、灵动地掌握课程内容,同时培养提高独立思考、自主学习、创新实践能力。
AI时代,获取知识信息越来越容易,面对海量信息,批判性思维、思辨和提问能力变得尤为重要。作为一名学习者,非常有必要有一套可行的思维方式。在课堂教学中,我们加强“5W + H”思维模式(what, when, where, who, why, how),让学生在学习过程中逐渐学会提问、批判、思辨。
2. 运用“5W+H”思维模式开启概率论与数理统计课程引论
1) What:给出概率论与数理统计的研究对象、研究内容及框架。从一些简单实例入手,引出概率论是度量“不确定性”建立起的一套公理化内容,数理统计则是给出从样本数据得到关于总体信息的一些处理、分析方法的可靠性度量。
2) When Where Who:从赌博的游戏开始,以讲故事的方式贯穿整个概率论与数理统计发展史,着重强调我国的许宝禄教授在概率论方面所做的贡献。
3) Why:为什么学习概率统计?列举概率论与数理统计课程开设的多重价值,列举其在各领域的广泛应用。强调作为学习者,概率统计的思维和锻炼到的能力,是学习本课程的核心任务。
4) How:如何学好概率统计?讲清本课程与以往课程的内容和学习方式的不同,可借助AI,运用“5W + H”预习,理清知识脉络,课上紧跟内容进度,及时复盘,通过做一些现实实际例子来培养和加强概率统计思维,等等。
通过“5W + H”思维模式在课程引论中的应用展示,使“5W + H”潜入到学生头脑中,在自主学习过程中反复运用,尤其what,why,how,使得自我提问的内容更有目标、方向,有助于加速主动构建知识的过程。
3. 采用问题驱动、典型案例引入知识内容、借助AI对抽象复杂的模型进行动画演示
1) 课堂上,我们运用循序渐进的引导、迁移学习法等引入概念
例如为了引入事件与概率的概念,可以发问“明天下雨的可能性是多大”这里“下雨”是一种天气现象,“可能性”在数学上希望用一个数值来表示,进而给出概率是刻画随机现象在一次试验中发生可能性的数量指标,即得概率的字面含义,给出概率论是研究随机现象的统计规律性的一门数学课程;随机现象可得出事件的表述,从统计规律性给出概率的概念。再如二维随机变量的内容,可从人的两个指标身高
与体重
,可把
与
作为一个整体来看待,同一对象的不同指标之间往往是有一定联系的,因此随之提出
与
两者之间存在什么关系?通过头脑风暴,不断提问、引导,从已知知识迁移到要学习新内容,让学生了解知识的来龙去脉和现实问题驱动等,学习更有目标感。
2) 运用一些典型的现实案例解释理论概念
通过对课程内容赋予现实、金融、经济例子,拓宽了学生的视野,培养学生运用知识的能力,增强学生学习兴趣。例如运用事件的独立性来诠释成语“智者千虑,必有一失”、“三个臭皮匠赛过诸葛亮”、数学期望和方差在经济管理决策中的应用,等等。比如,在进行经济管理决策之前,往往存在不确定的随机因素,所作的决策有一定的风险,只有正确、科学的决策才能达到以最小的成本获得最大的安全保障的总目标,才能尽可能节约成本,利用概率统计知识可以获得合理的决策,来实现这个目标。通过一系列的例子,让学生感到学有所用。
3) 课堂上通过对比冲突或矛盾问题引出知识,促进学生对所学内容产生深度思考
对比鲜明、冲突性强的例子来阐释知识概念,不仅能放大概念的核心思想,还能通过强烈的反差给学生带来认知上的冲击,从而更好地吸引注意力,留下深刻印象。比如,在讲解条件概率的核心思想时,即额外信息会改变我们对原有事件可能性的判断。一个对比强烈的例子是:若单纯讨论一个人活到百岁的概率,它通常较低,但如果我们得知某位老人已经活到了99岁364天,那么他活到百岁的概率会极高,因为只需再有一天,他就能活到百岁。这样的极端变化直观展现了条件概率的核心内涵。再如,讲解二维连续型随机变量
的在
条件下关于
的条件分布函数
,根据条件概率的定义,左式 =
;而对二维连续型随机变量而言,得到一个
的分式,从表面上看是不合理的,让学生联想微积分中的接触到过的
的情境,利用极限的思想来解释一点处的变化率和密度。通过这种类比联想,就能合理化并理解这个条件概率公式。
4. AI赋能,对抽象复杂的模型进行可视化动画演示
在教学中,为了便于学生理解抽象内容(如中心极限定理、区间估计等),采用AI技术赋能课堂演示,具体通过使用DeepSeek软件,生成交互式、可调控的动画模拟过程,进行理论内容的可视化,例见图1。相较于传统预设动画,该工具能够实时调整参数并动态呈现样本分布变化,增强直观感知与过程探究。从建构主义学习理论视角看,学习是学生主动建构知识的过程,此类交互式动画引导学生通过参数调整与模拟观察,亲历概念形成路径,实现从直观操作到抽象理解的认知跨越,从而提升教学效果。
Figure 1. Comparison of the binomial distribution and the normal distribution
图1. 二项分布与正态分布比较
5. 基于电子表格软件的概率统计上机实验设计
在课堂或课后自主学习环节,通过Excel或其他电子表格软件模拟一些概率分布和随机现象,这一灵感来源于物理、化学、生物等自然科学学科通过实验验证理论的做法。许多随机现象和理论同样可以借助计算机实验佐证,这样的教学实践不仅让抽象的概率理论变得更加生动,还赋予其一种可触摸、可验证的真实感。虽然目前有许多程序设计语言和软件能够实现概率现象的模拟,但Excel这样的常用表格软件,操作简便且易于获取,无需额外的资源投入就能为学生提供了一种类似实验室工具的直观手段。这些实践对活跃课堂气氛,丰富理论教学,激发学生们的学习热情起到积极作用。
Excel等电子表格软件提供了一个(伪)随机数函数RAND()。这个随机数函数返回一个在0到1之间的(伪)随机数。这个函数给出了一个在区间(0, 1)上服从均匀分布的连续型随机变量。基于这个简单的函数,我们就模拟出各种不同的随机分布,反复开展这些随机试验,利用频率近似概率,就可以观察到许多概率理论的直观呈现。
例:在电子表格中利用RAND()函数生成一个随机变量。注意到如果
是一个在区间(0, 1)上服从均匀分布的连续型随机变量,那么
是一个在区间(0, 5)上服从均匀分布的连续型随机变量,对
取整以后数值取0,1,2,3的概率和为0.8,取4的概率为0.2。所以我们令
,
就是一个(0, 1)型离散型随机变量。所以在电子表格的单元格中输入公式 = IF(FLOOR(RAND()*5, 1) = 4, 1, 0),这个公式就是以0.8的概率出现0,0.2的概率出现1。这里所用的FLOOR函数将其第一个参数向下舍入,第二个参数指示舍入到的倍数,第二个参数取1的话,效果就是下取整。我们把
对应的随机试验重复200次,1出现的次数对应的随机变量服从二项分布B (200, 0.2)。在电子表格中我们可以在单元格内输入 = IF (FLOOR(RAND()*5, 1) = 4, 1, 0),然后通过自动填充向下填充200行,这就是200重伯努利试验。可以通过求和函数 = sum(A1:A200),考查1出现的次数。将所有行往右自动填充,做80次以上这样的200重伯努利试验。在第201行求和,计算每一次200重伯努利试验1出现的次数。试验后可以看出来结果大致都在B (200, 0.2)的数学期望40左右。可以把这些伯努利试验的结果绘制成一个直方图,见图2,看出服从二项分布B (200, 0.2)的随机变量值的频率分布,见表1。电子表格一般版本没有方便生成直方图的工具,不过有许多在线工具可以完成这个任务。我们把结果复制一下,到https://histogrammaker.co/或其他一些在线网站去生成直方图。可以看出直方图2呈现中间大两边小的钟形。
Figure 2. Histogram of a random variable with distribution B (200, 0.2)
图2. 服从B (200, 0.2)的随机变量的频率直方图
Table 1. Frequency table of a random variable with the distribution B (200, 0.2)
表1. 服从B (200, 0.2)的随机变量值的频率分布表
Frequency Distribution |
Bin |
Count |
27~32 |
4 |
32~37 |
21 |
37~42 |
35 |
42~47 |
20 |
47~52 |
5 |
52~57 |
1 |
例:利用随机变量的函数生成经典的随机分布,观察它们的分布规律。
一维和二维随机变量函数的分布是学生学习中的难点。实际上电子表格提供的均匀分布通过函数的变换,就能生成各种其他经典的分布,尝试这些试验能让学生体会到随机变量函数的理论和应用价值,也能产生出一定的学习热情。
1) 生成指数分布
令
是一个在区间(0, 1)上服从均匀分布的连续型随机变量。令
。我们可以证明随机变量
服从参数为
的指数分布。
已知某种电子元件的寿命(单位:小时)服从参数为
的指数分布,求这样的元件使用寿命超过1000的概率。我们用实验模拟出频率。
这个概率的确切值是
在A1输入 = −1000*LN(RAND()),在B1用if函数 = IF(A1 ≥ 1000, 1, 0)判断其是否超过100将这两列用自动填充功能填充500行或更多。最后计算B列的和。笔者这次试验中超过1000小时的频率是
。与概率的真实值还是颇为接近的。可以同样在直方图生成网站中生成这些数据的直方图,见图3。
Figure 3. Frequency histogram of a random variable with exponential distribution
图3. 服从指数分布
的随机变量的频率直方图
可以看出直方图的形态左高右低,符合概率密度函数的图像特征。
2) 生成正态分布
可以利用Box-Muller变换来将两个在区间(0, 1)上服从均匀分布的连续型随机变量变换成两个服从标准正态分布的随机变量。令X1,X2是两个在区间(0, 1)上服从均匀分布的连续型随机变量,则下面两个随机变量
服从标准正态分布。
假设某地女性身高服从正态分布N(162,6.252) (单位:厘米),在电子表格中生成4500个服从该随机分布的随机数,并作出直方图。利用Box-Muller公式以及非标准正态分布和标准正态分布间的关系,可知利用公式 = SQRT(−2*LN(RAND()))*COS(2*PI()*RAND())*6.25 + 162就能生成所要的随机数。
在A1单元格中输入上述的公式,用自动填充生成4500个样本。最后在https://histogrammaker.co/生成直方图,见图4。
Figure 4. Frequency histogram of a random variable with normal distribution N (162, 6.252)
图4. 服从正态分布N (162, 6.252)的随机变量的频率直方图
3) 中心极限定理的模拟
独立地掷出10颗骰子,求掷出的点数之和在30点到40点之间的概率。用电子表格软件来模拟这个过程,并考察点数之和出现在30到40之间的频率,并将结果与正态分布近似得到的结果对比。
注意到每一次掷出骰子服从等可能分布,1到6点的概率都为
。给出一个在区间(0, 1)上服从均匀分布的连续型随机变量
,令
,则
就是一个取值为1到6的自然数,且取每个数概率都为
的离散型随机变量。在A1单元格中输入公式 = FLOOR(RAND()*6, 1) + 1,然后向下自动填充至A2到A10,即可生成10个随机数,这相当于模拟了独立掷出10颗骰子的结果。接着,在A11单元格中对前10个随机数求和。以此次试验为例,笔者得到的总和为39。随后,将所有行向右自动填充,即可模拟多次独立试验。笔者此次共模拟了1085次。将第11行的数据选中后,可以通过转置复制到其他区域,方便进一步分析。接下来,使用IF函数判断每个总和是否在30到40之间。通过AND函数,可以同时检测两个逻辑条件是否成立,若条件成立则返回1,否则返回0。完成设置后,向下自动填充公式以对所有1085个结果进行判断。最后,对B列的值求和即可得出总和介于30到40之间的次数。笔者此次试验中有722次符合条件,对应的频率与正态分布理论估计值0.65非常接近。
还可以模拟用矩估计的方法估计均匀分布的两个未知参数,参数的区间估计等。这里仅抛砖引玉,读者可循此思路,定能发挥创造力,构建出更有启发性,想象力和趣味性的概率实验。
经过一系列的教学实践探索,学生能够通过“5W + H”思辨进行构建知识内容,通过模型内容动态可视化,以及Excel自主模拟实验等,直观地理解了抽象的概念,学习主动性与课程参与度有了显著提高。在知识掌握、独立思考及解决实际问题的能力方面也均有明显进步。
基金项目
上海立信会计金融学院2025年校级教学改革与研究项目(AW-12-021225-003020)、《概率论与数理统计(序伦)》混合式校级金课。
NOTES
*通讯作者。