1. 引言
《概率论与数理统计》是大学数学类基础理论课程中独具特色的一门课程,主要研究随机现象的统计规律性,其理论与方法广泛渗透于自然科学、社会科学及工程技术等众多领域,是近代数学的重要组成部分[1] [2]。本课程以《高等数学》与《线性代数》为前导课程,能够为后续数字信号处理、装备工程、数据挖掘等相关课程的学习提供分析理论与计算工具支持。
“离散型随机变量”是《概率论与数理统计》课程中的重要内容,它将古典概型中如掷骰子、抽球等简单事件的概率计算,抽象为随机变量取值的概率描述,通过分布律实现了对随机事件可能性的系统化、符号化表达,完成了从“具体案例”到“概率模型”的跨越[3]。作为最简单的一类随机变量,离散型随机变量的理论和方法较容易被初学者理解,且能够为后续连续型随机变量的学习奠定理论和思维基础。特别是二项分布、泊松分布这两种重要的离散型随机变量,它们层层递进,相互关联,是学生逐步深入理解事件的概率度量及统计推断原理的重要桥梁。多年教学实践发现,多数学生虽然能熟练掌握离散型随机变量相关的概率计算,却缺乏对二项分布、泊松分布中参数变化对分布律影响的直观感知,难以深入理解参数的重要意义。与此同时,学生对泊松定理所揭示的两种分布内在关联理解不深刻,导致在面对实际问题时,难以依据问题背景选择恰当的概率模型进行建模分析。
2. 国内《概率论与数理统计》课程的可视化教学研究
2.1. 可视化教学的概念
早在远古文明时期,古埃及人就掌握了借助雕塑与绘画来传授宗教和历史知识的方式;古希腊人也深谙运用地图和图表讲解几何等学科内容的技巧;作为中华文化智慧结晶的汉字,则更是自问世之初便与可视化有着密不可分的联系。这些早期利用图形图像等可视化的方式来传递信息、传承知识的探索,为后世可视化教学的发展开辟了道路。在当代看来,可视化教学就是将抽象的知识理论、逻辑过程运用图形、动画、视频等表征手段展示出来,以促进教学目标达成的一种教学方式[4]。美国当代著名教育学家理查德·梅耶(Richard E. Mayer)提出的多媒体学习认知理论,明确指出视觉和听觉的协同运用更易促成有意义学习的发生[5] [6],为可视化教学的有效性提供了坚实的认知科学支撑。实施可视化教学的目的,是为了降低知识的认知理解门槛,促进学生对知识的掌握[7]。
2.2. 国内研究现状
国内《概率论与数理统计》课程的可视化研究与应用尚处于起步阶段,但已展现出其在教学中的潜力和优势。周宗好,王佳佳基于MATLAB软件从教学内容、知识思想、实际应用3个方面开展概率统计实验教学的探索[8];郭林祥等针对数理统计教学内容,融入基于R语言的实验教学,帮助学生深入理解数理统计的思想[9];张一敏分析了SPSS软件应用于《概率论与数理统计》教学的优势与不足,开展了探索研究并提出改进措施[10]。
针对本课程中“离散型随机变量”这一部分内容,目前尚未有学者开展可视化教学探索研究。为了破解学生在该内容学习过程中存在的困境,本研究聚焦离散型随机变量中的二项分布和泊松分布,借助MATLAB软件直观展现参数变化对其概率分布情况的影响;同时通过对比演绎,将二项分布与泊松分布之间的联系直观呈现出来,深化学生对泊松定理的理解。
3. “离散型随机变量”可视化教学设计
3.1. 二项分布的可视化教学设计
对于一次伯努利试验,结果只有两种:事件A发生或者不发生。若事件A发生的概率为p,则n次重复独立伯努利试验中,事件A发生的次数X是一个随机变量,服从参数为n,p的二项分布,记为
。随机变量X取值为
的概率为
二项分布与概率论中如事件的独立、互斥性等基础概念联系紧密,不仅为这些抽象概念的实际应用提供了具体场景,更是由基础概率知识迈向复杂概率理论的关键过渡。传统教学多侧重二项分布的理论阐释与概率计算训练,忽视对参数n,p变化对分布律影响的深入探讨,导致学生难以形成二项分布分布律的宏观画像,对参数n,p的调控作用理解流于表面。因此,可借助MATLAB绘制参数n,p取不同值时的二项分布分布律图像,将可视化图像展示与课堂理论讲授有机结合,助力学生构建对二项分布的深刻理解。MATLAB中可调用binopdf(k, n, p)函数来计算参数为n,p的二项分布
当随机变量取值为k时相应的概率值。
从图1可以看出,在参数n,p给定的二项分布分布律图像中,大部分随机变量取值点处的概率值非常接近0,只有小部分点处的概率值较大,而这一部分的概率值,随着k值由0增加到n,呈现出“先增后减”的变化趋势,且存在最大概率值点。对图1进行横向对比,发现当参数n不变,p不断增大时,二项分布分布律散点图形状会随着p的改变而变化,最大概率值点也会沿着横坐标轴向右移动;纵向对比则可看出,当保持参数p不变,n不断增大时,二项分布分布律散点图形状会越来越接近高中学过的正态分布密度函数曲线的形状。同时,在这一变化过程中,最大概率值点对应的X取值与X取值上限n的比值,显现出与p有较强的相关性。
通过观察图1所得出的这些结论,均能通过对二项分布定义式的深入剖析得到印证。二项分布
下概率
先是随着k的增大而增大,直至达到最大值后,继而会随着k增大而单调减小。若将概率
最大值点所对应的k取值记为
,则对于确定的n,p就有
求解上述方程组,可得
因为
不一定是整数,而二项分布中
只能取整数值,从而

同时,从上式中也能看出,n的取值越大,
与n的比值越趋于p,这就说明了为什么概率最大值点对应的k值与n的比值看起来与p相关性很大。至于为什么当p保持不变,n不断增大时,二项分布分布律散点图的形状会越来越接近正态分布密度函数曲线的形状,对这一现象的解释,恰能为后续学习棣莫弗–拉普拉斯中心极限定理做好铺垫。
Figure 1. Probability distribution of the binomial distribution
under different parameters
图1. 不同参数下二项分布
的分布律图
3.2. 泊松分布的可视化教学设计
1837年法国数学家、物理学家西蒙·丹尼尔·泊松(Siméon Denis Poisson, 1781~1840)在他发表的著作《刑事和民事案件判决的概率研究》(Recherches sur la probabilité des jugements en matière criminelle et en matière civile)首次阐述了被后人称为泊松分布的内容[11]。泊松分布定义为:若随机变量X的可能取值为
,取各个值的概率为
其中
是常数,则称随机变量X服从参数为
的泊松分布,记为
。泊松分布是概率论中非常重要的一种分布,可作为描述在一定时间或者空间内稀有事件发生次数的概率模型,在军事、交通运输、医学等现实统计方面有着重要应用[12]。
Figure 2. Probability distribution of the Poisson distribution
under different parameters
图2. 不同参数下泊松分布
的分布律图
MATLAB中可调用poisspdf(k,
)函数来计算参数为
的泊松分布
当随机变量取值为k时相应的概率值。图2展示了泊松分布
中参数
取不同值时对应的分布律图像,对比观察可以发现,在随机变量大多数可能值处,对应概率值都非常接近于0,只有在
值附近区间,相应的概率值较大。同样地,若将泊松分布中概率
最大值点对应的k取值记为
,类似二项分布的计算思路,可以计算出

3.3. 泊松定理的可视化教学设计
在很多小概率事件相关的问题中,常需计算具有n很大p很小这样特点的二项分布
的概率,学生容易发现,用常规方法计算此类型二项分布概率十分繁琐。此时,泊松分布就可以作为近似概率模型,对原二项分布概率实现较为高效和精确地估算。其理论依据就是泊松于1838年严格证明的泊松定理:
设随机变量
,若其两个参数始终满足
,则对于任意正整数k,
的概率可以由泊松分布表示,即
泊松定理表明,当二项分布
的参数n很大p很小时,就能使用近似公式
对于泊松定理所阐述的这一抽象结论,学生往往存在直观理解上的困难,因此可借助MATLAB将二项分布与泊松分布的近似关系可视化地呈现出来,从而有效降低理解门槛,帮助学生更深入地体会泊松定理所揭示的规律。
Figure 3. Comparison of probability distributions for binomial and Poisson distributions under different parameters
图3. 不同参数下二项分布与泊松分布分布律对比
图3展示了在始终满足
的前提条件下,n不断增大时,泊松分布对于二项分布的近似情况。可以看到,在n很大p很小时,参数为
的泊松分布对二项分布
有较好的近似效果,与文献[1] [2]结论一致。在实际应用中,常会用到两种分布的这一关系达到简化计算的目的。
4. 小结
本研究立足于《概率论与数理统计》课程特点,锚定学校人才培养目标,针对“离散型随机变量”这一部分内容,对课堂教学内容进行了可视化创新设计。对学生而言,依托MATLAB进行教学内容的可视化呈现,不仅能带领他们从全新视角对理论知识进行思考和解读,深化理解与掌握,更能让他们真切感受到以MATLAB为代表的数学软件在统计与科学计算领域强大的实用功能,有效激发探索热情,为今后更好适应数智化环境下的工程实践与研究奠定基础。