几类概率问题求解中样本空间的选取
The Choosing for Sample Space in Solving Several Kinds of Probability Problems
DOI: 10.12677/PM.2022.124073, PDF, HTML, XML, 下载: 356  浏览: 614  科研立项经费支持
作者: 胡贵新, 李冰青:河南理工大学,数学与信息科学学院,河南 焦作 ;周 雪:河南大学,数学与统计学院,河南 开封
关键词: 古典概率几何概率条件概率样本空间Classical Probability Geometric Probability Conditional Probability Sample Space
摘要: 样本空间是概率论的基本的概念之一,恰当选取样本空间是求解很多概率问题的关键。本文针对古典概率、几何概率、条件概率、随机变量及其分布等问题中遇到的有关样本空间的选择问题,给出了样本空间的选取原则,全面阐明了恰当选取样本空间在求解相关概率问题中的重要性,最后,分析了样本空间的形态与概率方法的一致性问题。
Abstract: Sample space is one of the basic concepts of probability theory, and appropriate choosing for the sample space is the key to solving many probability problems. This paper mainly deals with the problems of the choosing for sample space in classical probability, geometric probability, conditional probability, random variables and its distribution, gives the principle of the choosing for sample space, illustrates the importance of the choosing for sample space in solving some related probability problems, and analyzes the consistency of the form for sample space and the method of the probability problems.
文章引用:胡贵新, 李冰青, 周雪. 几类概率问题求解中样本空间的选取[J]. 理论数学, 2022, 12(4): 638-644. https://doi.org/10.12677/PM.2022.124073

1. 引言

众所周知,很多数学问题,都是在一定的空间进行的,若空间发生变化,那么问题的结果就会有所不同。样本空间是概率论的重要概念之一,这个概念的引入使得微积分学的一些内容,比如集合可以用来描述概率论中的随机事件,进而可以通过集合的关系和运算来实现事件间的关系和运算,为利用微积分的知识来解决概率问题提供了可能性,而所有的概率问题都是在样本空间中进行的,因此样本空间的选择在概率论问题的求解过程中占有重要的地位。有不少文献强调概率论问题中样本空间的重要性,文献 [1] 对概率论中“为什么要引入样本空间”这一问题进行了深刻的探讨,并指出样本空间与概率问题的背景有关,与问题的本身无关,且样本空间随着试验目的的不同而不同,且选取不唯一。文献 [2] 和 [3] 从概率论学习的思维方式、基本概念的理解、问题探究过程及对随机现象分析能力等方面,阐述了样本空间在刻画概率论重要概念中的作用。

本文将从以下几个方面对几类概率问题求解过程中,样本空间的选取做详细阐述。本文的安排如下:第二部分,首先以文献 [4] [5] [6] [7] 中的例子,阐明计算古典和几何概率相关问题时,如何恰当选取样本空间;其次,通过文献 [8] 中经典的摸球问题,对缩减样本空间在条件概率中的应用做详细阐述;然后,对随机变量及其分布中遇到的有关样本空间的选择问题,全面阐明恰当选取样本空间在求解相关概率论问题中的重要性;最后,分析样本空间的形态与概率方法的一致性问题。第三部分,给出本文研究的主要结论和展望。从本文的结果可以看出,同一个概率问题,由于样本空间的选择不同,其计算繁简往往差异较大,甚至出现不同的结果。无论是随机事件概率的计算问题,还是随机变量及其分布问题,选择适当的样本空间都是解题的关键。本文所涉及的例子以能说明问题为主,不追求问题的复杂性和难度。

2. 主要结果

2.1. 古典概率和几何概率相关问题求解中样本空间的选取

样本空间的选取是概率论学习中的难点问题,在古典和几何概率模型的计算中起着非常重要的作用,同一问题,可以选择不同的样本空间,进而得到不同的结果。古典概率模型针对样本空间有限、样本点具有等可能性时使用,而几何概率对样本空间没有有限的要求,下面通过几个例子详细说明,如何选取合适的样本空间,能有效简化运算过程,以便于求解概率的相关问题。

2.1.1. 古典概率相关问题样本空间的选取

下面以文献 [5] 中彩票中奖为例,说明古典概率问题计算中,合理选取样本空间的必要性。

例1:假设某公司推出n张彩票,其中m张可中奖,如果每次抽出后不放回,求第k次抽奖中奖的概率。

解:法一:给这n张彩票排序,视每张彩票是不同的,此时的样本空间采用n张彩票构成的全排列,

样本点的总个数为 n ! ,第k次中奖全排列为 m ( n 1 ) ! ,所以第k次抽奖中奖的概率为 m ( n 1 ) ! n ! = m n

法二:因为第k次抽奖时所有的彩票都是相同的,则每张彩票在第k次被抽中的概率也是相同的,

所以将n张彩票看作样本空间,一共有m张有奖的彩票,那么它们在n张彩票中第k次被抽中的概率为 m n

注:从本例可以得出,中奖和抽奖先后顺序是没有关系的,无论是第几个抽,中奖概率都是一样的。在计算同一问题时,选择不同的样本空间,计算过程不同。方法二对样本空间进行了简化,使运算过程更简单,这表明在解决概率问题时一定要注意样本空间的选取。

2.1.2. 几何概率问题中样本空间的选择

下面通过文献 [6] 中的一个例题,说明恰当选取样本空间在几何概率问题中的应用。

例2:在半径为1的圆周上随机取三个点 A , B , C ,求 Δ A B C 为锐角三角形的概率。

解:法一:将样本空间选为最大角所对应弧长的变化范围,则要使得三角形为锐角三角形,则该三角形中最大的一个角必是锐角,设 A Δ A B C 中的最大角,则 π 3 A < π ,半径为1的圆周长为 2 π 。根据题意,此三角形中每个内角都为圆周角,所以 A 对应的弧长的范围是 [ 2 π 3 , 2 π ) Δ A B C 为锐角三角形,则 π 3 A < π 2 , [ 2 π 3 , π ) A 对应的弧长的范围,则可得 Δ A B C 为锐角三角形的概率为 P = π 2 π 3 2 π 2 π 3 = 1 4

法二:将样本空间选为圆心角的变化范围,设圆心为O,在圆周上选三点,分别记为 A , B , C ,连接

O A , O B , O C ,设 A O B = α B O C = β C O A = γ ,则总的样本空间为 Ω = { ( α , β , γ ) | 0 < α < 2 π 0 < β < 2 π 0 < γ < 2 π α + β + γ = 2 π } Δ A B C 为锐角三角形所对应的事件为 Ω 1 = { ( α , β , γ ) | 0 < α < π 0 < β < π 0 < γ < π α + β + γ = 2 π } ,根据样本空间 Ω 和事件 Ω 1 所对应的面积,得所求概率为 1 4

注:对比以上两种不同的解题方法, Δ A B C 有三个内角,而方法一中只考虑了最大角的变化过程,虽然最后可以得到正确的结果,但是这种解题方法不严谨,容易产生歧义;方法二中将圆心角的变化范围作为总的样本空间,这样就把问题转化为测度为面积的几何概型,所求概率即为两个已知三角形的面积之比,与方法一相比,显然方法二能使过程更严谨、严密。

2.2. 条件概率中样本空间的选取及分析

2.2.1. 条件概率计算中正确选择样本空间

下面以文献 [5] 中一个例题的改进模型为例,说明正确选取样本空间在条件概率问题求解中的必要性。

例3:n件产品中含有m件不合格品,从中任取两件,已知两件中有一件是合格品,求另一件也是合格品的概率。

解:错解:设A为取出产品中一件是合格品,B为另一件也是合格品,由条件概率得

P ( B | A ) = P ( A B ) P ( A ) = ( C m 1 C n 1 ) 1 C m 2 C n 2 = m 2 ( m 1 ) n 2 ( n 1 ) .

分析:上述解答是错误的,原因在于计算 P ( A ) 时,样本空间与 P ( A B ) 不统一, P ( A B ) 的样本点是n件产品中任意组合的两件,而计算 P ( A ) 时则认为样本点是n件产品中的任意一个,事实上,A表示其中一件是合格品,也就是说是取出的两件中的一件是合格的。

正解:先设事件A为取出的两件产品中至少一件是合格品,事件B为两件都是合格品,则样本空间

的样本点个数为 C n 2 = n ( n 1 ) 2 。从n件产品中任取两件,至少一件是合格的,则有两种情况,一是一件

合格一件不合格,二是两件都合格,所以事件A的样本点个数为

C m 1 C n m 1 + C n m 2 = m ( n m ) + ( n m ) ( n m 1 ) 2 = ( n m ) ( n + m 1 ) 2 .

于是事件A的概率为 P ( A ) = ( n m ) ( n + m 1 ) n ( n 1 ) 。从n件产品中任取两件都是合格品,事件B的样本点个数为 C n m 2 = ( n m ) ( n m 1 ) 2 ,则B的概率为 P ( B ) = P ( A B ) = ( n m ) ( n m 1 ) n ( n 1 ) 。于是由条件概率公式得 P ( B | A ) = P ( A B ) P ( A ) = ( n m ) ( n m 1 ) n ( n 1 ) ( n m ) ( n + m 1 ) n ( n 1 ) = n m 1 n + m 1

注:选择恰当的样本空间,在同一个样本空间中计算 P ( A ) P ( A B ) ,是解决问题的关键。从这个例题可以看出,在解决概率问题尤其是条件概率问题时,如果不能正确选取样本空间,结果就是错误的,因此计算条件概率时,尤其要注意分母 P ( A ) P ( A B ) 样本空间的一致性。

2.2.2. 缩减样本空间在条件概率中的应用

下面通过文献 [8] 中经典的摸球问题,对缩减样本空间在条件概率中的应用做详细阐述。

例4:设箱子中有R个球,其中白球S个,黑球 R S 个,若从中不放回的摸球,每次摸一个,求第一次摸到白球后第二次摸到黑球的概率。

解:法一:设A为第一次摸到白球,事件A的概率为 P ( A ) = S R ,事件AB代表第一次摸到白球第二次摸到黑球,总样本点数依然为 A R 2 ,事件的AB样本点数为 C S 1 C R S 1 ,因此可求得事件AB的概率 S ( R S ) R ( R 1 ) ,由条件概率公式即可得 P ( B | A ) R S R 1

法二:缩减样本空间,把事件A的样本点数看作样本空间的总数,即 C S 1 C R 1 1 ,由已知第二次摸到黑

球的样本点数为 C S 1 C R S 1 ,则由古典概率计算得 P ( B | A ) 的值为 P ( B | A ) = C S 1 C R S 1 C S 1 C R 1 1 = R S R 1

法三:继续缩减样本空间,当在R个球中取出一个白球后,箱中还有 R 1 个球,其中有黑球 R S 个,所以把取出一个白球后剩余的 R 1 个球看作总的样本点,再摸到黑球只能有 R S 种情况,于是得

P ( B | A ) = R S R 1

注:在本例中可以看到,缩减样本空间对于简化运算是很有效的。通过分析以上经典案例,可以清楚的看出恰当选择样本空间的重要性,合适的样本空间会使解题过程更加直观和简便。而且,通过缩减样本空间,问题会得到简化,所以再遇到条件概率问题,便可以使用缩减样本空间的方法来解决问题。

2.3. 恰当选取样本空间在随机变量及其分布中的应用

随机变量是定义在样本空间中的实值函数,有两种常见的随机变量,离散型和连续型随机变量,均值和方差是随机变量的两个数字特征,一般通过方差来描述随机变量的取值在其期望值附近波动的大小。下面通过文献 [9] 中的一个例子,说明恰当选取样本空间在简化均值和方差计算中的作用。

例5:在平面直角坐标系内有一个圆,原点即圆心,半径为r,向该圆周上随机抛掷一个质点,设随机变量 ξ 表示质点落到圆周上的横坐标,求期望 E ( ξ ) 和方差 D ( ξ ) 的值。

解:方法一:将平面直角坐标系上的圆周看作样本空间,则欲求期望和方差,首先求得 ξ 的分布函

F ( x ) = { 1 π arccos ( x r ) r < x 0 1 1 π arccos π r 0 < x < r 和密度函数 p ( x ) = F ( x ) = { 1 π r 2 x 2 r < x < r 0 ,根据数学期望和

方差的定义得 E ( ξ ) D ( ξ ) 的值分别为

E ( ξ ) = 1 π r r x r 2 x 2 d x = 0 .

D ( ξ ) = E ( ξ 2 ) ( E ξ ) 2 = 1 π r r x 2 r 2 x 2 d x = r 2 2 .

方法二:考虑从极坐标入手,令质点的横坐标 ξ 为极坐标系下随机变量 θ 的一个函数 ξ = r cos θ θ 表示极坐标中的角度,把平面上的线段 [ 0 , 2 π ) 看作随机变量 θ 的样本空间,且 θ ~ U [ 0 , 2 π ) ,则可以得

E ( ξ ) = E ( r cos θ ) = 0 2 π ( r cos x ) 1 2 π d x = 0 .

D ( ξ ) = E ( ξ 2 ) ( E ξ ) 2 = E ( ξ 2 ) = 0 2 π ( r 2 ( cos x ) 2 ) 1 2 π d x = r 2 2 .

注:从本例中可以看出,求解随机变量及其分布的有关问题时,选取合适样本空间的重要性。方法一将坐标系上的整个圆周看作样本空间,通过求 ξ 的分布函数和密度函数,进而得到期望和方差;方法二则是运用极坐标,巧妙的选取了平面上的线段作为样本空间,得到了更简便的解题方法。归纳得出,概率问题的求解方法不唯一,很多都是样本空间的选取不同所造成的,在大多数情况下,需要分析题目的要求和随机事件的本质特征,巧妙的选取合适的样本空间,简化运算。

2.4. 样本空间的形态与概率方法的一致性问题

古典概率和几何概率是两种重要的概率模型,如果样本空间的样本点是有限可数的,且每个样本点发生的可能性是相等的,则可以用古典概率模型来描述,而当样本空间为一个可以度量的有界区域,且样本点落在每个子区域是等可能的,与子区域的位置和形状无关,此时的概率模型为几何概型。不难发现,两种概率模型在计算概率时,所用的原理是一样的,即事件发生的概率,等于样本点测度的比值,不同是测度的计算方法是不一样的,这是因为二者所用的样本空间一个是离散的,一个是连续的,这与确定性数学所讨论的可数集合上取值的离散变量和连续区间上取值的连续变量是一致的。

在确定性问题中,离散型变量通常采用无穷级数的方法处理,对连续型变量则通常采用积分方法。概率是研究随机现象变化规律的学科,在初等概率论中,随机事件和概率所涉及的古典概率和条件概率,对应确定性数学中的离散型变量,而对后续随机变量及其分布,其样本空间就发生了变化,采用积分学的办法处理问题,离散和连续两种不同形态普遍存在于数学中,处理方法虽然不同但是可以类比,二者在形态上是一致的。

其实数学的很多问题都是在特定的空间中进行的,如果空间变了,结果就会有所不同,例如教材 [10] 中提及的著名的贝特朗奇论问题,有着三个不同的答案,就是因为在解决同一个问题的时候,所选择的样本空间不同。对古典概率的计算,使用简单计数即可,而几何概率却要通过计算长度、面积和体积等来实现,随机变量及分布要通过积分来实现,差别的主要原因在于样本空间的形态不同,但其方法的本质是一致的,都是测度的计算,事实上,样本空间形态上的差别性和方法上的可类比性贯穿于概率论课程的始终。

3. 本文结论

本文从几个具体例子出发,就几类重要概率论问题求解过程中,如何恰当选取合适的样本空间做了详细的讨论和分析,阐明了在古典概率、几何概率、条件概率中恰当选取样本空间的方法,并介绍了样本空间在随机变量及其分布中的应用,最终得到恰当选取样本空间必要性的结论。通过具体实例,对比选取不同样本空间的解题过程,证明即使在同一问题中,巧妙选取样本空间,会减小计算量,使计算步骤更加简便易懂。本文论证了用概率公式解题时,要保证所求事件样本空间的一致性,如文献 [11] 和 [12] 中所述,对条件概率或其他概率问题,要注意不同样本空间之间的区别,否则会得到错误的求解结果。恰当选取样本空间,不仅能正确分析概率问题,也会对概率论与微积分学相关问题理解更透彻。

本文所研究的问题,是概率论的重要问题,通过本文所阐述的问题,不仅可以提高对样本空间概念的理解,而且对相关概率问题的求解、随机事件、样本空间的形态和概率方法的一致性认识都会有所提高,在一定程度可改善概率论学习的思维方式、提高问题求解的规范表达、加强对解题过程的重视程度等。

基金项目

河南省高校基本科研业务费专项资金(NSFRF200321)和河南理工大学青年骨干教师资助计划项目(2020XQG-03)。

参考文献

[1] 程海奎, 章建跃. 用样本空间刻画随机现象定义随机事件的概率发展学生的随机观念[J]. 数学通报, 2021, 60(5): 1-9.
[2] 邱瑶. “样本点、样本空间和随机事件的表达”教学设计[J]. 中国数学教育, 2021(4): 50-54.
[3] 谭雪莹, 胡典顺. 概率与统计的知识理解之样本空间[J]. 数学通报, 2021(18): 1-3.
[4] 郭华. 恰当选取样本空间, 简化古典概率计算[J]. 高等数学研究, 2000(3): 35-36.
[5] 兰旺森. 概率论教学中与样本空间有关的几个问题[J]. 高师理科学刊, 2017, 37(11): 50-52.
[6] 石亮. 一道几何概型题的探究、变式及引申[J]. 数学教学通讯, 2009(24): 60-61.
[7] 张德然, 何鹏光. 关于古典概率计算中样本空间的构造及优化[J]. 阜阳师范学院学报(自然科学版), 2005, 22(2): 71-74.
[8] 郑玉仙. 缩减样本空间在条件概率计算中的应用[J]. 浙江水利水电专科学校报, 2006, 18(1): 57-58.
[9] 杨洋, 张燕, 居艳. 概率解题中样本空间的选择[J]. 高等数学研究, 2007, 10(1): 96-98.
[10] 茆诗松. 概率论与数理统计教程[M]. 北京: 高等教育出版社, 2004: 48.
[11] Vos, P. and Anaya-Izquierdo, K. (2014) Using Geometry to Select One Dimensional Exponential Families That Are Monotone Likelihood Ratio in the Sample Space, Are Weakly Unimodal and Can Be Parametrized by a Measure of Central Tendency. Entropy, 16, 4088-4100.
https://doi.org/10.3390/e16074088
[12] 王展青, 王传廷, 张富铭, 赵―鹏. 基于有效候选集的支持向量机样本选择方法[J]. 计算机工程与应用, 2008, 44(23): 214-216.