1. 引言
在概率论中,古典概型(等可能概型)是一个重要的内容。等可能概型是概率论最早研究的情形,它与组合数学紧密结合,是概率的最简单分配形式。古典概型的基本思想为([1], p. 15):1) 所涉及的随机现象只有有限个样本点,记为
;2) 每个样本点发生的概率(可能性)相同;3) 若事件
包含
个样本点,则事件
发生的概率为:
(1)
因此计算事件的概率转化为了计算样本点的个数。
等可能概型中有一个经典的生日问题([2], p. 11):
问题1.1
个人的生日全不相同的概率是多少?
“生日问题”在密码学中有着广泛应用。它为密码学中的生日攻击方法提供了理论依据[3]。很多的教材都把这个问题当成“盒子模型”或“放球模型”的一个经典案例。
定理1.2 (盒子模型) 设有
个球,每个球都等可能地被放到
个盒子中的任一个,每个盒子所放球数不限。如果
,把
个球放到不同的盒子中的概率是
。
用上述的盒子模型解决生日问题,我们需要一个前提条件:假设每人的生日在一年365天中的任一天是等可能的。这样很容易得到以下结论。
定理1.3 假设每人的生日在一年365天中的任一天是等可能的。令
,则
个人的生日全不相同的概率是
。
定理1.3的结果有趣且有悖于人们的直觉[4] [5]。该结果告诉我们只要人数为57,则存在两人生日相同的概率高达0.9901。当然如果要存在两个人生日相同的概率等于1,则需要366 (或367)个人,这是经典的鸽笼原理(抽屉原理)告诉我们的。
跳出“等可能”的束缚,这个问题本身也是有趣的。那么考虑实际的情况,即某些年份中一年有366天,那么
个人的生日全不相同的概率是多少?关于非等可能的生日问题,目前研究的成果较少。只有文献[6]中讨论了每个人在2月29日出生的概率是其他日子出生概率1/4的情况。文献[4]初步讨论了生日概率不均衡(非等可能)的情况。本文研究考虑闰年情况的生日问题,本质上是研究非等可能概型的概率问题。我们提出分组的概念,可以在等可能概型的基础上解决一部分非等可能概率问题。这样的思路在教学上可以拓展学生的思路,锻炼学生的逻辑思维能力,为后续概率模型的学习做好准备和铺垫。
下面介绍闰年的概念:人们在使用历法时发现,随着时间的积累,历法所体现的日历日期与实际季节之间的总会渐行渐远,产生较大误差。这是因为地球公转的时间并不是地球自转时间的正整数倍,即地球公转的时间并不等于365天或者是366天,而是365天5小时48分46秒(合365.242 19天)。因此,为了确保日期与季节之间的对应关系不断保持。人们通过引入闰年的方式,调整日历,使其与地球公转周期保持一致。在现行公历中,闰年为366天,比常规年份多一天,即2月29日。在中国农历中,闰年为包含闰月的年份,比常规年份多一个月。
公元年数能被4整除的年为闰年,其余年为平年。但对整世纪年只有世纪数也能被4整除的才是闰年,其余的虽然年数都能被4整除,但仍为平年,比如2000年是闰年,而1900年不是。每到闰年,在这一年的2月多加一天,即2月29日,全年共366天。即:“四年一闰,百年不闰,四百年再闰”。
本文计算以下两种情况的概率值:1) 每个人出生在其他日子的概率是出生在2月29日概率的4倍;2) 每个人出生在其他日子的概率是出生在2月29日概率的
倍。并给出一般模型可以计算出生其他日子的概率是出生在2月29日概率的任意倍数(有理数)的情况。最后提供新的非等可能放球的盒子模型,该模型丰富了盒子模型理论。
2. 主要结果
为了说清楚问题1.1,我们从简单的设定开始。假设每四年出现一次2月29日。每个人出生在其他日子的概率是出生在2月29日概率的4倍。2009年,谢彬[6]研究了有闰年的生日问题,并给出这种假设下的准确概率。不过在证明过程中用到了1/4个盒子这样不准确的表达。下面我们通过分组的方式解决这种非等可能生日问题。
定理2.1 假设每个人出生在其他日子的概率是出生在2月29日概率的4倍。令
,则
个人的生日完全不相同的概率是
。
证明 设有
个盒子,分成366组,其中一组只有1个盒子(称为独立组),其他每组都有4个盒子。我们把
个球放到这些盒子中,假设每个球放到每个盒子的概率相同。
个人的生日全不相同的概率等于把
个球放到不同的组中的概率,记为
。分情况讨论:1) 没有球放到独立组中,把
个球放到不同的组中有
种放法。考虑到在每个组中有4种选择,所以一共有
种放球的方法;2) 有1个球放到独立组的那个盒子中,从
个球中取1个放到独立组中,有
种情况,接着把
个球放到不同的365组中的各个盒子里,有
种放法,因此这种情况共有
种放球的方法。把
个球放到这些盒子中,一共有
种情况。根据等可能概率模型公式可得:
(2)
□
根据定理2.1中的思路,我们可以得到以下结论。
定理2.2 (分组盒子模型) 设有
组盒子,每组有
个盒子,其中
。假设每个球放到每个盒子的概率相同,把
个球放到不同组中的概率是:
. (3)
证明 根据(1),只须计算总的样本点的个数(把
个球等可能放入
个盒子有多少种放法),以及事件包含的样本数(把
个球等可能放入不同组有多少种放法)。应用组合排列知识,把
个球放入
个盒子有
种方法。把
个球放入不同的组有
种放法。注意这里的每种放法(放入不同组)对应不同个的盒子数量。设第一个球放在
组中,第二个球放入
组中,以此类推,第
个球放在
组中。显然
各不相同。第一个球有
个盒子可以等可能放入,因此有
放法。以此类推,第二个球有
放法……第
个球有
放法。因此对应一种放入不同组的情况,
个球有
种放入盒子的方法。因此把所有放入不同组的放法对应的数量求和,可得到把
个球等可能放入不同组的各个盒子有
种方法。应用(1.1)可得(2.2)。 □
根据第一章中对于闰年的描述,如果考虑无尽的漫长岁月,我们只须考虑400年内闰年出现的频率即可。按照现有规律400年(0年~399年)内会出现97次闰年。也就是2月29日出现了97次,而其他的所有日期比如3月5日出现了400次。因此假设每个人出生在其他日子的概率是出生在2月29日概率的
倍。应用定理2.1中的思路或者直接应用定理2.2,可得以下推论:
推论2.3 假设每个人出生在其他日子的概率是出生在2月29日概率的
倍。令
,则
个人的生日全不相同的概率是
。
下面我们将定理1.3 (没有2月29日)、定理2.1 (其他日期出生概率是2月29日出生的4倍)、推论2.3 (其他日期出生概率是2月29日出生的400/97倍)的结果做如下比较。可以发现,定理2.1和推论2.3的结果已经非常接近,差距在十万分之一以内。(表1)
Table 1. Probability of the number of people on the same birthday as at least two people
表1. 人数与至少两人同一天生日的概率
人数 |
不考虑闰年 |
定理2.1 |
推论2.3 |
10 |
0.116 949 |
0.116 815 |
0.116 818 |
20 |
0.411 438 |
0.411 054 |
0.411 063 |
30 |
0.706 316 |
0.705 865 |
0.705 877 |
40 |
0.891 232 |
0.890 924 |
0.890 932 |
50 |
0.970 374 |
0.970 238 |
0.970 242 |
60 |
0.994 123 |
0.994 083 |
0.994 084 |
70 |
0.999 160 |
0.999 152 |
0.999 152 |
注记 在定理2.1以及推论2.3中,规定每个人出生在2月29日与出生在其他日子的概率之比并非真正的概率比例,而是根据闰年出现的规则得到的相应比例。从理论的角度来说,这样的假定已经足够。如果想计算准确值,那么可以用统计的放法找出每个人出生在不同日期的概率,然后应用定理2.2得到具体概率值。
3. 结论
本文从经典的等可能球放盒子模型出发,得到了不同闰年频率下的相同(不同)生日概率。并进一步给出了一种分组的盒子模型,该模型丰富了盒子模型理论,可以解决一些非等可能的样本点的概率问题。
问题3.1 随机实验有
个结果
,每种结果对应的概率为
。独立进行
次随机实验,计算至少两次结果相同的概率。假设
。
思路 想要利用分组的盒子模型解决问题,难点在于如何去构造分组中盒子的数量。不妨设
都是有理数(如果存在无理数可以取近似值化为有理数),不失一般性。假设对于
有
,其中
且
为正整数,构造如下模型:有
个球,放到
组盒子中,每组中盒子的数量为
,
。显然问题3.1的结果等于
个球放到不同组的概率,根据定理2.2,结果为
。
本文研究了非可能概率问题,把给定的不同概率转化为不同分组对应的盒子数,把一些概率问题转化为分组的盒子模型。既推广了盒子模型理论,也为一些非等可能概率问题找到了解决办法。
基金项目
本文受辽宁省教育厅面上项目(JYTMS20230281)、广西省自然科学基金面上项目(2023GXNSFAA026514)资助。
NOTES
*通讯作者。