考虑闰年条件的生日问题
Birthday Problem Considering Leap Year Condition
DOI: 10.12677/pm.2025.157204, PDF, HTML, XML,    科研立项经费支持
作者: 吕振华*, 刘 丹:沈阳航空航天大学理学院,辽宁 沈阳
关键词: 概率论古典概型等可能概型生日问题Probability Theory Classical Probability Equal Probability Model Birthday Problem
摘要: 很多概率论教材中有关计算存在两人相同生日概率的问题,也把解决这样的问题作为训练巩固学生理解等可能概率的重要手段。文章讨论了含有闰年情况的相同(不同)生日问题,通过分组方式给出了不同情况下生日不同的概率,并提出了一种非等可能放球的新的盒子模型,丰富了盒子模型理论。
Abstract: Many probability theory textbooks have the problem of calculating the probability that two people have the same birthday, and they also take solving such problems as an important means of training and consolidating students’ understanding of possible probabilities. This paper discusses the problem of the same (different) birthdays with leap years and presents a new box model with unequal possibilities of putting the ball, which enriches the box model theory.
文章引用:吕振华, 刘丹. 考虑闰年条件的生日问题[J]. 理论数学, 2025, 15(7): 40-44. https://doi.org/10.12677/pm.2025.157204

1. 引言

在概率论中,古典概型(等可能概型)是一个重要的内容。等可能概型是概率论最早研究的情形,它与组合数学紧密结合,是概率的最简单分配形式。古典概型的基本思想为([1], p. 15):1) 所涉及的随机现象只有有限个样本点,记为 n ;2) 每个样本点发生的概率(可能性)相同;3) 若事件 A 包含 k 个样本点,则事件 A 发生的概率为:

P( A )= A = k n (1)

因此计算事件的概率转化为了计算样本点的个数。

等可能概型中有一个经典的生日问题([2], p. 11):

问题1.1 n 个人的生日全不相同的概率是多少?

“生日问题”在密码学中有着广泛应用。它为密码学中的生日攻击方法提供了理论依据[3]。很多的教材都把这个问题当成“盒子模型”或“放球模型”的一个经典案例。

定理1.2 (盒子模型) 设有 n 个球,每个球都等可能地被放到 m 个盒子中的任一个,每个盒子所放球数不限。如果 nm ,把 n 个球放到不同的盒子中的概率是 A m n / m n

用上述的盒子模型解决生日问题,我们需要一个前提条件:假设每人的生日在一年365天中的任一天是等可能的。这样很容易得到以下结论。

定理1.3 假设每人的生日在一年365天中的任一天是等可能的。令 n365 ,则 n 个人的生日全不相同的概率是 A 365 n 365 n

定理1.3的结果有趣且有悖于人们的直觉[4] [5]。该结果告诉我们只要人数为57,则存在两人生日相同的概率高达0.9901。当然如果要存在两个人生日相同的概率等于1,则需要366 (或367)个人,这是经典的鸽笼原理(抽屉原理)告诉我们的。

跳出“等可能”的束缚,这个问题本身也是有趣的。那么考虑实际的情况,即某些年份中一年有366天,那么 n 个人的生日全不相同的概率是多少?关于非等可能的生日问题,目前研究的成果较少。只有文献[6]中讨论了每个人在2月29日出生的概率是其他日子出生概率1/4的情况。文献[4]初步讨论了生日概率不均衡(非等可能)的情况。本文研究考虑闰年情况的生日问题,本质上是研究非等可能概型的概率问题。我们提出分组的概念,可以在等可能概型的基础上解决一部分非等可能概率问题。这样的思路在教学上可以拓展学生的思路,锻炼学生的逻辑思维能力,为后续概率模型的学习做好准备和铺垫。

下面介绍闰年的概念:人们在使用历法时发现,随着时间的积累,历法所体现的日历日期与实际季节之间的总会渐行渐远,产生较大误差。这是因为地球公转的时间并不是地球自转时间的正整数倍,即地球公转的时间并不等于365天或者是366天,而是365天5小时48分46秒(合365.242 19天)。因此,为了确保日期与季节之间的对应关系不断保持。人们通过引入闰年的方式,调整日历,使其与地球公转周期保持一致。在现行公历中,闰年为366天,比常规年份多一天,即2月29日。在中国农历中,闰年为包含闰月的年份,比常规年份多一个月。

公元年数能被4整除的年为闰年,其余年为平年。但对整世纪年只有世纪数也能被4整除的才是闰年,其余的虽然年数都能被4整除,但仍为平年,比如2000年是闰年,而1900年不是。每到闰年,在这一年的2月多加一天,即2月29日,全年共366天。即:“四年一闰,百年不闰,四百年再闰”。

本文计算以下两种情况的概率值:1) 每个人出生在其他日子的概率是出生在2月29日概率的4倍;2) 每个人出生在其他日子的概率是出生在2月29日概率的 400 97 倍。并给出一般模型可以计算出生其他日子的概率是出生在2月29日概率的任意倍数(有理数)的情况。最后提供新的非等可能放球的盒子模型,该模型丰富了盒子模型理论。

2. 主要结果

为了说清楚问题1.1,我们从简单的设定开始。假设每四年出现一次2月29日。每个人出生在其他日子的概率是出生在2月29日概率的4倍。2009年,谢彬[6]研究了有闰年的生日问题,并给出这种假设下的准确概率。不过在证明过程中用到了1/4个盒子这样不准确的表达。下面我们通过分组的方式解决这种非等可能生日问题。

定理2.1 假设每个人出生在其他日子的概率是出生在2月29日概率的4倍。令 n365 ,则 n 个人的生日完全不相同的概率是 A 365 n1 × 4 n1 ×( 14643n ) 1461 n

证明 设有 365×4+1=1461 个盒子,分成366组,其中一组只有1个盒子(称为独立组),其他每组都有4个盒子。我们把 n 个球放到这些盒子中,假设每个球放到每个盒子的概率相同。 n 个人的生日全不相同的概率等于把 n 个球放到不同的组中的概率,记为 P n 。分情况讨论:1) 没有球放到独立组中,把 n 个球放到不同的组中有 A 365 n 种放法。考虑到在每个组中有4种选择,所以一共有 A 365 n × 4 n 种放球的方法;2) 有1个球放到独立组的那个盒子中,从 n 个球中取1个放到独立组中,有 n 种情况,接着把 n1 个球放到不同的365组中的各个盒子里,有 A 365 n1 × 4 n1 种放法,因此这种情况共有 A 365 n1 × 4 n1 ×n 种放球的方法。把 n 个球放到这些盒子中,一共有 1461 n 种情况。根据等可能概率模型公式可得:

P n = n× A 365 n1 × 4 n1 + A 365 n × 4 n 1461 n = A 365 n1 × 4 n1 ×( 14643n ) 1461 n (2)

根据定理2.1中的思路,我们可以得到以下结论。

定理2.2 (分组盒子模型) 设有 m 组盒子,每组有 k i 个盒子,其中 i{ 1,2,,m } 。假设每个球放到每个盒子的概率相同,把 n( m ) 个球放到不同组中的概率是:

P= i 1 , i 2 ,, i n {1,2,,m} j=1 n k i j ( i=1 m k i ) n . (3)

证明 根据(1),只须计算总的样本点的个数(把 n 个球等可能放入 i=1 m k i 个盒子有多少种放法),以及事件包含的样本数(把 n 个球等可能放入不同组有多少种放法)。应用组合排列知识,把 n 个球放入 i=1 m k i 个盒子有 ( i=1 m k i ) n 种方法。把 n 个球放入不同的组有 A m n 种放法。注意这里的每种放法(放入不同组)对应不同个的盒子数量。设第一个球放在 i 1 组中,第二个球放入 i 2 组中,以此类推,第 n 个球放在 i n 组中。显然 i 1 , i 2 ,, i n 各不相同。第一个球有 k i 1 个盒子可以等可能放入,因此有 k i 1 放法。以此类推,第二个球有 k i 2 放法……第 n 个球有 k i 1 放法。因此对应一种放入不同组的情况, n 个球有 j=1 n k i j 种放入盒子的方法。因此把所有放入不同组的放法对应的数量求和,可得到把 n 个球等可能放入不同组的各个盒子有 i 1 , i 2 ,, i n {1,2,,m} j=1 n k i j 种方法。应用(1.1)可得(2.2)。 □

根据第一章中对于闰年的描述,如果考虑无尽的漫长岁月,我们只须考虑400年内闰年出现的频率即可。按照现有规律400年(0年~399年)内会出现97次闰年。也就是2月29日出现了97次,而其他的所有日期比如3月5日出现了400次。因此假设每个人出生在其他日子的概率是出生在2月29日概率的 400 97 倍。应用定理2.1中的思路或者直接应用定理2.2,可得以下推论:

推论2.3 假设每个人出生在其他日子的概率是出生在2月29日概率的 400 97 倍。令 n365 ,则 n 个人的生日全不相同的概率是 A 365 n1 × 400 n1 ×( 146400303n ) 146097 n

下面我们将定理1.3 (没有2月29日)、定理2.1 (其他日期出生概率是2月29日出生的4倍)、推论2.3 (其他日期出生概率是2月29日出生的400/97倍)的结果做如下比较。可以发现,定理2.1和推论2.3的结果已经非常接近,差距在十万分之一以内。(表1)

Table 1. Probability of the number of people on the same birthday as at least two people

1. 人数与至少两人同一天生日的概率

人数

不考虑闰年

定理2.1

推论2.3

10

0.116 949

0.116 815

0.116 818

20

0.411 438

0.411 054

0.411 063

30

0.706 316

0.705 865

0.705 877

40

0.891 232

0.890 924

0.890 932

50

0.970 374

0.970 238

0.970 242

60

0.994 123

0.994 083

0.994 084

70

0.999 160

0.999 152

0.999 152

注记 在定理2.1以及推论2.3中,规定每个人出生在2月29日与出生在其他日子的概率之比并非真正的概率比例,而是根据闰年出现的规则得到的相应比例。从理论的角度来说,这样的假定已经足够。如果想计算准确值,那么可以用统计的放法找出每个人出生在不同日期的概率,然后应用定理2.2得到具体概率值。

3. 结论

本文从经典的等可能球放盒子模型出发,得到了不同闰年频率下的相同(不同)生日概率。并进一步给出了一种分组的盒子模型,该模型丰富了盒子模型理论,可以解决一些非等可能的样本点的概率问题。

问题3.1 随机实验有 m 个结果 A 1 , A 2 ,, A m ,每种结果对应的概率为 p 1 , p 2 ,, p m 。独立进行 n 次随机实验,计算至少两次结果相同的概率。假设 nm

思路 想要利用分组的盒子模型解决问题,难点在于如何去构造分组中盒子的数量。不妨设 p 1 , p 2 ,, p m 都是有理数(如果存在无理数可以取近似值化为有理数),不失一般性。假设对于 i=1,2,,m p i = k i N ,其中 N= i=1 m k i k i 为正整数,构造如下模型:有 n 个球,放到 m 组盒子中,每组中盒子的数量为 k i i=1,2,,m 。显然问题3.1的结果等于 n 个球放到不同组的概率,根据定理2.2,结果为 1 i 1 , i 2 ,, i n {1,2,,m} j=1 n k i j N n

本文研究了非可能概率问题,把给定的不同概率转化为不同分组对应的盒子数,把一些概率问题转化为分组的盒子模型。既推广了盒子模型理论,也为一些非等可能概率问题找到了解决办法。

基金项目

本文受辽宁省教育厅面上项目(JYTMS20230281)、广西省自然科学基金面上项目(2023GXNSFAA026514)资助。

NOTES

*通讯作者。

参考文献

[1] 茆诗松, 程依明, 濮晓龙. 概率论与数理统计教程(第三版) [M]. 北京: 高等教育出版社, 2019: 15.
[2] 盛骤, 谢式千, 潘承毅. 概率论与数理统计(第四版) [M]. 北京: 高等教育出版社, 2008.
[3] 喻秋叶. 生日悖论在密码学中的应用[D]: [硕士学位论文]. 武汉: 华中科技大学, 2013.
[4] 徐付霞, 常虹. 概率统计实验实践教学案例——生日问题[J]. 高等教育研究, 2017, 20(1): 121-123+125.
[5] 刘天昕, 耿凤杰, 赵俊芳. 非均匀分布下生日问题的模拟研究[J]. 计算机应用, 2015, 35(S2): 38-40.
[6] 谢彬. 生日概率的准确计算[J]. 内江科技, 2009, 30(8): 133-133.