1. 引言
随机变量函数的分布是现行概率论教材 [1] 中的重要章节,在实际应用和课程练习中意义重大,同时也是高校师生必须掌握的教学重点、学习难点。那么,如何定义随机变量函数的分布?如何对其进行分类?如何熟练运用各种解题方法?虽然大多数教科书已涉及上述问题并予以说明,但知识点的分布较杂、较散,而现有研究多从思路延伸和教学设计角度探讨上述问题,如生志荣 [2] 通过偏导数的思想给出求解二维连续型随机变量函数分布的一般化定理;马醒花 [3] 等给出了n维连续型随机变量函数分布的解法。两位学者均在一定程度上弥补了教材缺陷。而藏鸿雁 [4] 等以一维连续型随机变量函数的分布为基础展开教学设计,为课程教学提供新板块。但上述教材内容与各学者的研究鲜对其系统进行归纳。故本文结合教材中涉及的随机变量函数的知识点,在对其分类汇总的基础上,优化解题技巧,拓展解题方法,使问题易于理解,计算更为方便。
文章的主要内容将系统介绍一维和二维随机变量函数分布的常规解法,并重点利用一维数轴降维处理二维连续型随机变量函数的分布,同时引入国外教材“总–分–总”的解题思路与国内解法对比分析,在此基础上给出合理解题路径选择。
2. 一维随机变量函数的分布
2.1. 一维离散型随机变量函数的分布
设X是离散型随机变量,其分布律为:
(1)
若存在随机变量Y,使得
,则Y的分布律为:
(2)
例1 已知随机变量X的分布律为:
.
设
,试求随机变量Y的分布律。
解:由X的取值可确定Y的取值:
故:
.
,
,
.
故离散型随机变量Y的分布律如表1所示:
故离散型随机变量Y的分布律如表1所示。
2.2. 一维连续型随机变量函数的分布
2.2.1. 分布函数法
分布函数法是求解一维连续型随机变量函数分布的最常见解法,其核心思想是“替换”。设连续型随机变量具有概率密度
,
,试求
的概率密度。解题思想如下:
1) 利用X的概率密度不为0的区间,确定Y的概率密度不为0的区间。即将
,
代入
,确定y的两个分段点。再对
求导,若极值在区间内存在,则极值也是一个分段点。找到分段点有助于对y分类讨论。
2) 在上述区间内建立随机变量Y的分布函数
,即概率
。
3) 通过等价变形转化为用X的分布函数表示的
。
4) 对y求导,得到区间上Y的概率密度。
下面以一个例题进行具体说明:
例2 设随机变量X的概率密度为:
求随机变量
的概率密度。
解:由题可知,当x取值
时,y取值
情形一当
时,
,
情形二当
时,
,
情形三当y取值
时,Y的分布函数和概率密度为:
,
,
综上,
的概率密度为:
2.2.2. 公式法
定理1 [1] 设随机变量X具有概率密度
,设函数
处处可导且
或
恒成立。则
是连续型随机变量,其概率密度为:
(3)
其中,
,
。
是
的反函数。
例3 设随机变量
,试证明X的线性函数
也服从正态分布。
证:由题可知,X的概率密度为:
,
现有
,由此可得
,且有
,进一步推出
的概率密度为:
,
即:
,
即有:
.
证毕,并由此可得出一个重要结论:服从正态分布的随机变量的线性函数仍然服从正态分布,只是分布的参数不同。
3. 二维随机变量函数的分布
在利用随机变量函数的分布解决实际问题时,通常会引入不止一个已知变量确定一个未知变量的概率密度。例如,令X和Y分别表示一个人的年龄和体重,Z表示该人的血压,并且已知Z与X,Y的函数关系
,如何通过X,Y的分布确定Z的分布,便是二维随机变量函数的分布解决的问题。
3.1. 二维离散型随机变量函数的分布
3.1.1. 二维离散型随机变量函数的分布的一般求法
若二维离散型随机变量的联合分布律为:
(4)
则随机变量
的分布律为:
(5)
例4 设二维离散型随机变量
的联合分布律如表2所示,试求
的函数分布

Table 2. Distribution of two-dimensional discrete random variable ( X , Y )
表2. 二维离散型随机变量
的联合分布律
解:穷举出
的取值,进一步得到与之对应的:

Table 3. Probability corresponding to different values of ( X , Y )
表3.
不同取值对应的概率
将表3的同一取值的概率相加,得表4中
的分布律:

Table 4. Distribution of X − 2 Y
表4.
的分布律
3.1.2. 二维离散型随机变量的卷积公式
事件
可分解为若干个互不相容事件的和事件,即:
,
.
若X与Y相互独立,则:
(6)
或
(7)
这两个式子被称为离散型随机变量的卷积公式。一般而言,当X,Y的分布律无法用表格的形式表现出时,卷积公式是有效的解题思路,下面以例5进行说明:
例5 设X和Y相互独立,
,
,试证:
证:
的取值为
,对于
,有:
证毕,并由此推广:设
相互独立,
,
,则:
.
3.2. 二维连续型随机变量函数的分布
3.2.1. 分布函数法
与解决一维连续型随机变量函数的分布的分布函数法相同,利用分布函数法解决二维连续型随机变量函数的分布针对所有的函数分布均适用,是最常见的解题方法。此方法的一般步骤为:
1) 确定X,Y的联合概率密度
。
2) 由联合密度函数不为0的区域确定
的取值范围,即Z的概率密度不为0的区间。通常利用线性规划或非线性规划的方式确定Z的有效区间。
3) 在此区间上计算Z的分布函数
。
4) 在此区间上分布函数
对z求导,得到Z的概率密度
,在其他区间上
。
下面以例6进行具体说明:
例6 设连续型随机变量
的联合概率密度为:
试求
、
的概率密度
解:针对
由题可知,当
,
时,
的值域为
。下面利用图1进行说明:

Figure 1. Distribution of
图1.
的分布情况
情形一当
时,有效积分区域为
,Z的分布函数为:
,
故Z的概率密度为:
.
情形二当
时,有效积分区域为
,等价于
,故Z的分布函数为:
故Z的概率密度为:
.
情形三当
时,
,从而
。
情形四当
时,
,从而
。
综上所述,
的概率密度为:
针对
:
由题可知,当
,
时,
的值域为
。下面利用图2,分情况讨论Z的概率密度:

Figure 2. Distribution of
图2.
的分布情况
情形一当
时,有效积分区域为
,Z的分布函数为:
,
故Z的概率密度为:
.
情形二当
时,
,从而
。
情形三当
时,
,从而
。
综上所述,
的概率密度为:
3.2.2. 二维连续型随机变量各种特殊分布的概率密度
现行概率论教材在阐述两个随机变量的函数分布时,只就有限个具体的函数进行讨论。由于各函数解法类似,本文仅针对部分类型详细说明。针对此类题型可利用公式法求解。教材及配套练习虽简化了计算步骤,但在确定单个未知参数取值范围时所用方法较抽象,易出错。本文在采用公式法解题的基础上,利用几何画板画出一维数轴,分别作出x取值范围不同的一维图形,通过数形结合的方式判断两者是否存在交集,进一步推导出一重积分的有效积分区域。
1)
的分布
的分布函数为:
,
令
,有:
故Z的概率密度函数为:
(8)
或:
(9)
若
相互独立,则
的概率密度为:
(10)
或:
(11)
这两个公式称为
和
的卷积公式。下面利用卷积公式求解例6中
的概率密度。
解:由卷积公式得:
,
且
的联合概率密度为:
故:
情形一当
时,如图3中数轴所示,取值范围分别为
和
的未知参数x存在交集
,即有效积分区域为
:
故Z的概率密度为:
.
情形二当
时,如图4中数轴所示,取值范围分别为
和
的未知参数x存在交集
,即有效积分区域为:
故Z的概率密度为:
.
情形三当
和
时,如图5、图6所示,取值范围分别为
和
的未知参数x相互之间不存在交集,即有效积分区域不存在,故
。
综上所述,
的概率密度为:
2)
的分布
的概率密度为:
(12)
若
相互独立,则
的概率密度为:
(13)
下面利用此公式求解例6中
的概率密度:
解:由题可知:
,
且
的联合概率密度为:
故:
情形一当
时,如图7中数轴所示,取值范围分别为
和
的未知参数x存在交集
,即有效积分区域为
:
故Z的概率密度为:
.
情形二当
时,此时z的取值范围不在自身的定义域内。故有效积分区域不存在,
。
情形三当
时,如图8所示,取值范围分别为
和
的未知参数x相互之间不存在交集,即有效积分区域不存在,故
。
综上所述,
的概率密度为:
3)
的分布
的概率密度为:
(14)
若
相互独立,则
的概率密度为:
(15)
4)
和
的分布
设
是相互独立的随机变量,它们的分布函数分别为
,
则有:
(16)
(17)
若
独立同分布,则有:
(18)
(19)
3.3. 二维连续型随机变量函数的分布解法拓展
3.3.1. 对常见分布的二维连续型随机变量函数分布的一般化
定理2 [2] 设二维随机变量
的联合密度函数为
,对任一给定的二元连续实函数
满足:
1) 存在唯一的
。
2)
即
存在。
则随机变量
的函数
的概率密度为:
(20)
若
相互独立,则
的概率密度为:
(21)
同理,若对任一给定的二元连续实函数
满足:
3) 存在唯一的
。
4)
即
存在。
则随机变量
的函数
的概率密度为:
(22)
若
相互独立,则
的概率密度为:
(23)
利用此定理,可以将众多特殊分布的解法一般化。读者有兴趣可尝试求解例6。
3.3.2. 国外教材解二维连续型随机变量函数的分布 [5]
与国内流行教材“总–分”的解题思路不同,国外教材的思路偏向“总–分–总”。设连续型随机变量
的联合概率密度为
,另设连续型随机变量
的联合概率密度为
,且有:
,
或
,
。则
的概率密度
,
的解题思路如图9所示:

Figure 9. Thinking of solving the problem in domestic and foreign textbooks
图9. 国内外教材的解题思路
下面给出国外教材对此问题的解题步骤:
1) 求出
的联合分布
:
(24)
其中:
.
2) 求出单一变量的边缘密度:
(25)
下面利用该解法求解例7 [5] :
例7 设二维连续型随机变量
的联合概率密度为:
且存在连续型随机变量
,
,试求
的概率密度。
解:由题可知,
,
,有效积分区域如图10中
所示:
通过计算得出反函数:
,
利用矩阵与雅可比行列式求出
,进而求出
:
,
对
积分,便可得
的边缘密度
:
.
相较国内流行解法,通过该解题步骤可得出所求随机变量的联合概率密度,再对其求积分得出每个二维连续型随机变量的边缘密度。在处理类似问题时,“总–分”的解题思想存在一定的局限性,因为无法通过边缘密度推导出联合密度。而“总–分–总”的解题思想弥补了“总–分”思想的不足。且国内大多数概率论试题未涉及求解上述复合函数的知识点,引入该思想有助于国内高校师生发现新的数学问题,拓宽新的解题路径;但该解法存在较强的局限性,主要表现在:1) 对于需要分类讨论的概率密度适用性低;2) 若所求反函数以根式、非单一函数等形式出现,将极大增加计算量与计算难度,降低解题效率。以上局限性体现在对例6的反函数求解过程中:
,
.
若继续计算,则很可能无法求解出正确结果,此时采用分布函数法或公式法最佳。综上所述,国内外解题思路各有利弊,不存在“最优方法”之说。面对具体问题进行具体分析才是最佳解题策略。
3.3.3. n维随机变量函数的分布 [3]
设n维随机变量
的联合概率密度为
,且存在
,则随机变量函数
的概率密度函数解法为:
1) 求出y的分布函数
:
(26)
2) 求出
关于y的一阶导,有:
(27)
由于n维随机变量函数的分布在实际应用和课程练习中涉及较少,本文不对此展开详细说明,读者有兴趣可自行练习。
4. 结论
本文将各类随机变量函数的分布归纳总结,并基于二维连续型随机变量函数的分布,利用数轴法、公式法和引入国外教材的解题思路进行优化拓展,最终给出最优解题路径选择:若求解新变量的联合概率密度,则采用国外教材“总–分–总”的解题思路;若求解单一新变量的概率密度,不对联合概率密度作要求时,优先考虑公式数轴法和分布函数法,若原分布函数形式复杂,难以积分,选择公式数轴法,反之二者均可。作者衷心希望本文能对今后高校师生在随机变量函数分布方面的教学与学习提供一定的帮助。
致谢
作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见。
基金项目
新疆维吾尔自治区科技厅–创新环境(人才、基地)建设专项–自然科学计划(自然科学基金)–面上项目(XQZX20210022)。
参考文献
NOTES
*通讯作者。