1. 引言
概率论是研究复杂随机现象规律的有效方法和工具,近年来,随着社会上人们对随机现象的不断观察和研究,概率论的应用受到了越来越多的关注。事实上,在现实生活中很少存在单一的不受别的事件影响的情况,对于很多随机现象的研究往往有着一定的约束条件,比如,当今热门的大数据和微博热搜,因此,人们在利用概率论的理论知识去研究生活中的随机现象时往往离不开条件分布及其数字特征。
条件分布是概率论中最重要和最基本的概念之一,它描述了随机变量之间不独立时,已知其中一个随机变量发生的条件下另一随机变量的概率分布问题,在计算科学、信息网络等领域都有广泛的应用。条件期望刻画了已知一个随机变量发生的条件下另一随机变量取值的平均水平,它在随机过程和鞅的研究中是必不可少的工具,而且在统计、金融等领域发挥了极大的作用。
众所周知,在有关随机变量的问题上,我们往往需要计算期望、方差、分位数等特征数,这些特征数各从一个侧面描述了该分布的特征,例如,方差描述了随机变量取值的平均“波动”程度。那么在条件分布已知时,我们也可以计算得到条件方差等一系列特征数,从而更好的了解其分布特性。但是,现有理论中仅仅对条件期望的定义和性质做出了阐述,并未提及有关条件分布的其他特征数。
在已有的理论型文章中,文 [1] [2] 系统阐述了条件概率、条件分布与条件期望的定义和性质;文 [3] 从概率空间及事件域意义下解释了条件概率和条件分布的定义;文 [4] 对条件期望的性质及不同情形下的求法做出了详细分析;文 [5] 利用条件概率的定义,由随机变量分布函数的性质,给出了一般情形下条件分布函数的定义;文 [6] 探讨了条件分布的概念、与随机变量的独立性的关系及在条件期望中的应用;文 [7] 从几何角度揭示了边缘分布条件分布的几何意义;文 [8] 通过举例介绍当二维连续型随机变量的边缘密度函数为0时,相应的条件分布函数可能为连续型分布、离散型分布,还可能是非连续型非离散型分布。
鉴于此,本文对条件分布与条件数字特征进行了探讨,各个章节的具体安排如下:
第一章,我们简要的回顾了条件分布及其数字特征的研究背景和现状并介绍了文章的具体结构。
第二章,首先介绍了经典条件分布的定义,并且得到了全概率公式的密度函数形式和分布函数形式;然后,我们进一步给出了扩展条件分布的定义,即任一非零概率事件成立的条件下分布函数的一般性定义,并且通过例子给出了具体条件下的一些定义。
第三章,首先介绍了条件期望的定义和性质,并且在现有内容的基础上推广得到了某些新的性质,例如,重期望公式的全概率形式,同时给予了证明。此外,还定义了条件方差并证明了其性质。
第四章,我们提出了进一步需要研究的相关问题,对未来的研究工作做了展望。
本文的创新点在于对已有内容做了推广,定义了一般条件下的条件分布函数,给出了条件方差的定义和性质,并且得到了全概率公式的分布函数形式和重期望公式的全概率形式,值得推广应用。
2. 条件分布
2.1. 经典条件分布
条件分布是研究变量之间相依关系的一个有力工具,它描述了随机变量之间不独立时,已知其中一个随机变量发生的条件下另一随机变量的概率分布问题。下面给出经典的条件分布函数、条件密度函数的定义及全概率公式的密度函数形式等内容。
设
是二维离散型随机变量,其联合分布列为
,
,
定义2.1.1:对一切使得
的
,称给定
条件下X的条件分布列和条件分布函数分别为
,
(2.1.1)
(2.1.2)
设
是二维连续型随机变量,其联合密度函数为
,边际密度函数为
,
。
定义2.1.2 [1] :对一切使得
的y,给定
条件下X的条件分布函数和条件密度函数分别为
(2.1.3)
(2.1.4)
注:当
或
时,概率论中并未给出明确的定义。事实上,当
或
时,条件分布可能为连续型分布、离散型分布和既非连续又非离散型分布,例如,设二维连续型随机变量
的联合密度函数为
,求在
条件下X的条件分布。经计算
,
,由于
,所以X和Y相互独立,其条件分布就是无条件分布,故在
条件下X的条件密度为
。
有了条件分布密度函数的概念,顺便给出连续随机变量场合下全概率公式和贝叶斯公式的密度函数形式,先将(2.1.4)式改写成
(2.1.5)
再对
求边际密度函数,即得如下定理:
定理2.1.1 (全概率公式的密度函数形式)
(2.1.6)
有了联合密度函数
和边际密度函数
,很容易即可得到如下定理:
定理2.1.2 (贝叶斯公式的密度函数形式)
(2.1.7)
根据全概率公式的密度函数形式,我们很容易可以推广到分布函数上,即得:
定理2.1.3 (全概率公式的分布函数形式)
(2.1.8)
证明:
结论得证。
2.2. 扩展条件分布
以上定义的条件分布及条件密度函数等都是在给定
条件下给出的,如果将所定义的条件延伸为任一事件的发生,分布函数、密度函数的定义会有什么样的变化呢?下面我们首先给出B事件发生条件下X的条件分布函数的一般性定义。
定义2.2.1由条件概率,记
,B为任一概率非零事件,即
,则称
(2.2.1)
为B事件发生条件下X的条件分布函数。
下面通过举例给出几个具体条件下的定义。
例2.2.1:设
是随机变量,由定义2.2.1我们可进一步分连续和离散两种情况给出
条件下X的条件分布函数和相应的条件密度函数。
当
为二维连续型随机变量时,对一切使得
的y,称
(2.2.2)
为给定
条件下X的条件分布函数。
原来的条件密度函数是利用取极限和中值定理得到的,这里的条件密度函数通过求导的方式来给出,如下:
(2.2.3)
当
为二维离散型随机变量时,对一切使得
的y,称
(2.2.4)
为给定
条件下X的条件分布函数。
相应的条件分布列为
(2.2.5)
注意到,这里只给出了给定
条件下X的条件分布函数以及连续场合的条件密度函数、离散场合的条件分布列,我们可以把这个事件定义为任意一个区间,例如,
,在实际问题中,可以根据情况的不同进行定义。
例2.2.2:设随机变量X的密度函数为
,求
条件下X的条件分布函数。
解:考虑到需满足
,这里分析三种情况:
1) 当
时,
2) 当
时,
3) 当
时,
以上便给出了
条件下X的条件分布函数。
例2.2.3:设X和Y是相互独立的随机变量,且
,
。在已知
的条件下,求X的条件分布函数。
解:
又知在
条件下,X服从二项分布
,其中
,则
其中
,上式便给出了
条件下X的条件分布函数。
3. 条件分布下的数字特征
3.1. 条件期望
条件期望在概率论及现实生活中用途广泛,近年来随着研究的深入,条件期望在很多领域中都得到了应用,并取得了很好的效果。下文详细介绍了有关条件期望的定义、性质和重期望公式等,并基于上一章的内容,给出了重期望公式的全概率形式。
定义3.1.1:设
是二维连续型随机变量,对于一切使得
的y,若
,则称
(3.1.1)
为给定
条件下X的条件数学期望。
定义3.1.2:设
是二维连续型随机变量,对于一切使得
的y,若
,则称
(3.1.2)
为给定
条件下X的条件数学期望。
我们特别要强调的是:
是y的函数,对y的不同取值,
的取值也在发生变化,而
是随机变量Y的函数,可以将
看成是
时
的一个取值。
性质3.1.1:设X,Y是随机变量,
,
是实函数,且以下涉及的数学期望均存在,则
,
,
(3.1.3)
(3.1.4)
(3.1.5)
当X,Y独立时,
(3.1.6)
定理3.1.1 [1] (重期望公式):设
是二维随机变量,且
存在,则
(3.1.7)
重期望公式的用途在于当计算X的均值较困难时,借助一个与X有关的量Y,用Y的不同取值把X的取值划分成若干个小区域,先在小区域上求X的平均,再以此类平均求加权平均,即可得X的均值EX。
上一章给出了给定
条件下X的条件分布函数和密度函数,我们很容易联想到Y取值于某一区间条件下X的条件分布函数和密度函数,考虑到重期望公式在该条件下的表示,很容易即得:
定理3.1.2 (重期望公式的全概率形式):设
是随机变量,且
存在,若存在
,且
,则
(3.1.8)
其中,最简单的形式为
(3.1.9)
证明:这里仅给出(3.1.9)式的证明,(3.1.8)同理可证。
当
为二维连续随机变量时,
将结果代入(3.1.9)式可得
离散场合证明类似,故结论得证。
注:定理3.1.2是重期望公式的另一种表达形式,实际与重期望公式是一致的。当随机变量Y在不同区间取值时,若X有不同的分布形式,此时借助该定理去求解会更容易,若X有相同的分布形式,该定理只是通过分区间求期望再累加的方式进行求解,与单点求期望再积分或累加是一致的。
推论3.1.1 设
是随机变量,
为实函数,若
存在,则
(3.1.10)
特别地,
(3.1.11)
此外,根据中心矩与原点矩的关系,同理可求得X的k阶中心矩。
性质3.1.2 设X,Y,Z是随机变量,
是实函数,且以下涉及的数学期望均存在,则
(3.1.12)
(3.1.13)
(3.1.14)
(3.1.15)
证明:在此仅给出上述四条性质在连续场合的证明,离散场合的证明可类似得出。设二维连续随机变量
的联合密度函数为
,
条件下X的条件密度函数为
。
1)
2)
3)
4) 假设给定
时,
的条件密度函数为
,给定
和
时,Z的条件密度函数为
,且
成立。
由(2)可得
当
时,
故
从而可得
证毕。
定理3.1.3 [2] :设
是随机变量,且
,对于任何实函数
,都有
(3.1.16)
定理3.1.3给出了均方意义下,已知随机变量Y的条件下,X的最优预测为
,该定理可以解决一系列的预测问题,它在当前的经济发展中发挥了不可或缺的作用。
3.2. 条件方差
条件期望
是给定Y条件下随机变量X的分布的一种位置特征数,但该位置特征数无法反映出给定Y条件下X取值的“波动”程度,以下定义了度量此种“波动”程度大小的条件方差,并对其性质给予了证明。
定义3.2.1:设
是二维随机变量,若
,则称
(3.2.1)
为Y已知时X的条件数学方差,简称为条件方差。
性质3.2.1:条件方差具有如下性质:
(3.2.2)
,
(3.2.3)
,
(3.2.4)
(3.2.5)
证明:假设以下涉及的期望及方差均存在。
1)
2)
3)
4)
证毕。
4. 展望
本论文虽然在已有内容的基础上推广得到了一些结论,但随着条件分布及其数字特征的理论的深入研究,今后还有很多相关的内容值得我们去探讨。比如:分布函数和特征函数是一一对应的,那么条件分布函数的特征函数怎样去表示,它具有怎样的性质呢?希望有关条件分布的理论日益完善,并且得到越来越广泛的应用。