有关正态分布广义积分计算的一些注记
Some Notes on the Generalized Integral Cal-culation of the Normal Distribution
DOI: 10.12677/AAM.2023.126297, PDF, HTML, XML, 下载: 163  浏览: 1,339  科研立项经费支持
作者: 赵雯雪, 屈志扬, 侯 文*:辽宁师范大学数学学院,辽宁 大连
关键词: 正态分布广义积分含参变量积分Normal Distribution Improper Integral Integral with Parameters
摘要: 正态分布是概率论与数理统计中最重要的一个分布,而且有关正态分布的积分计算是比较常见的运算。本文主要利用不定积分公式和含参变量积分的方法,推导了若干有关正态分布的广义积分公式,并应用这些公式解决一些计算难度较大的问题。
Abstract: Normal distribution is the most important distribution in probability theory and mathematical sta-tistics, and the integral calculation of the normal distribution is a relatively common operation. This paper mainly uses the indefinite integral formula and the integral method with parametric varia-bles to derive some generalized integral formulas about normal distribution, and applies these formulas to solve some difficult calculation problems.
文章引用:赵雯雪, 屈志扬, 侯文. 有关正态分布广义积分计算的一些注记[J]. 应用数学进展, 2023, 12(6): 2951-2957. https://doi.org/10.12677/AAM.2023.126297

1. 引言

在概率分布中,正态分布是最重要的分布,也是应用最广泛的分布。有关正态分布的计算问题和若干性质,对概率论与数理统计的理论研究和实际应用有着重要意义。由于正态分布的概率密度含有 e x 2 2 ,因此其分布函数并不是一个初等函数,所以,有关正态分布的计算并不能直接应用常规积分方法求解,而是利用已有的有关 e x 2 2 的广义积分的结果,利用标准化方法化为标准正态分布方法求解。在求解有关正态分布的数字特征以及一些性质时,通过拼凑正态分布密度函数的归一化方法和已有的相关性质得以解决。在常用的概率论与数理统计教材和教学参考书中,对于标准正态分布的概率密度函数 ϕ ( x ) 和分布函数 Φ ( x ) 的性质和有关的计算都有详细的讨论 [1] [2] 。也有学者从更具体的问题探讨正态分布的有关计算与性质,见文献 [3] 和文献 [4] 等。另一方面,利用正态分布可以在拓广计算广义积分的计算方法,如文献 [5] 和文献 [6] 分别讨论了利用正态分布求解若干类型广义积分问题。

事实上,探究广义积分的方法与正态分布的有关计算有着密切联系。本文受文献 [7] 的启发,利用对含参变量积分广义积分采用积分号下求导方法,进一步讨论了对于标准正态分布的概率密度函数 ϕ ( x ) 及其分布函数 Φ ( x ) 的有关的积分问题,总结和归纳了若干有关正态分布的广义积分公式,并对其进行推导,也举例说明了这些公式在概率论与数理统计中的一些应用,使解决问题更容易,避免了在积分过程中一些繁琐复杂的计算。

2. 积分公式与证明

引理2.1 设随机变量X服从标准正态分布 N ( 0 , 1 ) ,其密度函数和分布函数分别为 ϕ ( x ) , Φ ( x ) a , b 为常数且 b > 0 ,令 t = b 2 + 1 ,则

(i) ϕ ( x ) ϕ ( a + b x ) d x = ( 1 / t ) ϕ ( a / t ) Φ ( t x + a b / t ) + C

(ii) x ϕ ( x ) Φ ( b x ) d x = b / ( 2 π t ) Φ ( t x ) ϕ ( x ) Φ ( b x ) + C

其中,C为任意常数。

证(i) 对式(i)左边求导,

( ϕ ( x ) ϕ ( a + b x ) d x ) = ϕ ( x ) ϕ ( a + b x )

对式(i)右边求导,

[ ( 1 / t ) ϕ ( a / t ) Φ ( t x + a b / t ) + C ] = 1 t 1 2 π e a 2 2 t 2 1 2 π t e ( t x + a b / t ) 2 2 = 1 2 π e x 2 2 1 2 π e ( a + b x ) 2 2 = ϕ ( x ) ϕ ( a + b x ) .

故式(i)得证。

证(ii) 对式(ii)左边求导,

( x ϕ ( x ) Φ ( b x ) ) = x ϕ ( x ) Φ ( b x ) .

对式(ii)右边求导,

( b / ( 2 π t ) Φ ( t x ) ϕ ( x ) Φ ( b x ) + C ) = b 2 π t 1 2 π t e t 2 x 2 2 [ ( x ) ϕ ( x ) Φ ( b x ) + ϕ ( x ) 1 2 π b e b 2 x 2 2 ] = b 2 π e ( 1 + b 2 ) x 2 2 + x ϕ ( x ) Φ ( b x ) b 2 π e ( 1 + b 2 ) x 2 2 = x ϕ ( x ) Φ ( b x ) .

故式(ii)得证。

命题2.2设随机变量X服从标准正态分布 N ( 0 , 1 ) ,其密度函数和分布函数分别为 ϕ ( x ) , Φ ( x ) ,b为常数且 b > 0 ,令 t = b 2 + 1 ,则

(i) + x ϕ ( x ) Φ ( b x ) d x = b / ( 2 π t )

(ii) 0 + x ϕ ( x ) Φ ( b x ) d x = 1 / ( 2 2 π ) [ 1 + b / t ]

证(i)由引理2.1中式(ii),

+ x ϕ ( x ) Φ ( b x ) d x = [ b / ( 2 π t ) Φ ( t x ) ϕ ( x ) Φ ( b x ) ] + = b / ( 2 π t ) .

证(ii)由引理2.1中式(ii)

0 + x ϕ ( x ) Φ ( b x ) d x = [ b / ( 2 π t ) Φ ( t x ) ϕ ( x ) Φ ( b x ) ] 0 + =   ( b / ( 2 π t ) ) ( b / ( 2 2 π t ) 1 / ( 2 2 π ) ) = 1 / ( 2 2 π ) ( 1 + b / t ) .

命题2.3 设随机变量X服从标准正态分布 N ( 0 , 1 ) ,其密度函数和分布函数分别为 ϕ ( x ) Φ ( x ) ,a,b为常数,且 b > 0 ,令 t = b 2 + 1 ,则

(i) + ϕ ( x ) Φ ( a + b x ) d x = Φ ( a / t ) ,其中,b为已知常数;

(ii) 0 + ϕ ( x ) Φ ( b x ) d x = 1 / ( 2 π ) arctan b + 1 / 4

证(i)令 I ( a ) = + ϕ ( x ) Φ ( a + b x ) d x

上式满足积分号下对a求导的条件 [3] ,因此有

I ( a ) = + ϕ ( x ) ϕ ( a + b x ) d x .

由引理2.1中式(i)得

I ( a ) = [ ( 1 / t ) ϕ ( a / t ) Φ ( t x + a b / t ) ] + = ( 1 / t ) ϕ ( a / t ) ,

I ( a ) = ( 1 / t ) ϕ ( a / t ) d a = Φ ( a / t ) + C .

a + C = 0 ,故 I ( a ) = Φ ( a / t )

故式(i)得证。

证(ii)

I ( b ) = 0 + ϕ ( x ) Φ ( b x ) d x

上式满足积分号下对b求导的条件 [3] ,因此有

I ( b ) = 0 + ϕ ( x ) ϕ ( b x ) x d x = 0 + 1 2 π e x 2 2 1 2 π e b 2 x 2 2 x d x = 0 + 1 2 π e ( b 2 + 1 ) x 2 2 x d x = 1 2 π 1 b 2 + 1 [ e ( b 2 + 1 ) x 2 2 ] 0 + = 1 2 π ( b 2 + 1 ) ,

I ( b ) = d b 2 π ( b 2 + 1 ) = 1 2 π arctan b + C .

b = 0 ,得 C = 1 / 4 ,故 I ( b ) = 1 / ( 2 π ) arctan b + 1 / 4

故式(ii)得证。

命题2.4 设随机变量X服从标准正态分布 N ( 0 , 1 ) ,其密度函数和分布函数分别为 ϕ ( x ) , Φ ( x ) ,b为常数且 b > 0 ,则

(i) + ϕ ( x ) [ Φ ( b x ) ] 2 d x = 1 / π arctan 1 + 2 b 2

(ii) 0 + ϕ ( x ) [ Φ ( b x ) ] 2 d x = 1 / ( 2 π ) [ arctan b + arctan 1 + 2 b 2 ]

证(i)令 I ( b ) = + ϕ ( x ) [ Φ ( b x ) ] 2 d x

上式满足积分号下对b求导的条件 [3] ,因此有

I ( b ) = + 2 ϕ ( x ) [ Φ ( b x ) ϕ ( b x ) x ] d x = 2 + ϕ ( x ) ϕ ( b x ) x ( b x 1 2 π e y 2 2 d y ) d x = 2 + 1 2 π e y 2 2 y b + x ϕ ( x ) ϕ ( b x ) d x d y = 2 + 1 2 π e y 2 2 ( 1 2 π y b + x e ( b 2 + 1 ) x 2 2 d x ) d y = 1 π 1 b 2 + 1 + 1 2 π e ( 2 b 2 + 1 ) y 2 2 b 2 d y = 1 π 1 b 2 + 1 b 2 b 2 + 1

对上述b求积分

I ( b ) d b = 1 π 1 b 2 + 1 b 2 b 2 + 1 d b = 1 π 1 ( 2 b 2 + 1 ) + 1 d ( 2 b 2 + 1 ) = 1 / π arctan 1 + 2 b 2 + C .

b = 0 ,得 C = 0 ,故 I ( b ) = 1 / π arctan 1 + 2 b 2

故式(i)得证。

证(ii)令 I ( b ) = 0 + ϕ ( x ) [ Φ ( b x ) ] 2 d x

上式满足积分号下对b求导的条件 [3] ,因此有

I ( b ) = 0 + ϕ ( x ) 2 [ Φ ( b x ) ϕ ( b x ) x ] d x = 2 0 + ϕ ( x ) ϕ ( b x ) x ( b x 1 2 π e y 2 2 d y ) d x = 2 0 + ϕ ( x ) ϕ ( b x ) x 0 1 2 π e y 2 2 d y d x + 2 0 + ϕ ( x ) ϕ ( b x ) x 0 b x 1 2 π e y 2 2 d y d x = 0 + ϕ ( x ) ϕ ( b x ) x d x + 2 0 + 1 2 π e y 2 2 y b + ϕ ( x ) ϕ ( b x ) x d x d y = 1 2 π 0 + x e ( b 2 + 1 ) x 2 2 d x + 1 2 ( 1 π 1 b 2 + 1 b 2 b 2 + 1 ) = 1 2 π ( b 2 + 1 ) + ( 1 2 π ( b 2 + 1 ) b 2 b 2 + 1 )

对上述b求积分

I ( b ) d b = 1 2 π ( 1 ( b 2 + 1 ) + 1 ( b 2 + 1 ) b 2 b 2 + 1 ) d b = 1 / ( 2 π ) [ arctan b + arctan 1 + 2 b 2 ] + C .

b = 0 ,得 C = 0 ,故 I ( b ) = 1 / ( 2 π ) [ arctan b + arctan 1 + 2 b 2 ]

故式(ii)得证。

3. 在概率统计中的应用

在概率统计中,经常会遇到有关正态分布的计算问题。有些计算问题十分棘手,应用本文第2节给出的公式,相对比较简单,下面给出计算例子。

例3.1 [4] 若 X ~ ( χ 2 ( 1 ) ) 1 / 2 ,则 E [ Φ ( X ) ] = 3 / 4

证X的密度函数为 f ( x ) = 2 π e x 2 2 I { x > 0 } ,因此有

E [ Φ ( X ) ] = 0 + Φ ( X ) 2 π e x 2 2 d x = 2 0 + Φ ( X ) ϕ ( x ) d x ,

由命题2.3中式(ii),当 b = 1 时,得

例3.2 [4] 若 X ~ N ( 0 , 1 ) ,则相关系数 ρ ( X , Φ ( X ) ) = 3 / π

证由于 X ~ N ( 0 , 1 ) ,因此 Y = Φ ( X ) ~ R ( 0 , 1 ) ,所以有 Var ( Φ ( X ) ) = 1 / 12

ρ ( X , Φ ( X ) ) = Cov ( X , Φ ( X ) ) / Var ( X ) Var ( Φ ( X ) )     = [ E ( X Φ ( X ) ) E ( X ) E ( Φ ( X ) ) ] / 1 1 / 12 = 2 3 E [ X Φ ( X ) ] = 2 3 + x ϕ ( x ) Φ ( x ) d x ,

由命题2.2中式(i),得

+ x ϕ ( x ) Φ ( x ) d x = 1 / 2 π

从而 ρ ( X , Φ ( X ) ) = 3 / π

例3.3 [4] 设总体 X ~ N ( μ , 1 ) X 1 , , X n 为X的样本,其样本均值 X ¯ = n 1 i = 1 n X i Φ ( X ) 为标准正态分布的分布函数,求m,使 E [ Φ ( m X ¯ ) ] = Φ ( μ )

证由于 X ¯ ~ N ( μ , 1 / n ) ,故 m X ¯ ~ N ( m μ , m 2 / n )

由命题2.3中式(i),得

E [ Φ ( m X ¯ ) ] = Φ ( m μ / 1 + m 2 / n )

令其等于 Φ ( μ ) ,则需 m / 1 + m 2 / n = 1 ,由此解得 m = n / ( n 1 )

即当 m = n / ( n 1 ) 时, E [ Φ ( m X ¯ ) ] = Φ ( μ )

4. 结论

在文中的第2部分有关正态分布的不定积分的公式证明中,主要是通过利用不定积分的方法和构造含参变量的积分方法达到求解目的。事实上,构造二重积分并用积分换序的方法也是常用的方法之一。但是,对于某些问题,如命题4的证明会有一定的难度。应用含参变量积分方法求解相对比较容易,也为求解正态分布有关的积分计算问题提供了一种新的解题思路。由此可见,含参变量积分方法可以作为一个工具,可以解决很多概率论与数理统计中的相关问题。含参变量积分方法是数学分析课程中技巧较高的内容,可以看成是在概率论与数理统计中的应用和延伸,值得在教学中加以重视和推广。

基金项目

2021年度辽宁省普通高等教育本科教学改革研究一般项目(项目编号:2021-254-058910165)。

参考文献

[1] 茆诗松, 程依明, 濮晓龙. 概率论与数理统计教[M]. 第2版. 北京: 高等教育出版社, 2011: 106-111.
[2] 李贤平, 沈崇圣, 陈子毅. 大学数学学习方法指导丛书(I)概率论与数理统计[M]. 上海: 复旦大学出版社, 2003: 99-104.
[3] 王志福, 苏再兴, 管杰, 韩丹丹, 王海洋. 关于正态分布的重要结论及注记[J]. 渤海大学学报(自然科学版), 2011, 32(2): 97-99.
[4] 吴鹏. 关于正态分布中一个重要积分的解法[J]. 成都教育学院学报, 2004, 18(10): 107-108.
[5] 张春春, 涂俐兰. 基于正态分布求解两类反常积分[J]. 高等数学研究, 2017, 20(1): 66-68.
[6] 陈平. 利用正态分布计算一类广义积分[J]. 衡水学院学报, 2008, 10(1): 20-22.
[7] 贾瑞玲, 孙铭娟, 张冬燕. 利用积分号下求导计算含参变量广义积分[J]. 高等数学研究, 2022, 25(2): 11-14.