基于连续型随机变量性质的积分运算公式
Integral Operation Formulas Based on the Properties of Continuous Random Variables
DOI: 10.12677/aam.2024.138365, PDF, HTML, XML,   
作者: 许 岷:北京工业大学数学统计学与力学学院,北京
关键词: 连续型随机变量积分运算贝叶斯统计Continuous Random Variables Integral Operation Bayesian Statistics
摘要: 面向工科类和经济类学生的概率论与数理统计教学实践中,积分运算是教学的难点。本文利用连续型随机变量的性质,推导了基于正态分布、伽马分布和贝塔分布的积分运算公式,解决某些复杂函数的积分运算问题,并将其应用于贝叶斯统计中。
Abstract: In the teaching practice of probability theory and mathematical statistics for engineering and economics students, the integral operation is difficult for students. By using the properties of continuous random variables, this paper derives several common integral operation formulas based on normal, gamma and beta distributions, computes the integrals of complex functions, and applies them to Bayesian statistics.
文章引用:许岷. 基于连续型随机变量性质的积分运算公式[J]. 应用数学进展, 2024, 13(8): 3837-3844. https://doi.org/10.12677/aam.2024.138365

1. 引言

《概率论与数理统计》是本科教学的数学基础课,《高等数学》中微积分知识是本课程的基础。在

面向工科类和经济类学生的教学实践中,针对复杂函数积分问题,如 e x 2 dx 0 x α1 e λx dx ( α>0,λ>0 ) 0 1 x a1 ( 1x ) b1 dx ( a>0,b>0 ) 等,由于积分的相关知识点掌握不牢,大多数学生存在畏惧心理。教学

课时有限,教师往往对上述积分计算无法详细展开,导致积分运算问题成为了《概率论与数理统计》教学实践中的痛点和难点。

事实上,利用连续型随机变量的定义、概率密度函数及其数字特征等性质,能够推导出一系列积分运算公式,简化复杂函数的积分问题。例如,文献[1][2]总结了正态分布和几类反常积分的关系。文献[3]

介绍了利用正态分布和指数分布计算积分 e x 2 dx 0 ( 9 x 2 +6x+1 ) e 3x dx 等复杂函数积分。文献[4]以积分 e x 2 /2 dx 的计算为例,强调了利用概率论求解积分的方法应在教学中加以重视。利用这类积分运算公

式,一方面简化了《高等数学》课程中涉及的复杂函数积分问题;另一方面有助于学生熟悉《概率论与数理统计》的基本知识。

与上述工作从具体的积分问题出发不同,本文基于常用连续型随机变量的性质,总结和归纳了若干积分运算公式,以《概率论与数理统计》中的典型题目为切入点,说明运用这类积分运算公式在解决复杂函数积分时的优势,为教学实践中微积分知识的讲授方式提供一种新角度。最后,本文强调了这类积分运算公式在贝叶斯统计中的一些应用。

2. 预备知识

本节介绍连续型随机变量的定义及其性质。

定义[5]:设X是一个随机变量, F( x ) 是其分布函数,如果存在一个定义在 ( , ) 上的非负实值函数 f( x ) ,使得

F( x )= x f( t )dt ,

则称X为连续型随机变量, f( x ) X的概率密度函数。

性质1 [5]:设 f( x ) 是某个连续型随机变量的概率密度函数,则

(i) f( x )0,<x<

(ii) f( x )dx =1

性质2 [5]:设连续型随机变量X的概率密度函数为 f( x ) ,若X的期望 E( X ) 存在,则

E( X )= xf( x )dx .

利用性质1和性质2,结合常用连续型随机变量的概率密度函数和期望,能够直接计算一些复杂函数的积分。

3. 常用连续型随机变量及其积分运算公式

本节介绍正态分布、伽马分布和贝塔分布等常用连续型分布的性质,并探讨对应的积分运算公式。

3.1. 正态分布

设连续型随机变量X服从均值为 μ 和方差为 σ 2 的正态分布,记为 X~N( μ, σ 2 ) ,概率密度函数为

f( x )= 1 2π σ 2 e ( xμ ) 2 2 σ 2 ,<x<.

由性质1和性质2,得到如下积分运算公式:

e ( xμ ) 2 2 σ 2 dx= 2π σ 2 , (1)

x e ( xμ ) 2 2 σ 2 dx=μ 2π σ 2 . (2)

例:设随机变量X的分布函数为

F( x )=0.5Φ( x )+0.5Φ( x4 2 ),

其中 Φ( x ) 为标准正态分布函数,求期望 E( X )

:先求X的概率密度函数为

f( x )= dF( x ) dx = 1 2 1 2π e x 2 2 + 1 4 1 2π e ( x4 ) 2 8 .

X的期望为

E( X )= 1 2 x 1 2π e x 2 2 dx+ 1 4 x 1 2π e ( x4 ) 2 8 dx,

这是一个复杂函数的积分,一般需使用变量变换和伽马函数等知识,有一定难度。然而,利用公式 (2) 能够简化积分计算。对第一个积分,可视为标准正态分布的期望,设 X 1 ~N( 0,1 ) ,则

1 2 x 1 2π e x 2 2 dx= 1 2 E( X 1 )=0.

对第二个积分,可视为正态分布 N( 4, 2 2 ) 的期望,设 X 2 ~N( 4, 2 2 ) ,则

1 4 x 1 2π e ( x4 ) 2 8 dx= 2 4 x 1 2 2π e ( x4 ) 2 2× 2 2 dx= 1 2 E( X 2 )=2.

E( X )=0+2=2 ,此题目为2017年全国硕士研究生统一招生考试数学(一)试题。

利用积分运算公式还可以计算标准正态分布的k阶矩 E( X k )

例:设随机变量X服从标准正态分布,即 X~N( 0,1 ) ,求Xk阶矩 E( X k )

:根据期望的定义

E( X k )= x k 1 2π e x 2 2 dx.

k为奇数时,被积函数为奇函数,故 E( X k )=0 ;当k为偶数时,

E( X k )= x k 1 2π e x 2 2 dx= 2 k/2 π 0 t k1 2 e t dt=( k1 )( k3 )1.

利用标准正态随机变量的k阶矩和极坐标变换,能够推导出一类复杂三角函数的积分运算公式。

例:当k为偶数时,计算 0 π/2 ( sinθ ) k dθ

:当k为偶数时,令

I k = x k 1 2π e x 2 2 dx=( k1 )( k3 )1.

则有

I k 2 = 1 2π u k v k e 1 2 ( u 2 + v 2 ) dudv.

作极坐标变换 u=rcosθ v=rsinθ

I k 2 = 1 2π 0 0 2π r 2k cos k θ sin k θ e r 2 /2 rdθdr= 1 2π [ 0 r 2k+1 e r 2 /2 dr ] [ 0 2π cos k θ sin k θdθ ].

其中第一个中括号的积分

0 r 2k+1 e r 2 /2 dr = 2 k 0 t k e t dt= 2 k Γ( k+1 ),

第一个等号利用变量变换 t= r 2 /2 ,第二个等号利用伽马函数。此时,能够计算复杂三角函数的积分

0 2π cos k θ sin k θdθ = 2π I k 2 2 k Γ( k+1 ) = π( k1 )( k3 )1 2 k1 k( k2 )2 ,k=2,4,6,.

如果对上述积分做适当的变量变换,有

0 2π cos k θ sin k θdθ = 0 2π ( 1 2 sin2θ ) k dθ= 1 2 k2 0 π/2 ( sint ) k dt ,

第二个等号利用变量变换 t=2θ 。由此,得到

0 π/2 ( sint ) k dt = ( k1 )( k3 )1 k( k2 )2 π 2 ,k=2,4,6,.

上述复杂三角函数的积分是《高等数学》课程“周期函数的定积分”小节的重点和难点,通常使用分部积分法和递归法则计算。正态随机变量推导出的积分运算公式,提供了求解这类复杂函数积分的一个新视角。

3.2. 伽马分布

设连续型随机变量X服从参数为 α>0,λ>0 的伽马分布,记为 X~Gamma( α,λ ) ,其概率密度函数为

f( x )={ λ α Γ( α ) x α1 e λx ,x>0, 0,x0,

其中 Γ( α )= 0 x α1 e x dx 为伽马函数。由性质1,得到如下积分计算公式

0 x α1 e λx dx= Γ( α ) λ α . (3)

例:设随机变量T服从自由度为nt分布,求随机变量T的期望和方差。

解:在本科教学中,由于t分布的概率函数密度函数较为复杂,讲授其性质时一般只介绍t分布的期望和方差的结果,不给出计算过程。本例利用t分布的定义和公式(3)推导一种求解t分布数字特征的方法,该方法简化了积分求解过程。

若随机变量T服从自由度为nt分布,则T可表示为

T= X Y/n ,

其中 X~N( 0,1 ) 服从标准正态分布, Y~ χ n 2 服从自由度为n的卡方分布,且XY相互独立。求期望

E( T )=E( X Y 1/2 n 1/2 )= n E( X )E( Y 1/2 ),

其中第二个等号是因为随机变量XY的独立性。因为 E( X )=0 ,所以 E( T )=0 。求方差

Var( T )=E( T 2 ) [ E( T ) ] 2 =E( X 2 Y 1 n )=nE( X 2 )E( Y 1 ),

其中最后一个等号是因为随机变量XY的独立性。计算

E( X 2 )=Var( X )+ [ E( X ) ] 2 =1

E( Y 1 )= 0 y 1 1 2 n/2 Γ( n/2 ) y n/2 1 e y/2 dy = 1 2 n/2 Γ( n/2 ) 0 y n/2 2 e y/2 dy.

利用公式 (3)进行积分运算,

1 2 n/2 Γ( n/2 ) 0 y n/2 2 e y/2 dy= 1 2 n/2 Γ( n/2 ) × Γ( n/2 1 ) ( 1/2 ) n/2 1 = 1 n2 ,

需满足 n/2 1>0 ,即 n>2 。由此,得 Var( T )= n n2 n>2

3.3. 贝塔分布

设连续型随机变量X服从参数为 a>0 b>0 的贝塔分布,记为 X~Beta( a,b ) ,其概率密度函数为

f( x )={ Γ( a+b ) Γ( a )Γ( b ) x a1 ( 1x ) b1 ,0<x<1, 0,,

由性质 1,得到如下积分计算公式

0 1 x a1 ( 1x ) b1 dx= Γ( a )Γ( b ) Γ( a+b ) . (4)

在《高等数学》中,公式(4)也被称为贝塔函数或 B函数,对工科类和经济类学生,一般属于选学内容。利用贝塔分布导出的积分运算公式,能够简化积分求解过程。在《概率论与数理统计》中该积分应用广泛,例如求解最小次序统计量的数字特征。

例:设随机变量 X 1 , X 2 ,, X n 相互独立,均服从 ( 0,θ ) 上的均匀分布,记 Y=min{ X 1 , X 2 ,, X n } ,求期望 E( Y )

解:因为 X i ~U( 0,θ ) ,其概率密度函数和分布函数分别为

f( x )={ 1 θ ,0<x<θ, 0,, F( x )={ 0,x<0 x θ ,0x<θ, 1,xθ.

0<t<θ 时,Y的概率密度函数为

f Y ( t )=n [ 1F( t ) ] n1 f( t )=n ( 1 t θ ) n1 1 θ .

求期望

E( Y )= 0 θ n ( 1 t θ ) n1 1 θ dt =nθ 0 1 z ( 1z ) n1 dz =nθ Γ( 2 )Γ( n ) Γ( n+2 ) = θ n+1 .

其中第二个等号利用变量变换 z=t/θ ,第三个等号利用公式(4)计算。

4. 在贝叶斯统计中的应用

本文提出的积分运算公式在贝叶斯统计中能够简化某些复杂函数的积分运算。设X θ 为连续型随机变量,连续型场合下的贝叶斯公式为

f( θ|x )= f( θ )f( x|θ ) f( θ )f( x|θ )dθ .

其中 f( | ) 表示条件概率密度。一般 θ 为参数 f( θ ) 为先验分布, f( θ|x ) 为观测到x后的后验分布。简化上式,得到贝叶斯统计框架:参数后验 f( θ|x ) 参数先验 f( θ )× 数据 f( x|θ ) 。积分运算公式能够简化积分 f( θ )f( x|θ )dθ 的计算,且当 θ 是随机向量时能够计算参数的边缘密度函数。

4.1. 托马斯·贝叶斯的桌球实验

贝叶斯公式的提出者托马斯·贝叶斯(Thomas Bayes)是位牧师,有优秀的数学素养,擅长通过数学思维解决实际问题[6]。为了探索因果关系,贝叶斯牧师进行了如下试验:假设有一个长方形的台球桌,长为L。贝叶斯牧师背对台球桌,让助手随机地抛出一个球到桌面上,记该球的水平位置为X,重复抛球n次,并汇报落在第一个位置X左侧的次数。随着试验次数的增加,通过试验结果,贝叶斯牧师能够猜测出该球可能落在的区域。

θ=X/L ,其中X未知。假设 θ 的先验分布为 ( 0,1 ) 上的均匀分布。助手进行n次试验,其中y次落在第一次的左边,利用贝叶斯公式,能够计算第一次球的水平位置落在区间 [ a,b ] 的概率:

P( a<X<b )= P( a<X<b,y ) f( y ) = 1 f( y ) a/L b/L C n y θ y ( 1θ ) ny dθ,

其中 C n y = n! y!( ny )! 表示组合数,

f( y )= 0 1 C n y θ y ( 1θ ) ny dθ= n! y!( ny )! Γ( y+1 )Γ( ny+1 ) Γ( n+2 ) = 1 n+1 ,

第二个等号利用公式(4)计算。

4.2. 正态分布假设下的后验分布

当参数 θ 是随机向量时,如正态分布的参数 θ=( μ, σ 2 ) ,利用贝叶斯公式能够得到联合后验密度函数,求解边缘后验密度函数的积分较为复杂,积分运算公式能够简化积分计算。本节以正态分布为例,介绍简化过程。

假设 x 1 , x 2 ,, x n 是来自服从正态总体 N( μ, σ 2 ) 的随机样本,记 τ=1/ σ 2 表示分布的精度。在贝叶斯统计框架下,有

f( μ,τ| x 1 , x 2 ,, x n )f( μ,τ )×f( x 1 , x 2 ,, x n |μ,τ ).

假设参数服从无信息先验分布 f( μ,τ )τ ,参数的后验分布为

f( μ,τ| x 1 , x 2 ,, x n )τ× τ n/2 exp{ τ 2 [ ( n1 ) s 2 +n ( x ¯ μ ) 2 ] },

其中

x ¯ = 1 n i=1 n x i , s 2 = 1 n1 i=1 n ( x i x ¯ ) 2 .

首先,根据参数的联合后验密度函数求解 τ 的边缘密度函数为

f( τ| x 1 , x 2 ,, x n ) τ n/2 +1 exp{ τ 2 [ ( n1 ) s 2 +n ( x ¯ μ ) 2 ] }dμ τ n/2 +1 exp{ τ( n1 ) s 2 2 } exp{ τn ( x ¯ μ ) 2 2 }dμ τ n/2 +1 exp{ τ( n1 ) s 2 2 } τ 1/2 = τ n+1 2 exp{ τ( n1 ) s 2 2 },

其中最后一行的正比号利用公式(1)计算。显然,参数 τ 的后验分布是伽马分布,即

τ| x 1 , x 2 ,, x n ~Gamma( n+3 2 , ( n1 ) s 2 2 ).

其次,求解 μ 的边缘密度函数为

f( μ| x 1 , x 2 ,, x n ) 0 τ n/2 +1 exp{ τ 2 [ ( n1 ) s 2 +n ( x ¯ μ ) 2 ] }dτ 2 n+4 2 Γ( n+4 2 ) [ ( n1 ) s 2 +n ( x ¯ μ ) 2 ] n+4 2 [ 1+ n ( x ¯ μ ) 2 ( n1 ) s 2 ] n+4 2 ,

其中第二行第一个正比号利用公式(3)计算。

5. 结论

本文基于常用的连续型随机变量的分布,如正态分布、伽马分布和贝塔分布等,推导了对应的积分运算公式。利用这些积分运算公式能够简化某些复杂函数的积分,为求解复杂积分问题提供新思路,值得在《概率论与数理统计》教学中加以重视和推广。本文还把这些积分运算公式应用在贝叶斯统计中,介绍了历史上托马斯·贝叶斯牧师的桌球实验和正态分布假设下参数的边缘密度函数的计算方法。

致 谢

作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见。

参考文献

[1] 张春春, 涂俐兰. 基于正态分布求解两类反常积分[J]. 高等数学研究, 2017, 20(1): 66-68.
[2] 赵雯雪, 屈志扬, 侯文. 有关正态分布广义积分计算的一些注记[J]. 应用数学进展, 2023, 12(6): 2951-2957.
[3] 贺慧敏, 李萍, 范钦伟. 巧用概率论方法求解积分问题[J]. 高等数学研究, 2024, 27(2): 93-95.
[4] 王彭德, 戈芳. 考研数学试题中的概率积分[J]. 高等数学研究, 2020, 23(4): 79-81.
[5] 王松桂, 张忠占, 程维虎, 高旅端. 概率论与数理统计[M]. 第4版. 北京: 科学出版社, 2023.
[6] 陈希孺. 数理统计简史[M]. 哈尔滨: 哈尔滨工业出版社, 2021.