t分布的渐进正态性证明及其特点分析
Proof of Asymptotic Normality of t Distribution and Analysis of Its Characteristics
DOI: 10.12677/PM.2020.109099, PDF, HTML, XML, 下载: 615  浏览: 1,909 
作者: 杨欣童:东北大学秦皇岛分校数学与统计学院,河北 秦皇岛
关键词: t分布正态性证明MATLABt Distribution Normality Proof MATLAB
摘要: 前人的研究已经证明t分布函数具有渐进正态的特性。我们改进了前人的研究,应用差函数的特性再次证明了t分布的渐进正态性,并结合MATLAB,直观验证了t分布的这一特性。之后,我们借助直观图形进一步分析了t函数的特性。
Abstract: Previous studies have proved that the t distribution function has the characteristics of asymptotic normality. This paper applies the characteristics of the difference function to prove the asymptotic normality of the t distribution again, improving the previous research. And with the use of MATLAB software, the asymptotic normality is verified intuitively. After that, we further analyze the char-acteristics of the t function with the help of intuitive graphics.
文章引用:杨欣童. t分布的渐进正态性证明及其特点分析[J]. 理论数学, 2020, 10(9): 852-861. https://doi.org/10.12677/PM.2020.109099

1. 引言

在概率统计学中,t分布函数是一种十分重要的分布函数,这种分布函数具有渐进正态性,即当自由度n趋于无穷大时,t分布函数趋近于标准正态分布。前人已经用求极限的方法证明了此结论 [1] - [9],但是证明过程比较复杂,并且前人没有给出这个过程的细致描述。因此,对于这个逼近过程具有什么样的具体特点不是很清楚。本文拟引进t分布函数与标准正态分布的差函数,首先分析差函数的性质,利用差函数的性质简明地证明t分布的极限分布为标准正态分布,然后,通过利用MATLAB绘制其函数图像来细致分析其逼近过程的具体特点。

2. t分布及其性质

2.1. t分布的定义

若两个独立的随机变量 ξ ~ N ( 0 , 1 ) ζ ~ χ 2 ( n ) ,那么随机变量 X = ξ ζ / n 服从自由度为n的t分布 [10]。

其概率密度函数为

f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) n + 1 2 , ( < x < + ) (1)

2.2. t分布的性质

性质1 (t分布的等价定义):若 n + 1 个独立的随机变量 ξ ~ N ( 0 , 1 )

ζ 1 ~ N ( 0 , 1 ) , ζ 2 ~ N ( 0 , 1 ) , , ζ n ~ N ( 0 , 1 ) ,那么随机变量 X = ξ i = 1 n ζ i / n ,服从自由度为n的t分布;

性质2 (对称性):由t分布的概率密度函数可得 f t ( x , n ) = f ( x , n ) 成立,因此t分布的概率密度函数关于x轴对称;

性质3 (均值和方差):若随机变量 X ~ t ( n ) ,则X的方差与均值为 E ( X ) = 0 D ( X ) = n n 2

性质4 (有界性):若随机变量,因为 D ( X ) = n n 2 ,所以当 n > 2 时X的方差有界,因此X的概率密度函数有界。

3. 利用差函数分析证明渐进正态性

t分布函数与标准正态分布的差函数的意义为两者在y轴方向的距离,若当n趋于无穷时,差函数在其各极值点的取值均趋于0,则可间接证明当n趋于无穷时,t分布趋于标准正态分布,即

lim n sup φ ( x , n ) = 0 ,则 t ( n ) 趋近标准正态分布 N ( 0 , 1 )

因此,下面首先分析差函数的性质,再利用差函数的性质证明t分布的极限分布为标准正态分布。

3.1. 差函数的定义

设随机变量的取值为x,则有标准正态分布的概率密度函数为 f N ( x ) = 1 2 π e x 2 2 ,自由度为n的t分

布的概率密度函数为

f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) n + 1 2 (2)

这样,自由度为n的t分布与标准正态分布的差函数表达式为:

f t ( x , n ) = Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) n + 1 2 (3)

3.2. 差函数的基本性质

性质1 (对称性):已知标准正态分布和t分布的概率密度函数均关于x轴对称,因此差函数也关于x轴对称;

性质2 (极值点):对 φ ( x , n ) 关于x求导数,得到

d φ ( x , n ) d x = x [ n + 1 n Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) n + 3 2 1 2 π e x 2 2 ] (4)

d φ ( x , n ) d x = 0 得到极值点 x 0 = 0 ,另有极值点 x k 满足方程

n + 1 n Γ ( n + 1 2 ) n π Γ ( n 2 ) ( 1 + x 2 n ) n + 3 2 = 1 2 π e x 2 2 (5)

利用上式方程得到差函数的极值

φ ( x k , n ) = Γ ( n + 1 n ) n π Γ ( n 2 ) ( 1 + x k n ) n + 1 2 [ 1 n + 1 n ( 1 + x k 2 n ) 1 ] (6)

3.3. t分布的正态渐进性证明

引理1 (瓦里斯公式推论):

lim n [ ( 2 n 1 ) ! ! ( 2 n ) ! ! ] n π = 1 ( n N ) (7)

证明:

已知瓦里斯公式为

n = 1 2 n 2 n 1 × 2 n 2 n + 1 = π 2 ( n N ) (8)

公式左端变形后为

lim n [ ( 2 n ) ! ! ( 2 n 1 ) ! ! ] 2 1 2 n 1 = π 2 (9)

再次变形得到

lim n [ ( 2 n ) ! ! ( 2 n 1 ) ! ! ] 2 ( 2 n 1 ) π = 1 lim n [ ( 2 n ) ! ! ( 2 n 1 ) ! ! ] 1 n π = 1 (10)

证毕

定理1:当 n 时,差函数的极值均趋于0。

证明:

首先,带入极值点 x 0 = 0 得到

lim n φ ( x 0 , n ) = Γ ( n + 1 n ) n π Γ ( n 2 ) 1 2 π (11)

当n为偶数时,不妨令 n = 2 k

(12)

当n为奇数时同理可证明 lim k φ ( x 0 , n ) = 0

下面,考虑其他极值点的极值

(13)

又由于t分布的概率密度函数的有界性得到

lim n f t ( x k , n ) = p , (p为一有限数) (14)

另外因为

lim n [ 1 n + 1 n ( 1 + x k 2 n ) 1 ] = 0 (15)

所以

lim n φ ( x k , n ) = 0 (16)

综上,当 n 时,差函数的极值趋于0。

因此,t分布的极限分布为标准正态分布。

4. t分布函数的渐进正态性直观验证

前文已经证明了t分布函数具有渐进正态性,但没有给出直观描述。下面首先利用MATLAB对其渐进正态性进行分析。在MATLAB中,输入下列代码,绘制标准正态分布以及自由度从1到100的t分布的概率密度函数。

clear all;clc;

x=-4:0.1:4;

n=linspace(1,100,100);

axis([-4 4 0 0.41]);

ylabel('$t(n)$','interpreter','latex', 'FontSize', 18);

xlabel('x')

for i=1:100

A(i,:)=tpdf(x,n(i));

end

plot(x,A);

hold on;

z=normpdf(x,0,1)

plot(x,z,'color','r','linewidth',2.3);

title('自由度从1到100的t分布密度函数和标准正态分布');

legend('n从1变化到100');

结果如图1所示。有图1可知,当t分布函数的自由度n增大的时,其概率分布函数在0附近的部分上升,其余两边的部分下降,总体趋近于标准正态分布曲线。t分布函数确实具有渐进正态性。

Figure 1. Asymptotic normality of t distribution

图1. t分布的渐进正态性

5. 利用差函数分析其具体特点

5.1. 差函数的变化图像

输入如下代码,绘制此函数当参数n 从1变化到100的函数图像。

clc;clear all;

x=-4:0.01:4;

n=linspace(1,100);

axis([-4 4 -0.2 0.41]);

ylabel('$t(n)-N(0,1)$','interpreter','latex', 'FontSize', 18);

xlabel('x')

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

end

plot(x,A);

title('自由度从1到100的t分布密度函数与标准正态分布的差函数');

legend('n从1变化到100');

结果如图2所示。从图2中可以看出,当参数n固定时,差函数是一个关于y轴对称的函数,这表明标准正态分布和t分布都是关于y轴对称的函数。

另外,当参数n固定时,很容易看出,一条差函数曲线具有5个极值点。由于其对称性,其中一个极值点为 x = 0 ,但它不是最值点。因此,虽然t分布和标准正态分布的最大值点都在 x = 0 处取得,但是他们的差的最大值并不是在 x = 0 处取得,而是在其他的极值点处取得。

当参数n从1增加到100时,差函数图像逐渐趋于x轴,整体变得平阔,函数范围越来越小,这直观地反映了当n增加时,t分布逐渐趋近于标准正态分布。

Figure 2. The image of difference function

图2. 差函数的变化图像

5.2. 差函数的最值

为了进一步分析差函数的性质,输入如下代码,求其当参数n从1变化到100时的差函数的最值。

clc;clear all;

MAX=[];MIN=[];a=zeros(1,5)

x=-4:0.01:4;

n=linspace(1,100);

axis([-4 4 -0.2 0.41]);

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

MAX(i)=max(A(i,:));

MIN(i)=min(A(i,:));

end

ma=vpa(MAX,3);

ma1=[ma a]

ma2=reshape(ma1,7,[])

ma3=vpa(ma2.',4)

mi=vpa(MIN,5)

mi1=[mi a]

mi2=reshape(mi1,7,[])

mi3=vpa(mi2.',3)

结果为:

表1表2所得数据可以看出,当差函数的参数从1变化到100时,差函数最大值从0.028099变化到0.001139,最小值从−0.099264变化到−0.0013572,显然,他们的绝对值都减小了很多。

Table 1. The maximum of difference functions

表1. 差函数最大值

Table 2. The minimum of difference functions

表2. 差函数最小值

5.3. 差函数最值的直观表示

为了使差函数最值随n的变化更直观,输入如下代码,绘制其当n从1变化到100函数的图像。

clc;clear all;

syms E F;

X1=[];X2=[];SUP=[];INF=[];

x=-4:0.001:4;

n=linspace(1,100);

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

SUP(i)=max(A(i,:));

INF(i)=min(A(i,:));

E=find(A(i,:)==SUP(i))

X1(i)=(E(:,2)-4000)*0.01

F=find(A(i,:)==INF(i))

X2(i)=(F(:,2)-4000)*0.01

end

plot(n,SUP,'o-','color','r','linewidth',2);

hold on;

plot(n,INF,'s-','color','b','linewidth',2);

title('参数从1到100的的差函数最值');

legend('差函数最大值','差函数最小值');

ylabel('$t(n)-N(0,1)最值$','interpreter','latex', 'FontSize', 18);

xlabel('n')

grid on;

Figure 3. The maximum value of the difference function varies with n

图3. 差函数最值随n的变化

结果如图3所示。从图3可以看出差函数的最大值和最小值随参数n的增大都趋于0。当n增加时,函数的变化速度减慢,因此看出,自由度n增加时,t分布渐进于标准正态分布的速度减慢。

6. 结论

1) 当自由度n趋于无穷的时,t分布总体趋近于标准正态分布曲线,可通过构造的差函数比较简单地证明;

2) 趋近方式为其概率分布函数在0附近的部分上升,其余两边的部分下降;

3) 当自由度n趋于无穷的时,t分布趋近于标准正态分布,但是速度越来越慢;

4) 当自由度n趋于无穷的时,t分布在不同点与标准正态分布的差值不相同;

5) 当自由度n趋于无穷的时,t分布不同点趋近于标准正态分布的速度不相同。

参考文献

[1] 杨洁, 李兆庚. 关于t分布的极限分布为标准正态分布的证明[J]. 石油化工高等学校学报, 1994(3): 78-80.
[2] 严琴, 唐贺, 李开灿. 中心多元t分布的一致渐近正态性[J]. 湖北文理学院学报, 2013, 34(2): 9-13.
[3] 李开灿, 孟赵玲. x~2分布、t分布和F分布的一致渐近正态性[J]. 北京印刷学院学报, 2004(3): 30-33.
[4] 梁琼. X~2•T•F分布的正态逼近[J]. 湖北民族学院学报(自然科学版), 1995(2): 33-38.
[5] 王娟. t分布密度函数之性质[J]. 淮阴工学院学报, 2007(5): 15-21.
[6] 彭定忠, 张映辉, 刘朝才. t分布概率密度的分析[J]. 湖南城市学院学报(自然科学版), 2012, 21(4): 50-52.
[7] 张光远. 关于多元t分布的一些讨论[J]. 新疆大学学报(自然科学版), 1996(3): 33-38.
[8] Li, R. and Saralees, N. (2020) A Review of Student’s t Distribution and Its Generalizations. Empirical Economics, 58, 1461-1490.
https://doi.org/10.1007/s00181-018-1570-0
[9] Chen, C.P. (2018) Complete As-ymptotic Expansions for the Density Function of t -Distribution. Statistics and Probability Letters, 141.
https://doi.org/10.1016/j.spl.2018.05.014
[10] 魏宗舒. 概率论与数理统计教程[M]. 北京: 高等教育出版社, 2008: 145-146.