t分布的渐进正态性证明及其特点分析

doi:10.12677/PM.2020.109099

期刊菜单

t分布的渐进正态性证明及其特点分析
Proof of Asymptotic Normality of t Distribution and Analysis of Its Characteristics

DOI: 10.12677/PM.2020.109099, PDF, HTML, XML,
作者: 杨欣童：东北大学秦皇岛分校数学与统计学院，河北秦皇岛
关键词: t分布；正态性；证明；MATLAB；t Distribution； Normality； Proof； MATLAB

摘要: 前人的研究已经证明t分布函数具有渐进正态的特性。我们改进了前人的研究，应用差函数的特性再次证明了t分布的渐进正态性，并结合MATLAB，直观验证了t分布的这一特性。之后，我们借助直观图形进一步分析了t函数的特性。

Abstract: Previous studies have proved that the t distribution function has the characteristics of asymptotic normality. This paper applies the characteristics of the difference function to prove the asymptotic normality of the t distribution again, improving the previous research. And with the use of MATLAB software, the asymptotic normality is verified intuitively. After that, we further analyze the char-acteristics of the t function with the help of intuitive graphics.

文章引用：杨欣童. t分布的渐进正态性证明及其特点分析[J]. 理论数学, 2020, 10(9): 852-861. https://doi.org/10.12677/PM.2020.109099

1. 引言

在概率统计学中，t分布函数是一种十分重要的分布函数，这种分布函数具有渐进正态性，即当自由度n趋于无穷大时，t分布函数趋近于标准正态分布。前人已经用求极限的方法证明了此结论 [1] - [9]，但是证明过程比较复杂，并且前人没有给出这个过程的细致描述。因此，对于这个逼近过程具有什么样的具体特点不是很清楚。本文拟引进t分布函数与标准正态分布的差函数，首先分析差函数的性质，利用差函数的性质简明地证明t分布的极限分布为标准正态分布，然后，通过利用MATLAB绘制其函数图像来细致分析其逼近过程的具体特点。

2. t分布及其性质

2.1. t分布的定义

若两个独立的随机变量 $ξ ~ N (0, 1)$ ， $ζ ~ χ^{2} (n)$ ，那么随机变量 $X = \frac{ξ}{\sqrt{ζ / n}}$ 服从自由度为n的t分布 [10]。

其概率密度函数为

$f_{t} (x, n) = \frac{Γ (\frac{n + 1}{2})}{\sqrt{n π} Γ (\frac{n}{2})} {(1 + \frac{x^{2}}{n})}^{- \frac{n + 1}{2}}$ , $(- \infty < x < + \infty)$ (1)

2.2. t分布的性质

性质1 (t分布的等价定义)：若 $n + 1$ 个独立的随机变量 $ξ ~ N (0, 1)$ ，

$ζ_{1} ~ N (0, 1), ζ_{2} ~ N (0, 1), \dots, ζ_{n} ~ N (0, 1)$ ，那么随机变量 $X = \frac{ξ}{\sqrt{\sum_{i = 1}^{n} ζ_{i} / n}}$ ，服从自由度为n的t分布；

性质2 (对称性)：由t分布的概率密度函数可得 $f_{t} (x, n) = - f (- x, n)$ 成立，因此t分布的概率密度函数关于x轴对称；

性质3 (均值和方差)：若随机变量 $X ~ t (n)$ ，则X的方差与均值为 $E (X) = 0$ ， $D (X) = \frac{n}{n - 2}$ ；

性质4 (有界性)：若随机变量，因为 $D (X) = \frac{n}{n - 2}$ ，所以当 $n > 2$ 时X的方差有界，因此X的概率密度函数有界。

3. 利用差函数分析证明渐进正态性

t分布函数与标准正态分布的差函数的意义为两者在y轴方向的距离，若当n趋于无穷时，差函数在其各极值点的取值均趋于0，则可间接证明当n趋于无穷时，t分布趋于标准正态分布，即

若 $\lim_{n \to \infty} \sup φ (x, n) = 0$ ，则 $t (n)$ 趋近标准正态分布 $N (0, 1)$ 。

因此，下面首先分析差函数的性质，再利用差函数的性质证明t分布的极限分布为标准正态分布。

3.1. 差函数的定义

设随机变量的取值为x，则有标准正态分布的概率密度函数为 $f_{N} (x) = \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}}$ ，自由度为n的t分

布的概率密度函数为

$f_{t} (x, n) = \frac{Γ (\frac{n + 1}{2})}{\sqrt{n π} Γ (\frac{n}{2})} {(1 + \frac{x^{2}}{n})}^{- \frac{n + 1}{2}}$ (2)

这样，自由度为n的t分布与标准正态分布的差函数表达式为：

$f_{t} (x, n) = \frac{Γ (\frac{n + 1}{2})}{\sqrt{n π} Γ (\frac{n}{2})} {(1 + \frac{x^{2}}{n})}^{- \frac{n + 1}{2}}$ (3)

3.2. 差函数的基本性质

性质1 (对称性)：已知标准正态分布和t分布的概率密度函数均关于x轴对称，因此差函数也关于x轴对称；

性质2 (极值点)：对 $φ (x, n)$ 关于x求导数，得到

$\frac{d φ (x, n)}{d x} = x [\frac{n + 1}{n} \frac{Γ (\frac{n + 1}{2})}{\sqrt{n π} Γ (\frac{n}{2})} {(1 + \frac{x^{2}}{n})}^{- \frac{n + 3}{2}} - \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}}]$ (4)

令 $\frac{d φ (x, n)}{d x} = 0$ 得到极值点 $x_{0} = 0$ ，另有极值点 $x_{k}$ 满足方程

$\frac{n + 1}{n} \frac{Γ (\frac{n + 1}{2})}{\sqrt{n π} Γ (\frac{n}{2})} {(1 + \frac{x^{2}}{n})}^{- \frac{n + 3}{2}} = \frac{1}{\sqrt{2 π}} e^{- \frac{x^{2}}{2}}$ (5)

利用上式方程得到差函数的极值

$φ (x_{k}, n) = \frac{Γ (\frac{n + 1}{n})}{\sqrt{n π} Γ (\frac{n}{2})} {(1 + \frac{x_{k}}{n})}^{- \frac{n + 1}{2}} [1 - \frac{n + 1}{n} {(1 + \frac{x_{k}^{2}}{n})}^{- 1}]$ (6)

3.3. t分布的正态渐进性证明

引理1 (瓦里斯公式推论)：

$\lim_{n \to \infty} \frac{[\frac{(2 n - 1)!!}{(2 n)!!}]}{\sqrt{n π}} = 1 (n \in N)$ (7)

证明：

已知瓦里斯公式为

$\prod_{n = 1}^{\infty} \frac{2 n}{2 n - 1} \times \frac{2 n}{2 n + 1} = \frac{π}{2} (n \in N)$ (8)

公式左端变形后为

$\lim_{n \to \infty} {[\frac{(2 n)!!}{(2 n - 1)!!}]}^{2} \frac{1}{2 n - 1} = \frac{π}{2}$ (9)

再次变形得到

$\begin{array}{l} \lim_{n \to \infty} [\frac{(2 n)!!}{(2 n - 1)!!}] \sqrt{\frac{2}{(2 n - 1) π}} = 1 \\ ∴ \lim_{n \to \infty} [\frac{(2 n)!!}{(2 n - 1)!!}] \sqrt{\frac{1}{n π}} = 1 \end{array}$ (10)

证毕

定理1：当 $n \to \infty$ 时，差函数的极值均趋于0。

证明：

首先，带入极值点 $x_{0} = 0$ 得到

$\lim_{n \to \infty} φ (x_{0}, n) = \frac{Γ (\frac{n + 1}{n})}{\sqrt{n π} Γ (\frac{n}{2})} - \frac{1}{\sqrt{2 π}}$ (11)

当n为偶数时，不妨令 $n = 2 k$

(12)

当n为奇数时同理可证明 $\lim_{k \to \infty} φ (x_{0}, n) = 0$ 。

下面，考虑其他极值点的极值

(13)

又由于t分布的概率密度函数的有界性得到

$\lim_{n \to \infty} f_{t} (x_{k}, n) = p$ , (p为一有限数) (14)

另外因为

$\lim_{n \to \infty} [1 - \frac{n + 1}{n} {(1 + \frac{x_{k}^{2}}{n})}^{- 1}] = 0$ (15)

所以

$\lim_{n \to \infty} φ (x_{k}, n) = 0$ (16)

综上，当 $n \to \infty$ 时，差函数的极值趋于0。

因此，t分布的极限分布为标准正态分布。

4. t分布函数的渐进正态性直观验证

前文已经证明了t分布函数具有渐进正态性，但没有给出直观描述。下面首先利用MATLAB对其渐进正态性进行分析。在MATLAB中，输入下列代码，绘制标准正态分布以及自由度从1到100的t分布的概率密度函数。

clear all;clc;

x=-4:0.1:4;

n=linspace(1,100,100);

axis([-4 4 0 0.41]);

ylabel('$t(n)$','interpreter','latex', 'FontSize', 18);

xlabel('x')

for i=1:100

A(i,:)=tpdf(x,n(i));

end

plot(x,A);

hold on;

z=normpdf(x,0,1)

plot(x,z,'color','r','linewidth',2.3);

title('自由度从1到100的t分布密度函数和标准正态分布');

legend('n从1变化到100');

结果如图1所示。有图1可知，当t分布函数的自由度n增大的时，其概率分布函数在0附近的部分上升，其余两边的部分下降，总体趋近于标准正态分布曲线。t分布函数确实具有渐进正态性。

Figure 1. Asymptotic normality of t distribution

图1. t分布的渐进正态性

5. 利用差函数分析其具体特点

5.1. 差函数的变化图像

输入如下代码，绘制此函数当参数n 从1变化到100的函数图像。

clc;clear all;

x=-4:0.01:4;

n=linspace(1,100);

axis([-4 4 -0.2 0.41]);

ylabel('$t(n)-N(0,1)$','interpreter','latex', 'FontSize', 18);

xlabel('x')

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

end

plot(x,A);

title('自由度从1到100的t分布密度函数与标准正态分布的差函数');

legend('n从1变化到100');

结果如图2所示。从图2中可以看出，当参数n固定时，差函数是一个关于y轴对称的函数，这表明标准正态分布和t分布都是关于y轴对称的函数。

另外，当参数n固定时，很容易看出，一条差函数曲线具有5个极值点。由于其对称性，其中一个极值点为 $x = 0$ ，但它不是最值点。因此，虽然t分布和标准正态分布的最大值点都在 $x = 0$ 处取得，但是他们的差的最大值并不是在 $x = 0$ 处取得，而是在其他的极值点处取得。

当参数n从1增加到100时，差函数图像逐渐趋于x轴，整体变得平阔，函数范围越来越小，这直观地反映了当n增加时，t分布逐渐趋近于标准正态分布。

Figure 2. The image of difference function

图2. 差函数的变化图像

5.2. 差函数的最值

为了进一步分析差函数的性质，输入如下代码，求其当参数n从1变化到100时的差函数的最值。

clc;clear all;

MAX=[];MIN=[];a=zeros(1,5)

x=-4:0.01:4;

n=linspace(1,100);

axis([-4 4 -0.2 0.41]);

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

MAX(i)=max(A(i,:));

MIN(i)=min(A(i,:));

end

ma=vpa(MAX,3);

ma1=[ma a]

ma2=reshape(ma1,7,[])

ma3=vpa(ma2.',4)

mi=vpa(MIN,5)

mi1=[mi a]

mi2=reshape(mi1,7,[])

mi3=vpa(mi2.',3)

结果为：

从表1、表2所得数据可以看出，当差函数的参数从1变化到100时，差函数最大值从0.028099变化到0.001139，最小值从−0.099264变化到−0.0013572，显然，他们的绝对值都减小了很多。

Table 1. The maximum of difference functions

表1. 差函数最大值

Table 2. The minimum of difference functions

表2. 差函数最小值

5.3. 差函数最值的直观表示

为了使差函数最值随n的变化更直观，输入如下代码，绘制其当n从1变化到100函数的图像。

clc;clear all;

syms E F;

X1=[];X2=[];SUP=[];INF=[];

x=-4:0.001:4;

n=linspace(1,100);

z=normpdf(x,0,1)

for i=1:100

A(i,:)=tpdf(x,n(i))-z;

SUP(i)=max(A(i,:));

INF(i)=min(A(i,:));

E=find(A(i,:)==SUP(i))

X1(i)=(E(:,2)-4000)*0.01

F=find(A(i,:)==INF(i))

X2(i)=(F(:,2)-4000)*0.01

end

plot(n,SUP,'o-','color','r','linewidth',2);

hold on;

plot(n,INF,'s-','color','b','linewidth',2);

title('参数从1到100的的差函数最值');

legend('差函数最大值','差函数最小值');

ylabel('$t(n)-N(0,1)最值$','interpreter','latex', 'FontSize', 18);

xlabel('n')

grid on;

Figure 3. The maximum value of the difference function varies with n

图3. 差函数最值随n的变化

结果如图3所示。从图3可以看出差函数的最大值和最小值随参数n的增大都趋于0。当n增加时，函数的变化速度减慢，因此看出，自由度n增加时，t分布渐进于标准正态分布的速度减慢。

6. 结论

1) 当自由度n趋于无穷的时，t分布总体趋近于标准正态分布曲线，可通过构造的差函数比较简单地证明；

2) 趋近方式为其概率分布函数在0附近的部分上升，其余两边的部分下降；

3) 当自由度n趋于无穷的时，t分布趋近于标准正态分布，但是速度越来越慢；

4) 当自由度n趋于无穷的时，t分布在不同点与标准正态分布的差值不相同；

5) 当自由度n趋于无穷的时，t分布不同点趋近于标准正态分布的速度不相同。

参考文献

[1]	杨洁, 李兆庚. 关于t分布的极限分布为标准正态分布的证明[J]. 石油化工高等学校学报, 1994(3): 78-80.
[2]	严琴, 唐贺, 李开灿. 中心多元t分布的一致渐近正态性[J]. 湖北文理学院学报, 2013, 34(2): 9-13.
[3]	李开灿, 孟赵玲. x~2分布、t分布和F分布的一致渐近正态性[J]. 北京印刷学院学报, 2004(3): 30-33.
[4]	梁琼. X~2•T•F分布的正态逼近[J]. 湖北民族学院学报(自然科学版), 1995(2): 33-38.
[5]	王娟. t分布密度函数之性质[J]. 淮阴工学院学报, 2007(5): 15-21.
[6]	彭定忠, 张映辉, 刘朝才. t分布概率密度的分析[J]. 湖南城市学院学报(自然科学版), 2012, 21(4): 50-52.
[7]	张光远. 关于多元t分布的一些讨论[J]. 新疆大学学报(自然科学版), 1996(3): 33-38.
[8]	Li, R. and Saralees, N. (2020) A Review of Student’s t Distribution and Its Generalizations. Empirical Economics, 58, 1461-1490. [Google Scholar] [CrossRef]
[9]	Chen, C.P. (2018) Complete As-ymptotic Expansions for the Density Function of t -Distribution. Statistics and Probability Letters, 141. [Google Scholar] [CrossRef]
[10]	魏宗舒. 概率论与数理统计教程[M]. 北京: 高等教育出版社, 2008: 145-146.

为你推荐

友情链接