1. 引言
在统计学中,为了对含参数的分布族中的某些参数进行估计,我们需要构造适当的统计量。Fisher矩阵可以用来刻画统计量的充分性。假设有一个分布族
,那么Fisher矩阵定义为
由于正态分布作为典型指数族分布,其参数空间的几何特性始终是核心研究议题。正态分布族的Fisher矩阵定义了该分布族上的Riemann度量。关于这类度量前人已有很多研究工作。早期突破见于Yoshiharu等学者(1979) [1]对二维正态分布的探索:他们首次证明当协方差矩阵Σ为对角阵时,参数空间具有爱因斯坦流形结构,但其结论限于二维情形,且未揭示高维推广的可能性。Skovgaard (1984) [2]通过将多元正态分布族建模为Fisher-Rao度量下的黎曼流形,系统推导了仿射联络与曲率张量的表达式,但其研究止步于黎曼曲率的定性分析,未深入计算数量曲率等全局几何不变量。
本文突破二维情形限制,一方面在Skovgaard (1984)关于高维正态分布族曲率研究尚不完整的基础上,系统研究了正态分布族的几何结构。得到正态分布族的Fisher度量的曲率张量,Ricci曲率以及数量曲率的完整公式
另一方面得到了当Σ为对角矩阵时,正态分布的参数空间是爱因斯坦空间,该结论推广了Yoshiharu (1979)的二维结果。
2. 预备知识
2.1. 经典信息几何
定义2.1 [3]:设
是集合
上的概率密度函数,其中
是密度函数的参数,称
是统计流形,其中
。
定义2.2 [4]:若
维统计流形
可以表示为:
则称
是一个指数分布族。其中,
是
维随机变量,
是该分布族的
维自然坐标,
是关于
的函数,
是
个关于
线性无关的函数,
称为关于参数
的势函数。
若我们规定特定的测量
,即
,那么指数族的密度函数就可以写为:
根据指数分布族的定义,可以将正态分布族写为指数分布族的形式。
首先给出
维正态分布的概率密度函数:
其中,
为正态分布的均值,
是n维协方差矩阵(
是n维正定对称矩阵),
为n维随机变量。
现在定义出新的随机变量
:
同时引入新的参数
:
那么正态分布族的势函数就可以得到:
并将正态分布族的Fisher信息度量定义为:
正态分布族的Fisher信息度量是由期望来定义,为了方便计算,在计算过程中一般由
进行计算,下面给出它的证明。
定理2.3 [4]:若
是光滑的,则
2.2. 矩阵的迹
下面介绍关于矩阵以及矩阵迹的相关性质,通过矩阵迹转化为元素的形式,进而得到更为简单的计算。
引理2.4:若
是
阶矩阵,则
(1)
(1)
(2) 当
或者
是
阶对称矩阵,有
(2)
(3) 当
或者
是
阶对称矩阵,有
(3)
(4)
(4)
(5) 若
,则
(5)
(6) 若
(6)
(7)
(7)
(8)
(8)
(9) 当
是
阶对称矩阵,有
(9)
其中
且
。
证明:
(1),(8)可以通过简单计算得到,(6)可以将其展开得到,着重证明以下式子。
对于(2)根据公式(2.1),将迹的形式转换为元素的形式
因为
,有
又因为
可以写成
所以
对于(3),
或者
是
阶对称矩阵
若
为对称矩阵就有
将
展开,就有
若
是对称矩阵就有
综上,若
或者
是
阶对称矩阵,就有
对于(4)将
展开,再计算其迹,有
对于(5)对
进行展开,有
对其求和,所以有
对于(7)因为
所以有
对所有的
求和即为
对于(9)若
是
阶对称矩阵
∎
3. 正态分布的Fisher信息度量的曲率
在这一部分我们将研究高维正态分布族参数空间的曲率,通常用曲率张量来描述空间的曲率,但要直观地把握空间的形状,曲率张量尚不充分。因此,我们在这里也要考虑一些二维曲面中由高斯曲率定义的截面曲率。有了前面的计算基础,这章将对高维正态分布族的曲率进行详细的计算。下面介绍后面计算高维正态分布的曲率所要用到的公式
引理3.1:设
是
中的元素,
是
中的元素,那么就有下面等式成立:
(1)
(4.1)
(2)
(4.2)
(3)
(4.3)
(4)
(4.4)
(5)
(4.5)
证明:对于(1),因为
对两边求
偏导有
化简过后得
对于(2),设
有
,对其矩阵展开并取出
的
行
列的元素,就有
对其两边求
的偏导
即
对于(3),因为
是对称矩阵,与
,对
求偏导有
因为
是对称矩阵,所以有
对于(4),将
展开,得到
对其求期望,所以有
对于(5),
∎
定理3.2 [2]:设
是高维正态分布的信息度量,则其度量的张量为
度量
的逆矩阵就可以表示为
定理3.3 [2]:正态分布的联络系数可表示为
定理3.4 [2]:若
表示
-方向的基向量场,
表示
-方向的基向量场,那么正态分布族的仿射联络
可以表示为
定理3.5 [2]:黎曼曲率张量可以表示为
下面我们介绍如何利用黎曼曲率张量计算n维正态分布的数量曲率。
定理3.6:n维正态分布的数量曲率为
证明:
首先计算Ricci张量的分量:
由公式(3)
由公式(4)
计算
由公式(8),可得
由公式(3),可得
下面计算
由公式(3),可得
由公式(4),可得
对于二维正态分布的参数空间,Ricci张量的分量由下面的公式给出:
那么数量曲率可以表示为
由公式(3),可得
∎
上述定理可知n维正态分布的数量曲率是跟维数有关的常数,但是通过Ricci张量和黎曼张量的比较,我们发现一般情况下我们的参数空间不是爱因斯坦空间,但是我们发现在某个特定的子流形下,高维正态分布的参数空间是爱因斯坦空间。下面给出高维正态分布的参数空间是爱因斯坦空间的充分条件。
推论3.7:若
是对角矩阵,则n-维正态分布的参数空间是爱因斯坦空间。
证明:当
是对角矩阵时,根据度量公式
可得到正态分布的黎曼度量为
因为
和
是对称矩阵,所以有正态分布的Fisher度量的逆矩阵
现在计算联络系数
当且仅当
时,
,其余为零,即
由于矩阵
是对称矩阵所以有
这个式子只有当
时不为零,即
这个式子只有当
时不为零,即
其余的联络系数为0。
正态分布族的仿射联络
为
其余为0。
接下来求二阶偏导:
其余为0。
黎曼曲率张量就可以表示为
其余为0。
Ricci曲率表示为
这个空间的数量曲率为
比较度量张量与Ricci张量,有如下的关系:
综上可以看到,n-维正态分布的参数空间是爱因斯坦空间。
∎