矩阵迹的Cauchy-Schwarz公式和Schur公式
Cauchy Schwarz Formula and Schur Formula for Matrix Traces
摘要: 本文介绍了相似矩阵、正交矩阵、正定矩阵、幂等矩阵、幂零矩阵、Hermite矩阵的迹的性质及定理,并证明了矩阵的迹的Cauchy-Schwarz公式和Schur公式。并举例说明这些引理和定理在具体解题过程中的应用,充分体现了用矩阵的迹在解决实际问题过程中的便捷性的便捷性以及掌握矩阵迹的性质的重要性。
Abstract: This article introduces the properties and theorems of the trace of similarity matrix, orthogonal matrix, positive definite matrix, idempotent matrix, nilpotent matrix, Hermite matrix, and proves the Cauchy Schwarz formula and Schur formula of the trace of matrix. Examples are given to illustrate the application of these property theorems in specific problem-solving processes, fully demonstrating the convenience of using the trace of matrix in solving practical problems and the importance of mastering the properties of matrix trace.
文章引用:葛岩岩, 王亚茹. 矩阵迹的Cauchy-Schwarz公式和Schur公式[J]. 理论数学, 2024, 14(11): 50-56. https://doi.org/10.12677/pm.2024.1411374

1. 引言

矩阵的迹及其应用是高等数学的重要内容,也是工程理论研究中的重要工具,他是国内外数学理论及工程理论研究的动力和基础,具有极其重要的学术价值和文化价值。随着科学技术的不断创新发展,数学在理论创新及性质研究方面也需要跟上时代的步伐,因此研究矩阵的迹的应用是十分有价值的。

本文首先介绍了矩阵的迹、Hermite矩阵、相似矩阵、正交矩阵、正定矩阵、幂等矩阵的定义[1]-[3],主要以高等代数中所学的矩阵的秩与矩阵的迹的关系、幂等矩阵的迹的情况、幂零矩阵的迹的性质及关于矩阵迹的不等式性质为依据[4]-[6],研究矩阵的迹在Cauchy-Schwarz公式和Schur公式方面的应用,以及体现其在解题过程中所带来的方便性。可以帮助我们更好的理解和运用矩阵的迹。

2. 矩阵的迹的相关概念及引理

2.1. 矩阵的相关概念

2.1.1. 矩阵的迹的定义

P为一个数域

A=( a ij ) M n ( P )   a ij P

矩阵A的主对角线上的元素之和叫做矩阵A的迹。记为

Tr( A )= a 11 + a 22 ++ a nn

2.1.2. Hermite矩阵定义

对复矩阵A,若有 A ¯ =A ,则A为Hermite矩阵;当A为实矩阵时,就是实对称矩阵。

2.1.3. 幂等矩阵定义

A为方阵,且 A 2 =A ,则称A为幂等矩阵。

2.1.4. 幂零矩阵定义

A为方阵,存在正整数 k ,使得 A k =0 ,则称A为幂零矩阵。

2.1.5. 相似矩阵的定义

如果有 n×n 的数字矩阵 P 0 , Q 0 使 λEA= P 0 ( λEB ) Q 0 ,则AB相似。

2.1.6. 正交矩阵的定义

An阶方阵,如果 A A Τ =E ,则称An阶正交阵。

2.1.7. 正定矩阵的定义

An阶方阵,如果对任意非零向量T都有 T AT>0 ,就称A为正定矩阵。

2.2. 矩阵的迹的相关引理

为了证明本文所要研究的两个定理,本节我们先给出以下引理,具体证明过程请见相关参考文献。

引理1 A M n ( P ), λ 1 , λ 2 ,, λ n 是矩阵A的全部特征根,那么

T r ( A )= λ 1 + λ 2 ++ λ n

且必有n阶正交矩阵T使得

T 1 AT=[ λ 1 0 0 0 λ 2 0 0 0 λ n ]

因为相似矩阵具有相同的特征多项式,因此他们具有相同的特征根。

引理2 A 1 , A 2 , A n M n ( P ) ,则

T r ( A 1 + A 2 ++ A n )= T r ( A 1 )+ T r ( A 2 )++ T r ( A n )

引理3 A,B n 阶方阵,则有

T r ( A )= T r ( A T ) T r ( αA+βB )=α T r ( A )+β T r ( B ) ,这里 α β 为常数。

引理4 A={ A 11 A 12 A 1n A 21 A 22 A 2n A 1n A 2n A nn } ,其中 A ij ( i,j=1,2,,k ) 均为方阵,则

T r ( A )= i=j k T r ( A ij )

引理5 A,B 分别为 n×m,m×n 矩阵,则

T r ( AB )= T r ( BA )

引理6 (Holder)如果 A,B 为正定阵, 1 p + 1 q =1 ,那么有

T r ( AB ) ( T r ( A p ) ) 1/p ( T r ( B q ) ) 1/q ,当 p>1 时。

T r ( AB ) ( T r ( A p ) ) 1/p ( T r ( B q ) ) 1/q ,当 0<p<1 p<0

2.3. 关于矩阵迹的两种不等式

基于以上关于矩阵的相关定义及矩阵的迹的相关引理,本节我们主要介绍关于矩阵的迹的两个重要公式:Cauchy-Schwarz公式和Schur公式,这两个公式在数学物理交叉领域中起着重要的作用,因此对矩阵的迹的Cauchy-Schwarz公式和Schur公式的研究具有一定的必要性。

定理1 Cauchy-Schwarz公式:

A,B 都是 n 阶矩阵,则有

T r ( A T B ) [ T r ( A T A ) ] 1/2 [ T r ( B T B ) ] 1/2

证明:不失一般性,设 a= [ a 1 a 2 a n ] T b= [ b 1 b 2 b n ] T ,则有向量的内积定义 [ a b ]=| a || b |cosθ ,(其中 θ a,b 的夹角),即

i=1 n a i b i = [ i=1 n a i 2 ] 1/2 [ i=1 n b i 2 ] 1/2

根据引理5及引理6可以推广矩阵的迹的形式为

T r ( A T B ) [ T r ( A T A ) ] 1/2 [ T r ( B T B ) ] 1/2

定理2 Schur公式:设 A n 阶方阵,则有

T r ( A 2 ) T r ( A T A )

证明:因为

( A A Τ ) 2 =( A A Τ )( A A Τ ) = A 2 A A Τ A Τ A+ ( A Τ ) 2

又因为 A A Τ 是反对称阵,固有 T r ( A A Τ ) 2 0 ,不失一般性,因此可以得到

T r ( A 2 ) T r ( A T A )

定理3 A,B 是对称矩阵,则有

T r ( AB ) 1 2 T r ( A 2 + B 2 )

证明:因为 A,B 是对称矩阵,则 A Τ =A, B Τ =B 。由Cauchy-Schwarz公式知:

T r ( AB ) [ T r ( A 2 ) ] 1/2 [ T r ( B 2 ) ] 1/2

又因为

[ T r ( A 2 ) ] 1/2 [ T r ( B 2 ) ] 1/2 1 2 [ T r ( A 2 )+ T r ( B 2 ) ]

又因为

1 2 [ T r ( A 2 + B 2 ) ]= 1 2 [ T r ( A 2 )+ T r ( B 2 ) ]

所以

T r ( AB ) 1 2 T r ( A 2 + B 2 )

3. 矩阵的迹在解题过程中的应用

为了更好地理解矩阵的迹和与之相关的性质定理及Cauchy-Schwarz公式、Schur公式在具体解题过程中的应用,本节我们给出几个具体的例子,希望能够帮助读者更加深入的理解矩阵的迹的性质,并期望为数学物理等领域的发展提供一定的帮助。

1 证明:不可能有两个n阶方阵 A,B 使得

ABBA=E

证明:由引理5可知

T r ( AB )= T r ( BA )

则有:

T r ( ABBA )= T r ( AB ) T r ( BA )=0

因为 T r ( E )=n0 ,所以

ABBAE

即对于任意的 n 阶方阵 A,B 都不可能满足 ABBA=E

2 如果 n 阶实矩阵 A,B 均可对角化,且 AB=BA ,则有

T r ( AB ) n = [ T r ( AB ) ] n = T r ( A n B n )

证明:因为 A,B 均可对角化,由引理1可知:存在正交矩阵 T 使得 T 1 AT= D 1 , T 1 BT= D 2 ,其中 D 1 , D 2 均为对角矩阵,则因为

因此

T r ( AB ) n = [ T r ( AB ) ] n = T r ( A n B n )

3 AB ,即 AB n 阶半正定矩阵,则 T r ( A ) T r ( B ) ,且等号的充要条件是 A=B

证明:令 λ 1 , λ 2 λ n 为半正定阵的特征根,因为矩阵为半正定阵的充要条件是它的特征根非负,所以

λ i 0 ( i=1,2,,n )

由引理1可知

T r ( AB )= I=1 n λ i 0

因为

T r ( AB )= T r ( A ) T r ( B )

则有

T r ( A ) T r ( B )

显然,当 A=B

T r ( A )= T r ( B )

下证当 T r ( A )= T r ( B ) A=B

AB 为半正定阵知它的特征根 λ i 0 ( i=1,2,,n ) ,根据引理1及引理2可知

T r ( AB )= I=1 n λ i

T r ( A )= T r ( B ) 时,由引理2知:

T r ( AB )= T r ( A ) T r ( B )=0

所以

I=1 n λ i =0

又因为 λ i 0( i=1,2,,n )

则可以得到:

λ 1 = λ 2 == λ n =0

4 A B 为同阶Hermite矩阵,则

T r ( A 2 )+ T r ( B 2 )2 T r ( AB )

且等号成立的充要条件是 A=B

证明:由已知 A B 为同阶 A ¯ =A, B ¯ =B ,则有

( AB ) ¯ = A B ¯ = A ¯ B ¯ =AB

( AB ) ¯ 也是Hermite矩阵。

所以 ( AB ) 2 为半正定矩阵,即 ( AB ) 2 0

根据例3知

T r ( AB ) 2 0

因为

T r ( AB ) 2 = T r ( A 2 ABBA+ B 2 ) = T r ( A 2 )+ T r ( B 2 ) T r ( AB ) T r ( BA ) = T r ( A 2 )+ T r ( B 2 )2 T r ( AB ) 0

所以

T r ( A 2 )+ T r ( B 2 )2 T r ( AB )

因为 AB 仍为Hermite矩阵,则有

( AB ) ¯ =AB, ( AB ) 2 = ( AB ) ¯ ( AB )

由例3可知

2 T r ( AB )= T r ( A 2 )+ T r ( B 2 ) T r ( AB ) 2 =0 T r ( AB ) ( AB )=0 AB=0

所以 A=B ,此时结论的证。

5 A= ( a ij ) n×n A 的特征多项式为

| λEA |= λ n + b n1 λ n1 ++ b 1 λ+ b 0

则可以得到:

b n1 = T r ( A )

证明:因为

| λEA |=[ λ a 11 a 12 a 1n a 21 λ a 22 a 2n a n1 a n2 λ a nn ] = λ n ( a 11 + a 22 ++ a nn ) λ n1 ++ ( 1 ) n detA

则可得到

b n1 =( a 11 + a 22 ++ a nn )

结论得证。

4. 结束语

知识来源于实践活动,又反过来运用到改造世界的实践活动中,其价值也就在于此。数学是一门基础学科,与人们的生活息息相关。本文通过探讨矩阵的迹的性质、定理起到抛砖引玉的作用,介绍了一些应用矩阵的迹解决实际问题的例子来说明矩阵的迹的应用方式以及哪些情况下应用会给解题带来方便。让人们更加深入的了解矩阵的迹并且应用好他来解决矩阵方面的问题。Cauchy-Schwarz公式和Schur公式是数学物理领域的两个重要公式,本文所研究矩阵的迹的Cauchy-Schwarz公式和Schur公式本质上是一种对这两个公式的推广,能够从更多的角度更清晰地理解这两个公式,并进一步揭示这两个公式的内涵。通过本文的研究,期望能够进一步吸引更多的专家学者深入研究矩阵的迹及Cauchy-Schwarz公式和Schur公式,从而不断促进基础数学领域的发展。愿我们祖国未来的建设者学好数学、用好数学,更好地为社会为人类服务。

NOTES

*通讯作者。

参考文献

[1] 宋乾坤. 矩阵的迹在解题过程中的应用[J]. 数学通报, 1990(2): 30-45.
[2] 钱吉林. 高等代数题解精粹[M]. 北京: 中央民族大学出版社, 2009.
[3] 张禾瑞, 郝炳新. 高等代数[M]. 北京: 高等教育出版社, 1983.
[4] 钱吉林, 陈良植. 高等代数方法导论[M]. 武汉: 华中师范大学出版社, 1990.
[5] 刘森, 苏仲阳. 高等代数应试训练[M]. 北京: 地质出版社, 1995.
[6] 刘麦学. 关于矩阵迹的几个不等式[J]. 蒙自师专学报, 1992(6): 59-62.