关于线性变换及其矩阵的一点注记
A Few Notes on Linear Transformations and Their Matrices
摘要: 线性变换及其矩阵是高等代数的精华内容,也是该课程教与学的一个难点。在线性变换与其矩阵的对应关系基础上,建立欧氏空间上正交变换与正交矩阵、镜面反射变换与镜面反射矩阵、对称变换与实对称矩阵等的1-1对应关系,帮助学生开拓思路、化抽象为具体,提升用矩阵方法和技巧处理线性变换问题的能力。
Abstract: Linear transformations and their matrices are the essential content of advanced algebra, and also a difficult point in the teaching and learning of this course. Based on the bijective correspondence between linear transformations and their matrices, one-to-one corresponding relationships are established, such as those between orthogonal transformations and orthogonal matrices in Euclidean spaces, between mirror reflection transformations and mirror reflection matrices, and between symmetric transformations and real symmetric matrices. This helps students broaden their thinking, transform the abstract into the concrete, and enhance their ability to handle problems related to linear transformations using matrix methods and techniques.
文章引用:来哲恒, 尹小艳, 施德才. 关于线性变换及其矩阵的一点注记[J]. 应用数学进展, 2025, 14(11): 90-97. https://doi.org/10.12677/aam.2025.1411464

1. 引言

线性空间和线性变换是高等代数研究的核心对象,也是高等代数中最重要的两个抽象概念。线性空间的结构理论、线性变换及其矩阵简化是高等代数下册教学的主线[1]-[5]。特别地,欧氏空间及其上的正交变换、对称变换则是线性空间理论与线性变换理论综合运用的典型例子,是后续泛函分析、矩阵理论、数值逼近等课程的重要基础。

由于线性空间、线性变换及内积等概念的抽象性、复杂性和多样性,这部分内容既是高等代数内容的精华,也是该课程教与学的一个难点。在代数学中,对有限维空间上的线性变换的研究,核心的方法是取定空间的基,将其转化为相应的矩阵问题来处理,这是高等代数中化抽象为具体思想的典型体现,也是研究有限维空间上线性变换的最重要的方法。如文献[4]探讨了线性变换的矩阵可相似对角化的充要条件,文献[5]讨论了对称与非对称实方阵可正交相似对角化的的问题等。

显然,这里线性变换与矩阵间的对应关系是至关重要的。教材[1]建立了n维线性空间上的线性变换与n阶矩阵之间的1-1对应关系。在此基础上,作为线性变换及其矩阵的注记,本文补充证明欧氏空间上几种常用的线性变换及对应性质的矩阵之间的1-1对应关系,为用矩阵的方法和技巧解决相关线性变换问题夯实基础。

2. 线性变换的矩阵

定义1 [1] ε 1 ,, ε n 是数域 P 上的 n 维线性空间 V 的一组基, σ V 上的线性变换。基向量的像可以由基唯一线性表出,即

{ σ ε 1 = a 11 ε 1 + a 21 ε 2 ++ a n1 ε n σ ε 2 = a 12 ε 1 + a 22 ε 2 ++ a n2 ε n σ ε n = a 1n ε 1 + a 2n ε 2 ++ a nn ε n

用矩阵表示就是

σ( ε 1 , ε 2 ,, ε n )=( ε 1 , ε 2 ,, ε n )A (1)

其中 A= ( a ij ) n×n ,称为 σ 在基 ε 1 ,, ε n 下的矩阵。

反之,对任意 n 阶方阵 A ,可定义 V 上的线性变换 σ αV ,设 α ε 1 , ε 2 ,, ε n 下的坐标为 x= ( x 1 , x 2 ,, x n ) ,令

σα=( ε 1 , ε 2 ,, ε n )Ax (2)

则易证 σ V 上的线性变换:

对任意向量 α,βV 及数 kP ,设 α=( ε 1 , ε 2 ,, ε n )x β=( ε 1 , ε 2 ,, ε n )y ,有

σ( α+β )=( ε 1 , ε 2 ,, ε n )A( x+y )=( ε 1 , ε 2 ,, ε n )Ax+( ε 1 , ε 2 ,, ε n )Ay=σ( α )+σ( β )

σ( kα )=( ε 1 ,, ε n )A( kx )=k( ε 1 ,, ε n )Ax=kσ( α )

显然,

σ( ε 1 , ε 2 ,, ε n )=( ε 1 , ε 2 ,, ε n )A

这样就建立了 L( V ) P n×n 的一个映射。记为

Φ:σ (2) (1) A (3)

其中 A σ 在基 ε 1 , ε 2 ,, ε n 下的矩阵。

下面的定理1表明这个映射 Φ 为双射且保持运算。

定理[1] ε 1 ,, ε n 是数域 P 上的 n 维线性空间 V 的一组基。在这组基下,上述对应 Φ 形成线性空间集合 L( V ) 到矩阵集合 P n×n 的一个双射,且有以下性质:

1) 线性变换的和对应与矩阵的和;

2) 线性变换的乘积对应于矩阵的乘积;

3) 线性变换的数乘对应于矩阵的数乘;

4) 可逆的线性变换与可逆矩阵对应,且逆变换对应于逆矩阵。

定理1使得我们可以通过讨论矩阵这一具体、简单和统一的对象来研究任意有限维空间上的任意抽象、复杂和多样的线性变换,简称这一思想为“变换为本、矩阵为用”。从这个意义上,可以说矩阵是处理有限维空间上线性变换的数学模型和强有力的工具。

当空间 V n 维欧氏空间时,我们看几种特殊的情形。

3. 正交变换与正交矩阵

定义2 [1] 欧氏空间 V 的线性变换 σ 称为正交变换,如果它保持向量的内积不变,即对任意 α,βV ,都有

( σα,σβ )=( α,β )

W 1 ={ σ| σV }L( V )

W ˜ 1 ={ A| An } P n×n

又记 Φ 1 Φ W 1 上的限制,即 Φ 1 =Φ| W 1

定理2 设 V 是数域 P 上的 n 维欧氏空间,取定 V 的标准正交基 ε 1 ,, ε n 。在该基下, Φ 1 形成正交变换集合 W 1 到正交矩阵集合 W ˜ 1 的双射。

证明 因为正交变换在标准正交基下的矩阵为正交阵[1],结合定理1, Φ 1 形成 W 1 W ˜ 1 的单射。

下证 Φ 1 为满射:

任取 A W ˜ 1 ( A A=A A =E ),由公式(2),存在 τL( V ) ,满足

τ( ε 1 , ε 2 ,, ε n )=( ε 1 , ε 2 ,, ε n )A

因为标准正交基的度量矩阵为单位阵,于是对任意 α,βV ,设 α,β ε 1 ,, ε n 下的坐标分别为 x,y 。由欧氏空间上内积的计算公式,有

( τα,τβ )= ( Ay ) E( Ax )=( Ax,Ay )= y A Ax= y x=( x,y )=( α,β )

因此 τ 为正交变换,即 τ W 1

4. 镜面反射变换与镜面反射矩阵

定义3 [1] η n 维欧氏空间 V 中一个单位向量,正交变换 σ

σα=α2( η,α )η

称为 V 上的镜面反射。

从几何上理解, α σα 关于 n1 维超平面 L ( η ) (形象地理解为“镜面”)对称。

定义4 [2] x R n 中的单位向量,矩阵 H=I2x x

称为 n 阶镜面反射矩阵。

W 2 ={ σ| σV }L( V n P ) W ˜ 2 ={ H| Hn } P n×n

又记 Φ 2 Φ W 2 上的限制,即 Φ 2 =Φ| W 2

定理3 设 V 是数域 P 上的 n 维线性空间,取

V 的标准正交基 ε 1 ,, ε n 。在这组基下, Φ 2 形成镜面反射变换集合 W 2 到镜面反射矩阵集合 W ˜ 2 的双射。

证明 分为两步:

第一步 证明 Φ 2 形成 W 2 W ˜ 2 的映射:

σ W 2 ,即存在单位向量 ωV ,使得 αV σα 可表示为

σα=α2( ω,α )α

由有限维欧氏空间基的扩充定理,将 ω 扩充成 V 的一组标准正交基 ω, β 2 ,, β n 。令

V 1 =L( β 2 ,, β n )

σ 在标准正交基 ω, β 2 ,, β n 下的矩阵为

diag( 1,1,,1 ) ,即

σ( ω, β 2 ,, β n )=( ω, β 2 ,, β n )[ 1 1 1 ]

从而对给定的标准正交基 ε 1 , ε 2 ,, ε n ,设 ω, β 2 ,, β n ε 1 , ε 2 ,, ε n 的过渡矩阵为 P ,即

( ε 1 , ε 2 ,, ε n )=( ω, β 2 ,, β n )P

P 为正交矩阵,i.e. P 1 = P ,将 P 按列分块,记为 P =[ p 1 , p 2 ,, p n ] ,于是, σ 在基 ε 1 , ε 2 ,, ε n 下的矩阵为

H= P 1 diag( 1,1,,1 )P=P'diag( 1,1,,1 )P=[ p 1 , p 2 ,, p n ][ 1 1 1 ][ p 1 p 2 p n ] = p 1 p 1 + p 2 p 2 ++ p n p n =( p 1 p 1 + p 2 p 2 ++ p n p n )2 p 1 p 1 =I2 p 1 p 1

σ ε 1 , ε 2 ,, ε n 下的矩阵 H 为镜面反射矩阵。又因为线性变换在给定基下的矩阵是唯一的,于是 Φ 2 形成 W 2 W ˜ 2 的映射。

第二步 证明上述映射为1-1对应

显然,由定理1,上述映射为单射。

下证这一映射为满射:即任取 H=I2x x W ˜ 2 ( x R n 为单位向量)为 n 阶镜面反射矩阵,需说明由(2)定义的线性变换 σ W 2 ,即 σ 必为镜面反射变换:

ω ε 1 , ε 2 ,, ε n 下的坐标为 x ,即

ω=( ε 1 , ε 2 ,, ε n )x ,由

σ( ε 1 , ε 2 ,, ε n )=( ε 1 , ε 2 ,, ε n )H

可得,对任意 αV ,设 α=( ε 1 , ε 2 ,, ε n )y ,有

σα=( ε 1 , ε 2 ,, ε n )Hy =( ε 1 , ε 2 ,, ε n )( y2x x y ) =( ε 1 , ε 2 ,, ε n )y2 x y( ε 1 , ε 2 ,, ε n )x =α2 x yω =α2( ω,α )ω

上式中最后一个等式成立是因为 x y=( ω,α )

如上图可见, σ 的确为 V 上关于 n1 维子空间(称为超平面) W= ( L( ω ) ) 的镜面反射。

由定理3的证明过程,我们有:

推论2 设 V n 维欧氏空间, σL( V ) 。则

σ 为镜面反射变换

σ 在某标准正交基下的矩阵为 diag( 1,1,,1 )

σ 在某标准正交基下的矩阵为镜面反射阵 σ 在任意标准正交基下的矩阵为镜面反射阵。

5. 对称变换与实对称矩阵

定义5 [3] σ 是欧氏空间 V 上的线性变换,如果对于任意的 α,βV ,都有

( σα,β )=( α,σβ )

则称 σ 称为对称变换。

W 3 ={ σ| σV }L( V n P ) W ˜ 3 ={ A| An } P n×n

又记 Φ 3 Φ W 3 上的限制,即 Φ 3 =Φ| W 3

与定理2、定理3证明类似有,

定理4 设 V 是数域 P 上的 n 维欧氏空间,取定 V 的标准正交基 ε 1 ,, ε n 。在这组基下, Φ 3 形成对称变换集合 W 3 到实对称矩阵集合 W ˜ 3 的双射。

注1 类似可证,在标准正交基下,欧氏空间上的反对称变换、投影变换、正交投影变换等,由(3),均可分别建立与反对称实矩阵、投影矩阵、正交投影矩阵之间的1-1对应;

注2 在有限维酉空间中,将“正交变换(正交矩阵)”换成“酉变换(酉矩阵)”,“对称变换(实对称矩阵)”换成“Hermite变换(Hermite矩阵)”,相应的命题依然成立。

注3 需要格外注意的是,定理2、定理3和定理4中的1-1对应必须要在 V 的标准正交基下才成立,在非标准正交基下,不一定成立。

1) 在非标准正交基下,正交变换的矩阵可能正交,也可能不正交:

例1 设 σ ˜ R 2 上向量关于 x 轴的镜面反射,求 σ ˜ 在以下两组基下的矩阵:

基I: α 1 =ij,  α 2 =j

基II: β 1 =i+ 1 2 j,  β 2 =i+ 1 2 j

解 将 σ ˜ 作用到 α 1 , α 2 上,

σ ˜ ( α 1 )=i+j= α 1 +2 α 2 ,  σ ˜ ( α 2 )=j= α 2

可得

σ ˜ ( α 1 , α 2 )=( α 1 , α 2 )[ 1 0 2 1 ]=( α 1 , α 2 )A

σ ˜ ( β 1 )=i 1 2 j= β 2 , σ ˜ ( β 2 )=i 1 2 j= β 1 ,可得

σ ˜ ( β 1 , β 2 )=( β 1 , β 2 )[ 0 1 1 0 ]=( β 1 , β 2 )B

可见,正交变换 σ ˜ 在非标准正交基I下的矩阵 A 不正交,但在非标准正交基II下的矩阵 B 正交且为镜面反射矩阵。

2) 在非标准正交基下,非正交线性变换的矩阵可能正交,也可能不正交:

例2 在 R 2 中,向量 α=i+j R 2 上线性变换 τ ˜ :( x,y )( x,y+2x ) ,求 τ ˜ 在以下两组基下的矩阵:

基I: ξ 1 =( 1,1 ), ξ 2 =( 0,1 )

基II: η 1 =( 1,0 ), η 2 =( 0,1 )

解. 由 τ ˜ ( 1,0 )=( 1,2 ) ,显然 τ ˜ 不保持向量长度,故它不正交。

τ ˜ ( ξ 1 )=( 1,1 )= ξ 1 , τ ˜ ( ξ 2 )= ξ 2 .

τ ˜ ( ξ 1 , ξ 2 )=( ξ 1 , ξ 2 )[ 1 1 ] ;

τ ˜ ( η 1 )=( 1,2 )= η 1 +2 η 2 ,  τ ˜ ( η 2 )= η 2

τ ˜ ( η 1 , η 2 )=( η 1 , η 2 )[ 1 0 2 1 ]

可见, τ ˜ 在非标准正交基I下的矩阵为正交阵 [ 1 1 ] (为镜面反射矩阵),而在非标准正交基II下的矩阵为非正交矩阵 [ 1 0 2 1 ]

不难看出,例1中的镜面反射变换 σ ˜ 也是 R 2 上的对称变换, σ ˜ 在非标准正交基 α 1 , α 2 下的矩阵非对称,但在非标准正交基 β 1 , β 2 下的矩阵对称。例2中的线性变换 τ ˜ 不是对称变换, τ ˜ 在非标准正交基 ξ 1 , ξ 2 下的矩阵对称,在非标准正交基 η 1 , η 2 下的矩阵不对称。

因此,由例1和例2可见:

3) 在非标准正交基下,对称变换的矩阵可能对称,也可能不对称。同时,非对称变换的矩阵可能对称,也可能不对称。

由定理1~定理4,在处理有限维线性/欧氏空间上的抽象的线性变换问题时,将其转换为对应的矩阵语言往往可以帮助我们更容易地理解和看清问题的本质,进而借助矩阵技巧轻松解决,达到事半功倍的效果。

例3 设 σ 1 , σ 2 n 维欧氏空间 V 的两个线性变换,且有

( σ 1 α, σ 1 α )=( σ 2 α, σ 2 α ),  αV

证明:在 V 中存在正交变换 τ ,使得

τ σ 1 = σ 2

直接用线性变换的语言证明该命题冗长复杂,不好理解(见参考文献[3],p. 474)。利用定理1和定理2,将其转化为矩阵语言则显得简洁明了。

证明 取定 V 的标准正交基 ε 1 , ε 2 ,, ε n ,记 σ 1 , σ 2 在该基下的矩阵分别为 A,B

αV ,记 α 在基 ε 1 , ε 2 ,, ε n 下的坐标为 x ,则由内积的计算公式,

( σ 1 α, σ 1 α )=( Ax,Ax )= x A Ax

( σ 2 α, σ 2 α )=( Bx,Bx )= x B Bx

从而由条件, x A Ax= x B Bx 。由 x 的任意性可知, A'A=B'B 。可见, A,B 的奇异值和右奇异向量分别相同,故存在正交阵 U 1 , U 2 ,V ,使得

A= U 1 [ Δ 0 0 0 ]V,  B= U 2 [ Δ 0 0 0 ]V

其中, Δ=diag( a 1 ,, a r ) a i ,i=1,2,,r 为矩阵 A 的所有正奇异值。于是, B= U 2 U 1 A 。令 U= U 2 U 1 ,则 U 为正交阵。由定理2,可按照(2)式定义 V 上唯一的正交变换 τ, 满足 τ( ε 1 , ε 2 ,, ε n )=( ε 1 , ε 2 ,, ε n )U 。则由 B=UA ,必有 σ 2 =τ σ 1

例4 设 V n 维欧氏空间, V 1 V 的2维子空间, δ V 上沿 V 1 绕原点逆时针旋转 θ 的旋转变换。证明 δ 可以表示为 V 上的两个镜面反射的复合。

证明 取 V 1 的标准正交基,记为 ε 1 , ε 2 ,将其扩充成 V 的标准正交基 ε 1 , ε 2 , ε 3 ,, ε n 。则旋转变换 δ ε 1 , ε 2 , ε 3 ,, ε n 下的矩阵为

G=[ cosθ sinθ sinθ cosθ 1 1 ]

显然,

G=[ cos θ 2 sin θ 2 sin θ 2 cos θ 2 1 1 ][ cos 3θ 2 sin 3θ 2 sin 3θ 2 cos 3θ 2 1 1 ] = H 1 H 2

由定理3,在标准正交基 ε 1 , ε 2 , ε 3 ,, ε n 下,由镜面反射矩阵 H 1 , H 2 ,可定义 V 上的镜面反射变换 δ 1 , δ 2 ,满足

δ i ( ε 1 , ε 2 ,, ε n )=( ε 1 , ε 2 ,, ε n ) H i ,  i=1,2.

于是正交变换 δ 和正交变换 δ 1 δ 2 在标准正交基 ε 1 , ε 2 ,, ε n 下的矩阵相同,故 δ= δ 1 δ 2

6. 启发与思考

有限维线性空间(欧氏空间)及其上的线性变换是高等代数研究的核心和精华内容。但由于形式和运算的抽象性,n维线性空间(欧氏空间)上的线性变换往往难以直观想象,很多问题处理起来非常复杂。取定适当基(标准正交基),将线性变换(正交变换、对称变换)等问题转换为相应性质的矩阵问题,从而利用矩阵运算技巧解决变换问题往往会使得思路豁然开朗,带来“柳暗花明”的惊喜。在高等代数的教学过程中,要注重提升变换与矩阵“双线叙事”、灵活切换的意识和能力,在传授知识的同时,引导学生掌握这种重要的代数方法。

基金项目

西安电子科技大学矩阵分析与计算在线课程建设项目(ZXKC2303),西安电子科技大学教学名师培育计划。

参考文献

[1] 北京大学数学系前代数小组. 高等代数[M]. 第5版. 北京: 高等教育出版社, 2018.
[2] 丘维声. 高等代数下册-大学高等代数课程创新教材[M]. 北京: 清华大学出版社, 2010.
[3] 钱吉林. 高等代数题解精粹[M]. 北京: 中央民族大学出版社, 2014.
[4] 尹小艳, 施德才. 从相似对角化探高代的教与学[J]. 高等数学研究, 2022, 25(4): 7-10.
[5] 蒋启芬. 对称与非对称实方阵相似对角化问题的注记[J]. 高等数学研究, 2021, 24(6): 76-78.