线性代数中的几个注记
Several Notes on Linear Algebra
DOI: 10.12677/aam.2026.152044, PDF, HTML, XML,   
作者: 李华灿:赣南科技学院文法学院,江西 赣州
关键词: 线性相关矩阵的秩行列式特征值Linear Dependence Matrix Rank Determinant Eigenvalue Trace
摘要: 本文针对学生在学习线性代数过程中易混淆的核心概念,系统梳理了向量组线性相关与部分组的关系、矩阵秩的几何意义、行列式与矩阵可逆性的等价性,以及特征值与矩阵迹、行列式的关联这四个关键问题。通过定义阐释、实例验证与理论透视,澄清概念误区,帮助学生建立“定义–实例–几何意义”三位一体的认知框架,打通线性代数理论与应用之间的理解壁垒。
Abstract: This paper addresses common conceptual confusions encountered by students in learning linear algebra. It systematically organizes four key issues: the relationship between linear dependence of a vector set and its subsets, the geometric meaning of matrix rank, the equivalence between zero determinant and matrix singularity, and the connection between eigenvalues, matrix trace, and determinant. Through definition explanation, concrete examples, and theoretical analysis, this paper clarifies misunderstandings, helping students establish a trinity cognitive framework of “definition-example-geometric meaning” and bridge the gap between linear algebra theory and application.
文章引用:李华灿. 线性代数中的几个注记[J]. 应用数学进展, 2026, 15(2): 1-7. https://doi.org/10.12677/aam.2026.152044

1. 引言

线性代数[1]作为描述向量空间、线性变换与数据结构的核心数学工具,是计算机科学、物理学、工程学及经济学等领域的基础课程,其理论体系兼具抽象性与逻辑性,学生在学习中常对“线性相关的局部与整体关系、矩阵秩的直观意义、行列式与可逆性的深层关联、特征值性质的应用边界”产生认知偏差,这些偏差既源于概念本身的抽象性,也与部分教材侧重计算、轻几何解释的编排有关。

从学科教学实践看,国际权威教材已高度重视这些概念的澄清。例如,Strang在《Introduction to Linear Algebra》[2]中强调,“矩阵的秩是线性代数的核心纽带”,其本质是向量组生成子空间的维度,而非单纯的“非零子式最高阶数”;Hoffman的《Linear Algebra》则通过线性变换的视角,揭示“行列式为零”与“线性变换不可逆”的等价性,而非孤立的计算规则;Axler在《Linear Algebra Done Right》[3]中更是摒弃传统行列式优先的讲法,直接从线性变换的核与像出发,诠释特征值与矩阵迹、行列式的关系,避免学生陷入“重计算、轻本质”的误区。

本文立足上述学术背景,针对教学中反复出现的概念混淆点,结合实例与几何意义展开分析,既呼应国际教材对核心概念的本质解读,也为线性代数教学提供更具针对性的澄清思路,助力学生从“会算”走向“懂理”。

2. 向量组线性相关 ≠ 部分组线性相关

学生常误认为“整体向量组线性相关,则其任意部分组也线性相关”或“部分组线性无关,则整体也线性无关”,本质是混淆了线性相关的“整体性质”与“局部性质”的逻辑关系。

2.1. 核心定义

定义1 (线性相关) 设 α 1 , α 2 ,, α m 是数域 上的 n 维向量组,若存在不全为零的数 k 1 , k 2 ,, k m ,使得 k 1 α 1 + k 2 α 2 ++ k m α m =0 ,则称该向量组线性相关;否则称线性无关。

逻辑关系:由定义1可知,线性相关的核心是“存在非平凡线性组合为零向量”,其逆否命题为“若所有线性组合为零向量仅当系数全为零,则线性无关”。

2.2. 反例与验证

1 (整体相关但部分组无关)

3 中的向量组为 α 1 = ( 1,0,0 ) T , α 2 = ( 0,1,0 ) T α 3 = ( 1,1,0 ) T

(1) 验证整体相关性:取 k 1 =1, k 2 =1, k 3 =1 (不全为零),则 1 α 1 +1 α 2 +( 1 ) α 3 =0 ,故 α 1 , α 2 , α 3 线性相关。

(2) 验证部分组无关:对 α 1 , α 2 ,若 k 1 α 1 + k 2 α 2 =0 ,则 ( k 1 , k 2 ,0 ) T = ( 0,0,0 ) T ,仅当 k 1 = k 2 =0 ,故 α 1 , α 2 线性无关。

例2 (部分组相关则整体相关)

2 中的向量组为 β 1 = ( 1,2 ) T , β 2 = ( 2,4 ) T , β 3 = ( 3,5 ) T

(1) 部分组 β 1 , β 2 :因 β 2 =2 β 1 ,存在 k 1 =2, k 2 =1 (不全为零)使 2 β 1 β 2 =0 ,故 β 1 , β 2 线性相关。

(2) 整体组 β 1 , β 2 , β 3 :取 k 1 =2, k 2 =1, k 3 =0 (不全为零),则 2 β 1 β 2 +0 β 3 =0 ,故整体线性相关。

2.3. 理论透视:生成子空间的维度视角

线性相关的本质可通过“向量组生成子空间的维度”解读:若向量组 α 1 ,, α m 线性无关,则其生成子空间 L( α 1 ,, α m ) 的维度 dimL=m (向量组个数 = 子空间维度);若线性相关,则 dimL<m ,即子空间维度小于向量组个数[4]

例1中, α 1 , α 2 生成的子空间是 3 中的 xy 平面( dim=2 ),加入 α 3 后, α 3 仍在 xy 平面内,子空间维度未增加(仍为2),故整体相关但部分组无关;例2中, β 1 , β 2 生成的子空间是 2 中的一条直线( dim=1 ),加入 β 3 后,子空间维度最多为2,但部分组已使“维度 < 个数”,故整体必然相关。

结论:线性相关的传递性仅单向成立,即部分组相关→整体相关,反之不成立;整体无关→部分组无关,反之不成立。

3. 矩阵的秩:行秩 = 列秩的几何意义

学生常记住“矩阵的行秩等于列秩,统称为矩阵的秩”,但不理解其几何本质,仅将秩视为“非零子式的最高阶数”,导致无法关联线性变换的直观意义。

3.1. 核心定义

定义2 (矩阵的秩):设 A m×n 矩阵,其行向量组的秩称为行秩,列向量组的秩称为列秩;矩阵 A 的秩 rank( A ) 定义为行秩(或列秩),也等于 A 中非零子式的最高阶数。

关键等价:对任意矩阵 A ,行秩 = 列秩,此性质是线性代数的“桥梁性结论”。

3.2. 实例验证

例3 (行秩 = 列秩的计算) 设矩阵 A=( 1 2 3 4 5 6 7 8 9 ) ,计算其行秩与列秩。

(1) 行秩计算:对行向量组 γ 1 =( 1,2,3 ), γ 2 =( 4,5,6 ), γ 3 =( 7,8,9 ) ,做初等行变换。

由于 γ 3 =2 γ 2 γ 1 ,行向量组线性相关,又 γ 1 , γ 2 不共线(不存在 k 使 γ 2 =k γ 1 ),故行秩 = 2。

(2) 列秩计算:对列向量组 α 1 = ( 1,4,7 ) T , α 2 = ( 2,5,8 ) T , α 3 = ( 3,6,9 ) T ,做初等列变换。

由于 α 3 =2 α 2 α 1 ,列向量组线性相关,又 α 1 , α 2 不共线(不存在 k 使 α 2 =k α 1 ),故列秩 = 2。

综上, rank( A )=2 ,行秩 = 列秩。

例4 设矩阵 B=( 1 2 3 2 4 6 3 5 7 4 6 8 ) (行向量线性关系不直观),计算其行秩与列秩。

解:(1) 行秩计算:初等行变换化为阶梯形。阶梯形矩阵的核心特征是“非零行首非零元列标严格递增”,非零行个数即为行秩。对 B 做如下初等行变换。

第一步:第2行 − 2 × 第1行,第3行 − 3 × 第1行,第4行 − 4 × 第1行,得

B 1 =( 1 2 3 0 0 0 0 1 2 0 2 4 )

第二步:交换第2行与第3行(使非零元列标递增),得

B 2 =( 1 2 3 0 1 2 0 0 0 0 2 4 )

第三步:第4行 − 2 × 第2行,得

B 3 =( 1 2 3 0 1 2 0 0 0 0 0 0 ) (阶梯形矩阵)

阶梯形 B 3 中非零行的个数为2,故行秩 = 2。

(2) 列秩计算:判断列向量组的极大无关组。设 B 的列向量为 γ 1 = ( 1,2,3,4 ) T γ 2 = ( 2,4,5,6 ) T γ 3 = ( 3,6,7,8 ) T

第一步:判断 γ 1 , γ 2 的线性相关性。设 k 1 γ 1 + k 2 γ 2 =0 ,得方程组

{ k 1 +2 k 2 =0 2 k 1 +4 k 2 =0 3 k 1 +5 k 2 =0 4 k 1 +6 k 2 =0

由第1式得 k 1 =2 k 2 代入第3式: 6 k 2 +5 k 2 = k 2 =0 k 2 =0 ,故 k 1 =0 ,因此 γ 1 , γ 2 线性无关。

第二步:判断 γ 3 是否可由 γ 1 , γ 2 线性表示。设 γ 3 = k 1 γ 1 + k 2 γ 2 ,得方程组

{ k 1 +2 k 2 =3 2 k 1 +4 k 2 =6 3 k 1 +5 k 2 =7 4 k 1 +6 k 2 =8

由第1式得 k 1 =32 k 2 ,代入第3式: 3( 32 k 2 )+5 k 2 =79 k 2 =7 k 2 =2 ,则 k 1 =34=1

验证第4式: 4( 1 )+62=4+12=8 ,满足方程,故 γ 3 可由 γ 1 , γ 2 线性表示。

因此,列向量组的极大无关组含2个向量,列秩 = 2。

综上, rank( B )=2 ,行秩 = 列秩,验证核心结论。

3.3. 理论透视:初等变换与秩零定理的基础解读

3.3.1. 行秩 = 列秩的基础证明(基于初等变换)

(1) 初等行变换不改变行秩

初等行变换包括三种操作:① 交换两行;② 某行乘非零常数;③ 某行加另一行的 k 倍。

操作①:交换行向量顺序,不改变向量组的线性相关性(线性组合的系数仅对应向量顺序变化,非零系数仍存在),故行秩不变;

操作②:某行乘非零常数 c ,新行向量 c β i 与原行向量 β i 线性相关( β i 为新行),但向量组的极大无关组仍包含原无关向量(若原组无关,新组仍无关),故行秩不变;

操作③:第i行 = 第i行 + k × 第j行,新行向量 β i = β i +k β j 是原两行的线性组合。此时原行向量组 { β 1 ,, β i ,, β j } 与新行向量组 { β 1 ,, β i ,, β j } 等价(原组可表示新组,新组也可表示原组: β i = β i k β j ),而等价向量组的秩相同,故行秩不变。

(2) 初等行变换不改变列秩

列向量组的线性相关性等价于“齐次线性方程组 Ax=0 是否有非零解”:若列向量 γ 1 ,, γ s 线性相关,则存在非零 x= ( k 1 ,, k s ) T 使 k 1 γ 1 ++ k s γ s =0 ,即 Ax=0 有非零解;反之则无解。

初等行变换对应方程组的同解变形,(如交换两行等价于交换方程顺序,不改变解;某行乘非零常数等价于方程两边乘非零常数,不改变解),因此“是否存在非零解”的性质不变,即列向量组的线性相关性不变,故列秩不变。

(3) 阶梯形矩阵的行秩 = 列秩

对任意矩阵 A ,可通过有限次初等行变换化为阶梯形矩阵 U 。设 U r个非零行,则

行秩:非零行向量线性无关(后一行的首非零元列标大于前一行,无法用前一行线性表示),故行秩 = r

列秩:非零行首非零元所在的r个列(主列)线性无关(各主列在不同行有非零元,无法用其他主列线性表示),其余列(非主列)可由主列线性表示(通过回代消元可得系数),故列秩 = r

因此,阶梯形矩阵的行秩 = 列秩 = r,而AU行秩、列秩均相等,故任意矩阵的行秩 = 列秩。

3.3.2. 秩零定理的直观解释(补充几何意义)

秩零定理:对 m×n 矩阵A (表示 n m 的线性变换),有

其中,像空间,列向量组生成的子空间,;核空间 Ax=0 的解空间,称为零维数; n 原空间 n 的维度(矩阵列数)。

几何意义:原空间 n 中的任意向量x可分解为“被 A 映射到零向量的部分”()和“被A映射到像空间的部分”(的原像),两者维度之和等于原空间维度[5],即“零向量的‘贡献’+ 非零像的‘贡献’= 总空间的‘大小’”。

例4中,B是4 × 3矩阵(n = 3),其阶梯形矩阵有r = 2个非零行,故。由秩零定理得

实际计算 Bx=0 的解空间。由阶梯形 B 3 得方程 { x 1 +2 x 2 +3 x 3 =0 x 2 2 x 3 =0 ,取自由变量,则 x 2 =2t, x 1 =2 x 2 3 x 3 =t ,解为 x=t ( 1,2,1 ) T ,即解空间是1维子空间,与秩零定理结果一致。

4. 行列式为零与矩阵不可逆的等价性

学生常机械记忆“行列式为零则矩阵不可逆,可逆则行列式不为零”,但忽略“行列式为零”的本质是“矩阵的列向量组线性相关”,导致无法解释“为什么行列式为零会使逆矩阵不存在”。

4.1. 核心定义

定义3 (可逆矩阵) 设 A n 阶方阵,若存在 n 阶方阵 B ,使得 AB=BA=E ( E 为单位矩阵),则称 A 可逆, B A 的逆矩阵,记为 A 1 ;否则称 A 为奇异矩阵(不可逆矩阵)。

定义4 (行列式) n 阶方阵 A 的行列式 det( A ) 是对 A 的列向量(或行向量)的一种“多线性反对称”运算,其几何意义是 n 个列向量张成的 n 维平行多面体的体积。

4.2. 实例

4 (行列式与可逆性的关联)

(1) 可逆矩阵:设 A=( 1 2 3 4 ) ,则 det( A )=1×42×3=20 ,令 A 1 =( 2 1 1.5 0.5 ) ,则 A A 1 = A 1 A=E ,故 A 可逆。

(2) 奇异矩阵:设 B=( 1 2 2 4 ) ,则 det( B )=1×42×2=0 . 假设存在逆矩阵 B 1 ,使 B B 1 =E ,两边取行列式得 det( B )det( B 1 )=det( E )=1 ,但 det( B )=0 ,矛盾,故 B 不可逆。

4.3. 常见误区

误区1:“为零是因为矩阵有全零行或全零列”。反例: C=( 1 1 1 1 ) ,无全零行或全零列,但 det( C )=0 ,本质是列向量线性相关( α 2 = α 1 )。

误区2:“矩阵不可逆仅因为行列式为零”。本质是“行列式为零”与“列向量组线性相关”“秩 < n ”“ Ax=0 有非零解”等价,这些性质共同导致逆矩阵不存在。若 A 的列向量线性相关,则 Ax=0 有非零解 x 0 ,若 A 可逆,则 x 0 = A 1 A x 0 = A 1 0=0

4.4. 理论透视:体积的几何意义

行列式的几何意义是“列向量张成的平行多面体体积”。

det( A )0 ,则 n 个列向量线性无关,张成的是 n 维空间的“满秩”平行多面体(体积非零),此时线性变换 T( x )=Ax 是“满射且单射”(双射),故存在逆变换 T 1 ( y )= A 1 y ,即 A 可逆;

det( A )=0 ,则 n 个列向量线性相关,张成的平行多面体“退化”(体积为零,如 3 中三个共面向量张成的平行六面体体积为零),此时线性变换 T( x )=Ax 是“非单射”(存在非零 x 0 使 T( x 0 )=0 ),故不存在逆变换,即 A 不可逆。

结论:行列式为零是矩阵不可逆的“表象”,本质是列向量组线性相关导致线性变换非双射。

5. 特征值的和、积与矩阵迹、行列式的关系

学生易记错“特征值的和等于矩阵的迹,特征值的积等于矩阵的行列式”,或忽略“重特征值需计入重数”的前提,导致应用时出错。

5.1. 核心定义

定义5 (特征值与特征向量) 设 A n 阶方阵,若存在数 λ 和非零向量 x ,使得 Ax=λx ,则称 λ A 的特征值, x A 对应 λ 的特征向量;特征值的全体称为 A 的谱。

定义6 (矩阵的迹) n 阶方阵 A 的迹 tr( A ) 定义为主对角线元素之和,即 tr( A )= a 11 + a 22 ++ a nn

5.2. 实例

5 (特征值与迹、行列式的关系) 设 A=( 2 1 0 1 2 1 0 1 2 ) (三阶对称矩阵),计算其特征值、迹与行列式。

解:矩阵A的特征多项式为

det( λEA )=| λ2 1 0 1 λ2 1 0 1 λ2 |= ( λ2 ) 3 2( λ2 )=( λ2 )( λ 2 4λ+2 )

从而解得特征值

λ 1 =2, λ 2 =2+ 2 , λ 3 =2 2 (均为单特征值)。

矩阵的迹为

tr( A )=2+2+2=6

矩阵A的行列式为

det( A )=4

容易验证

i=1 n λ i =tr( A ) i=1 n λ i =det( A )

5.3. 易错点

忽略重特征值。设 B=( 1 2 2 0 2 0 0 0 2 ) ,特征值 λ 1 =1 λ 2 = λ 3 =2 (二重),若 λ 2 = λ 3 =2 仅计一次特征值,则迹为 tr( B )=1+2+2 λ 1 + λ 2 ,矩阵的行列式为 det( B )=4 λ 1 λ 2 ;需计入重数,则矩阵的迹为 tr( B )= λ 1 + λ 2 + λ 3 =5 ,矩阵的行列式为 det( B )= λ 1 λ 2 λ 3 =4 ,满足关系。

5.4. 理论透视:特征多项式的展开

n 阶方阵 A 的特征多项式为

det( λEA )= λ n tr( A ) λ n1 ++ ( 1 ) n det( A ) .

另一方面,特征多项式可分解为

( λ λ 1 )( λ λ 2 )( λ λ n ) ( λ i 为特征值,含重数)。

展开后,有

λ n ( λ 1 + λ 2 ++ λ n ) λ n1 ++ ( 1 ) n λ 1 λ 2 λ n

对比两式的同次幂系数,可得

λ 1 + λ 2 ++ λ n =tr( A ), λ 1 λ 2 λ n =det( A ).

本质:迹与行列式是矩阵“谱不变量”不随相似变换改变,而特征值的和与积恰好是最直观的谱不变量,反映矩阵的“整体性质”,如迹反映线性变换在基向量上的“伸缩总和”,行列式反映“体积缩放比”。

参考文献

[1] 同济大学数学系. 线性代数[M]. 北京: 高等教育出版社, 2022.
[2] Strang, G. (2019) Introduction to Linear Algebra. Wellesley-Cambridge Press.
[3] Axler, S. (2015) Linear Algebra Done Right. Springer.
[4] 王辉, 刘杰. 线性相关与线性无关的教学误区澄清[J]. 高等数学研究, 2021, 24(5): 53-56.
[5] 李航, 张敏. 矩阵秩的几何意义及其教学实践[J]. 大学数学, 2023, 39(2): 68-72.