正交单位向量
正交单位向量是指既正交又是单位向量的一组向量。其定义包含以下两个条件:
1. 单位向量条件
单位向量是长度为 1 的向量。对于一个向量 (
v
\mathbf{v}
v ),满足:
∥
v
∥
=
1
或
v
⋅
v
=
1
,
\|\mathbf{v}\| = 1 \quad \text{或} \quad \sqrt{\mathbf{v} \cdot \mathbf{v}} = 1,
∥v∥=1或v⋅v=1,
其中 ( ∥ v ∥ \|\mathbf{v}\| ∥v∥ ) 表示向量的范数,通常为欧几里得范数(2 范数)。
2. 正交条件
两向量正交是指它们的点积为 0。对于两个向量 ( \mathbf{u} ) 和 ( \mathbf{v} ),若:
u
⋅
v
=
0
,
\mathbf{u} \cdot \mathbf{v} = 0,
u⋅v=0,
则称 ( u \mathbf{u} u ) 与 ( v \mathbf{v} v ) 正交。
正交单位向量的定义
一组正交单位向量是一组长度为 1 且两两正交的向量集合。例如,向量 ( u 1 , u 2 , … , u n \mathbf{u}_1, \mathbf{u}_2, \dots, \mathbf{u}_n u1,u2,…,un ) 是正交单位向量,当且仅当:
- ( ∥ u i ∥ = 1 , ∀ i \|\mathbf{u}_i\| = 1, \quad \forall i ∥ui∥=1,∀i )(单位向量条件)。
- ( u i ⋅ u j = 0 , ∀ i ≠ j \mathbf{u}_i \cdot \mathbf{u}_j = 0, \quad \forall i \neq j ui⋅uj=0,∀i=j )(正交条件)。
几何意义
在几何上,正交单位向量是相互垂直且标准化的向量。它们可以用来构造正交基。例如,在三维空间中:
- ( i = ( 1 , 0 , 0 ) \mathbf{i} = (1, 0, 0) i=(1,0,0) ),
- ( j = ( 0 , 1 , 0 ) \mathbf{j} = (0, 1, 0) j=(0,1,0) ),
- ( k = ( 0 , 0 , 1 ) \mathbf{k} = (0, 0, 1) k=(0,0,1) ),
是一组正交单位向量。
应用
正交单位向量在数学和物理中有广泛应用:
- 正交基:正交单位向量常用于构造正交基,用来简化向量表示和计算。
- 正交矩阵:正交矩阵的列(或行)是一组正交单位向量。
- 坐标系:如笛卡尔坐标系的标准基 ( i , j , k \mathbf{i}, \mathbf{j}, \mathbf{k} i,j,k )。
- 信号处理:正交单位向量用于分解信号成互不相关的分量。
矩阵的秩 (Rank of a Matrix)
矩阵的秩是描述矩阵行或列向量的线性无关性的一个重要量度。
设矩阵 (
A
\mathbf{A}
A ) 的大小为 (
m
×
n
m \times n
m×n ),秩 (
rank
(
A
\text{rank}(\mathbf{A}
rank(A) ) 是以下等价定义之一:
定义:
- 线性无关的最大数目:
- ( rank ( A ) \text{rank}(\mathbf{A}) rank(A) ) 是矩阵 ( A \mathbf{A} A ) 的行向量或列向量中线性无关向量的最大数目。
- 非零子式的最大阶:
- ( rank ( A ) \text{rank}(\mathbf{A}) rank(A) ) 是矩阵 ( A \mathbf{A} A ) 中非零子式的最大阶。
- 高斯消元法:
- ( rank ( A ) \text{rank}(\mathbf{A}) rank(A) ) 是矩阵 ( A \mathbf{A} A ) 经行变换后非零行的数目。
性质:
-
行秩等于列秩:
- 矩阵的行秩等于列秩。
-
秩的范围:
- 若 (
A
\mathbf{A}
A ) 的大小为 (
m
×
n
m \times n
m×n ),则:
0 ≤ rank ( A ) ≤ min ( m , n ) . 0 \leq \text{rank}(\mathbf{A}) \leq \min(m, n). 0≤rank(A)≤min(m,n).
- 若 (
A
\mathbf{A}
A ) 的大小为 (
m
×
n
m \times n
m×n ),则:
-
满秩矩阵:
- 若 ( rank ( A ) = min ( m , n ) \text{rank}(\mathbf{A}) = \min(m, n) rank(A)=min(m,n) ),则 ( A \mathbf{A} A ) 为满秩矩阵。
-
零矩阵的秩:
- 零矩阵的秩为 0,因为它没有非零向量。
示例:
对于矩阵:
A
=
[
1
2
3
4
5
6
7
8
9
]
,
\mathbf{A} = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{bmatrix},
A=
147258369
,
-
其列向量是线性相关的(第三列可以由前两列线性表示)。
-
经过行变换得到:
A ∼ [ 1 2 3 0 − 3 − 6 0 0 0 ] . \mathbf{A} \sim \begin{bmatrix} 1 & 2 & 3 \\ 0 & -3 & -6 \\ 0 & 0 & 0 \end{bmatrix}. A∼ 1002−303−60 .非零行数为 2,因此 ( rank ( A ) = 2 \text{rank}(\mathbf{A}) = 2 rank(A)=2 )。
非零行数为 2,因此 ( rank ( A ) = 2 \text{rank}(\mathbf{A}) = 2 rank(A)=2 )。
矩阵根和秩的联系
- 矩阵根的秩保持性:
若 ( B k = A \mathbf{B}^k = \mathbf{A} Bk=A ),则 ( rank ( B ) = rank ( A ) \text{rank}(\mathbf{B}) = \text{rank}(\mathbf{A}) rank(B)=rank(A) )。矩阵根不会改变矩阵的秩。 - 矩阵秩对可逆性的影响:
若 ( rank ( A ) = n \text{rank}(\mathbf{A}) = n rank(A)=n ) 且 ( A ∈ R n × n \mathbf{A} \in \mathbb{R}^{n \times n} A∈Rn×n ),则 ( A \mathbf{A} A ) 可逆,从而可能存在矩阵根。
矩阵的秩(rank)在几何上有以下主要意义:
1. 线性空间中的几何意义:
矩阵的秩表示矩阵的列向量(或行向量)能够张成的最大线性无关向量的个数。
- 列秩:矩阵列向量张成的列空间的维数,表示这些列向量在几何上可以构成一个几维空间。
- 行秩:矩阵行向量张成的行空间的维数,表示这些行向量在几何上可以构成一个几维空间。
根据 列秩等于行秩定理,矩阵的行秩和列秩总是相等,因此我们通常直接称为“矩阵的秩”。
2. 变换的几何意义:
矩阵可以看作一个线性变换,当该矩阵作用于一个向量空间时:
- 秩等于变换后空间的维数:矩阵将原空间中的向量映射到一个新的空间,这个新空间的维数就是矩阵的秩。
- 如果矩阵的秩是 r r r,说明变换后空间是 r r r 维。
例如,假设矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} A∈Rm×n:
- 若 rank ( A ) = n \text{rank}(A) = n rank(A)=n,表示 A A A 的列向量是线性无关的,矩阵的列张成了整个 R n \mathbb{R}^n Rn。
- 若 rank ( A ) < n \text{rank}(A) < n rank(A)<n,则存在部分列向量是线性相关的,变换会导致维数降低。
3. 矩阵表示系统的自由度:
对于线性方程组 A x = b A \mathbf{x} = \mathbf{b} Ax=b,矩阵 A A A 的秩揭示了系统解的自由度:
- rank ( A ) = n \text{rank}(A) = n rank(A)=n(列满秩):系统有唯一解。
- rank ( A ) < n \text{rank}(A) < n rank(A)<n:系统可能无解(矛盾)或有无穷多解(欠约束)。
这对应几何上线性方程组解的空间维数。
4. 列向量的线性相关性:
矩阵秩反映了列向量之间的线性相关性:
- 若 rank ( A ) = n \text{rank}(A) = n rank(A)=n,列向量线性无关。
- 若 rank ( A ) < n \text{rank}(A) < n rank(A)<n,说明列向量线性相关。
例如,对于 3 × 3 3 \times 3 3×3 矩阵:
- 如果 rank ( A ) = 3 \text{rank}(A) = 3 rank(A)=3,表示列向量能够构成 R 3 \mathbb{R}^3 R3 空间的基。
- 如果 rank ( A ) = 2 \text{rank}(A) = 2 rank(A)=2,表示列向量只能张成一个二维平面。
5. 矩阵的秩与几何对象:
在应用中,矩阵的秩也经常用于描述几何对象的维度。例如:
- 图像处理:秩反映图像的结构复杂度,例如低秩矩阵常被用来表示压缩后的图像。
- 机器学习:核矩阵的秩与特征的有效维数相关。
总结:
矩阵的秩在几何上描述了向量张成的空间维度,是线性相关性、线性变换维数、系统解的自由度的核心指标。
特征矩阵和特征值的概念
在线性代数中,特征值和特征向量描述了矩阵的某些内在属性。特征矩阵是特征值分解的产物之一,常用于将矩阵表示为特定的对角化形式。
特征值和特征向量
定义:
对于一个 ( n × n n \times n n×n ) 的矩阵 ( A \mathbf{A} A ),如果存在一个标量 ( λ \lambda λ ) 和非零向量 ( v \mathbf{v} v ),满足以下条件:
A
v
=
λ
v
,
\mathbf{A} \mathbf{v} = \lambda \mathbf{v},
Av=λv,
则称:
- ( λ \lambda λ ) 是矩阵 ( A \mathbf{A} A ) 的特征值。
- ( v \mathbf{v} v ) 是矩阵 ( A \mathbf{A} A ) 对应于特征值 ( λ \lambda λ ) 的特征向量。
特征值的物理意义
特征值表示矩阵在某些方向上的伸缩因子,而对应的特征向量表示这些方向。特征值和特征向量被广泛应用于振动分析、图像处理、机器学习(如 PCA)等领域。
特征矩阵
特征矩阵是指矩阵 ( A \mathbf{A} A ) 通过特征值分解后所得到的对角矩阵,它将特征值排列在对角线上。
特征值分解(适用于可对角化矩阵):
A
=
Q
Λ
Q
−
1
,
\mathbf{A} = \mathbf{Q} \mathbf{\Lambda} \mathbf{Q}^{-1},
A=QΛQ−1,
其中:
- ( Q \mathbf{Q} Q ) 是由特征向量组成的矩阵(特征向量矩阵)。
- ( Λ \mathbf{\Lambda} Λ ) 是对角矩阵,称为特征矩阵,其对角线上是 ( A \mathbf{A} A ) 的特征值:
Λ = diag ( λ 1 , λ 2 , … , λ n ) . \mathbf{\Lambda} = \text{diag}(\lambda_1, \lambda_2, \dots, \lambda_n). Λ=diag(λ1,λ2,…,λn).
特征值分解的推导
1. 特征方程
从特征值的定义 ( A v = λ v \mathbf{A} \mathbf{v} = \lambda \mathbf{v} Av=λv ),变形为:
(
A
−
λ
I
)
v
=
0
,
(\mathbf{A} - \lambda \mathbf{I}) \mathbf{v} = 0,
(A−λI)v=0,
其中 (
I
\mathbf{I}
I ) 是单位矩阵。
为使方程有非零解,矩阵 ( ( A − λ I ) (\mathbf{A} - \lambda \mathbf{I}) (A−λI) ) 必须是奇异矩阵,因此其行列式为 0:
det
(
A
−
λ
I
)
=
0.
\det(\mathbf{A} - \lambda \mathbf{I}) = 0.
det(A−λI)=0.
这是一个关于 (
λ
\lambda
λ ) 的 (
n
n
n ) 次多项式,称为特征多项式,其根是 (
A
\mathbf{A}
A ) 的特征值。
2. 特征向量求解
对于每个特征值 ( λ i \lambda_i λi ),求解线性方程组:
(
A
−
λ
i
I
)
v
=
0
,
(\mathbf{A} - \lambda_i \mathbf{I}) \mathbf{v} = 0,
(A−λiI)v=0,
即可得到对应的特征向量 (
v
i
\mathbf{v}_i
vi )。
示例:矩阵的特征值与特征矩阵
考虑矩阵:
A = [ 4 1 2 3 ] . \mathbf{A} = \begin{bmatrix} 4 & 1 \\ 2 & 3 \end{bmatrix}. A=[4213].
1. 求特征值
特征多项式为:
det
(
A
−
λ
I
)
=
det
[
4
−
λ
1
2
3
−
λ
]
=
(
4
−
λ
)
(
3
−
λ
)
−
2
⋅
1.
\det(\mathbf{A} - \lambda \mathbf{I}) = \det\begin{bmatrix} 4 - \lambda & 1 \\ 2 & 3 - \lambda \end{bmatrix} = (4 - \lambda)(3 - \lambda) - 2 \cdot 1.
det(A−λI)=det[4−λ213−λ]=(4−λ)(3−λ)−2⋅1.
展开得:
λ
2
−
7
λ
+
10
=
0.
\lambda^2 - 7\lambda + 10 = 0.
λ2−7λ+10=0.
解得特征值:
λ 1 = 5 , λ 2 = 2. \lambda_1 = 5, \quad \lambda_2 = 2. λ1=5,λ2=2.
2. 求特征向量
对于 ( λ 1 = 5 \lambda_1 = 5 λ1=5 ):
(
A
−
5
I
)
v
=
[
−
1
1
2
−
2
]
[
x
y
]
=
0.
(\mathbf{A} - 5 \mathbf{I}) \mathbf{v} = \begin{bmatrix} -1 & 1 \\ 2 & -2 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0.
(A−5I)v=[−121−2][xy]=0.
解得 (
v
1
=
[
1
1
]
\mathbf{v}_1 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}
v1=[11] )。
对于 ( λ 2 = 2 \lambda_2 = 2 λ2=2 ):
(
A
−
2
I
)
v
=
[
2
1
2
1
]
[
x
y
]
=
0.
(\mathbf{A} - 2 \mathbf{I}) \mathbf{v} = \begin{bmatrix} 2 & 1 \\ 2 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = 0.
(A−2I)v=[2211][xy]=0.
解得 (
v
2
=
[
−
1
2
]
\mathbf{v}_2 = \begin{bmatrix} -1 \\ 2 \end{bmatrix}
v2=[−12] )。
3. 构造特征矩阵
特征向量组成矩阵 ( Q \mathbf{Q} Q ):
Q
=
[
1
−
1
1
2
]
.
\mathbf{Q} = \begin{bmatrix} 1 & -1 \\ 1 & 2 \end{bmatrix}.
Q=[11−12].
特征值构成对角矩阵 (
Λ
\mathbf{\Lambda}
Λ ):
Λ
=
[
5
0
0
2
]
.
\mathbf{\Lambda} = \begin{bmatrix} 5 & 0 \\ 0 & 2 \end{bmatrix}.
Λ=[5002].
验证分解:
A = Q Λ Q − 1 . \mathbf{A} = \mathbf{Q} \mathbf{\Lambda} \mathbf{Q}^{-1}. A=QΛQ−1.
总结
- 特征值:标量 ( λ \lambda λ ),表示矩阵沿特定方向的伸缩因子。
- 特征向量:与特征值对应的方向。
- 特征矩阵:对角矩阵 ( Λ \mathbf{\Lambda} Λ ),包含所有特征值。
- 特征值分解:将矩阵表示为 ( A = Q Λ Q − 1 \mathbf{A} = \mathbf{Q} \mathbf{\Lambda} \mathbf{Q}^{-1} A=QΛQ−1 )。
共轭转置
共轭转置(Conjugate Transpose),也称为 Hermitian 转置,在矩阵分析中是对复数矩阵的一种操作,记作 ( A H A^H AH ) 或 ( A ∗ A^* A∗ )。对于一个复矩阵 ( A A A ),它的共轭转置定义如下:
定义
若 (
A
=
[
a
i
j
]
A = [a_{ij}]
A=[aij] ) 是一个 (
m
×
n
m \times n
m×n ) 的复矩阵,则它的共轭转置矩阵 (
A
H
A^H
AH ) 是一个 (
n
×
m
n \times m
n×m ) 的矩阵,其元素由以下规则给出:
(
A
H
)
i
j
=
a
j
i
‾
,
(A^H)_{ij} = \overline{a_{ji}},
(AH)ij=aji,
即:
- 对矩阵进行 转置(将行和列交换)。
- 对每个元素取复共轭(将复数的虚部取反)。
公式化表示为:
A
H
=
(
A
‾
)
T
=
(
A
T
)
‾
.
A^H = (\overline{A})^T = \overline{(A^T)}.
AH=(A)T=(AT).
其中:
- ( A T A^T AT ) 表示矩阵的转置。
- ( A ‾ \overline{A} A ) 表示矩阵中每个元素取复共轭。
特殊情况
- 如果矩阵 ( A A A ) 的元素全是实数,共轭转置等于普通转置:( A H = A T A^H = A^T AH=AT )。
- 如果矩阵 ( A A A ) 是实对称矩阵,那么 ( A H = A A^H = A AH=A )。
- 如果矩阵 ( A A A ) 是复 Hermitian 矩阵(厄米矩阵),则 ( A H = A A^H = A AH=A )。
示例
实数矩阵
对于实数矩阵
A
=
[
1
2
3
4
]
,
A = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix},
A=[1324],
由于没有复数部分,共轭转置等于转置:
A
H
=
A
T
=
[
1
3
2
4
]
.
A^H = A^T = \begin{bmatrix} 1 & 3 \\ 2 & 4 \end{bmatrix}.
AH=AT=[1234].
复数矩阵
对于复数矩阵
A
=
[
1
+
i
2
−
i
3
+
2
i
]
,
A = \begin{bmatrix} 1+i & 2 \\ -i & 3+2i \end{bmatrix},
A=[1+i−i23+2i],
其共轭转置是:
- 转置矩阵:
A T = [ 1 + i − i 2 3 + 2 i ] . A^T = \begin{bmatrix} 1+i & -i \\ 2 & 3+2i \end{bmatrix}. AT=[1+i2−i3+2i].
- 对每个元素取复共轭:
A H = [ 1 − i 2 i 3 − 2 i ] . A^H = \begin{bmatrix} 1-i & 2 \\ i & 3-2i \end{bmatrix}. AH=[1−ii23−2i].
性质
共轭转置具有以下重要性质:
- 自反性:( ( A H ) H = A (A^H)^H = A (AH)H=A)。
- 加法性质:( ( A + B ) H = A H + B H (A + B)^H = A^H + B^H (A+B)H=AH+BH)。
- 数乘性质:( ( c A ) H = c ‾ A H (cA)^H = \overline{c}A^H (cA)H=cAH),其中 ( c ) 是复数,( c ‾ \overline{c} c ) 是 ( c c c ) 的复共轭。
- 乘法性质:( ( A B ) H = B H A H (AB)^H = B^H A^H (AB)H=BHAH)。
- 单位矩阵:( I H = I I^H = I IH=I )(单位矩阵的共轭转置是它自身)。
- 内积性质:对于两个向量 ( u , v \mathbf{u}, \mathbf{v} u,v ),有 ( ( u H v ) = ( v H u ) ‾ (\mathbf{u}^H \mathbf{v}) = \overline{(\mathbf{v}^H \mathbf{u})} (uHv)=(vHu) )。
几何意义
在复数向量空间中,共轭转置操作与内积密切相关:
- 若 ( u , v \mathbf{u}, \mathbf{v} u,v ) 是复数向量,则内积可以表示为 ( u H v \mathbf{u}^H \mathbf{v} uHv )。
- 共轭转置是线性代数中定义内积和正交性的重要工具。
应用
- 线性代数:特征值分解、奇异值分解中常使用共轭转置。
- 量子力学:复数矩阵(如密度矩阵、哈密顿矩阵)的性质分析。
- 信号处理:复数矩阵的正交化和正交投影。
- 机器学习:复数域中的模型训练(如神经网络中的复数权值)。
行列式
行列式(Determinant)是线性代数中的一个重要概念,用来刻画一个方阵的某些代数性质和几何性质。它是一个与矩阵相关的标量值,通常记为 ( det ( A ) \det(A) det(A) ) 或 ( ∣ A ∣ |A| ∣A∣ ),其中 ( A A A ) 是矩阵。
定义
行列式仅定义在方阵(行数等于列数的矩阵)上。给定一个 ( n × n n \times n n×n ) 的方阵 ( A = [ a i j ] A = [a_{ij}] A=[aij] ),行列式是一个通过特定规则计算出的数值,用以反映矩阵的一些性质,如可逆性、线性相关性等。
小矩阵的行列式
1. 一阶矩阵
对于一个 (
1
×
1
1 \times 1
1×1 ) 矩阵 (
A
=
[
a
11
]
A = [a_{11}]
A=[a11] ),行列式为矩阵的唯一元素:
det
(
A
)
=
a
11
.
\det(A) = a_{11}.
det(A)=a11.
2. 二阶矩阵
对于一个 (
2
×
2
2 \times 2
2×2 ) 矩阵 (
A
=
[
a
b
c
d
]
A = \begin{bmatrix} a & b \\ c & d \end{bmatrix}
A=[acbd] ),行列式的计算公式是:
det
(
A
)
=
a
d
−
b
c
.
\det(A) = ad - bc.
det(A)=ad−bc.
3. 三阶矩阵
对于一个 (
3
×
3
3 \times 3
3×3 ) 矩阵 (
A
=
[
a
b
c
d
e
f
g
h
i
]
A = \begin{bmatrix} a & b & c \\ d & e & f \\ g & h & i \end{bmatrix}
A=
adgbehcfi
),行列式的计算公式是:
det
(
A
)
=
a
(
e
i
−
f
h
)
−
b
(
d
i
−
f
g
)
+
c
(
d
h
−
e
g
)
.
\det(A) = a(ei - fh) - b(di - fg) + c(dh - eg).
det(A)=a(ei−fh)−b(di−fg)+c(dh−eg).
此公式可以理解为按第一行展开的结果。
一般情况:高阶矩阵的行列式
对于 (
n
×
n
n \times n
n×n ) 的矩阵 (
A
=
[
a
i
j
]
A = [a_{ij}]
A=[aij] ),行列式通过递归展开的方式计算。选择某一行或某一列(通常为第一行)展开:
det
(
A
)
=
∑
j
=
1
n
(
−
1
)
1
+
j
a
1
j
det
(
A
1
j
)
,
\det(A) = \sum_{j=1}^n (-1)^{1+j} a_{1j} \det(A_{1j}),
det(A)=j=1∑n(−1)1+ja1jdet(A1j),
其中:
- ( A 1 j A_{1j} A1j ) 表示从 ( A A A ) 中去掉第 1 行和第 ( j j j ) 列得到的 ( ( n − 1 ) × ( n − 1 ) (n-1) \times (n-1) (n−1)×(n−1) ) 子矩阵。
- ( ( − 1 ) 1 + j (-1)^{1+j} (−1)1+j ) 是一个符号因子,决定正负号。
这个方法称为按行(或列)展开法。
行列式的性质
行列式具有以下重要性质:
-
交换行或列:
如果交换矩阵的任意两行或两列,行列式的值会变号。
det ( A ′ ) = − det ( A ) . \det(A') = -\det(A). det(A′)=−det(A). -
同一行或列线性相关:
如果矩阵的两行(或两列)线性相关,则行列式为零。 -
加法性质:
如果将矩阵的某一行(或列)的一个倍数加到另一行(或列),行列式的值不变。 -
比例因子:
如果矩阵的某一行(或列)乘以一个常数 ( k ),行列式的值也乘以 ( k )。 -
对角矩阵、上三角矩阵或下三角矩阵:
行列式等于对角线元素的乘积:
det ( A ) = a 11 a 22 ⋯ a n n . \det(A) = a_{11} a_{22} \cdots a_{nn}. det(A)=a11a22⋯ann. -
矩阵乘积:
对于两个 ( n × n n \times n n×n ) 矩阵 ( A A A ) 和 ( B B B ),有:
det ( A B ) = det ( A ) ⋅ det ( B ) . \det(AB) = \det(A) \cdot \det(B). det(AB)=det(A)⋅det(B). -
可逆矩阵:
矩阵 ( A A A ) 可逆当且仅当 ( det ( A ) ≠ 0 \det(A) \neq 0 det(A)=0 )。
几何意义
-
线性变换的体积变化:
行列式的绝对值表示由矩阵 ( A ) 表示的线性变换对单位体积的拉伸或压缩倍数。例如:- ( det ( A ) = 1 \det(A) = 1 det(A)=1 ):体积不变;
- ( det ( A ) = 0 \det(A) = 0 det(A)=0 ):体积压缩到零,说明矩阵不可逆。
-
方向性:
行列式的符号表示线性变换是否翻转了空间的方向(例如从右手系变成左手系)。
例子
例 1:二阶矩阵
A = [ 3 4 2 5 ] . A = \begin{bmatrix} 3 & 4 \\ 2 & 5 \end{bmatrix}. A=[3245].
计算行列式:
det
(
A
)
=
3
⋅
5
−
4
⋅
2
=
15
−
8
=
7.
\det(A) = 3 \cdot 5 - 4 \cdot 2 = 15 - 8 = 7.
det(A)=3⋅5−4⋅2=15−8=7.
例 2:三阶矩阵
A = [ 1 2 3 4 5 6 7 8 10 ] . A = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 10 \end{bmatrix}. A= 1472583610 .
按第一行展开:
det
(
A
)
=
1
∣
5
6
8
10
∣
−
2
∣
4
6
7
10
∣
+
3
∣
4
5
7
8
∣
.
\det(A) = 1 \begin{vmatrix} 5 & 6 \\ 8 & 10 \end{vmatrix} - 2 \begin{vmatrix} 4 & 6 \\ 7 & 10 \end{vmatrix} + 3 \begin{vmatrix} 4 & 5 \\ 7 & 8 \end{vmatrix}.
det(A)=1
58610
−2
47610
+3
4758
.
分别计算子矩阵的行列式:
∣
5
6
8
10
∣
=
5
⋅
10
−
6
⋅
8
=
50
−
48
=
2
,
\begin{vmatrix} 5 & 6 \\ 8 & 10 \end{vmatrix} = 5 \cdot 10 - 6 \cdot 8 = 50 - 48 = 2,
58610
=5⋅10−6⋅8=50−48=2,
∣ 4 6 7 10 ∣ = 4 ⋅ 10 − 6 ⋅ 7 = 40 − 42 = − 2 , \begin{vmatrix} 4 & 6 \\ 7 & 10 \end{vmatrix} = 4 \cdot 10 - 6 \cdot 7 = 40 - 42 = -2, 47610 =4⋅10−6⋅7=40−42=−2,
∣ 4 5 7 8 ∣ = 4 ⋅ 8 − 5 ⋅ 7 = 32 − 35 = − 3. \begin{vmatrix} 4 & 5 \\ 7 & 8 \end{vmatrix} = 4 \cdot 8 - 5 \cdot 7 = 32 - 35 = -3. 4758 =4⋅8−5⋅7=32−35=−3.
代入:
det
(
A
)
=
1
⋅
2
−
2
⋅
(
−
2
)
+
3
⋅
(
−
3
)
=
2
+
4
−
9
=
−
3.
\det(A) = 1 \cdot 2 - 2 \cdot (-2) + 3 \cdot (-3) = 2 + 4 - 9 = -3.
det(A)=1⋅2−2⋅(−2)+3⋅(−3)=2+4−9=−3.
总结
行列式是用来描述方阵的重要工具,它反映了矩阵的一些代数性质(如可逆性)和几何性质(如线性变换对空间的作用)。掌握行列式的定义、性质和计算方法,对深入理解线性代数中的线性变换和空间几何变换有重要意义。
奇异矩阵
奇异矩阵(Singular Matrix)是线性代数中的一个概念,指的是行列式值为零的矩阵,或者等价地,没有逆矩阵的矩阵。以下是对奇异矩阵的详细解释:
奇异矩阵的定义
一个 (
n
×
n
n \times n
n×n ) 的方阵 (
A
A
A ) 被称为奇异矩阵,如果它不满秩,即:
rank
(
A
)
<
n
,
\text{rank}(A) < n,
rank(A)<n,
或者其行列式为零:
det
(
A
)
=
0.
\det(A) = 0.
det(A)=0.
与之相对,非奇异矩阵(Non-Singular Matrix)是指行列式不为零的矩阵,其秩等于 (
n
n
n )。
奇异矩阵的等价条件
矩阵 ( A A A ) 是奇异矩阵,等价于以下任何一种情况成立:
- ( det ( A ) = 0 \det(A) = 0 det(A)=0 )。
- ( A A A ) 不可逆(即不存在矩阵 ( B B B ),使得 ( A B = B A = I AB = BA = I AB=BA=I ))。
- ( A A A ) 的列向量或行向量线性相关(至少有一列是其他列的线性组合)。
- ( A x = 0 A \mathbf{x} = \mathbf{0} Ax=0 ) 存在非零解(齐次线性方程组有无穷多解)。
- ( A A A ) 的特征值中至少有一个为零。
几何意义
在几何上,奇异矩阵可以理解为某种“压缩”变换:
- 一个非奇异矩阵对应于将 ( n n n )-维空间的点映射到 ( n n n )-维空间内的一种变换,且不会将空间“压缩”到更低维度。
- 奇异矩阵则将 (
n
n
n )-维空间压缩到更低维的空间。例如:
- 将 ( R 3 \mathbb{R}^3 R3 ) 的点映射到一个平面或一条直线上。
- 将 ( R 2 \mathbb{R}^2 R2 ) 的点映射到一条直线或一个点。
这种“压缩”现象源于矩阵的列向量或行向量线性相关。
奇异矩阵的性质
- 行列式为零:( det ( A ) = 0 \det(A) = 0 det(A)=0)。
- 不可逆性:奇异矩阵没有逆矩阵。
- 线性相关性:奇异矩阵的列向量或行向量存在线性相关关系。
- 零特征值:奇异矩阵至少有一个特征值为零,因此其特征多项式具有 ( λ = 0 \lambda = 0 λ=0 ) 的根。
- 零行列式的原因:奇异矩阵的行列式为零,可以由以下原因导致:
- 存在全零行或全零列。
- 存在某行或某列是其他行或列的线性组合。
例子
例 1:简单奇异矩阵
A = [ 1 2 2 4 ] . A = \begin{bmatrix} 1 & 2 \\ 2 & 4 \end{bmatrix}. A=[1224].
-
行列式:
det ( A ) = 1 ⋅ 4 − 2 ⋅ 2 = 0. \det(A) = 1 \cdot 4 - 2 \cdot 2 = 0. det(A)=1⋅4−2⋅2=0. -
列向量 ( [ 1 2 ] \begin{bmatrix} 1 \\ 2 \end{bmatrix} [12] ) 和 ( [ 2 4 ] \begin{bmatrix} 2 \\ 4 \end{bmatrix} [24] ) 线性相关。
例 2:非奇异矩阵对比
B = [ 1 2 3 4 ] . B = \begin{bmatrix} 1 & 2 \\ 3 & 4 \end{bmatrix}. B=[1324].
-
行列式:
det ( B ) = 1 ⋅ 4 − 2 ⋅ 3 = − 2 ≠ 0. \det(B) = 1 \cdot 4 - 2 \cdot 3 = -2 \neq 0. det(B)=1⋅4−2⋅3=−2=0. -
列向量线性无关,因此 ( B B B ) 是非奇异矩阵。
奇异矩阵的实际应用
- 线性方程组的解:
- 若系数矩阵是奇异矩阵,则方程组可能无解或有无穷多解。
- 若系数矩阵是非奇异矩阵,则方程组有唯一解。
- 线性变换:
- 奇异矩阵对应的变换会“压缩”空间,使维度降低。
- 机器学习:
- 在回归分析中,奇异矩阵可能导致不可逆的协方差矩阵,需进行正则化处理。
- 数值计算:
- 奇异矩阵可能导致矩阵求逆失败,需使用伪逆(Moore-Penrose伪逆)。
总结
奇异矩阵是指不可逆的方阵,其本质特性是列向量或行向量的线性相关性。这使得它在许多应用中会导致解的不确定性或空间的降维。理解奇异矩阵及其性质对于线性代数的学习和实际问题的求解都十分重要。
谱定理的推导
谱定理是线性代数和功能分析中的一个重要定理,它描述了对于某些类型的矩阵或线性算符,可以将其分解为特征值和特征向量的组合形式。谱定理在许多领域都有应用,尤其是在量子力学、数值分析、统计学等领域。
谱定理有两种主要的形式:
- 对称矩阵的谱定理
- 线性算符的谱定理
我们首先从对称矩阵的谱定理开始推导。
1. 对称矩阵的谱定理
对于一个实对称矩阵 ( A ∈ R n × n \mathbf{A} \in \mathbb{R}^{n \times n} A∈Rn×n ),谱定理表明该矩阵可以通过正交变换对角化,即存在一个正交矩阵 ( Q \mathbf{Q} Q ) 和一个对角矩阵 ( D \mathbf{D} D ),使得:
A
=
Q
D
Q
⊤
\mathbf{A} = \mathbf{Q} \mathbf{D} \mathbf{Q}^\top
A=QDQ⊤
其中:
- ( Q \mathbf{Q} Q ) 是由矩阵 ( A \mathbf{A} A ) 的特征向量组成的正交矩阵。
- ( D \mathbf{D} D ) 是对角矩阵,包含矩阵 ( A \mathbf{A} A ) 的特征值。
1.1 特征值和特征向量
谱定理的前提是矩阵 ( A \mathbf{A} A ) 是对称矩阵。根据线性代数的基本理论,对于对称矩阵 ( A \mathbf{A} A ),总是存在一组正交的特征向量 ( v 1 , v 2 , … , v n \mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n v1,v2,…,vn ),以及对应的实特征值 ( λ 1 , λ 2 , … , λ n \lambda_1, \lambda_2, \dots, \lambda_n λ1,λ2,…,λn ),使得:
A
v
i
=
λ
i
v
i
,
i
=
1
,
2
,
…
,
n
\mathbf{A} \mathbf{v}_i = \lambda_i \mathbf{v}_i, \quad i = 1, 2, \dots, n
Avi=λivi,i=1,2,…,n
这意味着我们可以将矩阵 (
A
\mathbf{A}
A ) 的特征向量 (
v
1
,
v
2
,
…
,
v
n
\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n
v1,v2,…,vn ) 组成一个矩阵 (
Q
\mathbf{Q}
Q ):
Q
=
[
v
1
v
2
…
v
n
]
\mathbf{Q} = [ \mathbf{v}_1 \, \mathbf{v}_2 \, \dots \, \mathbf{v}_n ]
Q=[v1v2…vn]
由于对称矩阵的特征向量是正交的,因此 (
Q
\mathbf{Q}
Q ) 是一个正交矩阵,满足:
Q ⊤ Q = I \mathbf{Q}^\top \mathbf{Q} = \mathbf{I} Q⊤Q=I
1.2 对角化
由于 ( A \mathbf{A} A ) 是对称矩阵,其特征向量是线性无关的,可以通过正交化得到一组正交基。根据特征值分解定理,可以将矩阵 ( A \mathbf{A} A ) 对角化为:
A
=
Q
D
Q
⊤
\mathbf{A} = \mathbf{Q} \mathbf{D} \mathbf{Q}^\top
A=QDQ⊤
其中 (
D
\mathbf{D}
D ) 是一个对角矩阵,其对角元素就是矩阵 (
A
\mathbf{A}
A ) 的特征值 (
λ
1
,
λ
2
,
…
,
λ
n
\lambda_1, \lambda_2, \dots, \lambda_n
λ1,λ2,…,λn )。
1.3 结论
因此,谱定理告诉我们,任何实对称矩阵 ( A \mathbf{A} A ) 都可以通过正交矩阵对角化,即存在正交矩阵 ( Q \mathbf{Q} Q ) 和对角矩阵 ( D \mathbf{D} D ),使得:
A
=
Q
D
Q
⊤
\mathbf{A} = \mathbf{Q} \mathbf{D} \mathbf{Q}^\top
A=QDQ⊤
其中,(
Q
\mathbf{Q}
Q ) 的列是矩阵 (
A
\mathbf{A}
A ) 的单位特征向量,(
D
\mathbf{D}
D ) 是一个包含特征值的对角矩阵。
2. 线性算符的谱定理
谱定理不仅适用于矩阵,也适用于线性算符。在函数分析中,谱定理可以描述自伴算符(即等于其共轭转置的算符)的性质。假设我们有一个自伴算符 ( T ) 定义在希尔伯特空间 ( H ) 上,谱定理表明:
T
=
∫
σ
(
T
)
λ
d
E
(
λ
)
T = \int_{\sigma(T)} \lambda \, dE(\lambda)
T=∫σ(T)λdE(λ)
其中 (
σ
(
T
)
\sigma(T)
σ(T) ) 是算符 (
T
T
T ) 的谱(特征值的集合),(
E
(
λ
)
E(\lambda)
E(λ) ) 是与特征值 (
λ
\lambda
λ ) 相关的投影算符。谱定理告诉我们,任何自伴算符 (
T
T
T ) 都可以通过谱分解表示为特征值和特征向量的积分。
3. 推导过程总结
- 对称矩阵具有一组正交的特征向量,可以通过这些特征向量构造一个正交矩阵 ( Q \mathbf{Q} Q )。
- 矩阵 ( A \mathbf{A} A ) 可以表示为 ( A = Q D Q ⊤ \mathbf{A} = \mathbf{Q} \mathbf{D} \mathbf{Q}^\top A=QDQ⊤ ),其中 ( D \mathbf{D} D ) 是包含特征值的对角矩阵。
- 该分解过程证明了实对称矩阵可以对角化,并且特征向量可以选择为正交的。
4. 特别注意
- 谱定理适用于所有的实对称矩阵,但不适用于所有矩阵。对于一般矩阵,可能需要使用更广泛的分解方法(如奇异值分解)。
- 谱定理对于理解矩阵的几何和代数性质非常重要,尤其是在优化、信号处理和数据分析等领域。
谱定理是线性代数中的一个重要结果,它说明了对称矩阵的对角化性质。以下是谱定理的具体表述及其推导过程。
谱定理的表述
对于一个实对称矩阵 ( A ∈ R n × n A \in \mathbb{R}^{n \times n} A∈Rn×n ):
- ( A A A ) 的特征值都是实数。
- ( A A A ) 存在一个正交矩阵 ( Q Q Q )(即 ( Q T Q = I Q^T Q = I QTQ=I )),使得 ( Q T A Q = Λ Q^T A Q = \Lambda QTAQ=Λ ),其中 ( Λ \Lambda Λ ) 是一个对角矩阵,对角线上的元素为 ( A A A ) 的特征值。
- ( Q Q Q ) 的列向量是 ( A A A ) 的特征向量,且彼此正交。
换句话说,实对称矩阵可以通过正交变换对角化。
详细推导过程
1. 特征值为实数
对于任意一个实对称矩阵 (
A
A
A ),令 (
λ
\lambda
λ ) 是 (
A
A
A ) 的一个特征值,(
v
\mathbf{v}
v ) 是对应的特征向量,满足
A
v
=
λ
v
.
A \mathbf{v} = \lambda \mathbf{v}.
Av=λv.
取上述方程的共轭转置:
v
H
A
=
λ
∗
v
H
,
\mathbf{v}^H A = \lambda^* \mathbf{v}^H,
vHA=λ∗vH,
其中 (
v
H
\mathbf{v}^H
vH ) 是 (
v
\mathbf{v}
v ) 的共轭转置,(
λ
∗
\lambda^*
λ∗ ) 是 (
λ
\lambda
λ ) 的共轭。
由于 (
A
A
A ) 是实对称矩阵,有 (
A
T
=
A
A^T = A
AT=A ) 且 (
A
A
A ) 的元素是实数,因此
v
T
A
=
v
H
A
.
\mathbf{v}^T A = \mathbf{v}^H A.
vTA=vHA.
将 (
A
v
=
λ
v
A \mathbf{v} = \lambda \mathbf{v}
Av=λv ) 左乘 (
v
H
\mathbf{v}^H
vH ),得:
v
H
A
v
=
λ
v
H
v
.
\mathbf{v}^H A \mathbf{v} = \lambda \mathbf{v}^H \mathbf{v}.
vHAv=λvHv.
将 (
v
H
A
=
λ
∗
v
H
\mathbf{v}^H A = \lambda^* \mathbf{v}^H
vHA=λ∗vH ) 右乘 (
v
\mathbf{v}
v ),得:
v
H
A
v
=
λ
∗
v
H
v
.
\mathbf{v}^H A \mathbf{v} = \lambda^* \mathbf{v}^H \mathbf{v}.
vHAv=λ∗vHv.
因为 (
v
H
A
v
\mathbf{v}^H A \mathbf{v}
vHAv ) 是实数,所以 (
λ
=
λ
∗
\lambda = \lambda^*
λ=λ∗ ),即 (
λ
\lambda
λ ) 为实数。
2. 特征向量正交性
设 (
λ
1
\lambda_1
λ1 ) 和 (
λ
2
\lambda_2
λ2 ) 是 (
A
A
A ) 的两个不同特征值,(
v
1
\mathbf{v}_1
v1 ) 和 (
v
2
\mathbf{v}_2
v2 ) 是对应的特征向量。由特征方程,有:
A
v
1
=
λ
1
v
1
,
A
v
2
=
λ
2
v
2
.
A \mathbf{v}_1 = \lambda_1 \mathbf{v}_1, \quad A \mathbf{v}_2 = \lambda_2 \mathbf{v}_2.
Av1=λ1v1,Av2=λ2v2.
取 (
v
1
T
\mathbf{v}_1^T
v1T ) 和 (
v
2
\mathbf{v}_2
v2 ) 的内积:
v
1
T
A
v
2
=
λ
2
v
1
T
v
2
.
\mathbf{v}_1^T A \mathbf{v}_2 = \lambda_2 \mathbf{v}_1^T \mathbf{v}_2.
v1TAv2=λ2v1Tv2.
又因 (
A
A
A ) 对称,(
A
T
=
A
A^T = A
AT=A ),有:
(
A
v
1
)
T
v
2
=
λ
1
v
1
T
v
2
.
(A \mathbf{v}_1)^T \mathbf{v}_2 = \lambda_1 \mathbf{v}_1^T \mathbf{v}_2.
(Av1)Tv2=λ1v1Tv2.
因此,
λ
1
v
1
T
v
2
=
λ
2
v
1
T
v
2
.
\lambda_1 \mathbf{v}_1^T \mathbf{v}_2 = \lambda_2 \mathbf{v}_1^T \mathbf{v}_2.
λ1v1Tv2=λ2v1Tv2.
由于 (
λ
1
≠
λ
2
\lambda_1 \neq \lambda_2
λ1=λ2 ),只能有
v
1
T
v
2
=
0.
\mathbf{v}_1^T \mathbf{v}_2 = 0.\
v1Tv2=0.
这表明不同特征值对应的特征向量正交。
3. 正交对角化
设 (
A
A
A ) 的特征值为 (
λ
1
,
λ
2
,
…
,
λ
n
\lambda_1, \lambda_2, \dots, \lambda_n
λ1,λ2,…,λn ),对应的单位特征向量为 (
v
1
,
v
2
,
…
,
v
n
\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n
v1,v2,…,vn )。因为这些特征向量正交且可归一化,可以构造一个正交矩阵
Q
=
[
v
1
,
v
2
,
…
,
v
n
]
,
Q = [\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n],
Q=[v1,v2,…,vn],
满足 (
Q
T
Q
=
I
Q^T Q = I
QTQ=I )。
将 (
A
A
A ) 用特征向量矩阵 (
Q
Q
Q ) 对角化:
Q
T
A
Q
=
[
v
1
T
v
2
T
⋮
v
n
T
]
[
A
v
1
A
v
2
⋯
A
v
n
]
=
[
λ
1
0
⋯
0
0
λ
2
⋯
0
⋮
⋮
⋱
⋮
0
0
⋯
λ
n
]
.
Q^T A Q = \begin{bmatrix} \mathbf{v}_1^T \\ \mathbf{v}_2^T \\ \vdots \\ \mathbf{v}_n^T \end{bmatrix} \begin{bmatrix} A \mathbf{v}_1 & A \mathbf{v}_2 & \cdots & A \mathbf{v}_n \end{bmatrix} = \begin{bmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix}.
QTAQ=
v1Tv2T⋮vnT
[Av1Av2⋯Avn]=
λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λn
.
这完成了对称矩阵的正交对角化,证明了谱定理。
总结
谱定理为实对称矩阵提供了一个对角化的过程,可以将矩阵分解为其特征向量和特征值的形式,这在许多实际应用中非常有用。通过谱定理,我们可以将复杂的矩阵运算转化为简单的对角矩阵运算,从而大大简化计算过程。
谱定理从以下几个核心性质推导而来:
- 对称矩阵的特征值是实数;
- 不同特征值对应的特征向量正交;
- 特征向量可以构成一组正交基,用于构造正交矩阵 ( Q Q Q ),实现对角化。
这些性质揭示了对称矩阵的优良特性,并在许多实际问题中具有重要应用。