向量与矩阵

基本符号

  • Rn :n维实数列向量空间
  • Rm×n :具有 m n 列的实数矩阵空间
  • In n×n 单位矩阵
  • 0m×n m×n 零矩阵

基本运算

  • 矩阵加法与标量乘法

    A+B=[aij+bij],cA=[caij]

    例如,设

    A=[a11a12a21a22],B=[b11b12b21b22]

    则它们的和为

    A+B=[a11+b11a12+b12a21+b21a22+b22]

    对于标量 cR

    cA=[ca11ca12ca21ca22]
  • 矩阵-向量乘积:若 ARm×n xRn ,则 AxRm 。例如,设

    A=[123456]R3×2,x=[78]R2

    Ax=[17+2837+4857+68]=[7+1621+3235+48]=[235383]R3
  • 矩阵-矩阵乘积:若 ARm×n BRn×p ,则 ABRm×p 。设

    A=[123456]R2×3,B=[789101112]R3×2

    AB=[17+29+31118+210+31247+59+61148+510+612]=[5864139154]R2×2

转置

  • A=[aij]Rm×n 转置 ARn×m ,定义为 (A)ij=aji 。例如,当

    A=[123456]

    则转置为

    AT=[142536]
  • 性质

    • (A)=A
    • (AB)=BA
    • (A+B)=A+B

对称矩阵

如果 A=A ,则方阵 A 对称的


线性组合、张成空间与线性无关

线性组合

如果向量 v 可以表示为向量 v1,,vk 线性组合,即

v=α1v1++αkvk,其中 αiR

例如,设

v1=[12],v2=[31],α1=2,α2=1

则线性组合为:

α1v1+α2v2=2[12][31]=[24][31]=[15]

张成空间

{v1,,vk} 张成空间是集合

span(v1,,vk)={i=1kαivi:αiR}

例如,设

v1=[10],v2=[01]

{v1,v2} 的张成空间是所有形如以下形式的向量的集合:

α1v1+α2v2=[α1α2],其中 α1,α2R

因此,

span(v1,v2)=R2

线性无关

如果方程

i=1kαivi=0

的唯一解是 α1==αk=0 ,则向量 v1,,vk 线性无关的。否则,它们是线性相关的

例如,设

v1=[100],v2=[03.3]

考虑方程

α1v1+α2v2=[00]

这变为

α1[100]+α2[03.3]=[10α13.3α2]=[00]

这意味着 α1=0 α2=0 。因此, v1 v2 是线性无关的。


矩阵秩与线性方程组

矩阵秩

矩阵 ARm×n r 是线性无关列的数量(等价地, A 的列空间的维数)。注意 rmin(m,n) ,当 r=min(m,n) 时,我们称 A 满秩的。满秩方阵称为非奇异的(或可逆的)。

考虑矩阵

A=[123456789]

第三列是前两列的线性组合:

第3列=1第1列+2第2列

因此,列是线性相关的, A 的秩为 2。

行列式

A=(aij)Rn×n A 行列式,记作 det(A) ,可以定义为

det(A)=σSnsgn(σ)i=1nai,σ(i)

其中 Sn {1,,n} 的所有排列的集合, sgn(σ) σ 的符号。

矩阵 A 可逆当且仅当 det(A)0

示例

计算矩阵的行列式

B=(123014560)

沿第一行展开:

det(B)=1det(1460)2det(0450)+3det(0156)

每个 2×2 行列式为

det(1460)=1046=24 det(0450)=0045=20 det(0156)=0615=5

因此

det(B)=1(24)2(20)+3(5)=24+4015=1

线性方程组

线性方程组 Ax=b 满足:

  • 解存在当且仅当 b A 的列空间中,即 bcol(A)=span(A的列)
  • 如果 A 是方阵且满秩,则解唯一且由 x=A1b 给出

例如,设

A=[1234],b=[511]

由于 A 是方阵且满秩(秩为 2),存在唯一解:

x=A1b=[211.50.5][511]=[12]

矩阵的逆

ARn×n 。如果矩阵 BRn×n 满足

BA=AB=In

则称 B A 的(双边)

如果这样的 B 存在,则称 A 可逆的(或非奇异的);这恰好发生在

rank(A)=ndet(A)0

在这种情况下,逆是唯一的,记作 A1

示例 1(符号形式, 2×2 :设

A=(abcd),adbc0

可以直接验证

A1=1adbc(dbca)

因为 (A1A)ij=δij

示例 2(数值形式):取

A=(1234)

所以 det(A)=2 。则

A1=12(4231)=(211.50.5)

可以验证 A1A=I2

特征值与特征向量

ARn×n 。如果存在标量 λR 使得非零向量 vRn 满足

Av=λv

则称 v A 特征向量

标量 λ 称为与 v 对应的 A 特征值。等价地, λ A 的特征值当且仅当

det(AλI)=0

A 的所有特征值的集合通常称为 A

例如,考虑矩阵

A=(2112)
  1. 计算特征多项式:

    det(AλI)=det(2λ112λ)=(2λ)21=λ24λ+3
  2. λ24λ+3=0 得到

    λ1=1,λ2=3
  3. 对于每个 λi ,找到满足 (AλiI)vi=0 的非零 vi

    • λ1=1 (AI)v=0(1111)v=0v1=(11)
    • λ2=3 (A3I)v=0(1111)v=0v2=(11)

因此特征对为

(λ1,v1)=(1,(1,1)),(λ2,v2)=(3,(1,1))

奇异值分解(SVD)

任何实矩阵 ARm×n 都可以分解为

A=UΣVT

其中:

  • URm×m 是正交矩阵(其列是 A 的左奇异向量)
  • ΣRm×n 是具有非负元素的对角矩阵( A 的奇异值)
  • VRn×n 是正交矩阵(其列是 A 的右奇异向量)

示例

A=[3102]R2×2

A 的一个(近似)SVD为:

U=[0.9570.2900.2900.957],Σ=[3.257001.842],V=[0.8820.4720.4720.882]

使得

A=UΣVT

这种分解有助于理解 A 的结构,广泛应用于降维、数据压缩和求解病态问题等应用中。

对称矩阵的谱分解

如果 ARn×n 是对称矩阵(即 A=A ),则它可以分解为

A=QΛQ

其中:

  • QRn×n 是正交矩阵,其列是 A 的特征向量
  • ΛRn×n 是对角矩阵,其对角元素是 A 的特征值

这种分解是 SVD 的特殊情况,称为 A 谱分解特征分解