线性代数复习

线性代数重要性质与定理总结


1. 基本概念与符号

  • 矩阵表示
    • $ A ^{m n} \(:\) m $ 行 $ n $ 列的实矩阵。
    • 列向量:$ x ^n $,默认按列排列;行向量为 $ x^T $。
    • 矩阵元素:$ A_{ij} $ 表示第 $ i $ 行第 $ j $ 列的元素。
  • 矩阵分块
    • 列分块:$ A = [a^1  a^2   a^n] $,其中 $ a^j $ 为第 $ j $ 列。
    • 行分块:$ A = [a_1^T;  a_2^T;  ;  a_m^T] $,其中 $ a_i^T $ 为第 $ i $ 行。

2. 矩阵乘法

  • 定义
    • $ C = AB $,其中 $ C_{ij} = {k=1}^n A{ik} B_{kj} $。
    • 矩阵乘积维度:$ A ^{m n}, B ^{n p} C ^{m p} $。
  • 特殊乘积形式
    • 内积:$ x^T y = _{i=1}^n x_i y_i $。
    • 外积:$ xy^T ^{m n} $,元素为 $ x_i y_j $。
    • 矩阵-向量乘积
      • 按行:$ Ax = [a_1^T x;  a_2^T x;  ;  a_m^T x] $。
      • 按列:$ Ax = _{j=1}^n x_j a^j $。
  • 矩阵乘积的四种视角
    1. 行-列内积:$ C_{ij} = a_i^T b^j $。
    2. 列-行外积和:$ AB = _{k=1}^n a^k b_k^T $。
    3. 矩阵-列向量乘积:$ AB = [A b^1  A b^2   A b^p] $。
    4. 行向量-矩阵乘积:$ AB = [a_1^T B;  a_2^T B;  ;  a_m^T B] $。
  • 性质
    • 结合律:$ (AB)C = A(BC) $。
    • 分配律:$ A(B + C) = AB + AC $。
    • 不可交换:一般 $ AB BA $。

3. 运算与性质

  • 单位矩阵与对角矩阵
    • 单位矩阵 $ I ^{n n} $,满足 $ AI = A = IA $。
    • 对角矩阵 $ D = (d_1, , d_n) $,非对角元素为 0。
  • 转置
    • 转置性质:
      • $ (AT)T = A $。
      • $ (AB)^T = B^T A^T $。
      • $ (A + B)^T = A^T + B^T $。
  • 对称矩阵
    • 对称矩阵:$ A = A^T $。
    • 任何方阵 $ A $ 可分解为对称与反对称矩阵之和:
      $ A = (A + A^T) + (A - A^T) $。
  • 迹(Trace)
    • 定义:$ (A) = {i=1}^n A{ii} $。
    • 性质:
      • $ (A) = (A^T) $。
      • $ (AB) = (BA) $。
      • 线性性:$ (A + B) = (A) + (B) $。
  • 范数(Norms)
    • 向量范数:
      • $ _2 $ 范数:$ |x|_2 = $。
      • $ _1 $ 范数:$ |x|_1 = |x_i| $。
      • $ $ 范数:$ |x|= |x_i| $。
    • 矩阵范数:
      • Frobenius 范数:$ |A|_F = $。
  • 线性相关与秩
    • 列秩 = 行秩 = 矩阵的秩。
    • 满秩矩阵:$ (A) = (m, n) $。
    • 秩的性质:
      • $ (AB) ((A), (B)) $。
  • 逆矩阵
    • 存在条件:方阵且满秩(非奇异)。
    • 性质:
      • $ (A{-1}){-1} = A $。
      • $ (AB)^{-1} = B^{-1} A^{-1} $。
      • $ (A{-1})T = (AT){-1} $。
  • 正交矩阵
    • 定义:列向量正交且归一化,满足 $ U^T U = I $。
    • 性质:
      • 保范性:$ |U x|_2 = |x|_2 $。
  • 范围与零空间
    • 列空间 $ (A) = {Ax x ^n} $。
    • 零空间 $ (A) = {x Ax = 0} $。
    • 正交补关系:$ (A^T) (A) = ^n $。
  • 行列式(Determinant)
    • 几何意义:平行多面体的体积。
    • 性质:
      • $ |AB| = |A||B| $。
      • $ |A^{-1}| = 1 / |A| $。
      • $ |A| = 0 A $ 奇异。
    • 递归公式:
      $ |A| = {j=1}^n (-1)^{i+j} A{ij} |A_{i j}| ( i ) $。
  • 二次型与半正定矩阵
    • 对称矩阵分类:
      • 正定(PD):$ x^T A x > 0 (x ) $。
      • 半正定(PSD):$ x^T A x $。
      • 负定(ND)、半负定(NSD)、不定。
    • Gram 矩阵:$ G = A^T A $ 必为半正定;若 $ A $ 列满秩,则 $ G $ 正定。
  • 特征值与特征向量
    • 定义:$ A x = x (x ) $。
    • 对称矩阵性质:
      1. 特征值为实数。
      2. 存在正交特征向量集,可对角化:$ A = U U^T $。
    • 迹与行列式:
      • $ (A) = _i $。
      • $ |A| = _i $。
    • 优化视角:
      • 最大特征值对应二次型最大值:$ {|x|=1} x^T A x = {} $。

4. 矩阵微积分

  • 梯度(Gradient)
    • 标量函数 $ f: ^{m n} \(,梯度为矩阵:\) (A f(A)){ij} = $。
    • 重要公式:
      • **$ _x (b^T x) = b $。**
      • **$ _x (x^T A x) = 2 A x (A ) $。**
  • Hessian 矩阵
    • 定义:二阶偏导数矩阵,对称。
    • 二次型:$ _x^2 (x^T A x) = 2 A (A ) $。
  • 最小二乘法
    • 目标函数:$ _x |Ax - b|_2^2 $。
    • 解:$ x = (A^T A)^{-1} A^T b $。
  • 行列式的梯度
    • $ _A |A| = |A| A^{-T} $。
    • 对数行列式:$ _A |A| = A^{-1} (A ) $。
  • 特征值的优化视角
    • 拉格朗日函数:$ (x, ) = x^T A x - (x^T x - 1) $。
    • 最优解条件:$ A x = x $,即 $ x $ 为特征向量,$ $ 为特征值。