线性代数复习
线性代数重要性质与定理总结
1. 基本概念与符号
矩阵表示
- $ A \in \mathbb{R}^{m \times n} $:$ m $ 行 $ n $ 列的实矩阵。
- 列向量:$ x \in \mathbb{R}^n $,默认按列排列;行向量为 $ x^T $。
- 矩阵元素:$ A_{ij} $ 表示第 $ i $ 行第 $ j $ 列的元素。
矩阵分块
- 列分块:$ A = [a^1 \ a^2 \ \cdots \ a^n] $,其中 $ a^j $ 为第 $ j $ 列。
- 行分块:$ A = [a_1^T; \ a_2^T; \ \cdots; \ a_m^T] $,其中 $ a_i^T $ 为第 $ i $ 行。
2. 矩阵乘法
定义
- $ C = AB $,其中 $ C_{ij} = \sum_{k=1}^n A_{ik} B_{kj} $。
- 矩阵乘积维度:$ A \in \mathbb{R}^{m \times n}, B \in \mathbb{R}^{n \times p} \Rightarrow C \in \mathbb{R}^{m \times p} $。
特殊乘积形式
- 内积:$ x^T y = \sum_{i=1}^n x_i y_i $。
- 外积:$ xy^T \in \mathbb{R}^{m \times n} $,元素为 $ x_i y_j $。
- 矩阵-向量乘积:
- 按行:$ Ax = [a_1^T x; \ a_2^T x; \ \cdots; \ a_m^T x] $。
- 按列:$ Ax = \sum_{j=1}^n x_j a^j $。
矩阵乘积的四种视角
- 行-列内积:$ C_{ij} = a_i^T b^j $。
- 列-行外积和:$ AB = \sum_{k=1}^n a^k b_k^T $。
- 矩阵-列向量乘积:$ AB = [A b^1 \ A b^2 \ \cdots \ A b^p] $。
- 行向量-矩阵乘积:$ AB = [a_1^T B; \ a_2^T B; \ \cdots; \ a_m^T B] $。
性质
- 结合律:$ (AB)C = A(BC) $。
- 分配律:$ A(B + C) = AB + AC $。
- 不可交换:一般 $ AB \neq BA $。
3. 运算与性质
单位矩阵与对角矩阵
- 单位矩阵 $ I \in \mathbb{R}^{n \times n} $,满足 $ AI = A = IA $。
- 对角矩阵 $ D = \text{diag}(d_1, \dots, d_n) $,非对角元素为 0。
转置
- 转置性质:
- $ (A^T)^T = A $。
- $ (AB)^T = B^T A^T $。
- $ (A + B)^T = A^T + B^T $。
- 转置性质:
对称矩阵
- 对称矩阵:$ A = A^T $。
- 任何方阵 $ A $ 可分解为对称与反对称矩阵之和:
$ A = \frac{1}{2}(A + A^T) + \frac{1}{2}(A - A^T) $。
迹(Trace)
- 定义:$ \text{tr}(A) = \sum_{i=1}^n A_{ii} $。
- 性质:
- $ \text{tr}(A) = \text{tr}(A^T) $。
- $ \text{tr}(AB) = \text{tr}(BA) $。
- 线性性:$ \text{tr}(A + B) = \text{tr}(A) + \text{tr}(B) $。
范数(Norms)
- 向量范数:
- $ \ell_2 $ 范数:$ |x|_2 = \sqrt{x^T x} $。
- $ \ell_1 $ 范数:$ |x|_1 = \sum |x_i| $。
- $ \ell_\infty $ 范数:$ |x|_\infty = \max |x_i| $。
- 矩阵范数:
- Frobenius 范数:$ |A|_F = \sqrt{\text{tr}(A^T A)} $。
- 向量范数:
线性相关与秩
- 列秩 = 行秩 = 矩阵的秩。
- 满秩矩阵:$ \text{rank}(A) = \min(m, n) $。
- 秩的性质:
- $ \text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B)) $。
逆矩阵
- 存在条件:方阵且满秩(非奇异)。
- 性质:
- $ (A^{-1})^{-1} = A $。
- $ (AB)^{-1} = B^{-1} A^{-1} $。
- $ (A^{-1})^T = (A^T)^{-1} $。
正交矩阵
- 定义:列向量正交且归一化,满足 $ U^T U = I $。
- 性质:
- 保范性:$ |U x|_2 = |x|_2 $。
范围与零空间
- 列空间 $ \mathcal{R}(A) = {Ax \mid x \in \mathbb{R}^n} $。
- 零空间 $ \mathcal{N}(A) = {x \mid Ax = 0} $。
- 正交补关系:$ \mathcal{R}(A^T) \oplus \mathcal{N}(A) = \mathbb{R}^n $。
行列式(Determinant)
- 几何意义:平行多面体的体积。
- 性质:
- $ |AB| = |A||B| $。
- $ |A^{-1}| = 1 / |A| $。
- $ |A| = 0 \iff A $ 奇异。
- 递归公式:
$ |A| = \sum_{j=1}^n (-1)^{i+j} A_{ij} |A_{\backslash i \backslash j}| \quad (\text{按第 } i \text{ 行展开}) $。
二次型与半正定矩阵
- 对称矩阵分类:
- 正定(PD):$ x^T A x > 0 \quad (\forall x \neq 0) $。
- 半正定(PSD):$ x^T A x \geq 0 $。
- 负定(ND)、半负定(NSD)、不定。
- Gram 矩阵:$ G = A^T A $ 必为半正定;若 $ A $ 列满秩,则 $ G $ 正定。
- 对称矩阵分类:
特征值与特征向量
- 定义:$ A x = \lambda x \quad (x \neq 0) $。
- 对称矩阵性质:
- 特征值为实数。
- 存在正交特征向量集,可对角化:$ A = U \Lambda U^T $。
- 迹与行列式:
- $ \text{tr}(A) = \sum \lambda_i $。
- $ |A| = \prod \lambda_i $。
- 优化视角:
- 最大特征值对应二次型最大值:$ \max_{|x|=1} x^T A x = \lambda_{\max} $。
4. 矩阵微积分
梯度(Gradient)
- 标量函数 $ f: \mathbb{R}^{m \times n} \to \mathbb{R} $,梯度为矩阵:
$ (\nabla_A f(A)){ij} = \frac{\partial f(A)}{\partial A{ij}} $。 - 重要公式:
- $ \nabla_x (b^T x) = b $。
- $ \nabla_x (x^T A x) = 2 A x \quad (A \text{ 对称}) $。
- 标量函数 $ f: \mathbb{R}^{m \times n} \to \mathbb{R} $,梯度为矩阵:
Hessian 矩阵
- 定义:二阶偏导数矩阵,对称。
- 二次型:$ \nabla_x^2 (x^T A x) = 2 A \quad (A \text{ 对称}) $。
最小二乘法
- 目标函数:$ \min_x |Ax - b|_2^2 $。
- 解:$ x = (A^T A)^{-1} A^T b $。
行列式的梯度
- $ \nabla_A |A| = |A| A^{-T} $。
- 对数行列式:$ \nabla_A \log |A| = A^{-1} \quad (A \succ 0) $。
特征值的优化视角
- 拉格朗日函数:$ \mathcal{L}(x, \lambda) = x^T A x - \lambda (x^T x - 1) $。
- 最优解条件:$ A x = \lambda x $,即 $ x $ 为特征向量,$ \lambda $ 为特征值。