信创简单总结
信创的时候做的一个复习资料
信创的时候做的一个复习资料
记录统计建模时期写的爬虫
记录selenium的一些基本知识的学习
启动软盘被覆盖其他数据的解决方案
CS229 2018Autumn 的PS0的解答
机器学习的线性代数前置知识复习
介绍关于支持向量机与核技巧的相关知识内容。
HUST-CSE-操作系统课程设计
基本思想: 通过迭代调整权重向量寻找能分隔不同类别数据点的超平面
特点:
概率密度/质量函数形式:
$$p(x|\eta) = b(x) \exp\left(\eta^T T(x) - a(\eta)\right)$$
参数说明:
符号 | 名称 | 说明 |
---|---|---|
$x$ | 随机变量 | 观测数据点 |
$\eta$ | 自然参数 | 决定分布形式的参数向量 |
$T(x)$ | 充分统计量 | 包含参数全部信息的函数(在CS229课程中常简化为$ x $) |
$b(x)$ | 基函数 | 与参数无关的基础测量函数 |
$a(\eta)$ | 对数归一化因子 | 确保概率积分为1的归一化项, 满足 $a(\eta) = \log\int b(x)\exp(\eta^T T(x))dx $ |
b(x)与参数无关 非常重要
数据类型 | 分布类型 | 典型应用场景 |
---|---|---|
连续值(实数域) | 高斯分布(Gaussian) | 回归问题 |
二元离散值 | 伯努利分布(Bernoulli) | 二分类 |
计数数据 | 泊松分布(Poisson) | 事件计数建模 |
正实数 | Gamma/指数分布 | 生存分析 |
概率分布 | Beta/Dirichlet分布 | 贝叶斯统计中的先验分布 |
模型参数(θ) | 自然参数(η) | 规范参数(μ) |
---|---|---|
待学习权重 | $ \theta^Tx $ | $\mathbb{E}[y|x]$ |
采用梯度下降法更新参数:
$$\theta_j := \theta_j - \alpha \left( h_\theta(x^{(i)}) - y^{(i)} \right) x_j^{(i)}$$
最小化交叉熵损失:
$$\mathcal{L}(\theta) = -\sum_{i=1}^m \sum_{k=1}^K \mathbb{I}{y^{(i)}=k} \log \frac{e^{\theta_k^T x^{(i)}}}{\sum_{j=1}^K e^{\theta_j^T x^{(i)}}}$$