机器学习知识
数学基础
KL 散度
KL 散度是描述两个概率分布P 和Q差异一种方法。
离散概率分布的KL散度计算公式为:
连续概率分布的KL散度计算公式为:
分布越相近,KL散度越小,分布越远,KL散度越大。
由上凸函数可证KL散度的结果非负。
- 非对称
- 不满足三角不等式
从熵的角度看:
基于P编码P的熵:
基于P编码Q的熵:
相减:
一些计算例子: orz
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.