数学基础

KL 散度

KL 散度是描述两个概率分布P 和Q差异一种方法。

离散概率分布的KL散度计算公式为:

连续概率分布的KL散度计算公式为:

分布越相近,KL散度越小,分布越远,KL散度越大。

由上凸函数可证KL散度的结果非负。

  • 非对称
  • 不满足三角不等式

从熵的角度看:

基于P编码P的熵:

基于P编码Q的熵:

相减:

一些计算例子: orz