- 熵:
H(p)=−∑xp(x)logp(x) - 交叉熵:
H(p,q)=−∑xp(x)logq(x) - 相对熵:
KL(p∥q)=−∑xp(x)logq(x)p(x)
- 相对熵(relative entropy)也叫 KL 散度(KL divergence);
- 用来度量两分布之间的不相似性(dissimilarity);
通过交叉熵的定义,连接三者:
1. 简森不等式与 KL散度
因为
这里我们令
也即 KL 散度恒大于等于 0;
通过交叉熵的定义,连接三者:
因为
也即 KL 散度恒大于等于 0;