信息熵

信息熵从数学上来说是某一个概率分布 上各个事件所具有的信息量的期望,公式如下:

从某种意义上来说,也就是这个概率分布 所具有的信息量的期望;信息熵的一个重要意义是将一个概率分布转化为了一个标量值,因此可以将这个标量值作为这个概率分布的一个评估

交叉熵

信息熵的计算前提是有真实的概率分布 ;然而真实的概率分布 需要通过实际采样后才能够获得,我们预先能够知道的只有一个估计的概率分布

交叉熵解决的其实是一个后验性的评估问题;也就是说,如果我们错误地使用分布 来估计实际分布 中所有事件的信息量,但事实上事件发生的真实概率分布 并不会随着我们的估计而改变,由此可以得出一个后验性的信息量估计:

从标量评估的角度,交叉熵其实量化了一个概率分布如何被另一个概率分布错误评估

Renyi 熵

Renyi 熵是香农熵的广义形式,为我们提供了一种更灵活的方式来衡量分布的不确定性。分布的 Renyi 熵定义为:

Renyi 熵由参数 控制,该参数决定了对分布中不同概率的权重分配; 当