信息论小记

知道一堆词汇里各个字出现的概率p_i，则对这些字的最优编码下各字的位长（也即每个字包含的信息）为：

香农公式：，知道各字的位长后，可依次给他们编码0、10、110...

这些字的平均编码长度为（也即信息量，或称信息熵）：

信息熵：

总结：信息是不确定性（无序）的度量，不确定性体现在概率分布上：概率分布越散，系统就越无序、不确定性也越大，从而信息量越大

相关阅读:
指针，数组，字符串的区别（高质量程序设计指南C++/C语言第7章）
bitset初始化问题
书籍
编译器的工作过程
C++函数传递指向指针的指针的应用
程序员面试金典--二叉树的下一个结点
程序员面试金典--对称的二叉树
程序员面试金典--按之字形顺序打印二叉树
程序员面试金典--阶乘尾零
程序员面试金典--矩阵元素查找

原文地址：https://www.cnblogs.com/z-sm/p/11933813.html