1、B+Tree索引
1、B+Tree首先是有序结构,为了不至于树的高度太高,影响查找效率,在叶子节点上存储的不是单个数据,提高了查找效率; 为了更好的支持范围查询,B+树在叶子节点冗余了非叶子节点数据,为了支持翻页,叶子节点之间通过指针相连; 2、B+树算法: 通过继承了B树的特征,通过非叶子节点查询叶子节点获取对应的value,所有相邻的叶子节点包含非叶子节点,使用链表进行结合,有一定顺序排序,从而范围查询效率非常高。 缺点:因为有冗余节点数据,会比较占内存。
2、Hash索引
’
1、Hash是k,v形式,通过一个散列函数,能够根据key快速找到value 2、哈希索引就是采用一定的hash算法,把键值换成新的哈希值,检索时不需要类似B+树那样从根节点到叶子节点逐级查找,只需要一次hash算法即可立即定位到相应的位置,速度非常快。 缺点: 因为底层数据结构是散列的,无法进行比较大小,不能进行范围查找
3、B+树索引和hash索引的明显区别:
1、如果是等值查询,那么hash索引有明显的优势,因为只需要经过一次算法即可找到相应的键值;当然了,这个键值是唯一的,如果不唯一,则需要先找到下标位置再链式查找。 2、从示意图可以知道,hash索引无法支持范围查询,因为原先是有序的键值,但是经过hash算法后,有可能变成不连续的,就没有办法利用索引完成范围查询检索数据。 3、同样,hash索引也没办法利用索引完成排序,以及like `xxx%`这样的模糊查询(范围查询)。 4、hash索引也不支持多列联合索引的最左前缀匹配规则。 5、B+树索引的关键字检索效率比较平均,不像B树那样波动幅度大,在有大量重复键的情况下,hash索引的效率也是极低的,因为存在hash碰撞问题。