2020-10-13：hash与B+tree的区别？

2020-10-13：hash与B+tree的区别？

福哥答案2020-10-13：

[答案来自知乎：](https://www.zhihu.com/question/425378511/answer/1522000015)

这里我从数据库索引的层面回答下这个问题。
由于Hash 索引结构的特殊性，所以其检索效率非常高，索引的检索可以一次定位，而B-Tree 索引则需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。
但是很多数据库的索引结构却使用的是B+Tree索引，这是因为虽然 Hash 索引效率高，但是 Hash 索引本身由于其特殊性也带来了很多限制和弊端，主要可以分为以下几个方面。
（1）InnoDB和MyISAM用B+Tree，MEMORY用Hash。
（2）Hash 索引仅仅能满足"=","IN"和"<=>"查询，不能使用范围查询。
由于 Hash 索引比较的是进行 Hash 运算之后的 Hash 值，所以它只能用于等值的过滤，不能用于基于范围的过滤，因为经过相应的 Hash 算法处理之后的 Hash 值的大小关系，并不能保证和Hash运算前完全一样。
（3）Hash 索引无法被用来避免数据的排序操作。
由于 Hash 索引中存放的是经过 Hash 计算之后的 Hash 值，而且Hash值的大小关系并不一定和 Hash 运算前的键值完全一样，所以数据库无法利用索引的数据来避免任何排序运算；
（4）Hash 索引不能利用部分索引键查询。
对于组合索引，Hash 索引在计算 Hash 值的时候是组合索引键合并后再一起计算 Hash 值，而不是单独计算 Hash 值，所以通过组合索引的前面一个或几个索引键进行查询的时候，Hash 索引也无法被利用。
（5）Hash 索引在任何时候都不能避免表扫描。
因为Hash 索引是将索引键通过 Hash 运算之后，将 Hash运算结果的 Hash 值和所对应的行指针信息存放于一个 Hash 表中，由于不同索引键存在相同 Hash 值，所以即使取满足某个 Hash 键值的数据的记录条数，也无法从 Hash 索引中直接完成查询，还是要通过访问表中的实际数据进行相应的比较，并得到相应的结果。
（6）Hash 索引遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高。
对于选择性比较低的索引键，如果创建 Hash 索引，那么将会存在大量记录指针信息存于同一个 Hash 值相关联。这样要定位某一条记录时就会非常麻烦，会浪费多次表数据的访问，而造成整体性能低下。
hash相当于把key通过hash函数计算，得到key的hash值,再用这个hash值做指针，查找hash表中是否存在key，如果存在就返回 key所对应的value，选定一个好的hash函数很重要，好的hash函数可以使计算出的hash值分布均匀，降低冲突，只有冲突减小了，才会降低 hash表的查找时间。
而b-tree完全基于key的比较，和二叉树相同的道理，相当于建个排序后的数据集，使用二分法查找算法，实际上也非常快，而且受数据量增长影响非常小。
***
[评论](https://user.qzone.qq.com/3182319461/blog/1602544550)
相关阅读:
Access Update 不支持子查询用查询解决
 vs2005中文乱码
 清理sql日志
 VS2005快捷键使用
 如何用C#改文件名
 C#中使用DirectSound录音
 VS2005打包到没有.NETFramework2.0的目标机器上安装
 Access中iif,isnull的用法
 水晶报表切换字段视图不能用的问题。
VS2005中TextBox的ReadOnly属性
原文地址：https://www.cnblogs.com/waitmoon/p/13811158.html