说一下Mysql索引
什么是索引
帮助数据库高效获取数据的数据结构
索引的作用
当表中数据量越来越大时,索引可以明显提高查询效率,当然索引并不是越多越好
索引的命中
MySql中索引默认结构为B+树,为什么不是B树、Hash,二叉树,红黑树?
B+树
B+树底层实现是多路平衡查找树,对于每一次的查询都是从根节点出发,查找到叶子节点方可获得所查键值,然后根据查询判断是否需要回表查询数据。B+树的查询效率比较稳定,对于所有的查询都是从根节点到叶子节点,且树的高度较低。
非叶子节点的查找用的二分查找。
B树
因为其不管是叶子节点还是非叶子节点都会保存数据,这样导致在非叶子节点中能保存的指针数量变少,指针少的情况下要保存大量的数据,只能增加树的高度,导致IO操作变多,查询性能变低
Hash
Hash索引底层就是hash表,进行查找时,调用一次hash函数就可以获取到相应的键值,之后进行回表查询获得实际数据。
Hash索引虽然在等值查询上比较快,但不稳定,性能不可预测,当某个键值存在大量重复的时候,发生hash碰撞,此时效率可能极差。
二叉树
树的高度不均匀,不能自平衡,查找和树的高度有关,并且IO代价高
红黑树
树的高度随着数据量的增加而增加,IO代价高
总结
MySQL使用B+Tree作为索引数据结构。
B+Tree在新增数据时,会根据索引指定列的值对旧的B+Tree做调整。从物理存储结构上说,B-Tree 和B+Tree都以页(4K)来划分节点的大小,但是由于B+Tree中中间节点不存储数据,因此B+Tree能够在同样大小的节点中,存储更多的key,提高查找效率。
影响MySQL查找性能的主要还是磁盘I0次数,大部分是磁头移动到指定磁道的时间花费。
MyISAM存储引擎下索引和数据存储是分离的,InnoDB 索引和数据存储在一起。
InnoDB 存储引擎下索引的实现,(辅助索引)全部是依赖于主索引建立的(辅助索引中叶子结点存储的并不是数据的地址,还是主索引的值,因此,所有依赖于辅助索引的都是先根据辅助索引查到主索引,再根据主索引查数据的地址)。
由于InnoDB索引的特性,因此如果主索引不是自增的(id作主键),那么每次插入新的数据,都很可能对B+Tree的主索引进行重整,影响性能。因此,尽量以自增id作为InnoDB的主索引。