1 数据库的索引是为了提高数据的查询效率。
2 索引常用的数据结构有,
2.1 hash表: 增加新的数据,查询依然很快,缺点是 查询范围数据慢。 适合做等值查询。
2.2 有序数组和长链表:适合做范围查询和等值查询, 只适用于静态数据引擎,缺点是当往数据中间插入记录的时候,需要挪动后面所有的记录。
2.3 二叉树: 数据查询的时间复杂度很低,可是需要较多的数据块,所以工业上实际应用的 是多叉树。
3 innoDB使用的数据索引模型是b+树。
3.1 b+树的索引分为 主键索引(聚簇索引)和非主键索引(二级索引)。
3.2 主键索引的叶子节点存储的是 整行数据,而非主键索引叶子节点是存储的是主键索引的值。
3.3 如果语句是 select * from T where ID=500,即主键查询方式,则只需要搜索 ID 这棵 B+ 树;
如果语句是 select * from T where k=5,即普通索引查询方式,则需要先搜索 k 索引树,得到 ID 的值为 500,再到 ID 索引树搜索一次。这个过程称为回表。
4 索引维护
b+树索引,当指定位置插入新数据,原有数据也已经满了的情况下会分页, 当相邻两个数据页数据量比较少,会发生合页的情况。
总体来说查询推荐使用主键自增索引,而且主键索引越小,普通叶子节点的索引就越小,普通索引占用的空间就越小。