一,直接创建完整索引,但是会占用大量空间
select * from t where a = "xxx"; 这条sql,如果创建完整索引的话,他的流程是:先去a索引树查询,获取到一条记录的主键id;到主键上根据该主键id查询行,判断a是否正确,加入结果集;取a索引树下一个位置数据,发现不满足循环结束。
二,mysql支持前缀索引
也就是说你可以定义字符串的一部分作为索引,默认不指定会创建完整索引。但是前缀索引会导致覆盖索引失效(需要回表获取数据)
select * from t where a = "abe"; 这条sql,如果创建前缀索引的话。索引假如为a(2),有三条数据abc,abd,abe,那么查询流程是:去a索引树上查询,获取到adc行,回主键查询该行不满足直接丢弃,接着获取a树下一位置,获取到行abd,回主键查询发现不符合,直接丢弃,继续取发现满足,则假如。一直循环,直到索引树取到的不是“ab”时结束。
建立前缀索引要区分到第几位呢,我们需要统计索引列数据的区分度:使用如下sql:select count(distinct email) as L from user; select count(left(email,4)) as L4 from user; .....
这种方式显而易见,会导致查询扫描次数增加。
三,倒序索引的使用
比如某个字段存储的是身份证号,我们知道索引列的差异性越大,使用索引的收益越高,如果我们使用前缀索引的话,因为身份证号前几位标识的地区码,重复较多,如果建立前缀索引的话,要建立12位才能满足一定的区分度。但是显然是浪费空间的。那么我们可以建立数据的倒序索引,新建数据时倒序插入,查询时使用 select * from t where id_card = reverse(idCard)进行查询。