近日查看SQL慢查询日志,发现对于in的查询总是出现超时问题。超时相关SQL语句:select * from flow_ru_bizvar where businessId IN () and status = 0。可以看到在这句SQL中,最耗时的就是因为in的原因。这里in的对象是一个Long类型(businessId)的List。先是从另一个表中,select出相关的businessId,然后再根据这些businessId进行查询。这样做的目的是为了避免表链接而带来的耗时,然而,从结果来看这样的处理结果还是耗时的。所以,关于这两个种方式究竟那种较好,以及各自的使用条件,如何对其两种进行优化。
1.当是集合时,in的处理机制:
2.当是子查询时,in的处理机制:
首先执行子查询,其查询出来的结果作为衍生表(临时表),同时,其原有的索引仍然会起作用。
3.in与exists的区别以及使用条件
exists使用主查询中的表作为驱动表,适用于子查询中的表有索引支持,主查询中的表数据较少时的情况。exists 对主表进行loop,根据主表的值去查看子表的结果(子表的结果为true或false),若子表的结果为true,则返回主表的结果,否则不返回主表的结果。
in使用子查询中的表作为驱动表,适用于主查询中的表有索引支持,子查询中的表数据较少时的情况。其执行流程,将主查询的结果集与子查询的结果集进行内链接。
测试语句:
explain select *
from flow_ru_business
where flow_ru_business.businessId in (select gte_order.businessId from gte_order where gte_order.status = 7);
主查询使用遍历全表而不是遍历索引的原因是:主查询要求返回出所有元素字段,只能查表,如果满足覆盖索引才会遍历索引而不是表。