分页查询，你真的懂吗？

分页查询，你真的懂吗？
序

　　程序员代码的编写能力主要体现在思维的严谨上。有些看起来很简单的东西，里面包含很多很细的点，你能想到吗？

　　今天我就简单说一下一个例子，让大家学习到新知识的同时，也养成一种思维的习惯。
问题

　　有一张收藏表，里面存储的是用户和图书ID。数据量为1亿。现在要求分页获取所有用户ID（不重复），写下你的sql语句。

　　表结构大致如下：

　　

CREATE TABLE 收藏表( `id` bigint(20) unsigned NOT NULL auto_increment COMMENT 'primary key', `uid` bigint(20) unsigned NOT NULL default 0 COMMENT 'uid',
　　 `status` tinyint(3) unsigned NOT NULL default 0 COMMENT 'status', `book_id` bigint(20) unsigned NOT NULL default 0 COMMENT 'book Id', `create_time` int(11) unsigned not null default 0 COMMENT 'create time', PRIMARY KEY (`id`), UNIQUE KEY `uid_book_id` (`uid`, `book_id`),
　　　 KEY `uid_status` (`uid`, `status`) )ENGINED=Innodb Auto_increment=1 default charset=gbk COMMENT '用户收藏信息';

三种设计

　　最容易想到的第一种分页语句是（这也是我们最容易想到的语句）：

select distinct uid from 收藏表 order by uid desc limit 0, 10; select distinct uid from 收藏表 order by uid desc limit 11, 10;

　　再高级点语句，第二种（$last_min_uid表示上一次读到的最后一个uid）：

select distinct uid from 收藏表 order by uid desc limit 10; select distinct uid from 收藏表 where uid < $last_min_uid order by uid desc limit 10;

　　最高级的方式

select uid from 收藏表 group by uid order by uid desc limit 10; select uid from 收藏表 group by uid having uid < $last_min_uid order by uid desc limit 10;

　　

　　

分析

　　以上三种方式都可以实现分页获取到用户ID列表，那么区别是什么？我现在就把每一种跟大家分析下。

　　第一种在业务场景中，会出现丢数据的情况。——这是比较严重的情况，不予采纳。

　　具体的业务场景是这样的：当你读取第5页的时候，前四页的用户id列表中，假如有一页的用户ID从库中删除掉，那么你这时读到的第5页(limit 51, 10)，就是原来的第6页，你会把1页的用户ID丢失掉。

　　第二种的第二条语句，通过explain分析，实际并没有命中唯一索引，而只是命中了一般索引，数据查询范围在7百万级别，故explain建议我们使用group by。——这个查询会有严重的性能问题。

+----+--------------+---------------+-------+-------------------------------------------------------------+-------------+----------+-------+------------+------------------------------------------------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+--------------+---------------+-------+-------------------------------------------------------------+---------------------+---------+------+---------+---------------------------------------------------------------------+
| 1 | SIMPLE | ubook_room | range | uid_book_id | uid_status | 4 | NULL | 7066423 | Using where; Using index for group-by; Using temporary; Using filesort |
+----+--------------+---------------+-------+-------------------------------------------------------------+-------------+----------+-------+------------+------------------------------------------------------------------------+

　　

　　第三种explain分析，数据查询范围在12万级别（跟第二种相差一个数量级），查询性能高。

+----+---------------+------------+-------+-----------------+-----------------+---------+----------+----------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+---------------+------------+-------+-----------------+-----------------+---------+----------+----------+-------------+
| 1 | SIMPLE | 收藏表 | index | NULL | uid_book_id | 12 | NULL | 121719 | Using index |
+----+---------------+------------+-------+-----------------+-----------------+---------+----------+----------+-------------+

　　

推荐

　　
相关阅读:
SqlSession接口和Executor
MySQL 存储表情字符
 Lisp学习--Windows下面的开发环境搭建
 使用反射+缓存+委托，实现一个不同对象之间同名同类型属性值的快速拷贝
 GIT团队合作探讨之一-保持工作同步的概念和实践
 关于IE8下media query兼容的解决方案探讨
 git下的团队合作模型及git基础知识汇集
 互联网环境下服务提供的模式
 web统计数据搜集及分析原理
 网站统计及移动应用数据统计相关术语知识详解
原文地址：https://www.cnblogs.com/baochuan/p/4625262.html