• MySQL使用Limit关键字限制查询结果的数量效率问题


    MySQL使用Limit关键字限制查询结果的数量

    1、Limit关键字的使用
    查询数据时,可能会查询出很多的记录。而用户需要的记录可能只是很少的一部分。这样就需要来限制查询结果的数量。Limit是MySQL中的一个特殊关键字。Limit子句可以对查询结果的记录条数进行限定,控制它输出的行数。

    在MySQL数据库中创建用户信息表(tb_user),并添加数据用于测试使用。

    -- 判断数据表是否存在,存在则删除
    DROP TABLE IF EXISTS tb_user;

    -- 创建“用户信息”数据表
    CREATE TABLE IF NOT EXISTS tb_user
    (
    user_id INT AUTO_INCREMENT PRIMARY KEY COMMENT '用户编号',
    user_name VARCHAR(50) NOT NULL COMMENT '用户姓名',
    province VARCHAR(50) NOT NULL COMMENT '省份'
    ) COMMENT = '用户信息表';

    -- 添加数据
    INSERT INTO tb_user(user_name,province) VALUES
    ('pan_junbiao的博客_01','广东省'),('pan_junbiao的博客_02','黑龙江省'),('pan_junbiao的博客_03','山东省'),('pan_junbiao的博客_04','安徽省'),('pan_junbiao的博客_05','黑龙江省'),
    ('pan_junbiao的博客_06','江苏省'),('pan_junbiao的博客_07','黑龙江省'),('pan_junbiao的博客_08','广东省'),('pan_junbiao的博客_09','陕西省'),('pan_junbiao的博客_10','广东省'),
    ('pan_junbiao的博客_11','广东省'),('pan_junbiao的博客_12','江苏省'),('pan_junbiao的博客_13','陕西省'),('pan_junbiao的博客_14','安徽省'),('pan_junbiao的博客_15','山东省'),
    ('pan_junbiao的博客_16','陕西省'),('pan_junbiao的博客_17','安徽省'),('pan_junbiao的博客_18','江苏省'),('pan_junbiao的博客_19','黑龙江省'),('pan_junbiao的博客_20','安徽省'),
    ('pan_junbiao的博客_21','江苏省'),('pan_junbiao的博客_22','广东省'),('pan_junbiao的博客_23','安徽省'),('pan_junbiao的博客_24','陕西省'),('pan_junbiao的博客_25','广东省'),
    ('pan_junbiao的博客_26','广东省'),('pan_junbiao的博客_27','安徽省'),('pan_junbiao的博客_28','山东省'),('pan_junbiao的博客_29','山东省'),('pan_junbiao的博客_30','黑龙江省'),
    ('pan_junbiao的博客_31','广东省'),('pan_junbiao的博客_32','江苏省'),('pan_junbiao的博客_33','陕西省'),('pan_junbiao的博客_34','安徽省'),('pan_junbiao的博客_35','山东省');
    1.1 语法格式1
    LIMIT m;
    m:表示查询多少条记录。

    【示例】查询用户信息表(tb_user),按照 user_id 编号进行升序排列,显示前5条记录。

    SELECT * FROM tb_user
    ORDER BY user_id
    LIMIT 5
    执行结果:

    1.2 语法格式2
    LIMIT m , n;
    m:表示开始查询的第一条记录的编号(注意:在查询结果中,第一个结果的记录编号是0,而不是1)。

    n:表示查询多少条记录。

    【示例】查询用户信息表(tb_user),按照 user_id 编号进行升序排列,从编号10开始,查询后面5条记录。

    SELECT * FROM tb_user
    ORDER BY user_id
    LIMIT 10,5
    执行结果:

    2、使用Limit分页查询的性能优化
    【示例】在存储过程中使用Limit的优化查询。

    2.1 使用一般分页查询(不推荐)
    DELIMITER $$

    -- 方式一:使用一般分页查询(不推荐)
    DROP PROCEDURE IF EXISTS proc_user_page$$
    CREATE PROCEDURE proc_user_page(IN page_index INT,IN page_size INT)
    BEGIN
    DECLARE begin_no INT;
    SET begin_no = (page_index-1)*page_size;

    SELECT * FROM tb_user
    ORDER BY user_id ASC
    LIMIT begin_no,page_size;
    

    END$$

    DELIMITER ;
    调用存储过程:查询第2页,每页5条记录。

    -- 调用存储过程:查询第2页,每页5条记录
    CALL proc_user_page(2,5);
    执行结果:

    弊端:方式一虽然实现了分页功能,但随着查询偏移的增大,尤其查询偏移大于10万以后,查询时间将急剧增加。这种分页查询方式会从数据库第一条记录开始扫描,所以越往后,查询速度越慢,而且查询的数据越多,也会拖慢总查询速度。

    2.2 使用子句优化查询(推荐)
    DELIMITER $$

    -- 方式二:使用子句优化查询(推荐)
    DROP PROCEDURE IF EXISTS proc_optimize$$
    CREATE PROCEDURE proc_optimize(IN page_index INT,IN page_size INT)
    BEGIN
    DECLARE begin_no INT;
    SET begin_no = (page_index-1)*page_size;

    SELECT * FROM tb_user
    WHERE user_id >= (
    	SELECT user_id FROM tb_user
    	ORDER BY user_id ASC
    	LIMIT begin_no,1
    )
    ORDER BY user_id ASC
    LIMIT page_size;
    

    END$$

    DELIMITER ;
    调用存储过程:查询第3页,每页5条记录。

    -- 调用存储过程:查询第3页,每页5条记录
    CALL proc_optimize(3,5);
    执行结果:

    优点:方式二适合数据表的id是连续递增的,则可以根据查询的页数和查询的记录数可以算出查询的id的范围。这种查询方式能够极大地优化查询速度,基本能够在几十毫秒之内完成。限制是只能使用于明确知道id的情况,不过一般建立表的时候,都会添加基本的自增的主键id字段,这为分页查询带来很多便利。

    3、Limit的效率问题
    以下内容转载至:https://www.cnblogs.com/acm-bingzi/p/msqlLimit.html

    3.1 Limit的效率高?
    常说的Limit的执行效率高,是对于一种特定条件下来说的:即数据库的数量很大,但是只需要查询一部分数据的情况。
    高效率的原理是:避免全表扫描,提高查询效率。

    比如:每个用户的email是唯一的,如果用户使用email作为用户名登陆的话,就需要查询出email对应的一条记录。
    SELECT * FROM t_user WHERE email=?;
    上面的语句实现了查询email对应的一条用户信息,但是由于email这一列没有加索引,会导致全表扫描,效率会很低。
    SELECT * FROM t_user WHERE email=? LIMIT 1;
    加上LIMIT 1,只要找到了对应的一条记录,就不会继续向下扫描了,效率会大大提高。

    3.2 Limit的效率低?
    在一种情况下,使用limit效率低,那就是:只使用limit来查询语句,并且偏移量特别大的情况

    做以下实验:
    语句1:
    select * from table limit 150000,1000;
    语句2:
    select * from table while id>=150000 limit 1000;
    语句1为0.2077秒;语句2为0.0063秒
    两条语句的时间比是:语句1/语句2=32.968

    比较以上的数据时,我们可以发现采用where...limit....性能基本稳定,受偏移量和行数的影响不大,而单纯采用limit的话,受偏移量的影响很大,当偏移量大到一定后性能开始大幅下降。不过在数据量不大的情况下,两者的区别不大。

    所以应当先使用where等查询语句,配合limit使用,效率才高

    ps:在sql语句中,limt关键字是最后才用到的。以下条件的出现顺序一般是:where->group by->having-order by->limit

    附录:OFFSET
    为了与 PostgreSQL 兼容,MySQL 也支持句法: LIMIT # OFFSET #。
    经常用到在数据库中查询中间几条数据的需求
    比如下面的sql语句:
    selete * from testtable limit 2,1;
    selete * from testtable limit 2 offset 1;
    注意:
    1.数据库数据计算是从0开始的
    2.offset X是跳过X个数据,limit Y是选取Y个数据
    3.limit X,Y 中X表示跳过X个数据,读取Y个数据
    这两个都是能完成需要,但是他们之间是有区别的:
    (1)是从数据库中第三条开始查询,取一条数据,即第三条数据读取,一二条跳过
    (2)是从数据库中的第二条数据开始查询两条数据,即第二条和第三条。

    不会,我可以学;落后,我可以追赶;跌倒,我可以站起来!
  • 相关阅读:
    directives vant之Field输入限制【v-input-float】
    【vue】 typeScript OSS图片压缩处理工具类
    vue单页面加载js方法
    H5网页打开App以及App内某个页面
    适配iphoneX万能方法!!!
    固定底部button按钮,兼容各种手机、微信等【flex布局】
    天行数据小程序demo
    iview Weapp index索引器 cityjs 增加每个城市的code值
    小程序上传图片至七牛云(支持多张上传、预览、删除图片)
    (转)异步与非阻塞之间的区别(看到的最清晰的说明)
  • 原文地址:https://www.cnblogs.com/xiaoshahai/p/14817607.html
Copyright © 2020-2023  润新知