• mysql分组求最值(模拟Oracle的分析函数)


    我们知道无论是oracle,还是mysql,只要对某列分组,就只能查询分组列或者分组函数列,而对于分组后的整体数据单单靠一个分组函数查询不出来。

    在以前开发时,使用的是oracle数据库,比如有很多年的数据,根据年限分组,获取每组最大值,在oracle中可以这样实现:

    select *
      from (select t.*,
                   row_number() over(partition by t.dqdm order by t.nf desc) cn --这么理解,按dqdm分组,每组按nf降序,这样row_number() 这列(别名cn) 会按照分好的组,每组都1、2、3,1、2、3的排
              from t_sjk_dqmjxx t
             where t.scbj = '0')
    where cn = '1'--这时取第一个就是按dqdm排序,取每组年份最大的字段值了
    

    但mysql没有类似的函数,需要我们使用用户变量来模拟实现类似的功能:

    1.测试数据表结构:

    CREATE TABLE `stud` (
      `id` varchar(30) NOT NULL,
      `name` varchar(30) NOT NULL,
      `score` int(11) DEFAULT NULL,
      `subject` varchar(30) DEFAULT NULL,
      PRIMARY KEY (`id`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8
    

    2.插入测试数据

    insert into `stud` (`id`, `name`, `score`, `subject`) values('1001','张三','98','语文');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1002','张三','86','数学');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1003','张三','73','英语');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1004','李四','85','语文');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1005','李四','92','数学');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1006','李四','79','英语');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1007','王五','68','语文');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1008','王五','79','数学');
    insert into `stud` (`id`, `name`, `score`, `subject`) values('1009','王五','92','英语');

    整理完是这样的表结构:


    3.使用sql查询分组


    这里有几个说明的地方:

    A:一定要自己手动排好序,因为我本意是按照科目分组,查出每个科目分数最高的学员信息,因此先按照subject排序,再按照score降序(asc查询的就是每科中成绩最低的学员信息了)

    B:仿照这个改sql时,除了自己的表字段以外,B处是要手动替换的字段,因为我需要科目分组,所以需要写成subject,按照每个科目的rank进行1、2、3...这样的展示

    C:rank <=1,1代表了选取每组第一行的数据

    完成sql如下展示:

    SELECT id, `name`, score, `subject`, rank FROM (
    	SELECT b.id, b.name, b.score, b.subject, IF(@pdept=b.subject, @rank:=@rank+1, @rank:=1) AS rank, @pdept:=b.subject FROM (
    		SELECT id, `name`, score, `subject` FROM stud ORDER BY `subject`, score DESC
    	) b, (SELECT @pdept:=NULL, @rank:=0) c 
    ) result HAVING rank <= 1; 

    编辑于17.10.12:

    这两天需要用到这方面的知识,但这个sql连我自己看着都麻烦,从网上找到被别人点过赞的。我也改写放到线上了。后来线上的一个数据还是有问题。分组取最值(或者说是需要的几条数据)失败。我这个麻烦归麻烦,写完也用下试试吧,结果真没问题。线上N个sql都用的这个求最值。但sql直接看实在有点乱。我再整理下吧:

    上面的sql总结下就是下面的这些,已经颜色区分开了

    SELECT aa, bb, cc, activityID,rank FROM (

       SELECT aa, bb, cc,activityID, IF(@orderField=maxb.activityID, @rank:=@rank+1, @rank:=1) AS rank,@orderField:=maxb.activityIDFROM (

           SELECT aa, bb, cc,activityIDFROM dates ORDER BY activityID DESC,endDate DESC, endTime DESC

        )maxb, (SELECT @orderField:=NULL, @rank:=0) maxc

    ) result HAVING rank <= 1;

    上面需要注意的就是:

    例如一个活动有可能有N个时间地点信息,现在要找出M个活动中最新的时间地点信息,按理说就是M条数据,参考:http://bjmx.xdf.cn/huodong/的应用示例(要把已结束的活动标记出来)

    1.排序,我想把数据按照活动id分组,求出每个活动最新的时间地点信息(dates这个表,按照活动id、日期倒序、时间倒序排序)

    自己的业务如要使用,第一个排序就是要分组的字段;第二个排序字段之后,就是求最值的字段,比如求时间最大值就按照时间序,时间最小值就是按照时间序,这个我不用多说就好理解,这里面用黄色背景标出

    2.分组,要对哪个进行分组,红色字体就替换成那个字段即可,这里面是activityID

    3.可能要查其它字段,直接在绿色背景上标出即可,这里面是aa, bb, cc

  • 相关阅读:
    详细深入分析 Java ClassLoader 工作机制
    centos 文件系统权限
    leaflet 实现地图上标记的发散闪烁动画
    GEOJSON 的渲染实例
    【转】多用户同时登陆Windows远程桌面 | 最近升级了win10系统,以前一直用的RDPWrap-1.6版本无法使用,解决方案
    getopt 用法
    安装oracle报:oracle net configuration assistant失败
    【Delphi学习】ADOQuery 用法
    如何为DOS批处理%time%小时的值小于10的时候如何在这个值前加0?
    .bat 中显示出的时间格式问题,如2:36:00,如何让运行脚本显示为02:36:00
  • 原文地址:https://www.cnblogs.com/dulinan/p/12033094.html
Copyright © 2020-2023  润新知