• mysql时间序列与窗口函数


    一、datetime 格式数据提取

    mysql 中已存在列格式为 datetime 格式时,提取其中的年:

    季度: quarter
    月:month
    周 :week 
    日:day
    时:hour
    分:minute
    秒:second
    select year(a.`订购日期`) from `订单` a;

    改变显示格式方法:

    1、格式化:
    SELECT DATE_FORMAT(a.`订购日期`,'%Y-%m') from `订单` a;
    
    2、字符串截取
    select left(a.`订购日期`,10) from `订单` a;

    二、mysql中关于date函数

    向日期添加指定时间间隔函数
    date_add(date,INTERVAL expr type)
    
    向日期减去指定时间间隔函数
    date_sub(date,INTERVAL expr type)
    
    返回两个日期之间的函数
    datediff(date1,date2)
    
    以不同的格式显示时间
    date_format(date,format)

    三、查看连续登录天数

    这类问题,用窗口函数来解决更方便些,下面先列举下常用的窗口函数

    1、累计计算窗口函数 
    sum、avg、max、min  
    sum(...A...) over (partition by...B... order by ...C... rows between....D1...and...D2...)
    partition by   分组字段
    order by       按什么字段排序
    rows...between  计算的行数范围   移动求平均值常用
    
    2、分区排序窗口函数
    row_number() over (partition by...B... order by ...C...)     1 2 3 4 5
    rank() over (partition by...B... order by ...C...)           1 1 1 4 5
    dense_rank() over (partition by...B... order by ...C...)     1 1 1 2 3 
    
    3、分组排序  
    ntile() 不支持分组排序 rows ..between ...
    ntile() over (partition by...B... order by ...C...)    前 10%的用户
    
    4、偏移分析窗口函数
    应用场景 :解决今天和昨天的数据差
    前offset 行数据
    lag(exp_str,offset,defval) over (partition by...B... order by ...C...)
    
    后offset 行数据
    lead(exp_str,offset,defval) over (partition by...B... order by ...C...)

    举个例子

    创建表,字段有 id,long_time 
    create table user_login(user_id int,login_time date);
    
    插入数据
    insert into user_login values
    (1,'2019-06-01'),
    (1,'2019-06-02'),
    (1,'2019-06-03'),
    (1,'2019-06-06'),
    (1,'2019-06-07'),
    (1,'2019-06-08'),
    (1,'2019-06-11'),
    (1,'2019-06-12'),
    (2,'2019-06-01'),
    (2,'2019-06-02'),
    (2,'2019-06-04'),
    (3,'2019-06-01'),
    (3,'2019-06-02'),
    (4,'2019-06-01'),
    (5,'2019-06-01'),
    (5,'2019-06-02');

    1、显示出每个用户连续登录天数,不去重用户

    1、对原表增加分区排序窗口函数 row_number,按序号分组,时间排序
    2、用date_sub()函数,登录日期减去序号,如果是连续登录日期,那么date_sub()函数结果就会一致
    3、最后,将数据结果按id 和 date_sub()函数分组
    
    SELECT user_id,
    date_sub(login_time, INTERVAL rn DAY) AS login_group,  -- 连续登录数据会一致
    min(login_time) AS start_login_time,
    max(login_time) AS end_login_time,
    count(login_time) AS continuous_days
    FROM
    (SELECT user_id,login_time,
    row_number () over (PARTITION BY user_id ORDER BY login_time) AS rn    分区排序窗口函数,分组、排序
    FROM 
    user_login) t
    GROUP BY user_id, date_sub(login_time, INTERVAL rn DAY);/2、

    2、计算连续出现n次数据问题

    成绩连续出现三次
    解题思路 :
    1、偏移分析窗口函数,将成绩向上偏移两位
    2、计算score列与偏移后成绩的差值,0值即连续的成绩
    
    SELECT id,score,(score - lead_score) as score3 from
    (select id,score,lead(score,2) over (order by id) as lead_score from score order by id) a
    WHERE  (score - lead_score)=0;

     

  • 相关阅读:
    oracle11g 卸载和安装(win7,32位)
    MySQL忘记密码解决办法
    GPIO硬件资源的申请,内核空间和用户空间的数据交换,ioctl(.....),设备文件的自动创建
    模块参数,系统调用,字符设备编程重要数据结构,设备号的申请与注册,关于cdev的API
    开发环境的搭建,符合导出,打印优先级阈值
    定时器中断
    Linux系统移植的重要文件
    linux 相关指令
    linux各文件夹含义和作用
    外部中断实验
  • 原文地址:https://www.cnblogs.com/interdrp/p/13633640.html
Copyright © 2020-2023  润新知