• 去重是distinct还是group by?


    distinct简单来说就是用来去重的,而group by的设计目的则是用来聚合统计的,两者在能够实现的功能上有些相同之处,但应该仔细区分,因为用错场景的话,效率相差可以倍计。

    单纯的去重操作使用distinct,速度是快于group by的

    distinct

    distinct支持单列、多列的去重方式。 
    单列去重的方式简明易懂,即相同值只保留1个。 
    多列的去重则是根据指定的去重的列信息来进行,即只有所有指定的列信息都相同,才会被认为是重复的信息。

    干巴巴的说不好理解,示例一下:

    示例数据表中的数据:
    mysql> select * from talk_test;
    +----+-------+--------+
    | id | name  | mobile |
    +----+-------+--------+
    |  1 | xiao9 | 555555 |
    |  2 | xiao6 | 666666 |
    |  3 | xiao9 | 888888 |
    |  4 | xiao9 | 555555 |
    |  5 | xiao6 | 777777 |
    +----+-------+--------+
    
    
    进行单列去重后的结果:
    
    mysql> select distinct(name) from talk_test;
    +-------+
    | name  |
    +-------+
    | xiao9 |
    | xiao6 |
    +-------+
    2 rows in set (0.01 sec)
    
    mysql> select distinct(mobile) from talk_test;
    +--------+
    | mobile |
    +--------+
    | 555555 |
    | 666666 |
    | 888888 |
    | 777777 |
    +--------+
    **只会保留指定的列的信息
    
    进行多列去重后的结果:
    mysql> select distinct name,mobile from talk_test;
    +-------+--------+
    | name  | mobile |
    +-------+--------+
    | xiao9 | 555555 |
    | xiao6 | 666666 |
    | xiao9 | 888888 |
    | xiao6 | 777777 |
    +-------+--------+
    **只有所有指定的列信息都相同,才会被认定为重复的信息

    group by使用的频率相对较高,但正如其功能一样,它的目的是用来进行聚合统计的,虽然也可能实现去重的功能,但这并不是它的长项。

  • 相关阅读:
    PMAC运动程序例程(一)
    【译】移动王国的诱惑【经济学人】
    粒子生物学【经济学人】
    快到家了【经济学人】
    关于贝加莱Modbus通讯的总结
    关于贝加莱Modbus通讯的总结
    移动王国的诱惑【经济学人】
    什么是Modbus
    动物精神【经济学人】
    什么是Modbus
  • 原文地址:https://www.cnblogs.com/shamo89/p/8944543.html
Copyright © 2020-2023  润新知