• SQL中 left join 的底层原理


    介绍

    left join的实现效果就是保留左表的全部信息,将右表往左表上拼接,如果拼不上则为NULL

    除了left join以外,还有inner joinouter joinright join等,文章不介绍其他连接的具体效果,主要讲解join的底层原理是如何实现的?具体效果是怎样呈现的?

    只有懂得了底层原理,才能更好的写出性能优越的SQL脚本,提高SQL的执行速度。

    join主要有3种方式,具体为:

    • Nested Loop -- 嵌套循环,细分为以下3种连接方式:
      • Simple Nested-Loop Join
      • Index Nested-Loop Join
      • Block Nested-Loop Join
    • Hash Join
    • Merge Join

    其他概念:

    驱动表(也叫外表)和被驱动表(也叫非驱动表,还可以叫匹配表,亦可叫内表),简单来说,驱动表就是主表,left join 中的左表就是驱动表,right join 中的右表是驱动表。

    一个是驱动表,那另一个就只能是非驱动表,在 join 的过程中,其实就是从驱动表里面依次(注意理解这里面的依次)取出每一个值,然后去非驱动表里面进行匹配。

    Simple Nested-Loop Join

    Simple Nested-Loop Join 是这三种方法里面最简单,最好理解,也是最符合大家认知的一种连接方式。

    现在有两张表 table Atable B,我们让table A left join table B,观察是怎样进行匹配的。

    ![](https://img2018.cnblogs.com/blog/1401833/201910/1401833-20191001235527140-899479194.jpg)

    从驱动表table A依次取出每一个值,然后去非驱动表table B中进行从上往下依次匹配,将值返回。

    利用这种方式进行匹配,总共需要执行10×10=100次查询。

    Index Nested-Loop Join

    利用索引进行匹配,Index要求非驱动表上具有索引,有了索引以后可以减少匹配次数,提高查询效率。

    数据库中索引一般采用B+树的存储结构,可以提高效率。

    如果索引是主键的话,效率会更高,因为主键必须是唯一的。所以如果被驱动表是用主键去连接,只会出现多对一或者一对一的情况,而不会出现多对多和一对多的情况。

    Block Nested-Loop Join

    理想情况下,用索引匹配是最高效的一种方式,但是在现实工作中,并不是所有的列都是索引列,这个时候就需要用到 Block Nested-Loop Join 方法了,这种方法与第一种方法比较类似,唯一的区别就是会把驱动表中 left join 涉及到的所有列(不止是用来on的列,还有select部分的列)先取出来放到一个缓存区域,然后再去和非驱动表进行匹配,这种方法和第一种方法相比所需要的匹配次数是一样的,差别就在于驱动表的列数不同,也就是数据量的多少不同。

    所以虽然匹配次数没有减少,但是总体的查询性能还是有提升的。

    参考链接:SQL底层原理

  • 相关阅读:
    安装Rocky版OpenStack 1控制节点+1计算节点环境部署脚本
    脚本安装Rocky版OpenStack 1控制节点+1计算节点环境部署
    采用脚本自动填写具有交互式命令的方法
    CentOS安装Docker
    WordPress博客搭建与问题总结
    OpenStack端口(15)
    openstack搭建之-horizon配置(14)
    openstack搭建之-创建实例(13)
    openstack搭建之-cinder配置(12)
    openstack搭建之-neutron配置(11)
  • 原文地址:https://www.cnblogs.com/hider/p/11616518.html
Copyright © 2020-2023  润新知