join原理

join 主要有Nested Loop、Hash Join、Merge Join这三种方式，

Nested Loop 翻译过来就是嵌套循环的意思，那什么又是嵌套循环呢？嵌套大家应该都能理解，就是一层套一层；那循环呢，你可以理解成是 for 循环。

Nested Loop 里面又有三种细分的连接方式，分别是Simple Nested-Loop Join、Index Nested-Loop Join、Block Nested-Loop Join，接下来我们就分别去看一下这三种细分的连接方式。

在正式开始之前，先介绍两个概念，驱动表(也叫外表)和被驱动表(也叫非驱动表，还可以叫匹配表，亦可叫内表)，简单来说，驱动表就是主表，left join 中的左表就是驱动表，right join 中的右表是驱动表。一个是驱动表，那另一个就只能是非驱动表了，在 join 的过程中，其实就是从驱动表里面依次(注意理解这里面的依次)取出每一个值，然后去非驱动表里面进行匹配，那具体是怎么匹配的呢？这就是我们接下来讲的这三种连接方式。

Simple Nested-Loop Join

left join 会从驱动表 table A 中依次取出每一个值，然后去非驱动表 table B 中从上往下依次匹配，然后把匹配到的值进行返回，最后把所有返回值进行合并，这样我们就查找到了table A left join table B的结果。是不是和你的认知是一样的呢？利用这种方法，如果 table A 有10行，table B 有10行，总共需要执行10 x 10 = 100次查询。

Index Nested-Loop Join

Index Nested-Loop Join 这种方法中，我们看到了 Index，大家应该都知道这个就是索引的意思，这个 Index 是要求非驱动表上要有索引，有了索引以后可以减少匹配次数，匹配次数减少了就可以提高查询的效率了。

Block Nested-Loop Join

理想情况下，用索引匹配是最高效的一种方式，但是在现实工作中，并不是所有的列都是索引列，这个时候就需要用到 Block Nested-Loop Join 方法了，这种方法与第一种方法比较类似，唯一的区别就是会把驱动表中 left join 涉及到的所有列(不止是用来on的列，还有select部分的列)先取出来放到一个缓存区域，然后再去和非驱动表进行匹配，这种方法和第一种方法相比所需要的匹配次数是一样的，差别就在于驱动表的列数不同，也就是数据量的多少不同。所以虽然匹配次数没有减少，但是总体的查询性能还是有提升的。

索引如何提升查询效率

join原理

你可能感兴趣的:(join原理)