sql优化:JOIN

连接总是需要顺序的。例如三个表A,B,C。A JOIN B产生结果集合D,D再和C连接产生最终结果。连接就是这么完成的。oracle从来不会多个表同时连接的。
优化器针对可能的连接顺序,连接方法和可行的访问路径,产生一些执行计划。然后优化器估计每个计划计划并选择具有最低消耗(成本)的那个。

hash join

执行计划格式如下

       hash join
          build table              (inner table) --驱动表
          probe table             (outer  table)

oracle,postgresql它们都是支持hash-join的,mysql并不支持
将两表中的小表作为hash表,hash表是放在内存中的,然后去扫描另一个表的每一行数据。
优点是没有索引也可以,问题是只能用于等值链接。

nested loops

相当于两个for循环的算法。

nested loop
           outer table             --驱动表
           inner table

嵌套循环连接,是比较通用的连接方式,分为内外表,每扫描外表的一行数据都要在内表中查找与之相匹配的行,没有索引的复杂度是O(N*M),这样的复杂度对于大数据集是非常劣势的,一般来讲会通过索引来提升性能。

sort merge-join

merge join需要首先对两个表按照关联的字段进行排序,分别从两个表中取出一行数据进行匹配,如果合适放入结果集;不匹配将较小的那行丢掉继续匹配另一个表的下一行,依次处理直到将两表的数据取完。merge join的很大一部分开销花在排序上,也是同等条件下差于hash join的一个主要原因。但是,如果两张表都已经排好顺序了,则效率会优于hash join。

你可能感兴趣的:(数据库)