mysql高效查询left join和group by(加索引)

mysql高效查询

mysql牺牲了group by来增加left join的速度(前提是加了索引)。

user表:10万数据

实例1: 200秒左右

SELECT U.id, A.favorite_count FROM (SELECT id from user) U
LEFT JOIN (
  -- 点赞数
  SELECT favorite_by AS user_id, SUM(favorite_count) AS favorite_count
  FROM favorite
  GROUP BY favorite_by
)  A ON U.id=A.user_id
LEFT JOIN (
  -- 评论数量
  SELECT user_id, COUNT(*) AS comment_count
  FROM photo_comment
  GROUP BY user_id
) B ON U.id=B.user_id

实例2:1秒多

select uf.user_id , uf.favorite_count, COUNT(pc.id) as comment_count from (
select u.id as user_id , SUM(f.favorite_count) as favorite_count from (SELECT id from user) u 
LEFT JOIN favorite f on f.favorite_by = u.id  
GROUP BY u.id
) uf 
LEFT JOIN photo_comment pc on pc.user_id = uf.user_id
GROUP BY uf.user_id

附:如何在MySQL高效的join3个表

对于下面这个三个表的join语句

select * 
from t1 
join t2 on(t1.a=t2.a) 
join t3 on (t2.b=t3.b) 
where t1.c>=X and t2.c>=Y and t3.c>=Z;

若改写成straight_join,要怎么指定连接顺序,以及怎么给三个表创建索引?

尽量使用BKA算法

使用BKA,并非“先计算两个表join的结果,再跟第三个表join”,而是直接嵌套查询的。具体实现:在t1.c>=X、t2.c>=Y、t3.c>=Z这三个条件里,选择一个经过过滤以后,数据最少的那个表,作为第一个驱动表。此时,可能会出现如下两种情况。

如果选出来是表t1或者t3,那剩下的部分就固定了:

  • 如果驱动表是t1,则连接顺序是t1->t2->t3,要在被驱动表字段创建上索引,也就是t2.a 和 t3.b上创建索引
  • 如果驱动表是t3,则连接顺序是t3->t2->t1,需要在t2.b 和 t1.a上创建索引。

同时,我们还需要在第一个驱动表的字段c上创建索引。

第二种情况是,若选出来的第一个驱动表是表t2,则需要评估另外两个条件的过滤效果。

思路就是,尽量让每一次参与join的驱动表的数据集,越小越好,因为这样我们的驱动表就会越小。

总结

到此这篇关于mysql高效查询left join和group by的文章就介绍到这了,更多相关mysql高效查询内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

你可能感兴趣的:(mysql高效查询left join和group by(加索引))