在最近的开发中, 碰到一个特别慢的sql
SELECT DISTINCT s.*
FROM pcom_stories s
INNER JOIN pcom_story_content sc
ON s.story_id = sc.story_id AND sc.language=?
INNER JOIN pcom_object_to_tag ot
ON s.story_id = ot.obj_id AND ot.obj_type=1
WHERE
ot.tag_id IN ( ? , ? , ? , ? , ? , ? )
AND s.fsource_id = ?
ORDER BY s.date_time DESC
LIMIT ?, ?
在10万左右的数据表中, 执行时间要1至2分钟. 这个查询的目的是生成一个文章标题列表页, 条件有: 1. 在指定的语言类型下, 有文章内容 2. 指定的来源 3. 与标签的映射关系中, 需要被包含在指定的标签集合中 后来经组里的同事提示, 改成了下面这样的写法, 查询时间只到原来的1/10:
SELECT s.*
FROM pcom_stories s
INNER JOIN pcom_story_content sc
ON s.story_id = sc.story_id AND sc.language=?
WHERE
EXISTS (
SELECT 1 FROM pcom_object_to_tag ot
WHERE
ot.tag_id IN ( ? , ? , ? , ? , ? , ?)
AND s.story_id = ot.obj_id
AND ot.obj_type=1
)
AND s.fsource_id = ?
ORDER BY s.date_time DESC
LIMIT ?, ?
所以, 在需要使用关系表, 又需要使输出值唯一的情况下, 可以尝试使用exists来改进SQL查询