SQL子查询与连接查询研究

假设有A、B两张表，其中B表有A表的外键。在SQL查询中，我们经常有这样的需求，需要根据B表中的条件筛选去查询A表中的内容，以工作流查询用户的已办流程为例来说明：
1、历史流程实例表act_hi_procinst：下述用A表代替

CREATE TABLE `act_hi_procinst` (
  `ID_` varchar(64) COLLATE utf8_bin NOT NULL,
  `PROC_INST_ID_` varchar(64) COLLATE utf8_bin NOT NULL,
  `BUSINESS_KEY_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `PROC_DEF_ID_` varchar(64) COLLATE utf8_bin NOT NULL,
  `START_TIME_` datetime(3) NOT NULL,
  `END_TIME_` datetime(3) DEFAULT NULL,
  `DURATION_` bigint(20) DEFAULT NULL,
  `START_USER_ID_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `START_ACT_ID_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `END_ACT_ID_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `SUPER_PROCESS_INSTANCE_ID_` varchar(64) COLLATE utf8_bin DEFAULT NULL,
  `DELETE_REASON_` varchar(4000) COLLATE utf8_bin DEFAULT NULL,
  `TENANT_ID_` varchar(255) COLLATE utf8_bin DEFAULT '',
  `NAME_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  PRIMARY KEY (`ID_`),
  UNIQUE KEY `PROC_INST_ID_` (`PROC_INST_ID_`),
  KEY `ACT_IDX_HI_PRO_INST_END` (`END_TIME_`),
  KEY `ACT_IDX_HI_PRO_I_BUSKEY` (`BUSINESS_KEY_`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

2、历史节点权限办理表ACT_HI_IDENTITYLINK：以下用B表代替

CREATE TABLE `act_hi_identitylink` (
  `ID_` varchar(64) COLLATE utf8_bin NOT NULL DEFAULT '',
  `GROUP_ID_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `TYPE_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `USER_ID_` varchar(255) COLLATE utf8_bin DEFAULT NULL,
  `TASK_ID_` varchar(64) COLLATE utf8_bin DEFAULT NULL,
  `PROC_INST_ID_` varchar(64) COLLATE utf8_bin DEFAULT NULL,
  PRIMARY KEY (`ID_`),
  KEY `ACT_IDX_HI_IDENT_LNK_USER` (`USER_ID_`),
  KEY `ACT_IDX_HI_IDENT_LNK_TASK` (`TASK_ID_`),
  KEY `ACT_IDX_HI_IDENT_LNK_PROCINST` (`PROC_INST_ID_`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

3、A、B表关系说明
A表的PROC_INST_ID_字段与主键ID_字段值完全相同，B表的PROC_INST_ID_字段作为A表的外键。
一个流程对应A表的一条数据，但会对应B表的多条数据（每个流程节点在办理时都会往B表插入数据），B表的USER_ID_字段会记录办理用户的ID，查询用户已办流程即根据此字段过滤即可，好了背景介绍完毕。
4、查询用户已办流程SQL写法
1）子查询（in方法）

SELECT DISTINCT
    RES.*
FROM
    ACT_HI_PROCINST RES
WHERE
    RES.PROC_INST_ID_ IN (
        SELECT
            LINK.PROC_INST_ID_
        FROM
            ACT_HI_IDENTITYLINK LINK
        WHERE
            LINK.USER_ID_ = 6742
    )

2）子查询（exists方法）

SELECT DISTINCT
    RES.*
FROM
    ACT_HI_PROCINST RES
WHERE
    (
        EXISTS (
            SELECT
                LINK.USER_ID_
            FROM
                ACT_HI_IDENTITYLINK LINK
            WHERE
                USER_ID_ = 6742
            AND LINK.PROC_INST_ID_ = RES.PROC_INST_ID_
        )
    )

3）连接查询（join方法）

SELECT DISTINCT
    RES.*
FROM
    ACT_HI_PROCINST RES
JOIN ACT_HI_IDENTITYLINK LINK ON LINK.PROC_INST_ID_ = RES.PROC_INST_ID_
WHERE
    LINK.USER_ID_ = 6742

以上3种方法查询结果均一致：

image.png

5、sql语句对比
1）查询速度
当外层查询结果集的数据量N较小时，优先选用方法2——子查询（exists方法）；
反之，当外层查询结果集的数据量N较大时，优先推荐方法3——连接查询（join方法）；
2）如何选择
分情况：
如果最后只要求查询A表种的字段内容，并且外层查询结果集的数据量N较小时则优先推荐方法2——子查询（exists方法）；
如果要求查询的内容包含A、B两个表的字段，或者外层查询结果集的数据量N较大时则优先推荐方法3——连接查询（join方法）；
至于方法一——子查询（in方法）基本不太建议，可读性和效率均不佳，除非in后面是确定的范围，如b.status in(1,2,3,4)这种；如果你用了方法一不妨看看能否用其他两种方法代替，以提升可读性和效率。
本文就到这儿了，平时经常用的sql查询，今天简单总结了下，希望对读者有帮助。

SQL子查询与连接查询研究

你可能感兴趣的:(SQL子查询与连接查询研究)