今天看《MySQL技术内幕: SQL编程》发现了not in和我之前想象不一样,之前的理解一直都是错的,在此记录一下。首先是in和exists效果是一样的,但是not in和not exists有区别。并且是子查询结果中有null的时候才有区别
。
EXISTS与IN的一个小区别体现在对三值逻辑的判断上。EXISTS总是返回TRUE或FALSE,而对于IN,除了TRUE、FALSE值外,还有可能对NULL值返回UNKNOWN。但是在过滤器中,UNKNOWN的处理方式与FALSE相同,因此使用IN与使用EXISTS一样, SQL优化器会选择相同的执行计划。
什么是unknown呢?unknown可以理解成MySQL中null的别名,就像true的别名1,false的别名是0。可以执行select true
,select false
;返回的就是1和0。
但是输入列表中包含NULL值时,NOT EXISTS和NOT IN之间的差异就表现得非常明显了。输入列表中包含NULL值时,IN总是返回TRUE和UNKNOWN,因此NOTIN总是返回NOT TRUE和NOT UNKNOWN,即FALSE和UNKNOWN。
上例子
# sql1
select "hello" where 'a' in ('a', 'b', null);
# sql2
select "hello" where 'a' not in ('a', 'b', null);
# sql3
select "hello" where null in ('a', 'b', null);
# sql4
select "hello" where null not in ('a', 'b', null);
# sql5
select "hello" where 'c' in ('a', 'b', null);
# sql6
select "hello" where 'c' not in ('a', 'b', null);
可以思考一下上面的sql1到sql6返回的结果都是什么。
上结果
# sql1
+-------+
| hello |
+-------+
| hello |
+-------+
# sql2到sql6
Empty set (0.00 sec)
是不是觉得很奇怪,为什么sql2到sql6的查询结果全是空。分析一下sql6,可以写成’c' <> 'a' and 'c' <> 'b' and 'c' <> null
。因为‘c' <> null的结果为 null所以最终的结果就是null,其他几个sql分析类似。区别是in拆分成or链接。
为什么’c' <> null为null呢?因为MySQL里面null与任何值比较都是null,即使是null=null,不信的话可以执行一下。所以,MySQL里面对null的判断都是is null, is not null。
结论就是创建表的时候尽量对字段设置默认是比如默认字符型默认为‘’,数值型默认为0。不要产生null,如果in的子查询里面有null的可以提前进行条件过滤,因为含有null的子查询返回数据总是null。
对于包含NULL值的NOT IN来说,其总是返回FALSE和UNKNOWN,而对于NOT EXISTS,其总是返回TRUE和FALSE。这就是NOT EXISTS和NOT IN的最大区别。
参考资料
MySQL NULL 值处理
NULL values inside NOT IN clause
MySQL “unknown”