本文首发于kii.io
多数情况下,不使用索引,试图通过其他途径来提高性能,纯粹是浪费时间(出自《MySQL技术内幕》)。
那索引是怎么提高性能的呢?
InnoDB总是使用B树来创建索引,对于这种索引,在使用<, <=,=,=>,!=,BETWEEN
操作符时有会很有效率。
Tip: BETWEEN在Django ORM对应
range
操作符。
import datetime
start_date = datetime.date(2005, 1, 1)
end_date = datetime.date(2005, 3, 31)
Entry.objects.filter(pub_date__range=(start_date, end_date))
相当于
SELECT ... WHERE pub_date BETWEEN '2005-01-01' and '2005-03-31';
比如以我们的项目而言,instance_name
,user_id
, check_date
出现的频率最高,所以这三个字段肯定需要建立索引。通过这样的索引,可以避免全表查找。
维度就是说表中容纳的非重复值的个数。我们尽量应该选择一些区分度高的,区分度=count(distinct col)/count(*)
,按照美团的博客来讲,一般需要join的字段我们都要求是0.1以上,即平均1条扫描10条记录。
由于在写入数据时,不仅要求写到数据行,还会影响所有的索引。所以索引建立越多,就会导致写入速度越慢。此外,索引会占据磁盘空间。
短
索引可以减少索引空间,从而加快速度。
比如地址,Province, City,通过这两个值得组合来建立索引。
mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)顺序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引则都可以用到,a,b,d的顺序可以任意调整。
尽量不要在where中的“=”的左边,进行计算。
先大概解释下Explain返回的字段名吧。
Column | 意义 |
---|---|
select_type | select类型 |
table | 展示行的table |
type | join类型 |
possible_keys | 索引的可能取值 |
key | 实际使用的索引 |
key_len | 使用索引的长度 |
ref | 跟索引 |
rows | 关键指标 |
filtered | |
Extra |
具体可参考MySQL Explain。
截止目前,我们进行的都是单表查询,接下来看看多表的。
先来复习下left join,right join, inner join, outer join:
Ref:
专注数字货币、高并发、中间件。欢迎关注微信公众号。