判断字段是否需要加索引?

1、这个可以用索引的选择性来回答。

索引的选择性是指索引列中不同值的数目和表的记录数的比值。假如表里面有1000条数据,表索引列有980个不同的值,这时候索引的选择性就是980/1000=0.98 。索引的选择性越接近1,这个索引的效率很高。

性别可以认为是3种,男,女,其他。如果创建索引,查询语句 性别=‘男’的数据,索引的选择性就是3/1000=0.003。索引的选择性值很低,对查询提升不大,所以性别建索引意义不大。

2、选择区分度高的列建立索引:区分度公式:

COUNT(DISTINCT 列名)/COUNT(*)

区分度字段不重复的比例,比例越大扫描的记录数越少,唯一键的区分度是1性别字段区分度查询示例:

SELECT COUNT(DISTINCT gender) , COUNT(DISTINCT gender)/COUNT(*) FROM user;
COUNT(DISTINCT gender) COUNT(DISTINCT gender)/COUNT(*)
3 0.0001

示例表中性别有三种值:0 未知 1 男 2 女从结果可得知区分度为0.0001,即根据gender查询1条数据需要扫描约10000行客户编号区分度查询示例:

SELECT	COUNT(DISTINCT customer_code),
	ROUND(COUNT(DISTINCT customer_code) / COUNT(*), 4)
	FROM test
COUNT(DISTINCT customer_code) ROUND(COUNT(DISTINCT customer_code)/COUNT(*) , 4)
82098 0.263

说明该字段在满足其它索引条件的情况下,非常适合加上索引注:无法从区分度准确计算出扫描行数,但可以确定区分度越大,扫描行数越少

你可能感兴趣的:(SQL,数据库)