什么是索引
索引是一种用来方便查询数据的 数据结构
B Tree就是一种常用的数据库索引数据结构,MongoDB采用 B 树做索引,索引创建在colletions 上。
我们可以在这个网站上直观的看到索引的效果
https://www.cs.usfca.edu/~galles/visualization/Algorithms.html
除了 B 树,平衡二叉树、红黑数、B + 树都可以用来做索引
mongodb 使用索引和不使用索引
MongoDB不使用索引的查询的时候,会先扫描所有的文档,再匹配符合条件的文档。
使用索引的查询,会通过索引找到文档,使用索引能够极大的提升查询效率
mongodb 中的索引
mongodb 中的索引与多种索引类型,梳理一下看看效果
索引类型 | 描述 | demo |
---|---|---|
单字段索引 | 在某一个特定的字段上建立索引 mongoDB 在 ID 上建立了唯一的单键索引,所以经常会使用 id 来进行查询; 在索引字段上进行精确匹配、排序以及范围查找都会使用此索引; |
创建一个倒序的索引 db.users. createIndex({age:-1}); |
复合索引 | 在多个特定的属性上建立索引 复合索引键的排序顺序,可以确定该索引是否可以支持排序操作; 在索引字段上进行精确匹配、排序以及范围查找都会使用此索引,但与索引的顺序 有关; 为了性能考虑,应删除存在与第一个键相同的单键索引 |
db.users. createIndex({username:1,age:-1,country:1}) |
多键索引 | 在数组的属性上建立索引 针对这个数组的任意值的查询都会定位到这个文档,既多个索引入口或者键值引用 同一个文档 |
db.users.createIndex({favorites.city:1}) |
空间索引 | 2 种平面几何的 2d 索引,球面几何的2dsphere索引 见后文详解 文本索引 支持在集合中搜索字符串内容 |
db.reviews.createIndex( { comments: "text" } ) |
Hash索引 | 不同于传统的B-树索引,哈希索引使用hash函数来创建索引 在索引字段上进行精确匹配,但不支持范围查询,不支持多键hash; Hash索引上的入口是均匀分布的,在分片集合中非常有用 |
db.users.createIndex({username : 'hashed'}) |
如何使用索引
MongoDB 使用 createIndex()
方法来创建索引,createIndex()
方法基本语法格式是这样的
db.集合名.createIndex(keys, options)
- key
文档类型值为要创建的索引字段,1为指定按升序创建索引,-按降序来创建索引指定为-1。
- options
文档类型值 MongoDB 中提供了丰富的属性,比如 background
,是否后台构建索引,
数据量太大时构建索引消耗时间长,为了不影响业务,可以加上此参数
后台运行同时还会为其他读写操作让路
- name
自定义索引名字
mongodb 的索引属性
唯一索引
可确保索引字段不会存储重复值
MongoDB默认在创建集合时会在_id字段上创建唯一索引,例如
db.collection.createIndex(
{id:1},
{unique:true}
)
部分索引
仅索引集合中符合指定过滤器表达式的文档
较低的存储需求,索引创建和维护的成本变小,例如
db.restaurants.createIndex(
{ cuisine: 1, name: 1 },
{
partialFilterExpression:{
rating:{
$gt: 5
}
}
}
)
稀疏索引
仅索引包含具有索引字段的文档,哪怕索引字段包含空值,例如
db.addresses.createIndex(
{ "xmpp_id": 1 },
{ sparse: true }
)
TLL索引
特殊的单字段索引,在一定时间后或在特定时间自动从集合中删除文档
这对于日志和会话类的信息很有用。
db.eventlog.createIndex(
{"lastModifiedDate":1},
{expireAfterSeconds:3600 }
)
不区分大小写
例如
db.fruit.createIndex(
{ type: 1},
{
collation:{
locale:'en',
strength:2
}
}
)
如何管理索引
创建索引
db.集合名.createIndex()
查看索引
db.集合名.getIndexes()
db.集合名.totalIndexSize()
更新索引
db.集合名.reIndex()
删除索引
db.集合名.dropIndex()
db.集合名.dropIndexes()
单字段索引
图片来源于 mongodb 官网
MongoDB 为文档集合中的任何字段上的索引提供了完整的支持
默认情况下,所有集合在_id字段上都有一个索引,应用程序和用户可以添加额外的索引来支持重要的查询和操作
复合索引
MongoDB 支持复合索引,其中单个索引结构保存对集合文档中多个字段的引用。
[图片上传失败...(image-cb7d74-1666018290956)]
图中可以看到使用了 userid 和 score 的引用, userid 是升序,score 是倒序
在官网上我们可以看到 mongodb 的每一种索引类型的图解
https://docs.mongodb.com/manual/indexes/
- 单字段索引
- 符合索引
- 多键索引
多键索引,或可以称为数组索引
文档的多个待索引字段是数组,不能创建两个多键值字段的复合索引,复合索引只能包含一个字段是多键索引。
MongoDB是文档型数据库,两个字段为数组,这个情况是可以发生改变的,比如其中一个为数组,另一个不是数组。
- 文本索引
- 通配符索引
MongoDB 支持动态的文档结构,通过通配符索引应用程序可以查询事先未知字段
例如可以这样创建索引
{ "userMetadata" : { "likes" : [ "pigs", "cats" ] } }
{ "userMetadata" : { "dislikes" : "pickles" } }
{ "userMetadata" : { "age" : 100 } }
可以 通过$**
来匹配某个字段后面未知的字段
db.userData.createIndex( { "xxx.$**" : 1 } )
- 二维空间
MongoDB中有两种二维平面索引:2d、geoHaystack。
1、2d,对在二维平面上坐标点为存储的数据使用索引,是2.2版本中的坐标对。
2、GeyHaystack索引是一个特殊的索引,该索引被优化以在较小的区域上返回结
3、GeHaystack索引提高了使用平面几何图形的查询的性能
例如
平面的坐标我们可以这样来表示
// 数组形式
location: [-43.856077, 21.848447]
// 内嵌文档形式,第一个为经度,第二个为纬度,忽略字段名
location: { field1: -63, field2: 31,6 }
空间索引总是稀疏的,并且忽略稀疏选项,仅支持简单的二进制比较
- hash 索引等等
Hash索引通过索引字段值的散列来维护索引数据,使用哈希函数来计算索引字段值的哈希,
主要使用在分片键上。需要注意的点:
1、支持任意单字段的Hash索引,不能创建多键的Hash索引
2、Hash值会发生碰撞,Hash索引不能设定为唯一约束
3、支持相等查询,不支持范围查询
4、创建hash索引的字段也可以创建其他索引
5、hashed索引不支持不能转换为64位整数的浮点值,大于2的53次方的浮点值
// 创建一个hash索引
db.集合名.createIndex( { field: "hashed" } )
写在最后
最后梳理一下 使用 mongodb 的注意事项:
- 对应用程序的查询要有深刻的理解
确定将要运行的查询的类型,以便可以构建引用这些字段的索引
- 通过索引来提高查询效率
当索引包含该查询扫描的所有字段时,该索引就支持该查询
- 通过索引对查询结果进行排序
为了支持有效的查询,在指定索引字段的顺序和排序顺序时间
- 确保索引有足够的内存
内存有限的情况下,MongoDB 通过保存最近的值来淘汰老值,mongodb 的索引还是很消耗内存的
- 使用能够覆盖索引的查询
查询使用索引缩小结果范围,可以限制可能检索的文档数量
总的来说,咱们学习还是从官网入手
欢迎点赞,关注,收藏
朋友们,你的支持和鼓励,是我坚持分享,提高质量的动力
好了,本次就到这里
技术是开放的,我们的心态,更应是开放的。拥抱变化,向阳而生,努力向前行。
我是阿兵云原生,欢迎点赞关注收藏,下次见~