Scrpay框架之MongoDB--Index

目录

MongoDB-Index

概念

索引类型

创建索引 

注意

样例

索引的查看

删除索引

语法

样例 

检测索引的速度优势

Mongo-Unique Index And Compound Index

唯一索引(Unique Index)

添加唯一索引的语法

利用唯一索引进行数据去重

复合索引(Compound Index)

建立索引注意点


MongoDB-Index

概念

在 MongoDB 中,索引(Index)是一种数据结构,用于加快对集合中文档的搜索速度。索引可以类比于书籍的目录,它使得数据库在查找特定数据时不需要扫描整个集合,而是通过在索引中查找来加快查询过程。这样可以大大提高查询效率,特别是在处理大量数据时。

索引类型

  1. 单键索引(Single-Field Index):针对单个字段创建的索引。它是最简单的索引类型,常用于加快对某个字段的查询。

  2. 复合索引(Compound Index):针对多个字段创建的组合索引。它可以将多个字段的值组合在一起创建索引,适用于复合查询,提高多条件查询的性能。

  3. 文本索引(Text Index):用于对文本字段进行全文本搜索。它支持对文本字段进行关键词搜索和模糊匹配。

  4. 地理空间索引(Geospatial Index):用于处理地理位置数据,支持对地理坐标进行地理空间查询。

  5. 哈希索引(Hashed Index):将字段的哈希值用作索引。适用于需要随机访问的数据,比如分布式系统中的负载均衡。

创建索引 

MongoDB使用 createIndex() 方法来创建索引

db.集合名.createIndex(keys, options)

语法中 Key 值为要创建的索引字段,1 为指定按升序创建索引,如果想按降序来创建索引指定为 -1 即可

注意

  • 在 3.0.0 版本前创建索引方法为 db.collection.ensureIndex(),之后的版本使用了 db.collection.createIndex() 方法,ensureIndex() 还能用,但只是 createIndex() 的别名
  • MongoDB默认所有的集合在_id字段上有一个索引。

样例

db.person.createIndex({"name":1})

索引的查看

默认情况下_id是集合的索引,查看方式:

db.集合名.getIndexes()

删除索引

语法

db.集合名.dropIndex({'索引名称':1})

样例 

db.person.dropIndex({name:1})
db.person.getIndexes()

检测索引的速度优势

测试:插入10万条数据到数据库中

插入数据:

for(i=0;i<100000;i++){db.t1.insert({name:'test'+i,age:i})}

创建索引前:

db.t1.find({name:'test10000'})
db.t1.find({name:'test10000'}).explain('executionStats') # 显示查询操作的详细信息

 创建索引:

db.t1.creatIndexIndex({name:1})

创建索引后

db.t1.find({name:'test10000'}).explain('executionStats')

 前后速度对比

Scrpay框架之MongoDB--Index_第1张图片

Scrpay框架之MongoDB--Index_第2张图片

Mongo-Unique Index And Compound Index

唯一索引(Unique Index)

在默认情况下mongdb的索引的值是可以相同的,创建唯一索引之后,数据库会在插入数据的时候检查创建索引域的值是否存在,如果存在则不会插入该条数据,但是创建索引仅仅能够提高查询速度,同时降低数据库的插入速度

添加唯一索引的语法

db.集合名.createIndex({"字段名":1}, {"unique":true})

利用唯一索引进行数据去重

根据唯一索引指定的字段的值,如果相同,则无法插入数据

db.person.createIndex({"name":1}, {"unique":true})
db.person.insert({name: 'test10000'})

复合索引(Compound Index)

在进行数据去重的时候,可能用多个字段来做数据的唯一性,这个时候可以考虑建立复合索引来实现。

建立复合索引的语法:

db.collection_name.createIndex({字段1:1,字段2:1})

建立索引注意点

  • 根据需要选择是否需要建立唯一索引

  • 索引字段是升序还是降序在单个索引的情况下不影响查询效率,但是带复合索引的条件下会有影响

  • 数据量巨大并且数据库的读出操作非常频繁的时候才需要创建索引,如果写入操作非常频繁,创建索引会影响写入速度

你可能感兴趣的:(#,python爬虫,mongodb,数据库,scrapy)