MongoDB入门笔记

慕课网学习笔记。
学习视频地址:https://www.imooc.com/learn/295
教程版本为2.x,部分API已经被废弃或处于别名状态,但功能类似,可供参考。
我在学习中使用的为4.0.2,没有遇到问题。


引言

Sql数据库:关系型数据库,如Qracle,Mysql等。但是其设计模式在现在的互联网模式下存在一些弊端。例如,其表结构使得数据库的横向扩充存在限制。
NoSql数据库:Redis,MongoDB

MongoDB入门笔记_第1张图片

一: MongoDB概念

MongoDB入门笔记_第2张图片
1. 为什么是选择MongoDB
  • 无数据结构的限制
    没有表结构的概念,每条记录可以有不同的结构。
    业务开发方便。
    不需要像sql数据库那样,事先定义表结构。

  • 完全的索引支持
    redis存储为key-value对,只支持按键值查询。
    hbase为单索引,二级索引需要自己实现。
    MongoDB支持单键索引,数据索引,全文索引等。

  • 方便的冗余和扩展
    复制集保证了数据的安全性
    分片扩展数据规模

分片技术提供了自动数据均衡,对数据库的同一入口。不需要人为的在应用层进行访问的分发,较少了很多人工操作。

MongoDB入门笔记_第3张图片
  • 良好的支持
    完整的文档。
    齐全的驱动支持。
2. 名词说明
sql中的概念 mongo中的概念 说明
database database 数据库
table collection 数据库表/集合
row document 数据记录行/文档
column field 数据字段/域
index index 索引
table joins 表连接,MongoDB不支持
primary key primary key 主键,MongoDB自动将_id字段设置为主键

二: 搭建MongoDB

1. 目录结构
MongoDB入门笔记_第4张图片

mongod数据库部署工具
mongo文件为客户端链接工具
mongoimport和mongoexport用于数据的导入导出
mongodump和mongorestore用于数据的二进制导入导出,用于数据的备份。
mongooplog用于数据库的操作记录
mongostat用于查看数据库状态

2. 搭建服务器

参考:https://www.runoob.com/mongodb/mongodb-linux-install.html

通过wget下载tgz包并解压,目录如下:

MongoDB入门笔记_第5张图片

MongoDB所需要的目录在安装过程不会自动创建,所以你需要手动创建data目录,log目录和conf目录。

mkdir log
mkdir -p data/db
mkdir conf
MongoDB入门笔记_第6张图片

然后在conf目录下创建mongodb.conf配置文件,添加如下内容:

dbpath = data
logpath = logs/mongod.log
storageEngine=mmapv1
fork = true
bind_ip = 0.0.0.0
fork 指明该服务为后台启动。
bind_ip 0.0.0.0 表明允许所有ip访问

启动时指定配置文件

./bin/mongod -f conf/mongodb.conf

这里补充一个问题,我在执行上述指令的时候出现了报错:
error while loading shared libraries: libcurl.so.4: cannot open shared object file: No such file or directory

然后我查看了一下依赖:

MongoDB入门笔记_第7张图片

需要安装一下:libcurl4-openssl-dev
然后启动成功:

MongoDB入门笔记_第8张图片
MongoDB入门笔记_第9张图片

之后可以从其它主机进行访问:

MongoDB入门笔记_第10张图片

三: MongoDB的基本使用

主要设计mongoDB的增删查改。

首先通过客户端连接mongoDB

./bin/mongo ip:port
如果为本地直接使用:./bin/mongo

连接成功:

MongoDB入门笔记_第11张图片
1. 数据库的增删改查
  • 查看已有数据库:
    show dbs
  • 切换数据库:
    use ***
  • 删除当前库:
    db.dropDatabase()
MongoDB入门笔记_第12张图片

如果使用use时,所指定的db并不存在,那么将自动生成相应的DB

2. 数据的增删改查
  • 插入数据
    通过use example 创建了db:example
    通过db.表名.insert({json})创建了记录。


    MongoDB入门笔记_第13张图片
  • 通过js语法进行操作:

  • 在对应表中查询数据
    db.表名.find(条件)
  • 对find结果进行设置:
    count()统计了总数
    skip()跳过了表中的前x项
    limit()设置返回的条目数
    sort()设置根据哪个字段排序
MongoDB入门笔记_第14张图片
  • 更新:
--全更新
> db.example_collection.update({x:1},{x:999})
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
> db.example_collection.find({x:999})
{ "_id" : ObjectId("5bbd91ce0980ab8f024199ac"), "x" : 999 }

> db.example_collection.insert({x:123,y:223,z:323})
WriteResult({ "nInserted" : 1 })
--部分更新,需要使用$set:
> db.example_collection.update({x:123},{$set:{z:999}})
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
> db.example_collection.find({x:123})
{ "_id" : ObjectId("5bbd95e00980ab8f02419a11"), "x" : 123, "y" : 223, "z" : 999 }

当我们更新一条不存在的内容时,可以通过在update后面加true令其自动创建。

MongoDB入门笔记_第15张图片

mongodb的update每次只对一条数据生效,当需要批量更新时,语法如下:

MongoDB入门笔记_第16张图片
  • 删除
    删除默认是删除所有匹配到的数据,与更新不同。
3. 数据表的增删改查
  • 增加
    当使用db.表名.insert()时,会根据表名自动创建表。

  • 删表:
    db.表名.drop()

四: 不同类型索引的创建与使用

用索引来优化大规模数据时的查询效率。

1. 索引的基本操作
  • 查看集合的索引情况:
> db.example_collection.getIndexes()
[
    {
        "v" : 2,
        "key" : {
            "_id" : 1
        },
        "name" : "_id_",
        "ns" : "example.example_collection"
    }
]
  • 创建索引
    1为正向索引,-1为负向索引。
    需要说明的是:索引一般在使用数据库前就创建完毕,若是数据库中已有大量数据,这时创建索引可能会出现错误。
> db.example_collection.ensureIndex({x:1})
{
    "createdCollectionAutomatically" : false,
    "numIndexesBefore" : 1,
    "numIndexesAfter" : 2,
    "ok" : 1
}

2. 索引的种类与使用
  • _id索引
    绝大多数集合默认建立的索引,每当插入数据的时候,MongoDB会自动的生成一条唯一的_id字段。

  • 单键索引
    指定某个字段作为索引。其值为单一的值

> db.example_collection.ensureIndex({x:1})
{
    "createdCollectionAutomatically" : false,
    "numIndexesBefore" : 1,
    "numIndexesAfter" : 2,
    "ok" : 1
}

  • 多键索引
    指定某个字段作为索引。其值有多个记录,例如数组。

对于该条数据,mongoDB认为上文创建了一个多键索引。

  • 复合索引
    当查询条件不止一个时,就需要建立复合索引。
MongoDB入门笔记_第17张图片
  • 过期索引
    是在一段时间后会过期的索引。
    在索引过期后,相应的数据会被删除。
    建立方法如下:
MongoDB入门笔记_第18张图片

过期索引字段的值必须是时间类型,为ISODate或者ISODate数组。
不能是时间戳。
插入时间类型的方式如下:

 db.example_collection.insert({time:new Date()})

如果索引字段指定的是数组,则根据最早过期的时间进行删除。
过期索引不能是复合索引。

最小时间间隔为60秒,因为服务60s运行一次输出操作。

  • 全文索引
    比较特殊的索引,在后文中详细介绍

  • 地理位置索引
    比较特殊的索引,在后文中详细介绍

3. 全文索引

全文索引,对字符串与字符串数组创建全文可搜索的索引。
例如,我们有三个字段:{author:"",title:"",article:""}
我们希望关键字去匹配author、title和article三者的内容。

建立方法:
单个字段:
db.articles.ensureIndex({key:"text"})

多个字段:
db.articles.ensureIndex({key:"text",key2:"text"})

任意字段:
db.articles.ensureIndex({"$**":"text"})
MongoDB入门笔记_第19张图片

每个数据集合只允许创建一个数据索引

使用方法:
查找包含coffee字段的数据
> db.article.find({$text:{$search:"coffee"}})

查找包含coffee字段或fee字段的数据
> db.article.find({$text:{$search:"coffee fee"}})

查找包含coffee字段且不包含fee字段的数据
> db.article.find({$text:{$search:"coffee -fee"}})

通过\个特殊字符进行转义,“”包含的内容是必须被匹配上的。
> db.article.find({$text:{$search:" \"america\" coffee"}})
全文匹配的相似度

$meta操作符:{score:{$meta:"textScore"}}
写在查询条件后可以返回反馈结果的相似度,一般与sort一起使用。

db.example_collection.find({$text:{$search:"1"}},{score:{$meta:"textScore"}})

根据score进行排序:
db.example_collection.find({$text:{$search:"1"}},{score:{$meta:"textScore"}}).sort({score:{$meta:"textScore"}})

全文索引的使用限制

每次查询只能使用一个$text查询
$text查询不能出现在$nor查询中
查询包含$text后,不能使用hint指定索引。

4. 地理位置索引

将一些点的位置存储在MongoDB中,创建索引后,可以按照位置来查找其他点。

分为:

  • 2d索引:用于平面查找。
  • 2dsphere索引:用于球面查找。

查找方式:

  • 查找距离某点一定范围内的点。
  • 查找包含在某个区域内的点。
2d索引的使用

创建:

> db.location.ensureIndex({"w":"2d"})
{
    "createdCollectionAutomatically" : true,
    "numIndexesBefore" : 1,
    "numIndexesAfter" : 2,
    "ok" : 1
}

位置表示方式:经纬度[j经度,纬度]
取值范围:经度[-180,180],纬度[-90,90]

插入了如下点:

查询方法:

  • $near查询:查找最近的点。
near查询默认返回100个点。:

> db.location.find({w:{$near:[1,1]}})
{ "_id" : ObjectId("5bbde1fd7b9cb8b60db8f0ac"), "w" : [ 1, 1 ] }
{ "_id" : ObjectId("5bbde20a7b9cb8b60db8f0ad"), "w" : [ 1, 2 ] }
{ "_id" : ObjectId("5bbde20e7b9cb8b60db8f0ae"), "w" : [ 3, 2 ] }
{ "_id" : ObjectId("5bbde2747b9cb8b60db8f0b0"), "w" : [ 100, 20 ] }
{ "_id" : ObjectId("5bbde27d7b9cb8b60db8f0b1"), "w" : [ 180, 80 ] }

通过maxDistance进行最大距离的限定。

> db.location.find({w:{$near:[1,1],$maxDistance:10}})
{ "_id" : ObjectId("5bbde1fd7b9cb8b60db8f0ac"), "w" : [ 1, 1 ] }
{ "_id" : ObjectId("5bbde20a7b9cb8b60db8f0ad"), "w" : [ 1, 2 ] }
{ "_id" : ObjectId("5bbde20e7b9cb8b60db8f0ae"), "w" : [ 3, 2 ] }
  • $geoWithin查询:查找某个形状内的点。
MongoDB入门笔记_第20张图片

例如:

  • $geoNear查询:near查询的进化版,可以使用更多的参数
MongoDB入门笔记_第21张图片

使用实例:

> db.runCommand({geoNear:"location",near:[1,2],maxDistance:10,num:1})
{
    "results" : [
        {
            "dis" : 0,
            "obj" : {
                "_id" : ObjectId("5bbde20a7b9cb8b60db8f0ad"),
                "w" : [
                    1,
                    2
                ]
            }
        }
    ],
    "stats" : {
        "nscanned" : 3,
        "objectsLoaded" : 1,
        "avgDistance" : 0,
        "maxDistance" : 0,
        "time" : 690
    },
    "ok" : 1
}

可以看到,返回的结果更加丰富,可以用于支持更多的功能。

2dsphere索引

创建:

> db.location.ensureIndex({"w":"2dsphere"})

位置表示方式:描述一个点,一条直线,多边形等形状。
格式为:{type:" ",coordinates:[]}
例如:

db.location.insert( { w: { type: "Point", coordinates: [ 120.31, 30.21] }, title: "location"})

除了支持之前的查询方式外,还支持查询两个多边形的交叉点。

5. 索引属性:
name:

在建立索引的时候可以对索引进行命名:
db.example_collection.ensureIndex({x:1,y:1},{name:"example_x_y"})

MongoDB入门笔记_第22张图片

使用名称可以更方便的删除索引:

db.example_collection.dropIndex("example_x_y")

unique,唯一性

db.example_collection.ensureIndex({x:1,y:1},{unique:true/false})

设置了unique的索引,表明该索引为唯一索引。不允许在同一集合中,插入两条具有相同唯一索引的字段的数据。

例如设置了x,y为唯一索引。
那么,不能插入x,y值都一样的数据。

sparse,稀疏性

db.example_collection.ensureIndex({x:1,y:1},{sparse:true/false}),默认是稀疏的。
设置稀疏意义在于,在你对于x字段创建了索引后,如果插入了一条没有x字段的数据,那么不会对该条数据建立x索引。
同样,你不能在这个稀疏索引上针对x进行搜索。

五:简单运维

1. 索引构建情况分析

索引的有点:加快索引相关的查询。
索引的缺点:增加磁盘空间消耗,降低写入性能。

评判从四个角度进行:

2. 常见的一些工具指令
  • mongostat:查看mongodb运行状态的程序。
使用方法 :mongostat -h 127.0.0.1:27017

edwin@ubuntu:~/mongodb/mongodb-linux-x86_64-ubuntu1604-4.0.2$ ./bin/mongostat 
insert query update delete getmore command flushes mapped vsize   res faults qrw arw net_in net_out conn                time
    *0    *0     *0     *0       0     1|0       0        1.64G 79.0M      0 0|0 0|0   155b   31.2k    3 Oct 10 19:38:13.316
    *0    *0     *0     *0       0     2|0       0        1.64G 79.0M      0 0|0 0|0   162b   32.6k    3 Oct 10 19:38:14.286
    *0    *0     *0     *0       0     2|0       0        1.64G 79.0M      0 0|0 0|0   158b   31.6k    3 Oct 10 19:38:15.286
    *0    *0     *0     *0       0     1|0       0        1.64G 79.0M      0 0|0 0|0   157b   31.6k    3 Oct 10 19:38:16.286
    *0    *0     *0     *0       0     1|0       0        1.64G 79.0M      0 0|0 0|0   157b   31.5k    3 Oct 10 19:38:17.288
    *0    *0     *0     *0       0     2|0       0        1.64G 79.0M      0 0|0 0|0   158b   31.7k    3 Oct 10 19:38:18.286
    *0    *0     *0     *0       0     1|0       0        1.64G 79.0M      0 0|0 0|0   157b   31.6k    3 Oct 10 19:38:19.286
    *0    *0     *0     *0       0     1|0       0        1.64G 79.0M      0 0|0 0|0   157b   31.6k    3 Oct 10 19:38:20.286
    *0    *0     *0     *0       0     1|0       0        1.64G 79.0M      0 0|0 0|0   157b   31.6k    3 Oct 10 19:38:21.287
    *0    *0     *0     *0       0     2|0       0        1.64G 79.0M      0 0|0 0|0   158b   31.6k    3 Oct 10 19:38:22.285

其中,qrw为读写队列数,会很直观的影响mongodb的性能。

  • profile集合
db.getProfilingLevel()
该指令可以查看Profile级别,级别为0不会记录任何操作,级别为2时,记录所有操作。

> db.getProfilingStatus()
{ "was" : 0, "slowms" : 100, "sampleRate" : 1 }
当level为1时,配合slowms作为阈值,高于其则记录。

>  db.setProfilingLevel(2)
{ "was" : 0, "slowms" : 100, "sampleRate" : 1, "ok" : 1 }
> db.getProfilingLevel()
2
对level进行修改。

直接show tables无法看到该集合,但是对system.profile进行find()操作,可以看到所记录的内容。
字段含义可以查看文档:
https://docs.mongodb.com/manual/reference/database-profiler/

> show tables
example.location
example_collection
location
> db.system.profile.find().limit(1)
{ "op" : "insert", "ns" : "example.location", "command" : { "insert" : "location", "ordered" : true, "lsid" : { "id" : UUID("e535e60c-0998-46e4-8eb9-1443ca5fdfdc") }, "$db" : "example" }, "ninserted" : 1, "keysInserted" : 2, "numYield" : 0, "locks" : { "Global" : { "acquireCount" : { "r" : NumberLong(1), "w" : NumberLong(1) } }, "MMAPV1Journal" : { "acquireCount" : { "w" : NumberLong(2) } }, "Database" : { "acquireCount" : { "w" : NumberLong(1) } }, "Collection" : { "acquireCount" : { "W" : NumberLong(1) } } }, "responseLength" : 45, "protocol" : "op_msg", "millis" : 0, "ts" : ISODate("2018-10-11T03:06:57.484Z"), "client" : "127.0.0.1", "appName" : "MongoDB Shell", "allUsers" : [ ], "user" : "" }
> 

profile在生产环境中建议关闭,以为在操作频繁时,profile的读写会占用mongoDB大量的资源。

  • 日志

日志在配置文件中进行配置,在第二大章中有提到,在配置文件中添加verbose字段:

...
verbose = vvvvv
...

v越多,详细程度越高。

  • explain()

使用在指令之后,会显示出指令的详细信息。

> db.example_collection.find({x:1})
{ "_id" : ObjectId("5bbdb18b41b7cdd7f5ed175b"), "x" : [ 1, 2, 3, 4, 5, 6 ] }
> db.example_collection.find({x:1}).explain()
{
...
}

3. 安全性问题

一些基本的方面包括:
物理隔离与网络隔离
IP白名单
用户密码及权限

一般用户名密码及权限是最常规的方法。

开启权限认证
  • auto开启
    在配置文件中添加:
auth = true

一般先创建用户,再设置该条选项。
指令为createUser

结构为:


MongoDB入门笔记_第23张图片
MongoDB入门笔记_第24张图片

roles的内建类型为:
read:读权限
readWrite:读写权限
dbAdmin:db的管理权限,除了读写还可以创建索引。
dbOwner:db所以权限
userAdmin:对其它角色进行管理。

可以对权限进行组合,创建一个新的role。
示例如下:

> db.createUser({user:"edwin",pwd:"1234",roles:[{role:"userAdmin",db:"example"},{role:"read",db:"example"}]})
Successfully added user: {
    "user" : "edwin",
    "roles" : [
        {
            "role" : "userAdmin",
            "db" : "example"
        },
        {
            "role" : "read",
            "db" : "example"
        }
    ]
}

这时再通过直接登陆,在操作时会报错:

MongoDB入门笔记_第25张图片

进行如下验证:

> use example
switched to db example
> db.auth("edwin","1234")
1
返回1说明成功

可以创建特殊的角色

MongoDB入门笔记_第26张图片

你可能感兴趣的:(MongoDB入门笔记)