sudo apt-get install -y mongodb-org
https://docs.mongodb.com/manual/tutorial/install-mongodb-on-ubuntu/
brew install mongodb
查看帮助:mongod –help
启动:brew services start mongodb
停止:brew services stop mongodb
重启:brew services restart mongodb
查看是否启动成功:ps -ef|grep mongod
配置文件的位置:/etc/mongod.conf
默认端⼝:27017
日志的位置:/var/log/mongodb/mongod.log
启动本地客户端:mongo
查看帮助:mongo –help
退出:exit或者ctrl+c
sudo mongod --config /etc/mongod.conf &
位置:https://docs.mongodb.com/manual/introduction/
内容
1. 掌握mongodb关于数据库和集合的基础命令
2. 掌握mongdb增删改查的命令
3. 掌握mongodb高级查询的命令
查看当前的数据库:db
查看所有的数据库:show dbs /show databases
切换数据库:use db_name
删除当前的数据库:db.dropDatabase()
默认不需要手动创建集合:向不存在的集合中第⼀次加⼊数据时,集合会被创建出来
手动创建结合:
db.createCollection(name,options)
db.createCollection("test")
db.createCollection("test01",{ capped:true,size:10})
参数capped:默认值为false表示不设置上限,值为true表示设置上限
参数size:当capped值为true时,需要指定此参数,表示上限⼤⼩,当⽂档达到上限时,会将之前的数据覆盖,单位为字节
查看集合:show collections
删除集合:db.集合名称.drop()
Object ID: ⽂档ID
String: 字符串, 最常⽤, 必须是有效的UTF-8
Boolean: 存储⼀个布尔值, true或false
Integer: 整数可以是32位或64位, 这取决于服务器
Double: 存储浮点值
Arrays: 数组或列表, 多个值存储到⼀个键
Object: ⽤于嵌⼊式的⽂档, 即⼀个值为⼀个⽂档
Null: 存储Null值
Timestamp: 时间戳, 表示从1970-1-1到现在的总秒数
Date: 存储当前⽇期或时间的UNIX时间格式
1. 创建⽇期语句如下:参数的格式为YYYY-MM-DD new 例:Date('2018-10-01')
2. 每个⽂档都有⼀个属性,为_id,保证每个⽂档的唯⼀性可以⾃⼰去设置_id插⼊⽂档,如果没有提供,那么MongoDB为每个⽂档提供了⼀个独特的_id,类型为objectID
3. objectID是⼀个12字节的⼗六进制数,每个字节两位,一共是24位的字符串:前4个字节为当前时间戳,接下来3个字节的机器ID接下来的2个字节中MongoDB的服务进程id 最后3个字节是简单的增量值
方法:db.集合名称.insert(document)
db.test.insert({name:'kungs',gender:1})
db.test.insert({_id:"20181001",name:'kungs',gender:1})
注意:插⼊⽂档时, 如果不指定_id参数, MongoDB会为⽂档分配⼀个唯⼀的ObjectId
db.集合名称.save(document)
如果⽂档的id已经存在则修改, 如果⽂档的id不存在则添加
db.集合名称.find()
db.集合名称.update( ,,{multi: })
参数query:查询条件
参数update:更新操作符
参数multi:可选, 默认是false,表示只更新找到的第⼀条记录, 值为true表示把满⾜条件的⽂档全部更新
db.test.update({name:‘kungs’},{name:‘kungs8’}) # 更新一条
db.test.update({name:‘kungs’},{KaTeX parse error: Expected 'EOF', got '}' at position 20: …{name:'kungs8'}}̲) # 更新一条 db.…set:{gender:0}},{multi:true}) # 更新全部
注意:“multi update only works with $ operators”
db.集合名称.remove(,{justOne: })
内容:
1. mongodb的数据查询操作
2. 比较运算符的使用
3. 逻辑运算符的使用
4. 范围运算符的使用
5. 正则的使用
6. skip和limit的使用
7. 投影方法的使用
8. 排序方法的使用
9. 去重方法的使用
1. ⽅法find(): 查询
db.集合名称.find({条件⽂档})
2. ⽅法findOne():查询,只返回第⼀个
db.集合名称.findOne({条件⽂档})
3. ⽅法pretty(): 将结果格式化
db.集合名称.find({条件⽂档}).pretty()
可以使用以下数据进行练习
{"name" : "郭靖", "hometown" : "蒙古", "age" : 20, "gender" : true }
{"name" : "⻩蓉", "hometown" : "桃花岛", "age" : 18, "gender" : false }
{"name" : "华筝", "hometown" : "蒙古", "age" : 18, "gender" : false }
{"name" : "⻩药师", "hometown" : "桃花岛", "age" : 40, "gender" : true }
{"name" : "段誉", "hometown" : "⼤理", "age" : 16, "gender" : true }
{"name" : "段王爷", "hometown" : "⼤理", "age" : 45, "gender" : true }
{"name" : "洪七公", "hometown" : "华⼭", "age" : 18, "gender" : true }
方法:
等于: 默认是等于判断, 没有运算符
⼩于:$lt (less than)
⼩于等于:$lte (less than equal)
⼤于:$gt (greater than)
⼤于等于:$gte
不等于:$ne
例如:
查询年龄大于18的所有人物
db.test.find({age:{$gte:18}})
逻辑运算符主要指与、或逻辑
1. and:在json中写多个条件即可
查询年龄⼤于或等于18, 并且性别为true的人物
db.test.find({age:{$gte:18},gender:true})
2. or:使⽤$or, 值为数组, 数组中每个元素为json
1. 查询年龄⼤于18, 或性别为false的人物
db.test.find({$or:[{age:{$gt:18}},{gender:false}]})
2. 查询年龄⼤于18或性别为男, 并且姓名是郭靖
db.test.find({$or:[{age:{$gte:18}},{gender:true}],name:'gj'})
使⽤$in, $nin 判断数据是否在某个数组内
查询年龄为18、 28的人
db.test.find({age:{$in:[18,28,38]}})
使⽤ //
或 $regex
编写正则表达式
创建products数据:
{ "_id" : 100, "sku" : "abc123", "description" : "Single line description." }
{ "_id" : 101, "sku" : "abc789", "description" : "First line\nSecond line" }
{ "_id" : 102, "sku" : "xyz456", "description" : "Many spaces before line" }
{ "_id" : 103, "sku" : "xyz789", "description" : "Multiple\nline description" }
查询products以abc开头的数据
db.products.find({sku:/^abc/})
查询sku以789结尾的数据
db.products.find({sku:{$regex:'789$'}})
1. ⽅法limit(): ⽤于读取指定数量的⽂档
db.集合名称.find().limit(NUMBER)
查询2条学⽣信息
db.test.find().limit(2)
2. ⽅法skip(): ⽤于跳过指定数量的⽂档
db.集合名称.find().skip(NUMBER)
db.test.find().skip(2)
3. 同时使用
db.test.find().limit(4).skip(5)
或
db.test.find().skip(5).limit(4)
注意:先使用skip在使用limit的效率要高于前者
由于mongo的shell是一个js的执行环境 使⽤ $where 后⾯写⼀个函数, 返回满⾜条件的数据
查询年龄⼤于30的学⽣
db.test.find({
$where:function() {
return this.age>30;}
})
find()
)在查询到的返回结果中, 只选择必要的字段,命令为:
db.集合名称.find({},{字段名称:1,...})
参数为字段与值, 值为1表示显示, 值为0不显 特别注意: 对于_id列默认是显示的, 如果不显示需要明确设置为0,例:
db.test.find({},{_id:0,name:1,gender:1})
⽤于对 集进⾏排序,命令为:
db.集合名称.find().sort({字段:1,...})
参数1为升序排列 参数-1为降序排列例:
根据性别降序, 再根据年龄升序
db.test.find().sort({gender:-1,age:1})
⽤于统计结果集中⽂档条数
方法1:db.集合名称.find({条件}).count()
方法2:db.集合名称.count({条件})
db.test.find({gender:true}).count()
db.test.count({age:{$gt:20},gender:true})
对数据进⾏去重
方法:db.集合名称.distinct('去重字段',{条件})
db.test.distinct('hometown',{age:{$gt:18}})
聚合(aggregate)是基于数据处理的聚合管道,每个文档通过一个由多个阶段(stage)组成的管道,可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果。语法:
db.集合名称.aggregate({管道:{表达式}})
在mongodb中,⽂档处理完毕后, 通过管道进⾏下⼀次处理 常用管道命令如下:
$group: 将集合中的⽂档分组, 可⽤于统计结果
$match: 过滤数据, 只输出符合条件的⽂档
$project: 修改输⼊⽂档的结构, 如重命名、 增加、 删除字段、 创建计算结果
$sort: 将输⼊⽂档排序后输出
$limit: 限制聚合管道返回的⽂档数
$skip: 跳过指定数量的⽂档, 并返回余下的⽂档
表达式:处理输⼊⽂档并输出 语法:表达式:’$列名’ 常⽤表达式:
$sum: 计算总和, $sum:1 表示以⼀倍计数
$avg: 计算平均值
$min: 获取最⼩值
$max: 获取最⼤值
$push: 在结果⽂档中插⼊值到⼀个数组中
$group是所有聚合命令中用的最多的一个命令,用来将集合中的文档分组,可用于统计结果
使用示例如下
db.test.aggregate(
{$group:
{
_id:"$gender",
counter:{$sum:1}
}
}
)
其中注意点:
1. db.db_name.aggregate: 是语法,所有的管道命令都需要写在其中
2. _id: 表示分组的依据,按照哪个字段进行分组,需要使用`$gender`表示选择这个字段进行分组
3. $sum:1: 表示把每条数据作为1进行统计,统计的是该分组下面数据的条数
当我们需要统计整个文档的时候,$group 的另一种用途就是把整个文档分为一组进行统计
使用实例如下:
db.test.aggregate(
{$group:
{
_id:null,
counter:{$sum:1}
}
}
)
注意点:
正常情况在统计的不同性别的数据的时候,需要知道所有的name,需要逐条观察,如果通过某种方式把所有的name放到一起,那么此时就可以理解为数据透视
使用示例如下:
1. 统计不同性别的人
db.test.aggregate(
{$group:
{
_id:null,
name:{$push:"$name"}
}
}
)
2. 使用$$ROOT可以将整个文档放入数组中
db.test.aggregate(
{$group:
{
_id:null,
name:{$push:"$$ROOT"}
}
}
)
对于如下数据,需要统计出每个country/province下的userid的数量(同一个userid只统计一次)
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "hf", "userid" : "c" }
{ "country" : "china", "province" : "hf", "userid" : "da" }
{ "country" : "china", "province" : "hf", "userid" : "fa" }
参考答案
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{country:'$_id.country',province:'$_id.province'},count:{$sum:1}}}
m a t c h 用 于 进 行 数 据 的 过 滤 , 是 在 能 够 在 聚 合 操 作 中 使 用 的 命 令 , 和 f i n d 区 别 在 于 match用于进行数据的过滤,是在能够在聚合操作中使用的命令,和find区别在于 match用于进行数据的过滤,是在能够在聚合操作中使用的命令,和find区别在于match 操作可以把结果交给下一个管道处理,而find不行
使用示例如下:
1. 查询年龄大于20的学生
db.test.aggregate(
{$match:{age:{$gt:20}}
)
2. 查询年龄大于20的男女学生的人数
db.test.aggregate(
{$match:{age:{$gt:20}}
{$group:{_id:"$gender",counter:{$sum:1}}}
)
$project
用于修改文档的输入输出结构,例如重命名,增加,删除字段
使用示例如下:
查询学生的年龄、姓名,仅输出年龄姓名
db.stu.aggregate(
{$project:{_id:0,name:1,age:1}}
)
查询男女生人生,输出人数
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}}
{$project:{_id:0,counter:1}}
)
对于如下数据:统计出每个country/province下的userid的数量(同一个userid只统计一次),结果中的字段为{country:"",province:"",counter:"*"}
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "hf", "userid" : "c" }
{ "country" : "china", "province" : "hf", "userid" : "da" }
{ "country" : "china", "province" : "hf", "userid" : "fa" }
参考答案
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{country:'$_id.country',province:'$_id.province'},count:{$sum:1}}},
{$project:{_id:0,country:'$_id.country',province:'$_id.province',counter:'$count'}}
)
$sort用于将输入的文档排序后输出
使用示例如下:
查询学生信息,按照年龄升序
db.stu.aggregate({$sort:{age:1}})
查询男女人数,按照人数降序
db.stu.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:-1}}
)
$skip
和 $limit
使用示例如下:
查询2条学生信息
db.test.aggregate(
{$limit:2}
)
查询从第三条开始的学生信息
db.test.aggregate(
{$skip:3}
)
统计男女生人数,按照人数升序,返回第二条数据
db.test.aggregate(
{$group:{_id:"$gender",counter:{$sum:1}}},
{$sort:{counter:-1}},
{$skip:1},
{$limit:1}
)
内容
1. mongodb创建索引的目的
2. mongdb创建索引的方式
1) 掌握mongodb索引的创建,删除操作
2) 掌握mongodb查看索引的方法
3) 掌握mongodb创建联合索引的方法
4) 掌握mongodb创建唯一索引的方法
3. mongdb备份和恢复的命令
1. 语法:
db.集合.ensureIndex({属性:1}) # 1表示升序, -1表示降序
或
db.集合.createIndex({属性:1})
2. 实例:
db.test.ensureIndex({name:1})
测试:插入10万条数据到数据库中 插入数据:
for(i=0;i<100000;i++){db.t255.insert({name:'test'+i,age:i})}
创建索引前:
db.t1.find({name:'test10000'})
db.t1.find({name:'test10000'}).explain('executionStats')
创建索引后:
db.t255.ensureIndex({name:1})
db.t1.find({name:'test10000'}).explain('executionStats')
创建索引前后速度对比executionTimeMillis,明显快了很多
默认情况下_id是集合的索引
查看方式:
db.collection_name.getIndexes()
添加索引前:
> db.test2000.insert({"name":"hello",age:20})
WriteResult({ "nInserted" : 1 })
> db.test2000.find()
{ "_id" : ObjectId("5ae0232f625b9ddd91a0e7ae"), "name" : "hello", "age" : 20 }
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
}
]
添加name为索引后:
> db.test2000.ensureIndex({name:1})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
}
]
在默认情况下mongdb的索引字段的值是可以相同的,仅仅能够提高查询速度
添加唯一索引的语法:
db.collection_name.ensureIndex({"name":1},{"unique":true})
使用普通索引的效果如下:
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
}
]
> db.test2000.insert({name:"hello",age:40})
WriteResult({ "nInserted" : 1 })
> db.test2000.find()
{ "_id" : ObjectId("5ae0232f625b9ddd91a0e7ae"), "name" : "hello", "age" : 20 }
{ "_id" : ObjectId("5ae02421625b9ddd91a0e7af"), "name" : "hello", "age" : 30 }
{ "_id" : ObjectId("5ae02432625b9ddd91a0e7b0"), "name" : "hello", "age" : 40 }
添加age为唯一索引之后:
> db.test2000.createIndex({age:1},{unique:true})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 2,
"numIndexesAfter" : 3,
"ok" : 1
}
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"unique" : true,
"key" : {
"age" : 1
},
"name" : "age_1",
"ns" : "test2000.test2000"
}
]
> db.test2000.insert({"name":"world",age:20})
WriteResult({
"nInserted" : 0,
"writeError" : {
"code" : 11000,
"errmsg" : "E11000 duplicate key error collection: test2000.test2000 index: age_1 dup key: { : 20.0 }"
}
})
语法:db.t1.dropIndex({‘索引名称’:1})
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1
},
"name" : "name_1",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"unique" : true,
"key" : {
"age" : 1
},
"name" : "age_1",
"ns" : "test2000.test2000"
}
]
> db.test2000.dropIndex({age:1})
{ "nIndexesWas" : 3, "ok" : 1 }
> db.test2000.dropIndex({name:1})
{ "nIndexesWas" : 2, "ok" : 1 }
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
}
]
ensureIndex({字段1:1,字段2:1})
)在进行数据去重的时候,可能用一个字段来保证数据的唯一性,这个时候可以考虑建立复合索引来实现。
例如:抓全贴吧信息,如果把帖子的名字作为唯一索引对数据进行去重是不可取的,因为可能有很多帖子名字相同
建立复合索引的语法:db.collection_name.ensureIndex({字段1:1,字段2:1})
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
}
]
> db.test2000.createIndex({name:1,age:1})
{
"createdCollectionAutomatically" : false,
"numIndexesBefore" : 1,
"numIndexesAfter" : 2,
"ok" : 1
}
> db.test2000.getIndexes()
[
{
"v" : 2,
"key" : {
"_id" : 1
},
"name" : "_id_",
"ns" : "test2000.test2000"
},
{
"v" : 2,
"key" : {
"name" : 1,
"age" : 1
},
"name" : "name_1_age_1",
"ns" : "test2000.test2000"
}
]
1. 根据需要选择是否需要建立唯一索引
2. 索引字段是升序还是降序在单个索引的情况下不影响查询效率,但是带复合索引的条件下会有影响
例如:
在进行查询的时候如果字段1需要升序的方式排序输出,字段2需要降序的方式排序输出,那么此时复合索引的建立需要把字段1设置为1,字段2设置为-1
备份的语法:
mongodump -h dbhost -d dbname -o dbdirectory
示例:
mongodump -h 127.0.0.1:27017 -d test1 -o ~/Desktop/
恢复语法:
mongorestore -h dbhost -d dbname --dir dbdirectory
示例:
mongorestore -h 127.0.0.1:27017 -d test2 --dir ~/Desktop/test1
pymongo 提供了mongdb和python交互的所有方法 安装方式:
pip install pymongo
1. 导入pymongo并选择要操作的集合 数据库和集合乜有会自动创建
from pymongo import MongoClient
client = MongoClient(host,port)
collection = client[db名][集合名]
2. 添加一条数据
ret = collection.insert_one({"name":"10086","age":100})
print(ret)
3. 添加多条数据
item_list = [{"name":"py_{}".format(i)} for i in range(10)]
#insert_many接收一个列表,列表中为所有需要插入的字典
t = collection.insert_many(item_list)
4. 查找一条数据
#find_one查找并且返回一个结果,接收一个字典形式的条件
t = collection.find_one({"name":"py_5"})
print(t)
5. 查找全部数据
结果是一个Cursor游标对象,是一个可迭代对象,可以类似读文件的指针,但是只能够进行一次读取
#find返回所有满足条件的结果,如果条件为空,则返回数据库的所有
t = collection.find({"name":"py_5"})
#结果是一个Cursor游标对象,是一个可迭代对象,可以类似读文件的指针,
for i in t:
print(i)
for i in t: #此时t中没有内容
print(i)
6. 更新一条数据 注意使用$set命令
#update_one更新一条数据
collection.update_one({"name":"py_5"},{"$set":{"name":"new_test10005"}})
7. 更行全部数据
# update_one更新全部数据
collection.update_many({"name":"py_5"},{"$set":{"name":"new_py_5"}})
8. 删除一条数据
#delete_one删除一条数据
collection.delete_one({"name":"py_10"})
9. 删除全部数据
#delete_may删除所有满足条件的数据
collection.delete_many({"name":"py_10"})
实例:
1. 使用python向集合t3中插入1000条文档,文档的属性包括_id、name
1) _id的值为0、1、2...999
2) _id的值为'py0'、'py1',...
2. 查询显示出_id为100的整倍数的文档,如100、200...,并将name输出
from pymongo import MongoClient
# client = MongoClient(host="127.0.0.1", port=27017)
client = MongoClient() # 本机,参数可以不用写
collection = client["test1000"]["t3"]
temp_list = [{"_id": i, "name": "py{}".format(i)} for i in range(1000)]
print(temp_list)
collection.insert_many(temp_list)
ret_list = list(collection.find({}))
ret = [i["name"] for i in ret_list if i["_id"]%100==0 and i["_id"]!=0]
print(ret)
pymongo操作MongoDB数据库,直接把对数据库的操作代码写在脚本里,应用的代码耦合性太强,不利于代码的优化管理。
通常情况下应用是使用MVC框架来设计的,为了更好地维持MVC结构,需要把数据库操作部分作为model抽离出来,这就需要借助MongoEngine
MongoEngine是一个对象文档映射器(ODM),相当于一个基于SQL的对象关系映射器(ORM)
MongoEngine提供的抽象是基于类的,创建的所有模型都是类
1.MongoEngine安装
pip3 install mongoengine
先声明一个继承自MongoEngine.Document的类
在类中声明一些属性,相当于创建一个用来保存数据的数据结构,即数据以类似数据结构的形式存入数据库中,通常把这样的一些类都存放在一个脚本中,作为应用的Model模块
from mongoengine import *
connect('test', host='localhost', port=27017)
import datetime
class Page(Document):
title = StringField(max_length=200, required=True)
date_modified = DateTimeField(default=datetime.datetime.utcnow)
# Create a new page and add tags
>>> page = Page(title='Using MongoEngine')
>>> page.tags = ['mongodb', 'mongoengine']
>>> page.save()
>>> Page.objects(tags='mongoengine').count()
>>> 1
具体操作的方法见下面链接
Docs参考:http://docs.mongoengine.org/tutorial.html