知识点:
美化输出:
db.stu.find().pretty()
$project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
$match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit:用来限制MongoDB聚合管道返回的文档数。
$skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
$unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
$group:将集合中的文档分组,可用于统计结果。
$sort:将输入文档排序后输出。
$geoNear:输出接近某一地理位置的有序文档。
安装mongodb:
sudo apt-get install mongodb
配置文件:
/etc/mongodb.conf
查看版本号:
mongo -version
启动:
service mongodb start
关闭:
service mongodb stop
配置文件启动mongdb:
sudo mongod --config /etc/mastermongodb.conf
sudo mongod -f /etc/mastermongodb.conf (简写)
通常这种方法启动是阻塞终端的,可以通过更改配置文件来让其后台启动:
vi /etc/mongodb.conf
加上 fork=true
允许创建子线程,也就是在后台子线程运行
有开启就有关闭,上面方法会永久开启mongodb,那么如何关闭其运行呢?
1、普通命令
use admin
db.shutdownServer()
2、如果没有up-to-date 从Mongodb且你想强制关闭服务,可以通过添加force:true;命令如下
db.shutdownServer({force : true})
3、指定特定超时时间的关闭服务器,命令同上,另外加上一个timeoutsec:参数
db.shutdownServer({force : true, timeoutsec : 5})
启动客户端:
mongo -port 27018
默认设置MongoDB是随Ubuntu启动自动启动的。
输入以下命令查看是否启动成功:
pgrep mongo -l #注意:-l是英文字母l,不是阿拉伯数字1
卸载MongoDB
sudo apt-get --purge remove mongodb mongodb-clients mongodb-server
打开mongodb客户端:
mongo
常用操作命令:
db 查看当前所用数据库
show dbs:显示数据库列表
show collections:显示当前数据库中的集合(类似关系数据库中的表table)
show users:显示所有用户
db.dropDatabase() 删除当前所用数据库 D要大写
db.createCollection('test') 创建一个集合(相当于表) C要大写
use yourDB:切换当前数据库至yourDB
db.help() :显示数据库操作命令
db.yourCollection.help() :显示集合操作命令,yourCollection是集合名
注:
MongoDB没有创建数据库的命令,如果你想创建一个“School”的数据库,先运行use School命令,之后做一些操作(如:创建聚集集合db.createCollection('teacher')),这样就可以创建一个名叫“School”的数据库
举例:
切换到school数据库(如果没有他自己会创建并且切换到school):
use school
创建collection(相当于关系数据库中的表)
db.createCollection('teacher')
插入数据有两种方式:insert和save。
db.student.insert({_id:1, sname: 'zhangsan', sage: 20}) #_id可选
db.student.save({_id:1, sname: 'zhangsan', sage: 22}) #_id可选
这两种方式,其插入的数据中_id字段均可不写,会自动生成一个唯一的_id来标识本条数据。而insert和save不同之处在于:在手动插入_id字段时,如果_id已经存在,insert不做操作,save做更新操作;如果不加_id字段,两者作用相同都是插入数据
注:
插入数据时 键可以不用加引号,但是值必须根据数据类型适当加引号!
添加的数据其结构是松散的,只要是bson格式均可,列属性均不固定,根据添加的数据为准。先定义数据再插入,就可以一次性插入多条数据
s = [{sname:'zhaoliu',_id:1,sage:12},{_id:2,sname:'daqiao',sage:13}]
db.stu.insert(s) #stu为collection的名字
查找数据:
db.student.find() #查询所有记录。相当于:select * from student
db.student.find({sname: 'lisi'}) #查询sname='lisi'的记录。相当于: select * from student where sname='lisi'
db.student.find({},{sname:1, sage:1}) #查询指定列sname、sage数据。相当于:select sname,sage from student。sname:1表示返回sname列,默认_id字段也是返回的,可以添加_id:0(意为不返回_id)写成{sname: 1, sage: 1,_id:0},就不会返回默认的_id字段了
db.student.find({sname: 'zhangsan', sage: 22}) #and 与条件查询。相当于:select * from student where sname = 'zhangsan' and sage = 22
db.student.find({$or: [{sage: 22}, {sage: 25}]}) #or 条件查询。相当于:select * from student where sage = 22 or sage = 25
更新数据:
db.youCollection.update(criteria, objNew, upsert, multi )
criteria: update的查询条件,类似sql update查询内where后面的
objNew : update的对象和一些更新的操作符(如$set)等,也可以理解为sql update查询内set后面的。
upsert : 如果不存在update的记录,是否插入objNew,true为插入,默认是false,不插入。
multi: mongodb默认是false,只更新找到的第一条记录,如果这个参数为true,就把按条件查出来多条记录全部更新。默认false,只修改匹配到的第一条数据。
其中criteria和objNew是必选参数,upsert和multi可选参数
例如:
db.stu.find()
{ "_id" : ObjectId("5aa4e02f8bc6ad195143a5f7"), "sname" : "lisi", "sage" : 12 }
{ "_id" : ObjectId("5aa4e02f8bc6ad195143a5f8"), "sname" : "wangwu", "sage" : 13 }
{ "_id" : 1, "sname" : "zhaoliu", "sage" : 12 }
{ "_id" : 2, "sname" : "daqiao", "sage" : 13 }
db.stu.update({sname:'lisi'},{$set:{sage:30}},false,true) 第三个参数为false 若查找不存在不用添加
WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 })
db.stu.find()
{ "_id" : ObjectId("5aa4e02f8bc6ad195143a5f7"), "sname" : "lisi", "sage" : 30 }
{ "_id" : ObjectId("5aa4e02f8bc6ad195143a5f8"), "sname" : "wangwu", "sage" : 13 }
{ "_id" : 1, "sname" : "zhaoliu", "sage" : 12 }
{ "_id" : 2, "sname" : "daqiao", "sage" : 13 }
db.stu.update({sname:'lisii'},{$set:{sage:30}},true,true) 第三个参数为true,若不存在需要添加此新项
db.stu.find()
{ "_id" : ObjectId("5aa4e02f8bc6ad195143a5f7"), "sname" : "lisi", "sage" : 30 }
{ "_id" : ObjectId("5aa4e02f8bc6ad195143a5f8"), "sname" : "wangwu", "sage" : 13 }
{ "_id" : 1, "sname" : "zhaoliu", "sage" : 12 }
{ "_id" : 2, "sname" : "daqiao", "sage" : 13 }
{ "_id" : ObjectId("5aa4e3d5b2fc99b176fbf052"), "sname" : "lisii", "sage" : 30 }
删除操作:
删除数据:
db.student.remove({sname: 'chenliu'}) #相当于:delete from student where sname='chenliu'
注:
把符合条件的全部删除
删除当前数据库:
db.dropDatabase()
注:
- 先use到要删除的数据库
- 在执行db.dropDatabase()
删除集合:
db.collection_name.drop()
例如:
db.student.drop() 删除student集合
聚合:
语法:
db.collection_name.aggregate(aggregate_operation)
db.mycol.aggregate([{$group : {_id : "$by_user", total : {$sum : 1}}}])
解:
_id:"$by_user"
根据by_user这个字段得值分组 $不能忘
total : {$sum : 1}
计算每个分组的数量 1表示数量的一倍也就是原数量,若为2就是每组的数量是原来的两倍 $不能忘
$sum 计算总和。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
将集合中所有文档分为一组:
db.stu.aggregate({$group:{_id:null,count:{'$sum':1},avgAge:{'$avg':'$age'}}})
$avg 计算平均值 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min 获取集合中所有文档对应值得最小值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max 获取集合中所有文档对应值得最大值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push 在结果文档中插入值到一个数组中。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet 在结果文档中插入值到一个数组中,但不创建副本。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first 根据资源文档的排序获取第一个文档数据。 db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last 根据资源文档的排序获取最后一个文档数据 db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])
透视数据:
把分组的数据信息放入列表中:
db.stu.aggregate({$group:{_id:'$gender',name:{$push:'$name'}}})
使用$$ROOT可以将内容加入到结果集的数组中:
db.stu.aggregate({$group:{_id:'$gender',name:{$push:'$$ROOT'}}})
例如:
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "c" }
{ "country" : "china", "province" : "bj", "userid" : "da" }
{ "country" : "china", "province" : "bj", "userid" : "fa" }
需求:统计出每个country/province下的userid的数量(同一个userid只统计一次)
解答:
db.tv3.aggregate(
{$group:{_id:{'country':'$country','province':'$province','userid':'$userid'}}}, #把所有字段分组就是去重
{$group:{_id:{'country':'$_id.country','province':'$_id.province'},count:{'$sum':1}}}
)
match是管道命令,能将结果交给后一个管道,但是find不可以
查询年龄大于20的所有数据
db.stu.aggregate({$match:{age:{'$gt':20}}})
查询来自桃花岛人的数量
db.stu.aggregate({$match:{hometown:'桃花岛'}},
{$group:{_id:null,count:{'$sum':1}}}
)
查询年龄大于20的男生.女生的人数:
db.stu.aggregate(
{$match:{age:{'$gt':20}}},
{$group:{_id:'$gender',count:{'$sum':1}}}
)
大于:gt
小于:lt
等于:e
大于等于:gte
$project -->:用于修改文档的结构,重命名,增加,删除字段,创建计算结构
例如:
只需查询学生的姓名,年龄
db.stu.aggregate({$project:{_id:0,name:1,age:1}})
注:0表示不显示 1表示显示 _id默认是显示的,需要手动关闭
查询男女生人数:
db.stu.aggregate(
{$group:{_id:'$gender',count:{'$sum':1}}},
{$project:{_id:0,count:1}}
)
例如:
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "b" }
{ "country" : "china", "province" : "sh", "userid" : "a" }
{ "country" : "china", "province" : "sh", "userid" : "c" }
{ "country" : "china", "province" : "bj", "userid" : "da" }
{ "country" : "china", "province" : "bj", "userid" : "fa" }
需求:统计出每个country/province下的userid的数量(同一个userid只统计一次),结果中的字段为{country:"",province:"",counter:"*"},并且结果按照counter的倒叙输出
解答:
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{'country':'$_id.country',province:'$_id.province'},count:{'$sum':1}}},
{$project:{country:'$_id.country',province:'$_id.province',counter:'$count',_id:0}},
{$sort:{counter:-1}}
)
$limit:
限制聚合管道返回的文档数
$skip:
跳过指定文档数,并返回余下文档
一般格式:
db.stu.aggregate({$limit:1})
$limit和$skip连用时一般 skip在前,limit在后
需求:统计出每个country/province下的userid的数量(同一个userid只统计一次),结果中的字段为{country:"",province:"",counter:"*"},并且结果按照counter的倒叙输出,结果文档跳过一个,输出一个
db.tv3.aggregate(
{$group:{_id:{country:'$country',province:'$province',userid:'$userid'}}},
{$group:{_id:{'country':'$_id.country',province:'$_id.province'},count:{'$sum':1}}},
{$project:{country:'$_id.country',province:'$_id.province',counter:'$count',_id:0}},
{$sort:{counter:-1}},
{$skip:1},
{$limit:1}
)
$unwind:
将⽂档中的某⼀个数组类型字段拆分成多条, 每条包含数组中的⼀个值
语法:db.集合名称.aggregate({$unwind:'$字段名称'})
db.t2.insert({_id:1,item:'t-shirt',size:['S','M','L']})
db.t2.aggregate({$unwind:'$size'})
结果如下:
{ "_id" : 1, "item" : "t-shirt", "size" : "S" }
{ "_id" : 1, "item" : "t-shirt", "size" : "M" }
{ "_id" : 1, "item" : "t-shirt", "size" : "L" }
属性值为false表示丢弃属性值为空的⽂档
属性preserveNullAndEmptyArrays值为true表示保留属性值为空的⽂档
用法:
db.stu.aggregate(
{$unwind:{size:'$size',priserveNullAndEmptyArrays:true}} #防止数据丢失
)
数据库中有一条数据:{"username":"Alex","tags": ['C#','Java','C++']},如何获取该tag列表的长度?
db.t2.aggregate(
{$unwind:'$tags'},
{$group:{_id:{username:'$username'},count:{'$sum':1}}},
{$project:{count:'$count',_id:0}}
)
数据库的备份与恢复:
备份:
备份的语法:
mongodump -h dbhost -d dbname -o dbdirectory
-h: 服务器地址, 也可以指定端⼝号
-d: 需要备份的数据库名称
-o: 备份的数据存放位置, 此⽬录中存放着备份出来的数据
mongodump -h 192.168.196.128:27017 -d test1 -o ~/Desktop/test1bak
恢复:
恢复语法:
mongorestore -h dbhost -d dbname --dir dbdirectory
-h: 服务器地址
-d: 需要恢复的数据库实例
--dir: 备份数据所在位置
mongorestore -h 192.168.196.128:27017 -d test2 --dir ~/Desktop/test1bak/test1
循环加入数据:
for(i=0;i<100000;i++){db.t255.insert({name:'test'+i,age:i})}
查看找到数据时的状态:
db.t1.find({name:'test10000'}).explain('executionStats')
建立索引:
语法:db.集合.ensureIndex({属性:1}),1表示升序, -1表示降序
具体操作:db.t255.ensureIndex({name:1})
在默认情况下索引字段的值可以相同
创建唯一索引(索引的值是唯一的):
db.t1.ensureIndex({"name":1},{"unique":true}) #如果要插入的值库里面已经有了就拒绝插入
建立联合索引(什么时候需要联合索引):
db.t1.ensureIndex({name:1,age:1}) #根据name和age的字段设置联合索引
查看当前集合的所有索引:
db.t1.getIndexes()
删除索引:
db.t1.dropIndex({'索引名称':1})
主从设置:
主的配置文件:/etc/mastermongodb.conf
从的配置文件:/etc/slavemongodb.conf
配置文件启动mongdb:
sudo mongod --config /etc/mastermongodb.conf
sudo mongod -f /etc/mastermongodb.conf (简写)
通常这种方法启动是阻塞终端的,可以通过更改配置文件来让其后台启动:
vi /etc/mongodb.conf
加上 fork=true
允许创建子线程,也就是在后台子线程运行
启动客户端:
mongo -port 27018 #主的端口