1. 聚合aggregate
聚合主要用于计算数据,类似sql中的sum()、avg()
语法:
db.集合名称.aggregate([{管道:{表达式}}])
stu准备的数据:
db.stu.insertMany([ { name: "gj",gender:true, age: 18}, { name: "gj1",gender:true, age: 28}, { name: "hr",gender:false, age: 18}, { name: "hr1",gender:false, age: 28} ])
1.1 管道
管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的输入。
ps ajx | grep mongo
在mongodb中,管道具有同样的作用,文档处理完毕后,通过管道进行下一次处理。
常用管道:
$group:将集合中的文档分组,可用于统计结果。
$match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
$sort:将输入文档排序后输出。
$limit:用来限制MongoDB聚合管道返回的文档数。
$skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
$unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
$geoNear:输出接近某一地理位置的有序文档。
1.2 表达式
处理输入文档并输出。
语法:
表达式:'$列名'
常用表达式:
$sum:计算总和,$sum:同count表示计数
$avg:计算平均值
$min:获取最小值
$max:获取最大值
$push:在结果文档中插入一个数组中,数组内容为选中字段
$first:根据资源文档的排序获取第一个文档数据
$last:根据资源文档的排序获取最后一个文档数据
1.3 $group
将集合中的文档分组,可用于统计结果。
_id表示分组的依据,使用某个字段的格式为‘$字段’
实例:
统计男生、女生的总人数:
db.stu.aggregate([ {$group:{_id:'gender',counter:{$sum:1}}} ])
统计学生性别及学生姓名:
db.stu.aggregate([ {$group:{_id:'gender',counter:{$push:'$name'}}} ])
使用$$ROOT可以将文档内容加入到结果集的数组中:
db.stu.aggregate([ {$group:{_id:'gender',name:{$push:'$$ROOT'}}} ])
将集合中所有文档分为一组。
求学生总人数、平均年龄:
db.stu.aggregate([ {$group:{_id:null,counter:{$sum:1},avgAge:{$avg:'$age'}}} ])
1.4 $match
用于过滤数据,只输出符合条件的文档。
使用MongoDB的标准查询操作。
实例:
查询年龄大于20的学生:
db.stu.aggregate([ {$match:{age:{$gt:20}}} ])
查询年龄大于20的男生、女生人数。
db.stu.aggregate([ {$match:{age:{$gt:20}}}, {$group:{_id:'$gender',counter:{$sum:1}}} ])
1.5 $project
修改输入文档的结构,如重命名、增加、删除字段、创建计算结果。
实例:
查询学生的姓名、年龄。
db.stu.aggregate([ {$project:{_id:0,name:1,age:1}} ])
查询男生、女生人数,输出人数。
db.stu.aggregate([ {$group:{_id:'$gender',counter:{$sum:1}}}, {$project:{_id:0,counter:1}} ])
1.6 $sort
将输入文档排序后输出。
实例:
查询学生学习,按年龄升序。
db.stu.aggregate([ {$sort:{age:1}} ])
查询男生、女生人数,按人数降序。
db.stu.aggregate([ {$group:{_id:'$gender',counter:{$sum:1}}}, {$sort:{counter:-1}} ])
1.7 $limit
限制聚合管道返回的文档数。
查询2条学生信息。
db.stu.aggregate([ {$limit:2} ])
1.8 $skip
跳过指定数量的文档,并返回余下的文档。
查询从第3条开始的学生信息。
db.stu.aggregate([ {$skip:2} ])
统计男生、女生人数,按人数升序,取第二条数据。
db.stu.aggregate([ {$group:{_id:'$gender',counter:{$sum:1}}}, {$sort:{counter:1}}, {$skip:1}, {$limit:1} ])
注意顺序:先写skip,再写limit。
1.9 $unwind
将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
语法1:
对某字段值进行拆分。
db.集合名称.aggregate([{$unwind:'$字段名称'}])
构造数据:
db.t2.insert({_id:1,title:'t-shirt',size:['M','L','S']})
查询:
db.t2.aggregate([{$unwind:'$size'}])
语法2:
对某字段值进行拆分。
处理空数组、非数组、无字段、null情况。
db.集合名称.aggregate([{ $unwind:{ path:'$字段名称', preserveNullAndEmptyArrays:#防止数据丢失 } ])
构造数据:
db.t3.insert([ {_id:1,"item":"a",size:["M","L","S"]}, {_id:2,"item":"b",size:[]}, {_id:3,"item":"c",size:"M"}, {_id:4,"item":"d"}, {_id:5,"item":"e",size:null} ])
使用语法1查询:
db.t3.aggregate([{$unwind:'$size'}])
使用语法2查询 :
db.t3.aggregate([ {$unwind:{path:'$size',preserveNullAndEmptyArrays:true}} ])