mongo中的高级查询之聚合操作(distinct,count,group)


mongo中的高级查询之聚合操作(distinct,count,group)

 

1.distinct的实现:

db.consumerecords.distinct("userId"):键值去重  类似于mysql中的 select distinct userId from consumerecords

db.consumerecords.distinct("userId",{act:"charge"}):过滤之后去重,类似于mysql中的select distinct userId from consumerecords where act="charge"

db.consumerecords.distinct("userId").length:去重之后求记录数,类似于mysql中的 select count(distinct userId) from consumerecords 

 

2.count的实现

db.consumerecords.count():类似于 mysql中 select count(*) from consumerecords

db.consumerecords.count({act:"charge"}):类似于mysql中的 select  count(*) from  consumerecords where act="charge"

 

3.group的实现

(1).分组求和:类似于mysql中的 select act,sum(count) from  consumerecords group by act

db.consumerecords.group(

... {

... key:{act:true}, 

... initial:{ct:0},    

... $reduce:function(doc,prev)  

... {

...              prev.ct = prev.ct + doc.count    

... }

... }

... )

 

(2).分组求和,过滤。类似mysql中的select act,sum(count) from  consumerecords group by act having act="charge"

db.consumerecords.group(

... {

... key:{act:true}, 

... initial:{ct:0},    

... $reduce:function(doc,prev)  

... {

...              prev.ct = prev.ct + doc.count    

... },

           condition:{act:"charge"}

... 

... }

... )

 

(3).将时间格式化并且按时间分组求count,不推荐使用这种方法。

db.playerlogs.aggregate({$project:{ userId:1,con:{$concat:[{$substr:[{$year:"$start"},0,4]},"0",{$substr:[{$month:"$start"},0,4]},{$substr:[{$dayOfMonth:"$start"},0,4]}]} ,_id:0}},{$group:{_id:"$con",count:{$sum:1}}},{$sort:{con:1}}) ;

 

group按时间分组(时间格式化)

http://www.tuicool.com/articles/EjUnQz

db.playerlogs.group({

 keyf : function(doc){

    var date = new Date(doc.start);

    var dateKey = ""+date.getFullYear()+"-"+(date.getMonth()+1)+"-"+date.getDate();

    return {'day':dateKey}; 

}, 

 initial : {count:0}, 

 reduce : function Reduce(doc, out) {

    out.count++

}

});

 

javascriptz中时间的相关函数参考:

http://blog.csdn.net/npp616/article/details/7181730

 

 

(4).group 分组方法实现的讲解。

group 的完整语法是。

db.consumerecords.group(

... {

... key:{act:true}, 

... initial:{ct:0},    

... $reduce:function(doc,prev)  

... {

...              prev.ct = prev.ct + parseInt(doc.count)    

... },

          finalize:function(doc)

      {

       doc.ct=doc.ct +  100

      },

           condition:{act:"charge"}

... }

... )

 

参数解释:

key:需要分组的键或是函数(function),group分组实例3中的key就是一个函数值

initial:声明并且初始化变量。每一组共享一个变量值。多个变量之间用逗号隔开

$reduce:循环体,集合中有多少个文档,就会循环多少次。函数(function)中变量doc表示当前文档对象,

prev表示累积处理的结果对象(这个地方可能描述的不是很情况,自己慢慢体会)

finalize:可选参数,可以简单理解为对分组之后的结果的再次处理,doc表示group之后的文档对象(这一步也是一个循环体

condition:可选参数,对已经分组好的结果进行过滤,有点类似于mysql中的having

 

4.mapReduce:暂缺,要想玩转这个方法需要有很强的JavaScript功能。

据说mapReduce 可以实现很复杂的查询,可以将一个复杂的查询分拆到多个机器上运行,

然后把各个结果集组合起来,形成最终结果。但是很慢。

mapreduce用法大全

http://www.cnblogs.com/yuechaotian/archive/2013/02/22/2922268.html

mapreduce性能调优

http://www.iteye.com/news/28013 

数组中去除重复值示例 

http://www.cnblogs.com/sosoft/archive/2013/12/08/3463830.html 



 

5.db.runCommand的相关命令.

db.runCommand({distinct:"consumerecords",key:"userId"}):键值去重  类似于mysql中的 select distinct userId from consumerecords

db.runCommand({distinct:"consumerecords",key:"userId"}).values.length:去重之后求记录数,类似于mysql中的 select count(distinct userId) from consumerecords 

db.runCommand({distinct:"consumerecords",key:"userId",query:{act:"charge"}}):去重之后求记录数,类似于mysql中的 select distinct userId from consumerecords where act="charge"

db.runCommand(

... {

... group:

... {

... ns:"test2",     # 集合名

... key:{iname:true},  # 分组字段

... initial:{dd:0},    # 按照来初始化该值

... $reduce:function(doc,prev)  # 每个文档循环一遍 doc当前文档  ,prev : 经过$reduce之后 ,function返回的值

... {

...             prev.dd=doc.iage+prev.dd    # 

... }

... 

... }

... }

... )

数值以字符串形式存储的解决方案:

db.runCommand(

{

  group:

  {

    ns:"consumerecords",

    key:{act:true},

    initial:{ct:100,tt:0},

    $reduce:function(doc,prev)

    {

          prev.tt=parseInt(prev.tt)+parseInt(doc.count)    

    },

        condition:{act:"charge"}

  }

}

)

 

mongo的聚合操作

http://www.cnblogs.com/huangxincheng/archive/2012/02/21/2361205.html

http://www.cnblogs.com/stephen-liu74/archive/2012/09/19/2652308.html

http://www.cnblogs.com/refactor/archive/2012/08/06/2592734.html

聚合框架:

http://dwchaoyue.blog.51cto.com/2826417/1608068

javascript数据类型转换

http://blog.csdn.net/yjq8116/article/details/3219993/

 

 


你可能感兴趣的:(distinct,mongo,count,group)