MongoDB系列之分组topN

阅读更多

   来源:https://groups.google.com/forum/#!topic/mongodb-user/Rjv6lyUCe1s

Collction last3有两个字段:variabletimestamp,需要先按variable分组,选出每组文档中timestamp最晚的3个,再从这些文档中找到timestamp最早的1个。

last3的部分数据如下:


MongoDB系列之分组topN_第1张图片
 

   集算器代码:


MongoDB系列之分组topN_第2张图片
 

A1:连接MongoDB,连接字格式为mongo://ip:port/db?arg=value&…

A2:使用find函数从MongoDB中取数并排序,形成游标。collectoinlast3,过滤条件是空,取出_id之外的所有字段,并按variable排序。集算器的find函数和mongdbfind+sort+limit函数类似,过滤条件的写法遵循mongodb规范。

        A3:循环从游标读数,每次取variable字段相同的一组文档。A3的作用范围是缩进的B3B4,其间可以用A3来引用循环变量。A3是内存数据,某次取数的结果如下:



 

B3:选出本组文档中timestamp最晚(大)的3个。

        B4:B3不断地追加到B2中。B2如下:


MongoDB系列之分组topN_第3张图片
 

A5:选出B2timstamp最早(小)的那个文档,即:



 

A6:关闭MongoDB连接。

  • MongoDB系列之分组topN_第4张图片
  • 大小: 123.2 KB
  • MongoDB系列之分组topN_第5张图片
  • 大小: 28.5 KB
  • MongoDB系列之分组topN_第6张图片
  • 大小: 15 KB
  • MongoDB系列之分组topN_第7张图片
  • 大小: 31.8 KB
  • MongoDB系列之分组topN_第8张图片
  • 大小: 5.9 KB
  • 查看图片附件

你可能感兴趣的:(Mongodb,分组,top,N,集算器)