XMonsterH

MongoDB Aggregation 聚合管道（Aggregation Pipeline）

MongoDB Aggregation 例子文档下载：

http://download.csdn.net/detail/huangchao1010/6820115

一管道的概念

管道是MongoDB2.2版本引入新的功能，它是数据聚合的一个新框架，其概念类似于数据处理的管道。管道的工作方式类似于UNIX-like的shell ps aux | grep mong* （下面的补充会详细介绍管道原理）。

每个文档通过一个由多个节点组成的管道，每个节点有自己特殊的功能（分组、过滤等），文档经过管道处理后，最后输出相应的结果。管道基本的功能有两个：一是对文档进行“过滤”，也就是筛选出符合条件的文档;二是对文档进行“变换”，也就是改变文档的输出形式。其他的一些功能还包括按照某个指定的字段分组和排序等。而且在每个阶段还可以使用表达式操作符计算平均值和拼接字符串等相关操作。管道提供了一个MapReduce 的替代方案，MapReduce使用相对来说比较复杂，而管道的拥有固定的接口(操作符表达),使用比较简单，对于大多数的聚合任务管道一般来说是首选方法。

二管道操作符

管道是由一个个功能节点组成的，这些节点用管道操作符来进行表示。聚合管道以一个集合中的所有文档作为开始，然后这些文档从一个操作节点流向下一个节点，每个操作节点对文档做相应的操作。这些操作可能会创建新的文档或者过滤掉一些不符合条件的文档，在管道中可以对文档进行重复操作。

先看一个管道聚合的例子：

管道操作符的种类：

Name	Description
`$project`	Reshapes a document stream. `$project` can rename, add, or remove fields as well as create computed values and sub-documents.
`$match`	Filters the document stream, and only allows matching documents to pass into the next pipeline stage.`$match` uses standard MongoDB queries.
`$limit`	Restricts the number of documents in an aggregation pipeline.
`$skip`	Skips over a specified number of documents from the pipeline and returns the rest.
`$unwind`	Takes an array of documents and returns them as a stream of documents.
`$group`	Groups documents together for the purpose of calculating aggregate values based on a collection of documents.
`$sort`	Takes all input documents and returns them in a stream of sorted documents.
`$geoNear`	Returns an ordered stream of documents based on proximity to a geospatial point.

管道操作符详细使用说明

1. $project: 数据投影，主要用于重命名、增加和删除字段

例如：

db.article.aggregate(
    { $project : {
        title : 1 ,
        author : 1 ,
    }}
 );

这样的话结果中就只还有_id,tilte和author三个字段了，默认情况下_id字段是被包含的，如果要想不包含_id话可以这样:

db.article.aggregate(
    { $project : {
        _id : 0 ,
        title : 1 ,
        author : 1
    }});

也可以在$project内使用算术类型表达式操作符，例如：

db.article.aggregate(
    { $project : {
        title : 1,
        doctoredPageViews : { $add:["$pageViews", 10] }
    }});

通过使用$add给pageViews字段的值加10，然后将结果赋值给一个新的字段:doctoredPageViews

注:必须将$add计算表达式放到中括号里面

除此之外使用$project还可以重命名字段名和子文档的字段名:

db.article.aggregate(
    { $project : {
        title : 1 ,
        page_views : "$pageViews" ,
        bar : "$other.foo"
    }});

也可以添加子文档：

db.article.aggregate(
    { $project : {
        title : 1 ,
        stats : {
            pv : "$pageViews",
            foo : "$other.foo",
            dpv : { $add:["$pageViews", 10] }
        }
    }});

产生了一个子文档stats,里面包含pv,foo,dpv三个字段。

2.$match: 滤波操作，筛选符合条件文档，作为下一阶段的输入

$match的语法和查询表达式(db.collection.find())的语法相同

db.articles.aggregate( [
                        { $match : { score : { $gt : 70, $lte : 90 } } },
                        { $group: { _id: null, count: { $sum: 1 } } }
                       ] );

$match用于获取分数大于70小于或等于90记录，然后将符合条件的记录送到下一阶段$group管道操作符进行处理。

注意： 1.不能在$match操作符中使用$where表达式操作符。

2.$match尽量出现在管道的前面，这样可以提早过滤文档，加快聚合速度。

3.如果$match出现在最前面的话，可以使用索引来加快查询。

3. $limit: 限制经过管道的文档数量

$limit的参数只能是一个正整数

db.article.aggregate(
    { $limit : 5 });

这样的话经过$limit管道操作符处理后，管道内就只剩下前5个文档了

4. $skip: 从待操作集合开始的位置跳过文档的数目

$skip参数也只能为一个正整数

db.article.aggregate(
    { $skip : 5 });

经过$skip管道操作符处理后，前五个文档被“过滤”掉

5.$unwind：将数组元素拆分为独立字段

例如:article文档中有一个名字为tags数组字段：

> db.article.find()
{ "_id" : ObjectId("528751b0e7f3eea3d1412ce2"),

"author" : "Jone", "title" : "Abook",

"tags" : [ "good", "fun", "good" ] }

使用$unwind操作符后：

> db.article.aggregate({$project:{author:1,title:1,tags:1}},{$unwind: "$tags"})
{
        "result" : [
                {
                        "_id" : ObjectId("528751b0e7f3eea3d1412ce2"),
                        "author" : "Jone",
                        "title" : "A book",
                         "tags" : "good"
                },
                {
                        "_id" : ObjectId("528751b0e7f3eea3d1412ce2"),
                        "author" : "Jone",
                        "title" : "A book",
                         "tags" : "fun"
                },
                {
                        "_id" : ObjectId("528751b0e7f3eea3d1412ce2"),
                        "author" : "Jone",
                        "title" : "A book",
                       "tags" : "good"
                }
        ],
        "ok" : 1
}

注意：a.{$unwind:"$tags"})不要忘了$符号

b.如果$unwind目标字段不存在的话，那么该文档将被忽略过滤掉，例如：

> db.article.aggregate({$project:{author:1,title:1,tags:1}},{$unwind:"$tag"})
{ "result" : [ ], "ok" : 1 }
将$tags改为$tag因不存在该字段，该文档被忽略，输出的结果为空

c.如果$unwind目标字段不是一个数组的话，将会产生错误，例如：

> db.article.aggregate({$project:{author:1,title:1,tags:1}},{$unwind:"$title"})

Error: Printing Stack Trace
    at printStackTrace (src/mongo/shell/utils.js:37:15)
    at DBCollection.aggregate (src/mongo/shell/collection.js:897:9)
    at (shell):1:12
Sat Nov 16 19:16:54.488 JavaScript execution failed: aggregate failed: {
        "errmsg" : "exception: $unwind: value at end of field path must be an array",
        "code" : 15978,
        "ok" : 0
} at src/mongo/shell/collection.js:L898

d. 如果$unwind目标字段数组为空的话，该文档也将会被忽略。

6.$group 对数据进行分组

$group的时候必须要指定一个_id域，同时也可以包含一些算术类型的表达式操作符：

db.article.aggregate(
    { $group : {
        _id : "$author",
        docsPerAuthor : { $sum : 1 },
        viewsPerAuthor : { $sum : "$pageViews" }
    }});

注意： 1.$group的输出是无序的。

2.$group操作目前是在内存中进行的，所以不能用它来对大量个数的文档进行分组。

7.$sort : 对文档按照指定字段排序

使用方式如下：

    db.users.aggregate( { $sort : { age : -1, posts: 1 } });

按照年龄进行降序操作，按照posts进行升序操作

注意：1.如果将$sort放到管道前面的话可以利用索引，提高效率

2.MongoDB 24.对内存做了优化，在管道中如果$sort出现在$limit之前的话，$sort只会对前$limit个文档进行操作，这样在内存中也只会保留前$limit个文档，从而可以极大的节省内存

3.$sort操作是在内存中进行的，如果其占有的内存超过物理内存的10%，程序会产生错误

8.$goNear

$goNear会返回一些坐标值，这些值以按照距离指定点距离由近到远进行排序

具体使用参数见下表:

Field	Type	Description
`near`	GeoJSON point orlegacy coordinate pairs	The point for which to find the closest documents.
`distanceField`	string	The output field that contains the calculated distance. To specify a field within a subdocument, use dot notation.
`limit`	number	Optional. The maximum number of documents to return. The default value is `100`. See also the `num` option.
`num`	number	Optional. The `num` option provides the same function as the `limit`option. Both define the maximum number of documents to return. If both options are included, the `num` value overrides the `limit` value.
`maxDistance`	number	Optional. A distance from the center point. Specify the distance in radians. MongoDB limits the results to those documents that fall within the specified distance from the center point.
`query`	document	Optional. Limits the results to the documents that match the query. The query syntax is the usual MongoDB read operation query syntax.
`spherical`	Boolean	Optional. If `true`, MongoDB references points using a spherical surface. The default value is `false`.
`distanceMultiplier`	number	Optional. The factor to multiply all distances returned by the query. For example, use the `distanceMultiplier` to convert radians, as returned by a spherical query, to kilometers by multiplying by the radius of the Earth.
`includeLocs`	string	Optional. This specifies the output field that identifies the location used to calculate the distance. This option is useful when a location field contains multiple locations. To specify a field within a subdocument, usedot notation.
`uniqueDocs`	Boolean	Optional. If this value is `true`, the query returns a matching document once, even if more than one of the document’s location fields match the query. If this value is `false`, the query returns a document multiple times if the document has multiple matching location fields. See `$uniqueDocs`for more information.

例如：

db.places.aggregate([
                      {
                        $geoNear: {
                                    near: [40.724, -73.997],
                                    distanceField: "dist.calculated",
                                    maxDistance: 0.008,
                                    query: { type: "public" },
                                    includeLocs: "dist.location",
                                    uniqueDocs: true,
                                    num: 5
                                  }
                      }
                   ])

其结果为：

{
  "result" : [
               { "_id" : 7,
                 "name" : "Washington Square",
                 "type" : "public",
                 "location" : [
                                [ 40.731, -73.999 ],
                                [ 40.732, -73.998 ],
                                [ 40.730, -73.995 ],
                                [ 40.729, -73.996 ]
                              ],
                 "dist" : {
                            "calculated" : 0.0050990195135962296,
                            "location" : [ 40.729, -73.996 ]
                          }
               },
               { "_id" : 8,
                 "name" : "Sara D. Roosevelt Park",
                 "type" : "public",
                 "location" : [
                                [ 40.723, -73.991 ],
                                [ 40.723, -73.990 ],
                                [ 40.715, -73.994 ],
                                [ 40.715, -73.994 ]
                              ],
                 "dist" : {
                            "calculated" : 0.006082762530298062,
                            "location" : [ 40.723, -73.991 ]
                          }
               }
             ],
  "ok" : 1}

其中，dist.calculated中包含了计算的结果，而dist.location中包含了计算距离时实际用到的坐标

注意： 1.使用$goNear只能在管道处理的开始第一个阶段进行

2.必须指定distanceField，该字段用来决定是否包含距离字段

3.$gonNear和geoNear命令比较相似，但是也有一些不同:distanceField在$geoNear中是必选的，而在geoNear中是可选的；includeLocs在$geoNear中是string类型，而在geoNear中是boolen类型。

三管道表达式

      管道操作符作为“键”,所对应的“值”叫做管道表达式。例如上面例子中{$match:{status:"A"}}，$match称为管道操作符，而{status:"A"}称为管道表达式，它可以看做是管道操作符的操作数(Operand)，每个管道表达式是一个文档结构，它是由字段名、字段值、和一些表达式操作符组成的，例如上面例子中管道表达式就包含了一个表达式操作符$sum进行累加求和。

      每个管道表达式只能作用于处理当前正在处理的文档，而不能进行跨文档的操作。管道表达式对文档的处理都是在内存中进行的。除了能够进行累加计算的管道表达式外，其他的表达式都是无状态的，也就是不会保留上下文的信息。累加性质的表达式操作符通常和$group操作符一起使用，来统计该组内最大值、最小值等，例如上面的例子中我们在$group管道操作符中使用了具有累加的$sum来计算总和。

除了$sum以为，还有以下性质的表达式操作符：

组聚合操作符

Name	Description
`$addToSet`	Returns an array of all the unique values for the selected field among for each document in that group.
`$first`	Returns the first value in a group.
`$last`	Returns the last value in a group.
`$max`	Returns the highest value in a group.
`$min`	Returns the lowest value in a group.
`$avg`	Returns an average of all the values in a group.
`$push`	Returns an array of all values for the selected field among for each document in that group.
`$sum`	Returns the sum of all the values in a group.

Bool类型聚合操作符

Name	Description
`$and`	Returns true only when all values in its input array are true.
`$or`	Returns true when any value in its input array are true.
`$not`	Returns the boolean value that is the opposite of the input value.

比较类型聚合操作符

Name	Description
`$cmp`	Compares two values and returns the result of the comparison as an integer.
`$eq`	Takes two values and returns true if the values are equivalent.
`$gt`	Takes two values and returns true if the first is larger than the second.
`$gte`	Takes two values and returns true if the first is larger than or equal to the second.
`$lt`	Takes two values and returns true if the second value is larger than the first.
`$lte`	Takes two values and returns true if the second value is larger than or equal to the first.
`$ne`	Takes two values and returns true if the values are not equivalent.

算术类型聚合操作符

Name	Description
`$add`	Computes the sum of an array of numbers.
`$divide`	Takes two numbers and divides the first number by the second.
`$mod`	Takes two numbers and calcualtes the modulo of the first number divided by the second.
`$multiply`	Computes the product of an array of numbers.
`$subtract`	Takes two numbers and subtracts the second number from the first.

字符串类型聚合操作符

Name	Description
`$concat`	Concatenates two strings.
`$strcasecmp`	Compares two strings and returns an integer that reflects the comparison.
`$substr`	Takes a string and returns portion of that string.
`$toLower`	Converts a string to lowercase.
`$toUpper`	Converts a string to uppercase.

日期类型聚合操作符

Name	Description
`$dayOfYear`	Converts a date to a number between 1 and 366.
`$dayOfMonth`	Converts a date to a number between 1 and 31.
`$dayOfWeek`	Converts a date to a number between 1 and 7.
`$year`	Converts a date to the full year.
`$month`	Converts a date into a number between 1 and 12.
`$week`	Converts a date into a number between 0 and 53
`$hour`	Converts a date into a number between 0 and 23.
`$minute`	Converts a date into a number between 0 and 59.
`$second`	Converts a date into a number between 0 and 59. May be 60 to account for leap seconds.
`$millisecond`	Returns the millisecond portion of a date as an integer between 0 and 999.

条件类型聚合操作符

Name	Description
`$cond`	A ternary operator that evaluates one expression, and depending on the result returns the value of one following expressions.
`$ifNull`	Evaluates an expression and returns a value.

注：以上操作符都必须在管道操作符的表达式内来使用。

各个表达式操作符的具体使用方式参见：

http://docs.mongodb.org /manual/reference/operator/aggregation-group/

四总结

管道是MongoDB新引入的聚合框架，它使用了大量的管道操作符来固定聚合的接口，每种管道操作符中又可以包含丰富的表达式操作符，每种操作符都有其特定的功能，只有在理解这些操作符使用方法的基础上，才可以写出正确的管道聚合程序。

下一节，将详细介绍聚合管道的代码编写。

补充 Linux shell中管道概念

POSIX多线程的使用方式中，有一种很重要的方式-----流水线（亦称为“管道”）方式，“数据元素”流串行地被一组线程按顺序执行。它的使用架构可参考下图：

以面向对象的思想去理解，整个流水线，可以理解为一个数据传输的管道；该管道中的每一个工作线程，可以理解为一个整个流水线的一个工作阶段stage,这些工作线程之间的合作是一环扣一环的。靠输入口越近的工作线程，是时序较早的工作阶段stage,它的工作成果会影响下一个工作线程阶段（stage）的工作结果,即下个阶段依赖于上一个阶段的输出，上一个阶段的输出成为本阶段的输入。这也是pipeline的一个共有特点！

一聚合管道的优化

1.$sort + $skip + $limit顺序优化

如果在执行管道聚合时，如果$sort、$skip、$limit依次出现的话，例如：

{ $sort : { age : - 1 } },

{ $skip : 10 },

{ $limit : 5 }

那么实际执行的顺序为：

{ $sort : { age : - 1 } },

{ $limit : 15 },

{ $skip : 10 }

$limit会提前到$skip前面去执行。

此时$limit = 优化前$skip+优化前$limit

这样做的好处有两个:1.在经过$limit管道后，管道内的文档数量个数会“提前”减小，这样会节省内存，提高内存利用效率。2.$limit提前后，$sort紧邻$limit这样的话，当进行$sort的时候当得到前“$limit”个文档的时候就会停止。

2.$limit + $skip + $limit + $skip Sequence Optimization

如果聚合管道内反复出现下面的聚合序列：

{ $limit : 100 },

{ $skip : 5 },

{ $limit : 10 },

{ $skip : 2 }

首先进行局部优化为：可以按照上面所讲的先将第二个$limit提前：

{ $limit : 100 },

{ $limit : 15 },

{ $skip : 5 },

{ $skip : 2 }

进一步优化：两个$limit可以直接取最小值，两个$skip可以直接相加:

{ $limit : 15 },

{ $skip : 7 }

3. Projection Optimization

过早的使用$project投影，设置需要使用的字段，去掉不用的字段，可以大大减少内存。除此之外也可以过早使用

我们也应该过早使用$match、$limit、$skip操作符，他们可以提前减少管道内文档数量，减少内存占用，提供聚合效率。

除此之外，$match尽量放到聚合的第一个阶段，如果这样的话$match相当于一个按条件查询的语句，这样的话可以使用索引，加快查询效率。

二聚合管道的限制

1.类型限制

在管道内不能操作 Symbol , MinKey , MaxKey , DBRef , Code , CodeWScope 类型的数据( 2.4版本解除了对二进制数据的限制).

2.结果大小限制

管道线的输出结果不能超过BSON 文档的大小（16M),如果超出的话会产生错误.

3.内存限制

如果一个管道操作符在执行的过程中所占有的内存超过系统内存容量的10%的时候，会产生一个错误。

当$sort和$group操作符执行的时候，整个输入都会被加载到内存中，如果这些占有内存超过系统内存的%5的时候，会将一个warning记录到日志文件。同样，所占有的内存超过系统内存容量的10%的时候，会产生一个错误。

三分片上使用聚合管道

聚合管道支持在已分片的集合上进行聚合操作。当分片集合上进行聚合操纵的时候，聚合管道被分为两成两个部分，分别在mongod实例和mongos上进行操作。

四聚合管道使用

首先下载测试数据: http://media.mongodb.org/zips.json 并导入到数据库中。

1.查询人口树大于一千万的州的名字

> db.zipcode.aggregate({$group:{_id:"$state",totalPop:{$sum:"$pop"}}},

{$match:{totalPop:{$gte:10*1000*1000}}},

{$sort:{_id:1}})

{

"result" : [

{

"_id" : "CA",

"totalPop" : 29760021

{

"_id" : "FL",

"totalPop" : 12937926

{

"_id" : "IL",

"totalPop" : 11430602

{

"_id" : "NY",

"totalPop" : 17990455

{

"_id" : "OH",

"totalPop" : 10847115

{

"_id" : "PA",

"totalPop" : 11881643

{

"_id" : "TX",

"totalPop" : 16986510

}

"ok" : 1

}

2.计算每个州平均每个城市打人口数

> db.zipcode.aggregate({$group:{_id:{state:"$state",city:"$city"},pop:{$sum:"$pop"}}},

{$group:{_id:"$_id.state",avCityPop:{$avg:"$pop"}}},

{$sort:{_id:1}})

{

"result" : [

{

"_id" : "AK",

"avCityPop" : 2989.3641304347825

{

"_id" : "AL",

"avCityPop" : 7907.2152641878665

{

"_id" : "AR",

"avCityPop" : 4175.355239786856

{

"_id" : "AZ",

"avCityPop" : 20591.16853932584

{

"_id" : "CA",

"avCityPop" : 27581.113067655235

{

"_id" : "CO",

"avCityPop" : 9922.873493975903

{

"_id" : "CT",

"avCityPop" : 14674.625

{

"_id" : "DC",

"avCityPop" : 303450

{

"_id" : "DE",

"avCityPop" : 14481.91304347826

{

"_id" : "FL",

"avCityPop" : 26676.136082474226

………………

{

"_id" : "WI",

"avCityPop" : 7323.00748502994

{

"_id" : "WV",

"avCityPop" : 2759.1953846153847

{

"_id" : "WY",

"avCityPop" : 3359.911111111111

}

"ok" : 1

}

3.计算每个州人口最多和最少的城市名字

>db.zipcode.aggregate({$group:{_id:{state:"$state",city:"$city"},pop:{$sum:"$pop"}}},

{$sort:{pop:1}},

{$group:{_id:"$_id.state",biggestCity:{$last:"$_id.city"},biggestPop:{$last:"$pop"},smallestCity:{$first:"$_id.city"},smallestPop:{$first:"$pop"}}},

{$project:{_id:0,state:"$_id",biggestCity:{name:"$biggestCity",pop:"$biggestPop"},smallestCity:{name:"$smallestCity",pop:"$smallestPop"}}})

{

"result" : [

"biggestCity" : {

"name" : "GRAND FORKS",

"pop" : 59527

"smallestCity" : {

"name" : "TROTTERS",

"pop" : 12

"state" : "ND"

…………………

………………...

{

"biggestCity" : {

"name" : "WASHINGTON",

"pop" : 606879

"smallestCity" : {

"name" : "PENTAGON",

"pop" : 21

"state" : "DC"

{

"biggestCity" : {

"name" : "DENVER",

"pop" : 451182

"smallestCity" : {

"name" : "CHEYENNE MTN AFB",

"pop" : 0

"state" : "CO"

}

"ok" : 1

}

五总结

对于大多数的聚合操作，聚合管道可以提供很好的性能和一致的接口，使用起来比较简单，和MapReduce一样，它也可以作用于分片集合，但是输出的结果只能保留在一个文档中，要遵守BSON Document大小限制（当前是16M)。

管道对数据的类型和结果的大小会有一些限制，对于一些简单的固定的聚集操作可以使用管道，但是对于一些复杂的、大量数据集的聚合任务还是使用MapReduce。

MongoDB 2.1 多了新Feature - Aggregation Framework。最近工作需要就稍微看了下，Mark之。

Overview

Aggregation 提供的功能map-reduce也能做(诸如统计平均值,求和等)。官方那个大胖子说这东西比map-reduce简单, map-reduce 我没用过, 不过从使用Aggregation的情况来看, 进行统计等操作还是蛮方便的。

总体而言，Aggregation就是类似 Unix-like中的管道的概念，可以将很多数据流串起来，不同的数据处理阶段可以再上一个阶段的基础上再次加工。

Pipeline-Operator

比较常用的有：

•$project - 可以重构数据

•$match - 可以实现类似query的功能

•$limit - 限制返回个数，你懂的

•$skip - 同上

•$unwind - 可以将一个包含数组的文档切分成多个, 比如你的文档有中有个数组字段 A, A中有10个元素, 那么经过 $unwind处理后会产生10个文档，这些文档只有字段 A不同

•$group - 统计操作，还提供了一系列子命令

–$avg, $sum …

•$sort - 排序

Usage - Java

我在db中造了些数据(数据时随机生成的, 能用即可)，没有建索引，文档结构如下：

 
             01 
             Document结构: 
           
             02 
               { 
           
             03 
                "_id" : ObjectId("509944545"), 
           
             04 
                "province" : "海南", 
           
             05 
                "age" : 21, 
           
             06 
                "subjects" : [ 
           
             07 
                 { 
           
             08 
                 "name"："语文", 
           
             09 
                 "score" : 53 
           
             10 
                 }, 
           
             11 
                 { 
           
             12 
                 "name"："数学", 
           
             13 
                 "score" : 27 
           
             14 
                 }, 
           
             15 
                 { 
           
             16 
                 "name"："英语", 
           
             17 
                 "score" : 35 
           
             18 
                 } 
           
             19 
                  ], 
           
             20 
                "name" : "刘雨" 
           
             21 
               }

接下来要实现两个功能：

统计上海学生平均年龄

统计每个省各科平均成绩

接下来一一道来

统计上海学生平均年龄

从这个需求来讲，要实现功能要有几个步骤: 1. 找出上海的学生. 2. 统计平均年龄 (当然也可以先算出所有省份的平均值再找出上海的)。如此思路也就清晰了

首先上 $match, 取出上海学生

 
               1 
               {$match:{'province':'上海'}}

接下来用 $group 统计平均年龄

 
               1 
               {$group:{_id:’$province’,$avg:’$age’}}

$avg 是 $group的子命令，用于求平均值，类似的还有 $sum, $max ....

上面两个命令等价于

 
               1 
               select province, avg(age) 
             
               2 
                from student 
             
               3 
                where province = '上海' 
             
               4 
                group by province

下面是Java代码

 
               01 
               Mongo m = new Mongo("localhost", 27017); 
             
               02 
                DB db = m.getDB("test"); 
             
               03 
                DBCollection coll = db.getCollection("student"); 
             
               04 
                 
               05 
                /*创建 $match, 作用相当于query*/ 
             
               06 
                DBObject match = new BasicDBObject("$match", new BasicDBObject("province", "上海")); 
             
               07 
                  
               08 
                /* Group操作*/ 
             
               09 
                DBObject groupFields = new BasicDBObject("_id", "$province"); 
             
               10 
                groupFields.put("AvgAge", new BasicDBObject("$avg", "$age")); 
             
               11 
                DBObject group = new BasicDBObject("$group", groupFields); 
             
               12 
                  
               13 
                /* 查看Group结果 */ 
             
               14 
                AggregationOutput output = coll.aggregate(match, group); // 执行 aggregation命令 
             
               15 
                System.out.println(output.getCommandResult());

输出结果：

 
               1 
               { "serverUsed" : "localhost/127.0.0.1:27017" ,        
             
               2 
                 "result" : [ 
             
               3 
                   { "_id" : "上海" , "AvgAge" : 32.09375} 
             
               4 
                   ] ,          
             
               5 
                  "ok" : 1.0 
             
               6 
                }

如此工程就结束了，再看另外一个需求

统计每个省各科平均成绩

首先更具数据库文档结构，subjects是数组形式，需要先‘劈’开，然后再进行统计

主要处理步骤如下：

1. 先用$unwind 拆数组 2. 按照 province, subject 分租并求各科目平均分

$unwind 拆数组

 
               1 
               {$unwind:’$subjects’}

按照 province, subject 分组，并求平均分

 
               1 
               {$group:{ 
             
               2 
                    _id:{ 
             
               3 
                        subjname:”$subjects.name”,   // 指定group字段之一 subjects.name, 并重命名为 subjname 
             
               4 
                        province:’$province’         // 指定group字段之一 province, 并重命名为 province(没变) 
             
               5 
                     }, 
             
               6 
                    AvgScore:{ 
             
               7 
                       $avg:”$subjects.score”        // 对 subjects.score 求平均 
             
               8 
                    } 
             
               9 
                }

java代码如下:

 
               01 
               Mongo m = new Mongo("localhost", 27017); 
             
               02 
                DB db = m.getDB("test"); 
             
               03 
                DBCollection coll = db.getCollection("student"); 
             
               04 
                  
               05 
                /* 创建 $unwind 操作, 用于切分数组*/ 
             
               06 
                DBObject unwind = new BasicDBObject("$unwind", "$subjects"); 
             
               07 
                  
               08 
                /* Group操作*/ 
             
               09 
                DBObject groupFields = new BasicDBObject("_id", new BasicDBObject("subjname", "$subjects.name").append("province", "$province")); 
             
               10 
                groupFields.put("AvgScore", new BasicDBObject("$avg", "$subjects.scores")); 
             
               11 
                DBObject group = new BasicDBObject("$group", groupFields); 
             
               12 
                 
               13 
                /* 查看Group结果 */ 
             
               14 
                AggregationOutput output = coll.aggregate(unwind, group);  // 执行 aggregation命令 
             
               15 
                System.out.println(output.getCommandResult());

输出结果

 
               01 
               { "serverUsed" : "localhost/127.0.0.1:27017" , 
             
               02 
                   "result" : [ 
             
               03 
                     { "_id" : { "subjname" : "英语" , "province" : "海南"} , "AvgScore" : 58.1} , 
             
               04 
                     { "_id" : { "subjname" : "数学" , "province" : "海南"} , "AvgScore" : 60.485} , 
             
               05 
                     { "_id" : { "subjname" : "语文" , "province" : "江西"} , "AvgScore" : 55.538} , 
             
               06 
                     { "_id" : { "subjname" : "英语" , "province" : "上海"} , "AvgScore" : 57.65625} , 
             
               07 
                     { "_id" : { "subjname" : "数学" , "province" : "广东"} , "AvgScore" : 56.690} , 
             
               08 
                     { "_id" : { "subjname" : "数学" , "province" : "上海"} , "AvgScore" : 55.671875, 
             
               09 
                     { "_id" : { "subjname" : "语文" , "province" : "上海"} , "AvgScore" : 56.734375, 
             
               10 
                     { "_id" : { "subjname" : "英语" , "province" : "云南"} , "AvgScore" : 55.7301 } , 
             
               11 
                     . 
             
               12 
                     . 
             
               13 
                     . 
             
               14 
                     . 
             
               15 
                    "ok" : 1.0 
             
               16 
                }

统计就此结束.... 稍等，似乎有点太粗糙了，虽然统计出来的，但是根本没法看，同一个省份的科目都不在一起。囧

接下来进行下加强,

支线任务：将同一省份的科目成绩统计到一起( 即，期望 'province':'xxxxx', avgscores:[ {'xxx':xxx}, ....] 这样的形式)

要做的有一件事，在前面的统计结果的基础上，先用 $project 将平均分和成绩揉到一起，即形如下面的样子

 
               1 
               { "subjinfo" : { "subjname" : "英语" ,"AvgScores" : 58.1 } ,"province" : "海南" }

再按省份group，将各科目的平均分push到一块，命令如下：

$project 重构group结果

 
               1 
               {$project：{province:"$_id.province", subjinfo:{"subjname":"$_id.subjname", "avgscore":"$AvgScore"}}

$使用 group 再次分组

 
               1 
               {$group:{_id:"$province", avginfo:{$push:"$subjinfo"}}}

java 代码如下：

 
               01 
               Mongo m = new Mongo("localhost", 27017); 
             
               02 
               DB db = m.getDB("test"); 
             
               03 
               DBCollection coll = db.getCollection("student"); 
             
               04 
                             
               05 
               /* 创建 $unwind 操作, 用于切分数组*/ 
             
               06 
               DBObject unwind = new BasicDBObject("$unwind", "$subjects"); 
             
               07 
                             
               08 
               /* Group操作*/ 
             
               09 
               DBObject groupFields = new BasicDBObject("_id", new BasicDBObject("subjname", "$subjects.name").append("province", "$province")); 
             
               10 
               groupFields.put("AvgScore", new BasicDBObject("$avg", "$subjects.scores")); 
             
               11 
               DBObject group = new BasicDBObject("$group", groupFields); 
             
               12 
                             
               13 
               /* Reshape Group Result*/ 
             
               14 
               DBObject projectFields = new BasicDBObject(); 
             
               15 
               projectFields.put("province", "$_id.province"); 
             
               16 
               projectFields.put("subjinfo", new BasicDBObject("subjname","$_id.subjname").append("avgscore", "$AvgScore")); 
             
               17 
               DBObject project = new BasicDBObject("$project", projectFields); 
             
               18 
                             
               19 
               /* 将结果push到一起*/ 
             
               20 
               DBObject groupAgainFields = new BasicDBObject("_id", "$province"); 
             
               21 
               groupAgainFields.put("avginfo", new BasicDBObject("$push", "$subjinfo")); 
             
               22 
               DBObject reshapeGroup = new BasicDBObject("$group", groupAgainFields); 
             
               23 
                  
               24 
               /* 查看Group结果 */ 
             
               25 
               AggregationOutput output = coll.aggregate(unwind, group, project, reshapeGroup); 
             
               26 
               System.out.println(output.getCommandResult());

结果如下：

 
               01 
               { "serverUsed" : "localhost/127.0.0.1:27017" , 
             
               02 
                 "result" : [ 
             
               03 
                      { "_id" : "辽宁" , "avginfo" : [ { "subjname" : "数学" , "avgscore" : 56.46666666666667} , { "subjname" : "英语" , "avgscore"

你可能感兴趣的:(MongoDB,mongodb)

MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
springboot整合MongoDB时碰到的问题生产队队长 Database Spring All mongodb spring
1.账号总是不对，导致查不出数据，报错Auth…权鉴错误这次，我也是第一次接触MongoDB，非常的生疏springboot整合MongoDB，要在properties文件中配置账号mongodb基本语法：useDATABASE_NAME;--创建数据库showdbs;--查看我们所有的库，注意，我们刚创建的库，如果没有数据，是不会被显示的showusers;--查看当前库所有拥有的账号db.cr
java mongodb group分组使用 yank1225 mongodb java mongodb group
mongodb的关键字及介绍.mongodb的查询是有一定规则的,刚开始接触老是各种错误,参照以下内容有很多帮助https://docs.mongodb.com/manual/reference/sql-aggregation-comparison/另外出现这种错误时Apipelinestagespecificationobjectmustcontainexactlyonefield是因为条件不对
MongoDB Atlas与LangChain集成指南 afTFODguAKBF mongodb langchain 数据库 python
引言MongoDBAtlas是一款全托管的云数据库解决方案,可在AWS、Azure和GCP上使用。最新版本支持在MongoDB文档数据上进行原生向量搜索。本文将介绍如何使用LangChain将MongoDBAtlas与语言模型集成,以实现高效的向量搜索和语义缓存。安装和设置1.安装langchain-mongodb包pipinstalllangchain-mongodb向量存储LangChain提
数据库管理的利器Navicat —— 全面测评与热门产品推荐界面开发小八哥数据库 Navicat 数据库开发 sql mysql
在数据库管理领域，Navicat无疑是一款深受欢迎的软件。作为一个强大的数据库管理和开发工具，它支持多种数据库类型，包括MySQL、MariaDB、MongoDB、SQLServer、Oracle、PostgreSQL等。本文将全面测评Navicat的核心功能，同时推荐几款热门的Navicat产品。Navicat的主要特点1.跨平台支持：Navicat支持Windows、Mac和Linux平台，可
MongoDB C++库编译，windows平台+VS2015（QT中也可以用） hp_cpp C++
编译准备工作：（1）mongo-c-driver下载地址：https://github.com/mongodb/mongo-c-driver/releases下载最新版：mongo-c-driver1.12.0的Soucecode版（2）mongodb/mongo-cxx-driver下载地址：https://github.com/mongodb/mongo-cxx-driver/releases
使用docker部署MongoDB数据库数据小白的进阶之路数据库 docker mongodb
最近由于工作需要搭建MongoDB数据库：将解析的车端采集的数据写入到数据库，由于MongoDB高可用、海量扩展、灵活数据的模型，因此选用MongoDB数据库；由于现公司只有服务器，因此考虑容器化部署MongoDB数据，特此记录一下~一、镜像拉取使用如下命令拉取最新MongoDB镜像dockerpullmongo二、创建MongoDB容器2.1创建宿主机目录执行如下代码：mkdir-p/home/
MongoDB数据库 weixin_34104341 数据库 json shell
一简介MongoDB是一款强大、灵活、且易于扩展的通用型数据库1.易用性MongoDB是一个面向文档（document-oriented）的数据库，而不是关系型数据库。不采用关系型主要是为了获得更好得扩展性。当然还有一些其他好处，与关系数据库相比，面向文档的数据库不再有“行“（row）的概念取而代之的是更为灵活的“文档”（document）模型。通过在文档中嵌入文档和数组，面向文档的方法能够仅使用
【Docker】MongoDB 容器化部署轻云UC 运维部署 mongodb docker 数据库
MongoDBdocker容器化部署MongoDB标准软件基于BitnamiMongoDB构建。当前版本未7.0.5你可以通过轻云UC部署工具直接安装部署，也可以手动按如下文档操作配置文件地址:https://gitee.com/qingplus/qingcloud-platformQinghubStudio在线体验初始化一个新实例使用Docker容器网络，应用程序容器可以轻松访问容器内运行的Mo
MongoDB ：第五章：MongoDB 插入更新删除查询文档 2401_84558091 作者\/mongodb 数据库
“_id”:ObjectId(“56064f89ade2f21f36b03136”),“title”:“MongoDB”,“description”:“MongoDB是一个Nosql数据库”,“by”:“菜鸟教程”,“url”:“http://www.runoob.com”,“tags”:[“mongodb”,“database”,“NoSQL”],“likes”:100}可以看到标题(title
数据库有关c语言 h海棠溪数据库学习 c语言 linux
数据库的概念SQL（StructuredQueryLanguage）是一种专门用来与数据库进行交互的编程语言，它允许用户查询、更新和管理关系型数据库中的数据。关系型数据库是基于表（Table）的数据库，其中表由行（Row）和列（Column）组成，每一行代表一个记录（Record），每一列代表一个字段（Field）。非关系型数据库MongoDB1、分类：大型中型小型ORACLEMYSQL/MSSQ
使用 MongoDB 构建 AI：Patronus 如何自动进行大语言模型评估来增强对生成式 AI 的信心 MongoDB 数据平台 AI应用客户案例人工智能 mongodb
大语言模型可能不可靠，这几乎算不上头条新闻。对于某些用例，这可能会带来不便。而对于其他行业，尤其是受监管行业，后果则要严重得多。于是，业内首个大语言模型自动评估平台PatronusAI应运而生。PatronusAI由MetaAI和MetaRealityLabs的机器学习专家创立，旨在增强企业对生成式AI应用程序的信心，在塑造值得信赖的AI生态方面处于领先地位。Patronus联合创始人兼首席技术官
MongoDB-副本集PSA架构搭建配置手册玩亚索的小孔 MongoDB MongoDB 副本集 PSA
1安装配置------------------------------------------------------------------------------------机器准备：•系统：RedHatEnterpriseLinuxServerrelease7.3(Maipo)•MongoDB版本：mongodb-linux-x86_64-rhel70-3.4.16•下载地址:http://
解决方案| MongoDB PSA 架构痛点以及如何应对？ MongoDB中文社区 MongoDB mongodb 架构数据库
一.背景最近MongoDB群里面有群友遇到2次重启MongoDB后一直处于实例恢复状态(应用OPLOG)，多达几天甚至更长才完成重启，通常MongoDB副本集三个实例作为标准，重启主库会发生重新选出新主节点(通常在12s内完成)重新对外服务，通常不符合官方标准化或者内部发生异常导致的。经过了解副本集采用PSA架构且存在一个数据从节点不可达的情况(甚至有的从节点宕机几个月没有发现)，来分析这些情况以
MongoDB之写关注及PSA架构相关问题吃饭端住碗 MongoDB mongodb 架构数据库
MongoDB的写关注主要指定了写入操作的确认级别。具体来讲就是客户端在向MongoDB执行比如delete、insert、update等相关写入操作时，MongoDB的写入行为，比如是否立刻刷盘、是否需要等待Secondary节点确认等。写关注说明写关注配置主要包含以下3个字段：{w:,j:,wtimeout:}w选项指定了写入操作需要等待确认的副本集成员个数。取值如下：“majority”：写
mongoDB 对一个做了索引的字段，要不要给默认值？ hongkid mongodb 数据库
引言在设计数据库模式时，如何处理字段的默认值是一个值得深入探讨的话题。对于MongoDB这样的NoSQL数据库来说，灵活性是其一大特点，但这同时也意味着开发者需要更加谨慎地考虑数据的一致性和完整性。本文将探讨在一个已创建索引的字段上，在插入文档时是否应该显式设置默认值的问题，并给出具体的建议。MongoDB中的索引与字段设置在MongoDB中，索引可以帮助提高查询性能，特别是在处理大规模数据集时。
MongoDB-聚合查询操作介绍侯晓阳丶 MongoDB mongodb 数据库 linux dba 经验分享
目录前言db.collection.aggregate()db.collection.aggregate()示例一db.collection.aggregate()示例二复杂的聚合操作通过mongoimport导入测试数据复杂的聚合操作示例聚合操作的偏好设置-project函数聚合操作的偏好设置-unwind函数前言MongoDB聚合操作相当于关系型数据库SQL语句的"groupby"、“orde
Docker搭建MongoDB Replica Set高可用集群+数据丢失&被黑解决+自动备份与恢复脚本+持久化慢查询记录秋风お亦冷运维企业实战笔录运维 docker mongodb 数据库
文章目录引节点规划配置文件创建持久化目录创建并推送证书启动临时容器修改配置文件单节点参考mongod.confdocker-compose.ymlReplicaSet参考mongod.confdocker-compose.yml部署与配置部署集群配置集群验证集群增删节点增加节点删除节点查看节点常用命令重置集群备份数据关闭服务删除持久化数据启动集群配置集群验证集群创建用户验证集群用户管理权限说明创建
vue+jsonrpc+mongoDB文件传输解决方案（任意格式文件） weideng_san 前端 java 文件传输 jsonrpc mongoDB vue
环境及需求：前端采用vue；后端采用spring，但是只用到了spring的对象注入功能，未使用springweb相关功能。前后端通信采用jsonrpc，现需要在前端选中文件（格式未知，上传到后端，后端将其存储在mongoDB中）。背景：springweb可以直接使用controller接受MultipartFile对象；但是jsonrpc不能直接传输文件类型，jsonrpc是轻量级通信框架，擅长
mongodb 在 Windows 环境下迁移数据库的问题 Eagsen CEO 数据库 mongodb
mongodb是一款非常优秀的文档数据库，它的社区版本是免费的。但是mongodb的迁移和其他传统的关系数据库不太一样，通过官方提供的图形化的客户端工具无法备份和迁移，需要下载命令行工具进行。首先下载命令行工具：DownloadMongoDBCommandLineDatabaseTools|MongoDBWindows安装后，使用管理员身份打开cmd命令窗口，导航到安装目录的bin目录下，如果是默
python网络爬虫（五）——爬取天气预报光电的一只菜鸡 python python 爬虫开发语言
1.注册高德天气key 点击高德天气，然后按照开发者文档完成key注册；作为爬虫练习项目之一。从高德地图json数据接口获取天气，可以获取某省的所有城市天气，高德地图的这个接口还能获取县城的天气。其天气查询API服务地址为https://restapi.amap.com/v3/weather/weatherInfo?parameters，若要获取某城市的天气推荐2.安装MongoDB Mong
Spring常用中间件贺仙姑 spring 中间件 java
1.数据库中间件（1）MySQL:常用的关系型数据库，支持JDBC和JPA。（2）PostgreSQL:功能强大的开源关系型数据库，支持复杂查询。（3）MongoDB:NoSQL数据库，适合存储非结构化数据。（4）Redis:内存数据结构存储，常用于缓存和消息队列。2.消息队列（1）RabbitMQ:开源消息代理，支持多种消息协议，适合异步处理。（2）Kafka:分布式流处理平台，适合处理大规模数
Node.js 数据库操作详解：构建高效的数据持久化层 Switch616 前端 node.js 数据库运维服务器系统架构前端框架前端
Node.js数据库操作详解：构建高效的数据持久化层目录MongoDB使用mongoose连接MongoDB定义模型和数据验证实现CRUD操作️MySQL使用mysql或mysql2模块连接MySQL执行SQL查询处理结果和错误SQLite使用sqlite3模块连接SQLite执行SQL查询处理事务MongoDB使用mongoose连接MongoDBmongoose是一个为MongoDB提供对象数
MongoDB的WiredTiger存储引擎云掣YUNCHE mongodb 数据库
作者：太阳从MongoDB3.2开始，MongoDB实例默认的存储引擎为WiredTiger，WiredTiger存储引擎具体以下几大优点：文档级并发将数据持久化到磁盘快照和checkpoint数据压缩本地数据加密一、文档级别并发1、WiredTiger使用文档级别并发，意味着在同一时间，MongoDB实例允许多个对不同文档间的写操作并发执行（复制应用oplog时同样可以做到文档级并发应用）。2、
mongodb中常用的运算符和正则表达式手搓二十四种设计模式 mongodb
在mongodb中不能>=，----$gt=----$gte<=----$lte!==----$ne例如：查询id比三大的所有记录db.students.find({id:{$gt:3}});2.逻辑运算符：$or逻辑或例如：查询年龄为十岁或九岁的数据db.students.find({$or:[{age:10},{age:9}]});$and逻辑与：例如：查询年龄大于十一岁且小于二十四的db.s
SpringCloud 结合 MongoTemplate 打印执行语句log kikiki1
在调度MongoTemplate的时候，我们无法确定我们写的方法是否能发出正确的语句,这时候我们需要将语句给打印出来。springcloud使用方法在application.yml文件中增加如下配置即可logging:level:org.springframework.data.mongodb.core.MongoTemplate:DEBUG
2024年Python最新Python爬虫教程-新浪微博分布式爬虫分享(2) 2401_84584682 程序员 python 爬虫新浪微博
开发语言：Python2.7开发环境：64位Windows8系统，4G内存，i7-3612QM处理器。数据库：MongoDB3.2.0、Redis3.0.501（Python编辑器：Pycharm；MongoDB管理工具：MongoBooster；Redis管理工具：RedisStudio）爬虫框架使用Scrapy，使用scrapy_redis和Redis实现分布式。分布式中有一台机充当Maste
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他