转mongodb入门

获取数据库

下载数据库, 解包, 运行mongod:

$ bin/mongod

连接数据库

现在我们通过数据库的shell来实际操作一下。（注意：任何编程语言都可以通过合适的驱动进行类似的操作.只不过shell的方式更方便交互操作。）

运行MongoDB JavaScript shell:

$ bin/mongo

(默认情况下shell将连接本机（localhost）的数据库）你会看到:

MongoDB shell version: 0.9.8
url: test
connecting to: test
type "help" for help
>

"connecting to:" 表明shell连接的数据名。要切换数据库:

> use mydb

输入 help 可以看到一个简单的命令列表。

给有其他数据库经验的开发者的提示
在下面的例子中你可能会注意到，我们没有创建数据库和集。MongoDB并不用那么做。一旦你插入内容，MongoDB会建立对应的集和数据库。要是查询了不存在的集，Mongo就将其视为空的集。

向集中插入数据

我们建立一个测试用的集，然后插入一些数据。我们将会新建两个对象 j 和 t , 然后将其存放在 things 集中。

下面的例子中, '>' 表示shell命令提示符

> j = { name: "mongo"};
{"name" : "mongo"}
> t = { x : 3 };
{ "x" : 3 }
> db.things.save(j);
> db.things.save(t);
> db.things.find();
in cursor for : DBQuery: example.things ->
{"name" : "mongo" , "_id" : "497cf60751712cf7758fbdbb"}
{"x" : 3 , "_id" : "497cf61651712cf7758fbdbc"}
>

注意事项：

我们并没有预先定义集。数据库会在第一次插入操作时自动创建集。
我们存储的文档可以拥有任意不同的结构。事实上在本例中，文档之间根本没有共同的数据元素。在实际应用中文档通常都已相同的结构保存在集里面。这种灵活意味着迁移或者扩充都非常容易。几乎不需要写脚本来执行诸如“alter table”之类的操作。
一旦被插入数据库，对象就被分配一个ID（要是还没有的话）存储在 _id 域中
你运行上面的例子时，你的ObjectID的值会有所不同。

下面再往集里面添加一些记录：

> for( var i = 1; i < 10; i++ ) db.things.save( { x:4, j:i } );
> db.things.find();
in cursor for : DBQuery: example.things ->
{"name" : "mongo" , "_id" : "497cf60751712cf7758fbdbb"}
{"x" : 3 , "_id" : "497cf61651712cf7758fbdbc"}
{"x" : 4 , "j" : 1 , "_id" : "497cf87151712cf7758fbdbd"}
{"x" : 4 , "j" : 2 , "_id" : "497cf87151712cf7758fbdbe"}
{"x" : 4 , "j" : 3 , "_id" : "497cf87151712cf7758fbdbf"}
{"x" : 4 , "j" : 4 , "_id" : "497cf87151712cf7758fbdc0"}
{"x" : 4 , "j" : 5 , "_id" : "497cf87151712cf7758fbdc1"}
{"x" : 4 , "j" : 6 , "_id" : "497cf87151712cf7758fbdc2"}
{"x" : 4 , "j" : 7 , "_id" : "497cf87151712cf7758fbdc3"}
{"x" : 4 , "j" : 8 , "_id" : "497cf87151712cf7758fbdc4"}
has more

注意这里并没有列出所有的文档 - shell 会默认显示10个。先前已经有两个文档在集里面了，所以这里只能看见新插入的前8个文档。

要是想接着看结果，可以用 it 。接着上面的例子往下：

{"x" : 4 , "j" : 7 , "_id" : "497cf87151712cf7758fbdc3"}
{"x" : 4 , "j" : 8 , "_id" : "497cf87151712cf7758fbdc4"}
has more
> it
{"x" : 4 , "j" : 9 , "_id" : "497cf87151712cf7758fbdc5"}
{"x" : 4 , "j" : 10 , "_id" : "497cf87151712cf7758fbdc6"}

通常，find()会返回一个游标对象，但是在上面那个例子中，我们并不确定游标是可移动的。所以shell自动的移动游标，并且把初始化后的结果返回给我们，同时允许我们通过"it"命令继续移动游标。

但是我们仍然可以直接使用游标，在下一部分中将讨论如何这样做。

使用查询访问数据

在我们对查询进行深入讨论之前，我们先来看看如何通过一个游标对象操作查询结果。我们将使用简单的find()查询函数，它会返回一个集(表)，并且在随后讨论如何创建一个具体的查询。

在使用mongo shell的时候，为了查看所有集(表)中的数据，我们需要从find()操作中返回一个游标。

然后开始重复相同的查询操作，但是这次我们使用find()返回的游标，并且在while循环中移动游标：

> var cursor = db.things.find();
> while (cursor.hasNext()) { print(tojson(cursor.next())); }
{"name" : "mongo" , "_id" : "497cf60751712cf7758fbdbb"}
{"x" : 3 , "_id" : "497cf61651712cf7758fbdbc"}
{"x" : 4 , "j" : 1 , "_id" : "497cf87151712cf7758fbdbd"}
{"x" : 4 , "j" : 2 , "_id" : "497cf87151712cf7758fbdbe"}
{"x" : 4 , "j" : 3 , "_id" : "497cf87151712cf7758fbdbf"}
{"x" : 4 , "j" : 4 , "_id" : "497cf87151712cf7758fbdc0"}
{"x" : 4 , "j" : 5 , "_id" : "497cf87151712cf7758fbdc1"}
{"x" : 4 , "j" : 6 , "_id" : "497cf87151712cf7758fbdc2"}
{"x" : 4 , "j" : 7 , "_id" : "497cf87151712cf7758fbdc3"}
{"x" : 4 , "j" : 8 , "_id" : "497cf87151712cf7758fbdc4"}
{"x" : 4 , "j" : 9 , "_id" : "497cf87151712cf7758fbdc5"}
>

上述例子展示了一个游标的使用方式，hasNext()函数返回当前的document对象后面是否还有数据，而next()函数则返回一个document对象。同时我们还使用了内嵌的tojson()函数来把document的对象变成JSON数据格式。

这个shell是Javascript的，所以这里还可以享用其语言本身的特性：可以对游标调用 forEach 。还拿上面的例子来说，直接在游标处将循环用 forEach() 换掉了:

> db.things.find().forEach( function(x) { print(tojson(x));});
{"name" : "mongo" , "_id" : "497cf60751712cf7758fbdbb"}
{"x" : 3 , "_id" : "497cf61651712cf7758fbdbc"}
{"x" : 4 , "j" : 1 , "_id" : "497cf87151712cf7758fbdbd"}
{"x" : 4 , "j" : 2 , "_id" : "497cf87151712cf7758fbdbe"}
{"x" : 4 , "j" : 3 , "_id" : "497cf87151712cf7758fbdbf"}
{"x" : 4 , "j" : 4 , "_id" : "497cf87151712cf7758fbdc0"}
{"x" : 4 , "j" : 5 , "_id" : "497cf87151712cf7758fbdc1"}
{"x" : 4 , "j" : 6 , "_id" : "497cf87151712cf7758fbdc2"}
{"x" : 4 , "j" : 7 , "_id" : "497cf87151712cf7758fbdc3"}
{"x" : 4 , "j" : 8 , "_id" : "497cf87151712cf7758fbdc4"}
{"x" : 4 , "j" : 9 , "_id" : "497cf87151712cf7758fbdc5"}
>

在{{forEach()}}里必须定义对游标中的每一个文档的操作函数。

在 mongo shell中，也可以把游标当作数组处理：

> var cursor = db.things.find();
> print (tojson(cursor[4]));
{"x" : 4 , "j" : 3 , "_id" : "497cf87151712cf7758fbdbf"}

当这样使用游标时，注意这会将最大访问数据（上面的例子中的cursor[4]）以下的所有数据都同时加载到内存中。这对大结果非常不合适，会导致内存不够用的。返回结果数量很大时，游标应该作为迭代器使用。

In addition to array-style access to a cursor, you may also convert the cursor to a true array:
除了用数组的风格来操作游标，也可以干脆将游标转换程真正的数组：

> var arr = db.things.find().toArray();
> arr[5];
{"x" : 4 , "j" : 4 , "_id" : "497cf87151712cf7758fbdc0"}
请注意这种数组特性是［］特有的，并不是所有的驱动都支持。
MongoDB游标并不做快照。如果你或者别人在你查询时，确切的说从第一次到最后一次调用 ｛｛next｝｝之间，对数据进行了修改，那么修改可能被返回，也可能不返回。要是想做快照查询的话得使用互斥锁。
h3. 定制查询结果
现在我们知道了如何使用查询返回的游标对象，下面看看如何通过修改查询来定制结果。
通常，可以通过创建一种键值相匹配的”query documents”来实现这个方式。
这些用实例更能说明问题。在下面的例子里，我们将给出SQL查询的例子，并且同时利用MongDB的 [mongo shell|mongo - The Interactive Shell] 实现查询，通过这种方式进行查询对于MongoDB来说是必要的，而且你也会发现其在任何语言环境中的便利性。
{code:title=SELECT * FROM things WHERE name="mongo"}> db.things.find({name:"mongo"}).forEach(function(x) { print(tojson(x));});
{"name" : "mongo" , "_id" : "497cf60751712cf7758fbdbb"}
>

SELECT * FROM things WHERE x=4

> db.things.find({x:4}).forEach(function(x) { print(tojson(x));});
{"x" : 4 , "j" : 1 , "_id" : "497cf87151712cf7758fbdbd"}
{"x" : 4 , "j" : 2 , "_id" : "497cf87151712cf7758fbdbe"}
{"x" : 4 , "j" : 3 , "_id" : "497cf87151712cf7758fbdbf"}
{"x" : 4 , "j" : 4 , "_id" : "497cf87151712cf7758fbdc0"}
{"x" : 4 , "j" : 5 , "_id" : "497cf87151712cf7758fbdc1"}
{"x" : 4 , "j" : 6 , "_id" : "497cf87151712cf7758fbdc2"}
{"x" : 4 , "j" : 7 , "_id" : "497cf87151712cf7758fbdc3"}
{"x" : 4 , "j" : 8 , "_id" : "497cf87151712cf7758fbdc4"}
{"x" : 4 , "j" : 9 , "_id" : "497cf87151712cf7758fbdc5"}
>

查询表达式本身就是一个document对象，如果是一个类似于{a:A, b:B, …}的document查询对象，则表示”where a=A and b=B and…”，更多关于查询的用法，在 Mongo开发者指南的查询与游标章节中。

MongoDB也允许您返回一个”部分document对象”，也就是返回一个数据库中存储的document的子集。您只要通过使用find()函数的第二个参数就可以做到这一点。
例如，我们在上一个 find({x:4}) 的例子中，加一个函数，就能够只返回j列的数据了：

SELECT j FROM things WHERE x=4

> db.things.find({x:4}, {j:true}).forEach(function(x) { print(tojson(x));});
{"j" : 1 , "_id" : "497cf87151712cf7758fbdbd"}
{"j" : 2 , "_id" : "497cf87151712cf7758fbdbe"}
{"j" : 3 , "_id" : "497cf87151712cf7758fbdbf"}
{"j" : 4 , "_id" : "497cf87151712cf7758fbdc0"}
{"j" : 5 , "_id" : "497cf87151712cf7758fbdc1"}
{"j" : 6 , "_id" : "497cf87151712cf7758fbdc2"}
{"j" : 7 , "_id" : "497cf87151712cf7758fbdc3"}
{"j" : 8 , "_id" : "497cf87151712cf7758fbdc4"}
{"j" : 9 , "_id" : "497cf87151712cf7758fbdc5"}
>

Note that the "_id" field is always returned.

需要注意的是"_id"列是每次都要被返回的。

findOne() -

为了方便起见，mongo shell（和其他驱动）能避免让你编程处理游标，你只需要通过findOne（）函数就能获得一个文档。findOne()和find()使用相同的参数，但是它不返回游标，而是从数据库中返回第一个档，或者没有匹配条目时返回null。

例如，我们可以通过很多种方式检索一个名称为’mongo’的document，包括在游标中调用next()函数(当然，要验证完是否为null之后)，或者把游标看做一个数组然后访问数组的[0]下标元素。

无论采用何种方式，findOne()函数还是既方便又高效的：

> var mongo = db.things.findOne({name:"mongo"});
> print(tojson(mongo));
{"name" : "mongo" , "_id" : "497cf60751712cf7758fbdbb"}
>

如果只从数据库返回一个对象，这个方式是更加方便的，并且在数据库和网络传输上有更少的工作需要来做。这种方式等价于find({name:"mongo"}).limit(1)。

使用 limit()

通过 limit() 方法可以指定返回结果的最大数量，这样就能控制查询结果的大小了。

非常推荐使用这种方式，可以提高性能，因为这样减少了数据库的工作量，也减少了网络中的数据流量。举个例子：

> db.things.find().limit(3);
in cursor for : DBQuery: example.things ->
{"name" : "mongo" , "_id" : "497cf60751712cf7758fbdbb"}
{"x" : 3 , "_id" : "497cf61651712cf7758fbdbc"}
{"x" : 4 , "j" : 1 , "_id" : "497cf87151712cf7758fbdbd"}
>