mongodb 学习笔记

mongodb 深入学习笔记

mongodb基本知识

mongodb是介于关系型数据库与非关系型数据库之间的NoSQL,是最像关系型数据库的产品。

  • mongodb支持的查询语言非常强大,几乎可实现类似关系型数据库单表的大部分功能查询,且还可创建索引。
  • mongodb是面向集合的(collection oriented),模式自由(schema free)的文档型数据库。
  • 文件存储格式BSON: Binary Serialized dOcument Notation.
  • mongodb服务端默认端口是27107
  • mongodb是一个可移植的数据库,是一系列与磁盘有关系的物理文件所组成的。
  • mongodb默认的数据目录是/data/db,它负责存储所有的MongoDB的数据文件。

mondodb的每个数据库都包含一个.sn文件和一些数据文件,且这些数据文件会随着数据量的增加越来越多,如有个foo数据库,那么在这个数据库中就会有 foo.sn, foo.1,foo.2等这些文件存在。

  • 可以通过“show dbs” 命令显出所有数据库的列表,“db”命令显示当前数据库对象或集合;“use XXXX”表示连接到一个指定的数据库(XXXX)。

mongodb的逻辑结构

mongodb是一种层次结构,由文档(document),集合(collection),数据库(database)组成。

  • mongodb的文档相当于关系型数据库里的一行记录;
  • 多个文档组合成一个集合相当于关系型数据库里的表;
  • 多个集合逻辑上组织在一起,就是数据库。
  • 一个mongodb实例可支持多个数据库database。

mongodb与关系型数据库对比:

MongoDB 关系型数据库
文档(document) 行(row)
集合(collection) 表(table)
数据库(database) 数据库(database)

mongodb内部有预分配空间的机制,保证在数据量激增的情况下磁盘压力过大的问题。

mongodb文档里的_id

  • 存储在集合中的每个文档里都会有一默认生成的主键_id值,默认是ObjectID数据类型,我们也可以根据实际情况对其进行设置的,但在同个集合中_id值是必须保持唯一的

mongodb命令&操作

  1. 创建数据库:use DATABASE_NAME,如果数据库不存在, 刚创建数据库, 否则切换到指定数据库。
  2. 删除数据库, db.dropDatabase(),删除当前数据库。
  3. 查看所有集合,show collections,显示当前数据库中的集合。
  4. 删除集合, db.collection.drop(), 删除集合。
  5. 插入文档,insert()方法向集合中插入文档,db.COLLECTION_NAME.insert(document),。插入文档也可以用db.collect_name.save(document)命令,如果不指定_id字段,save()方法类似于insert()方法;如果有指定_id字段,则会更新该_id的数据。
  6. 更新文档,用update()与save(),

db.collection.update(, , {upsert: , multi:, writeConcern: })

参数说明:

query : update的查询条件,类似sql update查询内where后面的。

update : update的对象和一些更新的操作符(如$,$inc...)等,也可以理解为sql update查询内set后面的

upsert : 可选,这个参数的意思是,如果不存在update的记录,是否插入objNew,true为插入,默认是false,不插入。

multi : 可选,mongodb 默认是false,只更新找到的第一条记录,如果这个参数为true,就把按条件查出来多条记录全部更新。

writeConcern :可选,抛出异常的级别。

db.collection.save(, {writeConcern:})

参数说明

document: 文档数据

writeConcern:可选,抛出异常的级别

  1. 删除文档,db.collection.remove(, {justOne: , writeConcern:})

参数说明

query:可选,删除的文档的条件

justOne : (可选)如果设为 true 或1,则只删除一个文档。

writeConcern :(可选)抛出异常的级别。

  1. 文档查询, db.collection.find(), 可以通过pretty()使得查询出来的结果排版好看点;db.collection.findOne()只返回一条记录。

MongoDB与关系型数据库where语句对比

操作 格式 范例 RDBMS句型
等于 {:} db.col.find({"id":"wills"}).pretty() where id="wills"
不等于 {: {$ne:}} db.col.find({"id":{$ne:"wills"}}).pretty() where id!="wills"
大于 {:{$gt:}} db.col.find({"id":{$gt:"wills"}}) where id > "wills"
大于等于 {:{$gte:}} db.col.find({"id":{$gte:"wills"}}).pretty() where id>="wills"
小于 {: {$lt:}} db.col.find({"id":{$lt:"wills"}}).pretty() where id<"wills"
小等于 {:{$lte:}} db.col.find({"id":{$lte:"wills"}}) where id <= "wills"
大于且小于 {:{$lt:,$gt:}} db.col.find({"id":{$lt:100,$gt:50}}) where id>50 and id<100

MongoDB里的一些条件查询

  1. AND

db.col.find({key1:value1, key2:value2}).pretty()

  1. OR

db.col.find({$or: [{key1: value1}, {key2:value2} ] } ).pretty()

  1. AND与OR一起用

db.col.find({key1: {$gt:value}, $or: [{key2: value},{key3:value}]}).pretty()

  1. limit(n)

db.col.find().pretty().limit(n) 返回n条查询到的数据

  1. skip(n)

db.col.find().skip(n),跳过n条数据开始查询返回

  1. sort();

db.col.find().sort({key1:1,key2:-1}) ,1表示升序,-1表示降序

  1. ensureIndex() 索引,索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构。

db.col.ensureIndex({KEY:1}) Key 值为你要创建的索引字段,1为指定按升序创建索引,如果你想按降序来创建索引指定为-1即可。

参数 类型 描述
backgrounp boolean 建索引过程会阻塞其它数据库操作,默认值false
unique boolean 建立的索引是否唯一,默认false
name string 索引名字
dropDups boolean 建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false
sparse boolean 对文档中不存在的字段数据不启用索引;这个参数需要特别注意,如果设置为true的话,在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.
expireAfterSeconds integer 指定一个以秒为单位的数值,完成 TTL设定,设定集合的生存时间
v index version 索引版本号
weight document 索引权重值,数值在 1 到 99,999 之间,表示该索引相对于其他索引字段的得分权重
default_language string 对于文本索引,该参数决定了停用词及词干和词器的规则的列表。 默认为英语
language_override string 对于文本索引,该参数指定了包含在文档中的字段名,语言覆盖默认的language,默认值为 language

MongoDB 聚合

MongoDB中聚合(aggregate)主要用于处理数据(统计平均值,求和等),并返回计算后的数据结果,类似sql语句中的count(*)。

db.col.aggregate(options)

参数 描述 实例
$sum 求和 db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg 平均值 db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min 获取集合中所有文档对应值得最小值 db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max 获取集合中所有文档对应值得最大值 db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push 在结果文档中插入值到一个数组中 db.col.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet 在结果文档中插入值到一个数组中,但不创建副本 db.col.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first 根据资源文档的排序获取第一个文档数据 db.col.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$$last 根据资源文档的排序获取最后一个文档数据 db.col.aggregate([{$group : {_id : "$by_user", first_url : {$last : "$url"}}}])

管道的概念

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。
MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。
表达式:处理输入文档并输出。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。
这里我们介绍一下聚合框架中常用的几个操作:

  1. $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
  2. $match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
  3. $limit:用来限制MongoDB聚合管道返回的文档数。
  4. $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
  5. $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
  6. $group:将集合中的文档分组,可用于统计结果。
  7. $sort:将输入文档排序后输出。
  8. $geoNear:输出接近某一地理位置的有序文档。

db.articles.aggregate( [ { $match : { score : { $gt : 70, $lte : 90 } } },{ $group: { _id: null, count: { $sum: 1 } } }] ); $match用于获取分数大于70小于或等于90记录,然后将符合条件的记录送到下一阶段$group管道操作符进行处理

你可能感兴趣的:(mongodb 学习笔记)