MongoDB 第一篇

一、MongoDB 权威指南

亲身经历了在快速发展的大型互联网公司应于MySQL的过程。开始
时只有很少的数据,一台服务器就可以了。然后就得建立备份,以便应对大量
的读取和不时的当季。用不了多久,就得加一个缓存层,调整所有的查询。
投入更多的硬件。

MongoDB是是一款强大、灵活、且易于扩展的通用性数据库。它能扩展出
非常多的功能,如二级索引, 范围查询,排序,聚合,以及地理空间索引

纵向扩展就是适用计算能力更强的机器,而横向扩展就是通过分区将
数据分散到更多的机器上。通常,纵向扩展是最省力的做法,其缺点是大型机
一般都非常昂贵。而且,当数据量达到机器的物理极限时,无论话多少钱也买不到
更强的机器了。

另一个选择是横向扩展;要增加存储空间或提高性能,只需购买一台普通的服务器
并把它添加到集群中就可以了。

横向扩展的缺点就是,维护一个1000个集群的机器,比一个维护一个机器更麻烦。

二、为什么MongoDB 更易于横向扩展呢?

因为MongoDB 的主键不是自增的,所以不会有自增时候的限制。
并且使用类似UUID的方式,更加适用于分布式存储

这里需要研究下UUID的存储

三、MongoDB 提供一个卓越的性能。

MongoDB的一个主要目标是提供卓越的性能。这很大成都上决定了MongoDB的设计。
MongoDB能对文档进行动态填充(dynamic padding),也能预分配数据文件以利用
额外的空间来换取稳定的性能。MongoDB把竟可能多的内存做缓存(cache),
试图在各方面都保持他的卓越性能。

四、MongoDB 不提供

MongoDB 不提供连接(join)和复杂的多行事务(multirow trasaction).
省略这些功能是出于架构上的考虑,因为在分布式系统中这两个功能难以高效的实现

五、MongoDB 存储的特点

  • 文档的键是字符串。

  • 键不能含有\0(空字符串)。这个字符用于表示键的结尾

  • .和$具有特殊意义

  • MongoDB 的文档不能有重复的键。下面的文档就是非法的

{ "greeting": "Hello, world!", "greeting": "Hello, MongoDB!" }

  • 文档中的键/值对是有序的

{ "x": 1, "y": 2 } 与 { "y": 2, "x": 1 } 是不同的

六、MySQL 与 MongoDB 的映射

MySQL MongoDB
db(tables) db(collections)

table collection

record document

七、动态模式

集合是动态的。这意味着一个集合里面的文档可以是各种各样的。
例如,下面两个文档可以存储在同一个集合里面

{ "greeting": "Hello, world!" }
{ "foo" : 5 }

但还是有必要设计多个集合

  • 查询简单。

  • 磁盘寻道操作更少。

  • 创建索引,使用文档的附加结构。一个集合中只放入一种类型的文档,可以更有效地
    对集合进行索引。

八、命名

集合不能出现以下情况

1、不能为空字符串
2、不能包含\0字符
3、不能以system.开头
4、不能包含$

九、子集合

组织集合的一种惯例是使用“.”分隔不同命名空间的自己合。
例如,一个具有博客功能的应用可能包含两个集合,分别是
blog.posts 和 blog.authors 这是为了使组织结构更加清晰。
这里的blog集合(这个集合甚至不需要存在)跟它的子集合
没有任何关系

十、数据库命名限制

  • 不能是空字符串。
  • 不能还有特殊符号, 可以使用- 或 _。数字或字母。
  • 区分大小写。
  • 最多64位。

如果要使用cms数据库中的blog.posts集合,这个结合的命名空间
就是cms.blog.posts。命名空间的长度不得超过121个字节

十一、MongoDB 启动

 使用 mongod 启动

mongod 在没有参数的情况下会适用默认数据目录/data/db。
如果数据目录不存在或者不可写,服务器会启动失败。

MongoDB 监听27017 端口。

MongoDB还会启动一个非常基本的HTTP服务器,监听数字比主
端口号高1000的端口,也就是28017 端口。这意味着,通过浏览器
访问http://localhost:28017 能获取数据库的管理信息。

十二、MongoDB shell简介

MongoDB 自带JavaScript shell, 可在shell中适用命令行
能运行任意JavaScript程序。

十三、MongoDB 的CRUD

  • 创建
  > post = {
    "title"   : "My Blog Post",
    "content" : "Here1s my blog post",
    "date"    : new Date()
  }

db.blog.insert(post)

  • 查询

  > db.blog.find()

  or

  > db.blog.findOne()
  • 更新

  > post.comments = []

  > db.blog.update({ title : "My Blog Post"}, post)

  • 删除

使用remove 方法可将文档从数据库中永远删除。
如果没有使用任何参数,它将集合内的所有文档全部删除。
它可以接受一个作为限定条件的文档作为参数。

> db.blog.remove({title: "My Blog Post"})

十四、数据类型

  • null

  { "x" : null }

  • 布尔型
  { "x" : true }
  • 数值

  { "x" : 3.14 }
  { "x" : NumberInt("3")}
  { "x" : NumberLong("3") }

  • 字符串

  { "x" : "foobar" }

  • 日期

毫秒数


  { "x" : new Date() }

  • 正则表达式

{ "x" : /foobar/i }

  • 数组

  { "x": ["a", "b", "c"]}

  • 内嵌文档

  {"x": {"foo" : "bar"}}

  • _id

  { "x" : ObjecteId() }

  • 二进制数据

所以可以存储任何的文件

  • 甚至代码

{ "x" : function() { /* ... */ } }

参考 《MongoDB 权威指南》

你可能感兴趣的:(MongoDB 第一篇)