MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。在这里我们有必要先简单介绍一下非关系型数据库(NoSQL)
NoSQL,指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写,是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。
关系型数据库 | NoSQL数据库 |
---|---|
高度组织化结构化数据 | 代表着不仅仅是SQL |
结构化查询语言(SQL) | 没有声明性查询语言 |
数据和关系都存储在单独的表中 | 没有预定义的模式 |
数据操作语言,数据定义语言 | 键-值对存储,列存储,文档存储,图形数据库 |
严格的一致性 | 最终一致性,而非ACID属性 |
基础事务 | 非结构化和不可预知的数据 |
CAP定理 | |
高性能,高可用性和可伸缩性 |
类型 | 典型代表 | 特点 |
---|---|---|
列存储 | Hbase Cassandra Hypertable |
顾名思义,是按照列存储数据的。最大的特点是方便存储结构化和半结构化的数据,方便做数据压缩,对针对某一列或者某几列的查询有非常大的IO优势 |
文档存储 | MongoDB CounchDB |
文档存储一般用类似json的格式存储,存储的内容是文档型的。这样也就有机会对某些字段建立索引,实现关系数据库的某些功能。 |
Key-value存储 | Tokyo Cabinet/Tyrant Berkelery DB Memcache Redis |
可以通过key快速查询到其value。一般来说,存储不管value的格式,照单全收。(Redis包含了其他功能) |
图存储 | Neo4J FlockDB |
图形关系的最佳存储。使用传统关系数据库来解决的话性能低下,而且设计使用不方便。 |
对象存储 | Db4o Versant |
通过类似面向对象语言的语法操作数据库,通过对象的方式存储数据。 |
XML数据库 | Berkeley DB XML BaseX |
高效的存储XML数据,并存储XML的内部查询语法,比如XQuery,Xpath。 |
在计算机科学中, CAP定理(CAP theorem), 又被称作 布鲁尔定理(Brewer's theorem), 它指出对于一个分布式计算系统来说,不可能同时满足以下三点:
1、一致性(Consistency) (所有节点在同一时间具有相同的数据)
2、可用性(Availability) (保证每个请求不管成功或者失败都有响应)
3、分区容错性(Partition tolerance) (系统中任意信息的丢失或失败不影响系统的继续运行)
CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。 因此,根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三 大类: CA - 单点集群,满足一致性,可用性的系统,通常在可扩展性上不太强大。 CP - 满足一致性,分区容错性的系统,通常性能不是特别高。 AP - 满足可用性,分区容错性的系统,通常可能对一致性要求低一些。
关系型数据库术语/概念 | MongoDB术语/概念 | 解释/说明 |
---|---|---|
Database | Database | 数据库 |
Table | Collection | 数据库表/集合 |
Row | Document | 数据记录行/文档 |
Column | Field | 数据列/数据字段 |
Index | Index | 索引 |
Table joins | 表关联/MongoDB不支持 | |
Primary Key | Object ID | 主键 / MongoDB自动将 _ id 设置为主键 |
数据类型 | 说明 | 解释 | 举例 |
---|---|---|---|
Null | 空值 | 表示空值或者未定义的对象 | {“x”:null} |
Boolean | 布尔值 | 真或者假:true或者false | {“x”:true} |
Integer | 整数 | 整型数值。用于存储数值。根据你所采用的服务器,可分为 32 位或 64 位。 | |
Double | 浮点数 | 双精度浮点值。 | {“x”:3.14,”y”:3} |
String | 字符串 | UTF-8字符串 | |
Symbol | 符号 | 符号。该数据类型基本上等同于字符串类型,但不同的是,它一般用于采用特殊符号类型的语言。 | |
ObjectID | 对象ID | 对象 ID。用于创建文档的 ID。 | {“id”: ObjectId()} |
Date | 日期 | 日期时间。用 UNIX 时间格式来存储当前日期或时间。 | {“date”:new Date()} |
Timestamp | 时间戳 从标准纪元开始的毫秒数 | ||
Regular | 正则表达式 | 文档中可以包含正则表达式,遵循JavaScript的语法 | {“foo”:/testdb/i} |
Code | 代码 | 可以包含JavaScript代码 | {“x”:function() {}} |
Undefined | 未定义 | 已废弃 | |
Array | 数组 | 值的集合或者列表 | {“arr”: [“a”,”b”]} |
Binary | Data | 二进制 | 用于存储二进制数据。 |
Object | 内嵌文档 | 文档可以作为文档中某个key的value | {“x”:{“foo”:”bar”}} |
Min/Max keys | 最小/大值 | 将一个值与 BSON(二进制的 JSON)元素的最低值和最高值相对比。 |
对于MongoDB实际应用来讲,是否使用MongoDB需要根据项目的特定特点进行一一甄别,这就要求我们对MongoDB适用和不适用的场景有一定的了解。 根据MongoDB官网的说明,MongoDB的适用场景如下:
1)网站实时数据:MongoDB非常适合实时的插入,更新与查询,并具备网站实时数据存储所需的复制及高度伸缩性。
2)数据缓存:由于性能很高,MongoDB也适合作为信息基础设施的缓存层。在系统重启之后,由MongoDB搭建的持久化缓存层可以避免下层的数据源过载。
3)大尺寸、低价值数据存储:使用传统的关系型数据库存储一些数据时可能会比较昂贵,在此之前,很多时候程序员往往会选择传统的文件进行存储。
4)高伸缩性场景:MongoDB非常适合由数十或数百台服务器组成的数据库。MongoDB的路线图中已经包含对MapReduce引擎的内置支持。
5)对象或JSON数据存储:MongoDB的BSON数据格式非常适合文档化格式的存储及查询。
了解了MongoDB适用场景之后,还需要了解哪些场景下不适合使用MongoDB,具体如下:
1)高度事务性系统:例如银行或会计系统。传统的关系型数据库目前还是更适用于需要大量原子性复杂事务的应用程序。
2)传统的商业智能应用:针对特定问题的BI数据库会对产生高度优化的查询方式。对于此类应用,数据仓库可能是更合适的选择。
3)需要复杂SQL查询的问题。
相信通过上面的说明,你已经大致了解了MongoDB的使用规则,需要说明一点的是,MongoDB不仅仅是数据库,更多的使用是将MongoDB作为一个数据库中间件在实际应用中合理划分使用细节,这一点对于MongoDB应用来讲至关重要!
下载:www.mongodb.com/download-ce…
1.在D盘创建安装目录,D:\MongoDB,将解压后的文件拷入新建的文件。
2.在D盘创建一个目录,D:\MongoDB\Data,用于存放MongoDB的数据。
3.执行安装,使用命令行,进入MongDb的安装目录,执行安装命令,并指明存放MongoDB的路径。
注意,如果这是你的目录中有空格,会报Invalid command错误,将dbpath后面的值加上双引号即可mongod.exe -dbpath=”D:\MongoDB\Data”。
最后一行显示我们的MongoDB已经连接到27017,它是默认的数据库的端口;它建立完数据库之后,会在我们的MongoDbData文件夹下,生成一些文件夹和文件:在journal文件夹中会存储相应的数据文件,NoSQL的MongoDB,它以文件的形式,也就是说被二进制码转换过的json形式来存储所有的数据模型。
启动MongoDB数据库,需要根据自己配置mongodb.bat文件,在D:\MongoDB\Server\3.4\bin中创建一个mongodb.bat文件,然后我们来编写这个可执行文件如下:
mongod --dbpath=D:\MongoDB\Data
运行mongodb.bat文件,MongoDB便启动成功!