MongoDB是一种非关系型数据库,被广泛用于大型数据存储和分布式系统的构建。MongoDB支持的数据模型比传统的关系型数据库更加灵活,支持动态查询和索引,也支持BSON格式的数据存储,这种格式可以支持读取和写入大量的数据。
MongoDB的优势主要包括:
灵活的数据模型:MongoDB支持动态查询和索引,可以支持更大的数据集。
分布式扩展:MongoDB可以轻松地横向扩展,支持跨多个服务器分布数据,实现高可用性和负载均衡。
大规模数据存储:MongoDB支持海量数据存储,提供非常高的性能和可扩展性。
易于使用:MongoDB提供简单的命令行工具和可视化界面,支持多种编程语言,易于使用和自定义。
MongoDB基于JSON格式存储数据,并使用BSON格式处理数据。它支持多个数据节点的分布式存储,每个数据节点都可以独立扩展。MongoDB可以自动化控制数据的复制和故障转移。需要注意的是,MongoDB不支持跨节点的事务。
MongoDB将数据存储为对应的BSON格式文件,这个文件是二进制的,可以通过MongoDB提供的命令行工具进行读取和写入。BSON是Binary JSON的缩写,是JSON的一种扩展,能够更快地将数据存储和读取到MongoDB数据库中。
MongoDB索引是为一个或者多个文档字段创建的数据结构,能够帮助MongoDB更加快速地执行查询操作。索引可以被定义为唯一的,如果这样定义,MongoDB将确保所有的值都不同。MongoDB支持单边和多边索引,可以深度嵌套和数组字段的嵌套索引。
使用db.collection.createIndex()在集合中创建一个索引
MongoDB查询性能可以优化的方法包括:
为查询字段创建索引:在查询频繁的字段上创建索引,能够提高查询速度。
限制查询结果的数量:可以使用skip()和limit()方法分页,减少查询结果大小。
只查询需要的字段:使用projection或者特定字段查询的方式,避免查询所有字段,减少网络传输带宽。
使用聚合查询:使用聚合查询代替多个单独的查询语句,可以提高性能。
为数据结构优化设计:为了优化结构设计,尽可能减少重复的数据。
MongoDB的复制工作是基于主从复制实现的。其中一个节点被定义为主节点,使用replica set的方式,其他的节点被定义为备份节点,数据会进行实时同步。在某些情况下,主节点可能会失效或消失,这时候从节点将被提升为主节点继续工作。
MongoDB的副本集是一组备份节点,用于实现高度的可用性。副本集维护多个数据节点,其中的一个被定义为主节点,其他的节点都被定义为备份节点。如果主节点在崩溃,选择另外一个节点作为主节点。
MongoDB相较关系型数据库有以下几个显著的不同点:
数据结构不同:MongoDB使用文档形式存储数据,而关系型数据库使用表这种结构体来存储数据。
索引不同:MongoDB支持的索引比关系型数据库更加灵活。
分布式和可扩展性强:MongoDB具有高度的可扩展性和分布式数据库的特性,能够支持海量数据存储。而关系型数据库的可扩展性较差,虽然引入到分布式系统,但是需要较多的数据库连接和配置。
MongoDB的聚合函数用于对文档进行分组和汇总操作,支持对数据进行复杂计算和处理。聚合函数对于数据分析和统计非常有用,通过数据分组可以更快的获取收集数据中的关键信息。聚合函数可以支持多个匹配条件,同时也可以支持分组计算,并提供了丰富可运算算法和运算符支持。
db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
以下特点使得MongoDB成为最好的NoSQL数据库:
db.collectionName.find({
key:value})
db.collectionName.find().pretty()
db.collectionName.update({
key:value},{
$set:{
newkey:newValue}})
db.collectionName.remove({
key:value})
并使用1 和 -1 来指定排序方式,其中 1 表示升序,而 -1 表示降序。
db.connectionName.find({
key:value}).sort({
columnName:1})
GridFS是一种将大型文件存储在MongoDB中的文件规范。使用GridFS可以将大文件分隔成多个小文档存放,这样我们能够有效的保存大文档,而且解决了BSON对象有限制的问题
不会,磁盘写操作默认是延迟执行的.写操作可能在两三秒(默认在60秒内)后到达磁盘.例如,如果一秒内数据库收到一千个对一个对象递增的操作,仅刷新磁盘一次.
db._adminCommand("connPoolStats");
MongoDB支持存储过程,它是javascript写的,保存在db.system.js表中。
如果一个分片停止了,除非查询设置了“Partial”选项,否则查询会返回一个错误。如果一个分片响应很慢,MongoDB会等待它的响应。
每一个分片(shard)是一个分区数据的逻辑集合。分片可能由单一服务器或者集群组成,我们推荐为每一个分片(shard)使用集群。
MongoDB 分片是基于区域(range)的。所以一个集合(collection)中的所有的对象都被存放到一个块(chunk)中。只有当存在多余一个块的时候,才会有多个分片获取数据的选项。现在,每个默认块的大小是 64Mb,所以你需要至少 64 Mb 空间才可以实施一个迁移。
它是当前备份集群(replica set)中负责处理所有写入操作的主要节点/成员。在一个备份集群中,当失效备援(failover)事件发生时,一个另外的成员会变成primary。
Seconday从当前的primary上复制相应的操作。它是通过跟踪复制oplog(local.oplog.rs)做到的。
MongoDB和CouchDB都是面向文档的数据库。MongoDB和CouchDB都是开源NoSQL数据库的最典型代表。 除了都以文档形式存储外它们没有其他的共同点。MongoDB和CouchDB在数据模型实现、接口、对象存储以及复制方法等方面有很多不同。
细节如下: