MongoDB入门---GridFS&固定集合&自动增长

    经过前段时间的学习,对MongoDB有了一个大概的了解了。那么今天呢,就来看一下新的东西。在MongoDB中,GridFS 用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片、音频、视频等)。GridFS 也是文件存储的一种方式,但是它是存储在MonoDB的集合中。GridFS 可以更好的存储大于16M的文件。GridFS 会将大文件对象分割成多个小的chunk(文件片段),一般为256k/个,每个chunk将作为MongoDB的一个文档(document)被存储在chunks集合中。GridFS 用两个集合来存储一个文件:fs.files与fs.chunks。每个文件的实际内容被存在chunks(二进制数据)中,和文件有关的meta数据(filename,content_type,还有用户自定义的属性)将会被存在files集合中。下面看一下简单的 fs.files 集合文档:

{
   "filename": "test.txt",
   "chunkSize": NumberInt(261120),
   "uploadDate": ISODate("2014-04-13T11:32:33.557Z"),
   "md5": "7b762939321e146569b07f72c62cca4f",
   "length": NumberInt(646)
}

    再来看一下简单的 fs.chunks 集合文档:

{
   "files_id": ObjectId("534a75d19f54bfec8a2fe44b"),
   "n": NumberInt(0),
   "data": "Mongo Binary Data"
}

    好啦,大家到这里就有一定的了解了。接下来我们使用 GridFS 的 put 命令来存储 mp3 文件。调用 MongoDB 安装目录下bin的 mongofiles.exe工具。首先,打开命令提示符,进入到MongoDB的安装目录的bin目录中,找到mongofiles.exe,并输入下面的代码:

>mongofiles.exe -d gridfs put song.mp3

    GridFS 是存储文件的数据名称。如果不存在该数据库,MongoDB会自动创建。Song.mp3 是音频文件名。然后呢,我们来使用以下命令来查看数据库中文件的文档:

>db.fs.files.find()

    执行上述命令之后,这里会返回以下文档数据,请看:

{
   _id: ObjectId('534a811bf8b4aa4d33fdf94d'), 
   filename: "song.mp3", 
   chunkSize: 261120, 
   uploadDate: new Date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41",
   length: 10401959 
}

    我们可以看到 fs.chunks 集合中所有的区块,以下我们得到了文件的 _id 值,我们可以根据这个 _id 获取区块(chunk)的数据:

>db.fs.chunks.find({files_id:ObjectId('534a811bf8b4aa4d33fdf94d')})

    上面的实例中,查询返回了 40 个文档的数据,意味着mp3文件被存储在40个区块中。OK,到这里,就算是介绍完GridFS了。接下来,我们来看一下固定集合。MongoDB 固定集合(Capped Collections)是性能出色且有着固定大小的集合,对于大小固定,我们可以想象其就像一个环形队列,当集合空间用完后,再插入的元素就会覆盖最初始的头部的元素。接下来,我们通过createCollection来创建一个固定集合,且capped选项设置为true:

>db.createCollection("cappedLogCollection",{capped:true,size:10000})

    我们还可以指定文档个数,加上max:1000属性:

>db.createCollection("cappedLogCollection",{capped:true,size:10000,max:1000})

    然后呢,我们来判断集合是否为固定集合:

>db.cappedLogCollection.isCapped()

    不是的话,如果需要将已存在的集合转换为固定集合可以使用以下命令:

>db.runCommand({"convertToCapped":"posts",size:10000})

    通过上面的代码,我们就会将已存在的 posts 集合转换为固定集合。然后我们来看一下,固定集合的查询。固定集合文档按照插入顺序储存的,默认情况下查询就是按照插入顺序返回的,也可以使用$natural调整返回顺序:

>db.cappedLogCollection.find().sort({$natural:-1})

    再来看一下,固定集合的特点。固定集合可以插入及更新,但更新不能超出collection的大小,否则更新失败,不允许删除,但是可以调用drop()删除集合中的所有行,但是drop后需要显式地重建集合。在32位机子上一个cappped collection的最大值约为482.5M,64位上只受系统文件大小的限制。

    最后呢,就是它的属性以及用法,首先来看属性:

  • 属性1:对固定集合进行插入速度极快
  • 属性2:按照插入顺序的查询输出速度极快
  • 属性3:能够在插入最新数据时,淘汰最早的数据

    再来看一下固定集合的用法:

  • 用法1:储存日志信息
  • 用法2:缓存一些少量的文档

    好啦,接下来就是最终要分享的自动增长了。我们都知道,MongoDB 没有像 SQL 一样有自动增长的功能,MongoDB 的 _id 是系统自动生成的12字节唯一标识。但在某些情况下,我们可能需要实现 ObjectId 自动增长功能。由于 MongoDB 没有实现这个功能,我们可以通过编程的方式来实现,以下我们将在 counters 集合中实现_id字段自动增长。首先我们来考虑以下 products 文档。我们希望 _id 字段实现从 1,2,3,4 到 n 的自动增长功能:

{
  "_id":1,
  "product_name": "Apple iPhone",
  "category": "mobiles"
}

    为此,创建 counters 集合,序列字段值可以实现自动长:

>db.createCollection("counters")

    现在我们向 counters 集合中插入以下文档,使用 productid 作为 key:

{
  "_id":"productid",
  "sequence_value": 0
}

    sequence_value 字段是序列通过自动增长后的一个值。我们使用以下命令插入 counters 集合的序列文档中:

>db.counters.insert({_id:"productid",sequence_value:0})

    接下来我们来创建JavaScript函数。我们将使用 getNextSequenceValue 函数创建一个新的文档,并设置文档 _id 自动为返回的序列值:

>db.products.insert({
   "_id":getNextSequenceValue("productid"),
   "product_name":"Apple iPhone",
   "category":"mobiles"})

>db.products.insert({
   "_id":getNextSequenceValue("productid"),
   "product_name":"Samsung S3",
   "category":"mobiles"})

    就如你所看到的,我们使用 getNextSequenceValue 函数来设置 _id 字段。为了验证函数是否有效,我们可以使用以下命令读取文档:

>db.products.find()

    以上命令将返回以下结果,我们发现 _id 字段是自增长的:

{ "_id" : 1, "product_name" : "Apple iPhone", "category" : "mobiles"}

{ "_id" : 2, "product_name" : "Samsung S3", "category" : "mobiles" }
    好啦,到这里呢,今天的分享就结束了。如果感觉不错的话,请多多点赞支持哦。。。

你可能感兴趣的:(原创,php,shell,python,mysql,MongoDB等技术学习之路,MongoDB学习之路,MongoDB,GridFS,固定集合,自动增长)