MongoDB的一个重要子模块,可基于MongoDB来持久存储文件,并且支持分布式存储和读取。
持久存储:对应瞬时数据如内存,指保存到数据库中,能持久保存。
分布式存储:将数据分散地存储于多个位置。
MongoDB采用BSON格式存储数据,对数据的大小限制为16M,但是在实际的系统开发中,上传的图片或文件可能尺寸会很大,此时可以使用MongoDB中的GridFS解决,通常用来处理大文件的存储。
元数据:用来描述数据的数据,如数据大小、创建时间、文件名、格式类型等。
当一个文件存储到GridFS时,如果文件大于chunksize(一个chunk的大小,256KB),会将文件按照chunk的大小分割成多个chunk块,最终将chunk块的信息存储在fs.chunks集合的多个文档中,然后将文件信息存储在fs.files集合的唯一一份文档中。
先根据查询条件在fs.files集合中找到对应的文档,得到_id
字段,在查询对应fs.chunks集合中所有files_id
和_id
相同的文档,最后根据n
字段的顺序读取chunk的data
字段二进制数据,还原文件。
mongofiles
是GridFS的实用工具,用于管理GridFS文件,在MongoDB安装目录下的bin目录中,可在命令行直接使用。
mongogiles put 文件名
生成的fs.files:
生成的fs.chunks:(我上传的file.mov共750KB,分成了3个chunk)
mongofiles list
mongofiles get 文件名
mongofiles delete 文件名