整理mongodb文档:collation
对于mongodb的collation。个人主要用的范围是在createcollection,以及find的时候用,所以本片介绍的时候也是这两个地方入手,对新手个人觉得理解概念就好。不要求强制性掌握,但是要看到的时候知道这个是什么意思。
先看一下官网中对于Collation的介绍
Collation allows users to specify language-specific rules for string
comparison, such as rules for lettercase and accent marks.
排序规则允许用户为字符串比较指定特定于语言的规则,例如大小写和重音标记的规则。
对于重音标记,指的是类似德语中的“ö”这样的,但我们项目比较少出现这样的,因此剩下的就是大小写的考虑了。
locale: <string>,
caseLevel: <boolean>,
caseFirst: <string>,
strength: <int>,
numericOrdering: <boolean>,
alternate: <string>,
maxVariable: <string>,
backwards: <boolean>
locale,指的是我们所选用的地区的代码,比如中国是zh,美国那边就是en,而当我们选用二进制的格式的时候,需要设置的是’simple’.当使用’simple’的时候,也就不再需要设置别的参数了。
strength,总共有五个挡位,当我们设置值为1跟2的时候,可以理解为不比较大小写,而当为3,4,5的时候可以理解为需要比较大小写。默认值是3,当然实际1与2,3-5之间都有差距,只是对我们来说差距不大。相当于越大越严格。
caseFirst,大小写的问题,数据的大小写谁在前,谁在后,当值为’upper’,大写排在小写前面,当值为’lower’,小写排在大写的前面。当值为’off’,表示关闭。
暂时的介绍就这些,其他的希望大家自己看,接下来是介绍两三个例子作为实操,先准备几条数据,分别是
{ "string": "a", "sort": "1" },
{ "string": "B", "sort": "2" },
{ "string": "C", "sort": "3" },
{ "string": "d", "sort": "4" }
接下来创建一个最基本的collection。尝试将这四个数据加进去。
对比了下查询出来的数据,我们插入的时候用的是sort按照1234的顺序插入的。但是当我们用sort({string:1})查询数据的时候,返回的却是先大写,然后是小写。就是系统区分了大小写,先大写再小写,这样子我们大概可以立即为根据二进制进行排序返回了。
接着删除这个collection,重新生成一个新的collection,但是使用下面的指令来生成
db
.createCollection("blog",
{collation:{ "locale": "en", strength : 1}})
可以看到两次的查询语句都一样,但是出现了不同的结果,这是因为我们创造collection的时候,使用了不同的collation。
第一次使用的是默认的locale=simple,根据二进制的规则,先大写后小写。
而第二次的时候,我们直接无视大小写,也就出现了先a后B的情况。具体的应用场景还有很多,只是这个最为经典,最适合做例子罢了。
同样的道理,当我们用一个既定的collation来查询一个数据的时候,我们也可以使用到特定的collation来查询。使用的方法如下:
db.blog.find()
.sort({string:1})
.collation({locale:'zh',strength:1})
collation的最大作用是在让我们按照自己的规则来查询,创建集合,如果是做crud,需要做大小写区分的时候可以考虑这个,而不需要使用正则,但是注意下版本,一般都是支持的。
本文数据来源:mongodb官网