前言
这里声明: elasticsearch -> es
漫谈
我们都知道Python 下 有es的sdk包的,我们也知道java 下有封装更好的es包。为什么说python 下的就封装不好呢? 其实这个也两说,有人就喜欢这样呢
Python下的es包首先什么都能做,实现功能完全没问题。但是对于 DSL 的话,Python下的es就没有封装了,完全按照es的语法写查询语句。当然这种也是优点,但是如果用了Java下的es 的sdk的话,你会会发现对于DSL 都封装的很好。
至于封不封装DSL,其实也看业务复不复杂,简单的业务,几行的DSL 直接写也没什么,但是如果很长的呢,比如我这样业务的DSL:
{
"size": 1000,
"query": {
"bool": {
"must": [
{
"term": {
"prod_code": {
"value": "JDB"
}
}
},
{
"bool": {
"must": [],
"must_not": [],
"should": [
{
"bool": {
"must": [],
"must_not": [],
"should": [
{
"query_string": {
"default_field": "rp_content",
"query": "*下了*"
}
},
{
"query_string": {
"default_field": "rp_content",
"query": "*下款*"
}
}
],
"filter": []
}
},
{
"nested": {
"path": "rp_data",
"query": {
"bool": {
"must": [],
"must_not": [],
"should": [
{
"query_string": {
"default_field": "rp_data.rp_content",
"query": "*下了*"
}
},
{
"query_string": {
"default_field": "rp_data.rp_content",
"query": "*下款*"
}
}
],
"filter": []
}
}
}
}
],
"filter": []
}
}
]
}
}
}
如果是这样的DSL 直接写在代码中,这个也太长了吧,而且这还不是全部,只是一部分,对于这种动态而且复杂的DSL,直接写,会显得太长。
故此,我对Python 下的es包进行了增强 —— 对DSL进行封装。项目请点击:# elasticsearch-python
对于上面DSL 的封装调用结果是这样的:
prod_code = 'JDB'
key = "下了"
value = '下了 | 下款'
bq = bool_query()
bq.must(term_query('prod_code', prod_code)) \
.must(bool_query()
.should(multi_query_string('rp_content', value))
.should(nested_query('rp_data', multi_query_string('rp_data.rp_content', value)))
)
print(bq)
print(QueryBuilders(bq).size(1000))
这下清爽了很多是吧!
当然这个没写完,对于聚合还没写,而且query也没全部支持,只是把自己用到的给简单封装了下,其实不知道到底有没有人用,没人用自己写再多也就自己玩玩了。这里我的实现也很简单,其实希望有人能有更好的实现。