最近在做 hadoop+hive 相关的项目时,中间好几次被搜索项目那边叫去 写附加搜索功能(添加其他搜索规则,用Lucene实现),总是觉得那边需求一变或增加,就要投入精力去重新添加代码(其实很多都是类似)。
在经历过后,就一直在想有没有偷懒的方法,正好昨天在写Hive一半的时候,突然相当一条。
因为Hive是通过编写HQL语句,然后引擎对此解析,转化为MapReduce工作模型,是一种简化MapReduce编程的方式。
类似,那么可不可以写一种类SQL语句来执行Lucene搜索功能呐? 暂且叫 LQL
那么搜索时传入LQL:
SELECT xx, yy, zz FROM Index_i WHERE query="Lucene" FIELD IN "field_i" SORT BY FIELD "field_ j" DESC;
底层搜索引擎对此LQL进行解析,转化为IndexSearch 能识别的语句 进行搜索并返回搜索结果
****************************************
* LQL 语句
****************************************
*
*
* * *
***
*
****************************************
* LQL 解析引擎
****************************************
*
*
* * *
***
*
****************************************
* Lucene IndexSearch
****************************************
*
*
* * *
***
*
****************************************
* 搜索结果集
****************************************
这样的话,每次需求改变时就只需要改变LQL语句,方便调用方/业务方进行自行定制,
既 加速业务快速完成 又节省大量开发成本 又降低使用成本(SQL 语句比较通用)
这样的效果就能像Hive一样,知道HQL就可以进行MapReduce开发(最好在了解MapReduce的基础上,这样更容易写出高效的HQL语句)!!!
等项目完成,可以尝试!!
- -#