ElasticSearch 使用心得

版本 ES 1.7.1   pyes 0.99.6


  • ES 2.x版本不兼容_head等插件,所以先用1.7.1(这和Python2/3类似)
  • pyes 0.99.5 没有FunctionScoreQuery.FieldValueFactor, 0.99.6有
  • RTF(免配置的中文搜索) 
  • 插件head:  图形化web管理页面

中文分词插件--IK


  • 根据版本下载对应的code, 需要安装MVN,自己编译(推荐);
  1. 编译好的zip文件解压到  ES根目录/plugin/analyzerIK
  2. 拷贝IK的config/ik 到 ES根目录/config/
  3. ES根目录/config/elasticsearch.yml  中追加
index.analysis.analyzer.default.type : "ik"
index:
  analysis:
    analyzer:
      ik:
          alias: [ik_analyzer]
          type: org.elasticsearch.index.analysis.IkAnalyzerProvider
      ik_smart:
          type: ik
          use_smart: true
      ik_max_word:
          type: ik
          use_smart: false

重启ES即可

  • RTF版本有编译好的,但我移植到自己的ES上就报错了,但官方给出的解决方案我是醉了(见https://github.com/medcl/elasticsearch-analysis-ik/issues/48)
  • 测试 http://localhost:9200/your_index/_analyze?analyzer=ik&pretty=1&text=我要信耶稣,得永生

查询 | pyes使用


  • 搜索结果的展示,最要关心的莫过于 排序

  • ES的全文搜索,默认依据_score降序排

  • _score的算法,一般来讲了解即可,ES暴露出API来给我们调整score  TF/IDF... 详见http://blog.csdn.net/dm_vincent/article/category/2718099
  • boosting in query-time是常用的干预手段
  • FunctionScoreQuery可以让我们更加大力度影响最终score,也就是排序
  • FunctionScoreQuery.FieldValueFactor  可以用文档中某一字段来影响score






你可能感兴趣的:(ElasticSearch 使用心得)