lemur 使用

       我主要想研究下 indri ,所以 就只研究这快

 

       下载源代码后,直接configure ;make 就可以了

 

        建立索引:

 

        配置文件

<parameters> <index>/home/admin/indri/buildindex/test/index </index> <corpus> <path>/home/admin/indri/buildindex/test/data</path> <class>xml</class> </corpus> <memory>128m</memory> <stemmer> <name>krovetz</name> </stemmer> <stopper> <word>a</word> <word>an</word> <word>the</word> </stopper> <field> <name>title</name> </field> <field> <name>body</name> </field> </parameters> 

 

这里设定了索引生成的位置,原始数据地址,数据类型, 分词器, 停用词,字段等信息

 

 

      准备数据, xml 格式的, 每个doc 存放在一个文件中。

 

    进入 buildindex 目录, indexbuild conffile 

 

 

2  查询,进入 

 

    runquery 目录 ,运行   ./IndriRunQuery -index=../buildindex/test/index/ / -query="#combine(king)" 

 

   查询包含 king 的doc , 

 

 

3  我们也可以启动查询的服务 

 

     进入 indrid 目录 IndriDaemon  -index = ../buildindex/test/index/ /  -port=8888

 

 

好了,前进吧 

 

你可能感兴趣的:(lemur 使用)