whoosh使用简述

1. whoosh安装:

sudo pip install Whoosh


2. 添加索引:

生成schema

(Schema 有两个field, 标题title & 内容content)

用关键词参数来映射 filed name 与field type,这些名字与类型将定义在索引的对象以及可搜索的对象

3.创建index:

(create_in函数,生成index文件夹,里面包含二进制文件)


4.编辑和删除索引

删除操作使用writer的以下三个方法:
delete_document(docnum)方法  (docnum是索引查询结果的每条结果记录的docnum属性)
delete_by_term(field_name,termtext)方法  (特别适合删除ID,或KEYWORD字段)
delete_by_query(query)

添加操作使用writer的以下方法:

add_document

update_document


(commit的内容到index的二进制文件中)

5. 查询索引:

创建search 对象:

searcher = ix.searcher()

用完一定要关闭, searcher.close()

生成查询对象, 有三种方式:

构建query对象:

   


构建查询分析器:

   

以query对象为参数调用searcher的search方法.得到查询result.

默认的search方法的results最多仅返回10个匹配的文档.若要得到全部的结果,可把limit=None
results = searcher.search(query,limit=20)


results = searcher.find方法:

   



内容来源:http://blog.csdn.net/u012387575/article/details/52188054

你可能感兴趣的:(whoosh,python)