社工库2.0

#大题目 社工库2.0
###环境

  • whoosh2.7
  • jieba
  • 12306
  • python3.7
  • 网上嫖来的网页模板(感谢站长之家
    ###实现效果
  • 建立的索引文件
    社工库2.0_第1张图片
  • 好看的页面
    社工库2.0_第2张图片
  • 更快的查找速度
    社工库2.0_第3张图片
    ###实现过程
    具体的实现过程比较简易,毕竟whoosh已经封装的很好了
  • 第一步 建立索引并存储
schema = Schema(zhanghao=TEXT(stored=True), code=STORED,
                name=TEXT(stored=True, analyzer=analyzer), IDc=TEXT(stored=True),
                phone=TEXT(stored=True), mail=TEXT(stored=True))
# 再指定一个存储目录存储相关代码
ix_path = 'indexdir/'
ix_name = 'test_index_name'

if not os.path.exists(ix_path):
    os.mkdir(ix_path)
ix = create_in(ix_path, schema,indexname=ix_name)
ix.close()
  • 第二步 修改网页模板和我们期望的功能对接
    这里浪费的时间比较长,对web还是不够熟悉
  • 第三步 查询索引,编写接口
with storage.open_index(indexname=ix_name).searcher() as searcher:
    # 检索标题中出现'文档'的文档
    results = searcher.find(u"name", u"帅")
    # 检索出来的第一个结果,数据格式为dict{'title':.., 'content':...}
    for r in results:
        print(r)
        doc = r.fields()
        jsondoc = json.dumps(doc, ensure_ascii=False)
        display(jsondoc)  # 打印出检索出的文档全部内容

###接下来

  • 有时间可以继续尝试其他的搜索引擎框架
    打印出检索出的文档全部内容
###接下来
- 有时间可以继续尝试其他的搜索引擎框架
- 将写好的程序封装成docker,上传到git,方便其他人测试

你可能感兴趣的:(社工库2.0)