[C++项目] Boost文档 站内搜索引擎(3): 建立文档及其关键字的正排 倒排索引、jieba库的安装与使用...
之前的两篇文章:第一篇文章介绍了本项目的背景,获取了Boost库文档[C++项目]Boost文档站内搜索引擎(1):项目背景介绍、相关技术栈、相关概念介绍…第二篇文章分析实现了parser模块.此模块的作用是对所有文档html文件,进行清理并汇总[C++项目]Boost文档站内搜索引擎(2):文档文本解析模块parser的实现、如何对文档文件去标签、如何获取文档标题…至此,搜索引擎建立索引的4个步