问题:这个python搜索引擎针对什么资源?|如果对txt文件实现搜索,展示在cmd命令行上吗?
-----------------------------------------------------------------
假想:一个简陋的pyqt的搜索页面,后端的数据是《西方哲学史》这本书
-----------------------------------------------------------------
问题:分词对检索到底有什么用途?具体的程序步骤是什么?
-----------------------------------------------------------------
参考文章:从csdn中
我用Python写了一个搜索引擎 http://blog.csdn.net/storymonster/article/details/53933337
是针对小范围的网页进行的)
python做全文检索引擎
正则表达式是搜索引擎的关键
blog.csdn.net/qq_30843221/article/details/48184311
工具:whoosh
whoosh要怎么使用?
根据前面的网页:
0,导入包
1,中文分词解析器
2,构建索引的函数
3,检索函数
--------------------------------------------------
-----------------------------------------------------------------------
参考:http://blog.csdn.net/gdufsTFknight/article/details/72840872 Whoosh 使用简述
blog.csdn.net/u010138758/article/details/77148968 whoosh学习
1. whoosh安装:
2. 添加索引:
3.创建index:
4.编辑和删除索引:
5. 查询索引:
-----------------------------------------------
实例:参考:文件https://github.com/RyinSummers/AVerySimpleSearchEngine
1,爬取网页链接。,2,得想要的内容。,3,把内容做成词条索引,4,根据搜索词在词条索引里查询
Python搜索引擎实现原理和方法
http://blog.csdn.net/yr990412/article/details/78651717
python数据挖掘案例系列教程——python实现搜索引擎
http://blog.csdn.net/luanpeng825485697/article/details/78997189
Python分布式爬虫打造搜索引擎Scrapy
http://blog.csdn.net/qq_33936481/article/details/75263503
---------------------------------------------
问题是:我只需要针对本地的txt文章进行搜索就好了,不用那么复杂= =
先写到这里,看怎么解决。。。