python实现搜索引擎,数据检索项目:职业查询系统(基本的搜索引擎+爬虫拉勾网职业数据库),搜索引擎可以学习用户的标记,职业网站爬虫生成数据集
简介信息检索小组项目,队友已同意上传用spider爬拉钩网站排序文档基于tfidf和cosine相似性从搜索历史和用户标记的相关和不相关的结果中学习IDE规则方法,优化结果基于Tkinter的UI标准登录模块主搜索窗口与页面切换这里我只放出我贡献相关的部分,原文为英文,懒得翻译就机翻一下,文末给出文件链接正文数据处理搜索引擎我们遵循基本的管道,并实现了排名搜索引擎与一些经典的算法,我们已经研究过。