Python净化百度搜索结果!真正的做到无广告环境!


前言

现在在百度上面搜索一个关键词,最前面的几个搜索结果都是广告,比如你搜索一个Python,前面几个都是百度竞价的Python培训机构。

既然是净化,广告什么的当然要通通剔除啦。。。

基本环境配置

Python版本:3.5.4

相关模块:

requests模块、bs4模块、win_unicode_console模块、PyQt5模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

主要思路

利用Python处理百度搜索关键字后返回的页面,提取其中的有效信息。

使用方式

(1)直接运行

功能:

在cmd窗口运行BaiduSearch_Spider.py文件后,根据提示输入相关信息后将得到的有效信息保存到results.txt文件中。

若需其他功能请自行修改源代码。

运行示例如下图所示:

结果:

(2)作为模块导入

使用示例如下图所示:

运行以及结果图:

返回的数据格式为:

简单实例:

功能:

(1)在cmd窗口中运行并展示获得的有效信息;

(2)根据有效信息选择想要了解的链接后将该链接网站在PyQt制作的简易Demo中显示。

结果图:

细心的小伙伴可能会发现:

这里不支持播放这种视频,因为我没配置,官网有配置教程,全英文实在懒得看,如果需要深入了解的小伙伴可以自己去看一下文档。


转载于:https://juejin.im/post/5bfe901f518825291d62ffa0

你可能感兴趣的:(Python净化百度搜索结果!真正的做到无广告环境!)