盗字笔记(10)

实例3:百度、360搜素关键词提交

问题:可不可以向百度或者260提交问题,来搜素结果

搜素引擎关键字接口:

百度关键词接口:

http://www.baidu.com/s?wd=keyword

360的关键词接口:

http://www.so.com/s?q=keyword

2,所以对于requests库来讲,只要构造这样的url就可以实现这样的提取

盗字笔记(10)_第1张图片
百度搜索关键词提交

>>>import requests

>>>kv = {'wd' : 'Python'} # 键值对 'wd'是搜索引擎的接口前的标识,Python是我们的关键值

>>>r = requests.get("http://www.baidu.com/s,"params = kv)  #params可以向URL中增加相关内容

>>>r.status_code

200

>>>r.request.url  #发给百度的request对应的URL

>>>len(r.text)

3400061 #先不要打印反馈的信息,看看信息长度,340061这是340k的信息(解析反馈内容分,下周见)

百度全代码:

盗字笔记(10)_第2张图片
本练习中的百度全代码
盗字笔记(10)_第3张图片
360全代码

注意:

360全代码和百度全代码的区别是:keyword前边的不同,如上图。

实例四:网络图片的爬取和储存

网络图片的爬取(利用代码保存图片)

网络图片链接的格式:

http://www.example.com/picture.jpg

比如找:国家地理:

http://www.nationalgeographic.com.cn/(从国家地理里选取图片)

选择一个图片的web页面地址:

http://img1.gtimg.com/news/pics/19345/19345304.jpg

盗字笔记(10)_第4张图片
爬取图片
盗字笔记(10)_第5张图片
在D盘的显示(写入D盘里)

爬取文件的全代码:

盗字笔记(10)_第6张图片
爬取图片的全代码


'http://www.baidu.com/s?wd=Python'

你可能感兴趣的:(盗字笔记(10))