网络爬虫与信息提取(一)

Requests库入门

安装

网站:www.python-requests.org
1.管理员身份打开cmd

pip install requests

进行安装
2.查看安装效果
IDLE(python自带的)查看:
访问百度网站


网络爬虫与信息提取(一)_第1张图片
image.png

状态码为200,访问成功
utf-8编码,打印网页内容


image.png

Requests库的7个主要方法

网络爬虫与信息提取(一)_第2张图片
image.png

get()方法

r=requets.get(url)

返回的r是一个Reponse对象,包含从服务器返回的所有资源
正式形式


网络爬虫与信息提取(一)_第3张图片
image.png

Reponse对象的五个类型


网络爬虫与信息提取(一)_第4张图片
image.png

两种编码方式的区别:
r.enconding:如果header中不村子啊charset,则认为编码为ISO-8859-1
r.apparent_encoding:根据网页的内容分析出的编码方式

你可能感兴趣的:(网络爬虫与信息提取(一))