requests库的使用

文章目录

  • get 请求
  • post 请求
  • get 请求和 post 请求的区别
  • response
    • 1. res.headers
    • 2. status_code
    • 3. json

get 请求

参数 类型 作用
url str 发起请求的地址
params 字典 url为基准地址,不包含查询参数;使用此参数会自动对 params 字典编码,然后和url拼接
headers 字典 请求头,发送请求的过程中请求的附加内容,携带着一些必要的参数
cookies 字典 携带登陆信息
proxies 字典 用来设置代理 IP 服务器

post 请求

post请求中的两种数据格式:json 格式表单 格式
使用 resp.headers 查看文本类型
'Content-Type': 'text/html'

get 请求和 post 请求的区别

GET请求: 就是在浏览器中输入网址加回车就是GET请求,请求参数会直接包含到网址里,例如我们在百度搜索爬虫关键字,就会包含到请求的URL中

POST请求: 大多数在提交表单时发起的,例如在登录页面输入账号密码后,点击登录后通常以POST请求将数据以表单的形式传输,不会提现在URL中

  1. 用途:GET主要用于请求数据,而POST主要用于提交数据。GET请求用于获取数据,不会改变服务器上的数据;POST请求用于创建或更新服务器上的数据。
  2. 数据传输方式:GET请求将参数附加在URL上,参数之间使用&符号分隔。POST请求则将数据放在HTTP请求的消息体中,使用特定的编码格式。

response

res = requests.get( url )

发送请求后,返回的是个 requests.models.Response 对象

Response对象成员 类型
headers 返回resonpse对象的头部信息
status_code http 请求的返回状态,若为 200 则表示请求成功
text http 响应内容的字符串形式,即返回的页面内容
content http 响应内容的二进制形式
json() 得到对应的 json 格式的数据,类似于字典

1. res.headers

即响应标头

requests库的使用_第1张图片

2. status_code

状态码 说明
200 服务器正常响应
404 未找到请求的内容
500 服务器内部错误
503 服务器临时维护
403 禁止访问
301 永久重定向
302 重定向
303 可重定向
307 临时重定向
400 不允许的请求
401 未授权
402 付款表单未提交
403 禁止访问
404 未找到请求的内容
405 方法不受支持
406 不接受 HTTP 方法
407 请求的 URI 不合法
408 重复请求
409 冲突
410 超时
411 未知错误
412 格式错误
413 请求太大
414 不允许的请求体
415 未描述的错误
416 不支持的媒体类型
417 请求包含无效的参数
418 未处理的错误,反爬虫,需修改请求头信息 ‘User-Agent’
429 过载
500 服务器内部错误
503 服务器临时维护
504 服务器遇到错误
505 网络错误

3. json

json后面要加括号,例:
resp.json()

你可能感兴趣的:(Python,python,爬虫)