python 爬虫学习笔记(一)--- requests获取网页源代码(get请求 post请求区别)

python的requests库可以发起的http请求有如下几种:

  • PUT
  • DELETE
  • HEAD
  • OPTIONS
  • GET
  • POST

GET与POST是两种较常使用的请求,也是主要的获取网页源代码的方式。其对比如下:
python 爬虫学习笔记(一)--- requests获取网页源代码(get请求 post请求区别)_第1张图片

关于post请求的知识会在后面的文章当中提到,这里简单的写一段代码来说明一下requests的基本用法

import requests
url = "https://www.baidu.com"
r = requests.get(url)
#r.encoding = "utf-8"
#r.encoding = r.apparent_encoding
print(r.status_code)
print(r.text)

说明:
requests.get(url)会返回一个response对象。
r.status_code是返回的状态码,200代表正常连接
对r的编码方式有两种:
r.encoding = “utf-8”
r.encoding = r.apparent_encoding
其中第二种方式花费的时间较多。

补充:
上面讲到get请求可以通过url传递参数,有示例如下:`

#这里是一篇百家号的文章
#原来的网址为:url = "http://baijiahao.baidu.com/s?id=1650555453251474626"
#可以通过如下的方式使用URL传递参数
url = "http://baijiahao.baidu.com/s"
payload = {"id":"1650555453251474626"}
r = requests.get(url,params = payload)
r.encoding = "utf-8"
print(r.url)
#r.url 结果为:http://baijiahao.baidu.com/s?id=1650555453251474626
print(r.text)

你可能感兴趣的:(python 爬虫学习笔记(一)--- requests获取网页源代码(get请求 post请求区别))