目录
- Requests
- 1. 准备
- 2. 发送GET、POST请求,获取响应
- 3. response的方法
- 4. 获取网页源码的正确方法(通过下面三种方式一定能获取到网页的正确解码后的字符串)
- 5. header 的使用
- 6. 使用超时参数
- 7. Retrying
- 处理 cookie 相关请求
Requests
1. 准备
2. 发送GET、POST请求,获取响应
requests.get(url)
: 发送get请求,请求url地址对应的响应
requests.post(url,data={请求体的字典})
:发送post请求,请求url地址对应的响应
url = "baidu.com"
query_hearders = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.20 Safari/537.36"}
response = requests.get(url)
responsePost = requests.post(url, data = query_headers, )
print(response)
print(response.content.decode())
3. response的方法
response.text
- 该方式往往出现乱码,出现乱码使用response.encoding=‘utf-8’
- 该方法获取网页的HTML字符串
response.content.decode()
response.request.url
response.url
response.reques.headers
response.headers
4. 获取网页源码的正确方法(通过下面三种方式一定能获取到网页的正确解码后的字符串)
response.content.decode()
response.content.decode('gbk')
response.text
5. header 的使用
headers = {
"User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1",
"Referer":"https://fanyi.baidu.com/translate?aldtype=16047"}
response = requests.get(url, headers)
6. 使用超时参数
requests.get(url, headers=headers, timeout=3)
7. Retrying
from retrying import retry
@retry(stop_max_attempt_number=3)
def fun1():
print('this is func1')
raise ValueError('this is test error')
处理 cookie 相关请求