04 Response对象的status_code属性可以获取响应状态码

04 Response对象的status_code属性可以获取响应状态码

文章目录

  • 04 Response对象的status_code属性可以获取响应状态码
    • 4.1 Response.status_code 可以获取响应状态码
    • 4.2 课堂实操
      • 4.2.1 访问百度网页
      • 4.2.2 访问豆瓣电影首页
      • 4.2.3 访问知乎首页
      • 4.2.4 访问B站
    • 4.3 总结

4.1 Response.status_code 可以获取响应状态码

爬虫的第一步是获取网页。
而获取网页中最关键的一步就是模拟浏览器向服务器发出请求。

在Python中可以用requests库的get函数模拟浏览器向服务器发起网络请求。

用requests.get()函数成功发起网络请求后,得到的是 注意是得到的是一个类的对象。
注意得到200表示网络请求成功。

当服务器收到网络请求时,会返回一个三位数字的代码响应浏览器的请求,表示服务器对于这个请求的响应状态,我们称之为响应状态码。
其中 200就是响应状态码。

我们要得到具体的响应状态码200可以通过调用 Response 对象的status_code 属性去获得。

4.2 课堂实操

4.2.1 访问百度网页

# 导入访问网页要用的re库
import requests

# 申明一个变量存储网址
# 网址是一个字符串变量,注意网址前后都必须有引号
url = 'https://www.baidu.com/'

# 用requests.get(网址)发送请求,并把响应结果赋值给变量res
# 库名.函数名(要访问的网址) 
res = requests.get(url)


print('******requests.get(url)函数得到的是一个Response对象******')
print(res,'\n') # '\n'表示输出后换行

print('******type()函数查看requests.get()函数返回结果的类型******')
print(type(res),'\n')

print('******打印Response对象的status_code属性,即状态码******')
#    对象.属性
print(res.status_code)

【终端输出】

******requests.get(url)函数得到的是一个Response对象******
 

******type()函数查看requests.get()函数返回结果的类型******
 

******打印Response对象的status_code属性,即状态码******
200

requests.get(url).status_code就成功获取到一个3位数的响应状态码。

4.2.2 访问豆瓣电影首页

# 导入访问网页要用的库
import requests

# 申明一个变量存储网址
# 网址是一个字符串变量,注意网址前后都必须有引号
url = 'https://movie.douban.com'

# 用requests.get(网址)访问网页 
# 库名.函数名(要访问的网址) 
print('******requests.get(url)函数得到的是一个Response对象******')
print(requests.get(url),'\n')


print('******打印Response对象的status_code属性,即状态码******')
print(requests.get(url).status_code)

【终端输出】

******requests.get(url)函数得到的是一个Response对象******
 

******打印Response对象的status_code属性,即状态码******
418

4.2.3 访问知乎首页

# 导入访问网页要用的库
import requests

# 申明一个变量存储网址
# 网址是一个字符串变量,注意网址前后都必须有引号
url = 'https://www.zhihu.com/'

# 用requests.get(网址)访问网页 
# 库名.函数名(要访问的网址) 
print('******requests.get(url)函数得到的是一个Response对象******')
print(requests.get(url),'\n')


print('******打印Response对象的status_code属性,即状态码******')
print(requests.get(url).status_code)

【终端输出】

******requests.get(url)函数得到的是一个Response对象******
 

******打印Response对象的status_code属性,即状态码******
403

4.2.4 访问B站

# 导入访问网页要用的库
import requests

# 申明一个变量存储网址
# 网址是一个字符串变量,注意网址前后都必须有引号
url = 'https://www.bilibili.com/'

# 用requests.get(网址)访问网页 
# 库名.函数名(要访问的网址) 
print('******requests.get(url)函数得到的是一个Response对象******')
print(requests.get(url),'\n')


print('******打印Response对象的status_code属性,即状态码******')
print(requests.get(url).status_code)

【终端输出】

******requests.get(url)函数得到的是一个Response对象******
 

******打印Response对象的status_code属性,即状态码******
403

4.3 总结

04 Response对象的status_code属性可以获取响应状态码_第1张图片

你可能感兴趣的:(网络爬虫,python,爬虫,前端)