HTTP响应(Response)

# HTTP响应(Pesponse)
'''
当网站服务器接收到浏览器的请求后,会发送响应信息给浏览器,这个响应就叫做HTTP响应。
一个完整的响应消息主要包括:
响应状态码(Response Status Code);
响应头(Response Headers);
响应体(Response Body)。
'''

# 1.响应状态码(Response Status Code)
'''
响应状态码表示服务器对请求的响应结果。
例如,200代表服务器的响应成功,403代表禁止访问,404代表页面未找到,408代表请求超时。
浏览器会根据状态码做出响应的处理。
在爬虫中,可以根据状态码来判断服务器的状态,如果状态码为200,则继续处理数据,否则直接忽略。
下表列举了常见的状态码:
'''

HTTP响应(Response)_第1张图片

# 2.响应头(Response Headers)
'''
响应头中包含了服务器对请求的应答信息。
在Chrome浏览器的“开发者工具“中,响应头的内容在Header选线卡中的Response Headers目录中,如下图所示
'''

HTTP响应(Response)_第2张图片

'''
Date:服务器响应时间。
Content-Type:返回数据的文档类型,如text/html代表返回HTML文档;application/x-javascript代表返回JavaScript文件;image/jpeg代表返回图片。
Content-Encoding:服务器支持的返回内容压缩编码类型。
Server:服务器软件的名称。
Set-Cookie:设置HTTP Cookie。
Expires:响应过期的日期和时间。
'''
# 3.响应体(Response Body)
'''
响应体中存放服务器发送给浏览器的正文数据。
在Chrome浏览器的“开发者工具”中,与Headers选项卡平行的Response选项卡中存储的就是响应体数据。
比如请求访问百度首页时,它的响应体就是百度首页的HTML代码
在爬虫中,我们从响应体中获取HTML代码、JSON数据和网络图片,然后从中提取相应的内容。
'''

你可能感兴趣的:(python,http)