网页请求与响应

请求

请求,由客户端向服务端发出,可以分为4部分内容:请求方法(Request Method)、请求的网址(Request URL)请求头(Request Headers)、请求体(Request Body)。

请求方法

常见的请求方法有两种:GET 和 POST

  1. GET请求:该请求中的参数包含在URL里面,数据可以在URL中看到,而POST请求的URL不会包含这些数据,数据是通过表单形式传输的,会包含在请求体中。
  2. GET轻轻提交的数据最多只有1024字节,而POST方式没有限制。

如果需要登录,最好使用POST方式。

其他请求方法还有HEAD、PUT、DELETE、OPTIONS、CONNECT、TRACE等。
作用如下:
GET : 请求页面,并返回页面内容
HEAD : 类似于GET请求,只不过返回的响应中没有具体内容,用于获取报头。
POST : 大多用于提交表单或上传文件,数据包含在请求体中。
PUT : 从客户端向服务器传送的数据取代指定文档中的内容。
DELETE : 请求服务器删除指定的页面
CONNECT : 把服务器当作跳板,让服务器代替客户端访问其他网页。
OPTIONS : 允许客户端查看服务器的性能。
TRACE : 回显服务器收到的请求,主要用于测试或诊断。

请求的网址

请求的网址,即统一资源定位符URL, 它可以唯一确定我们想请求的资源。

请求头

请求头,用来说明服务器要使用的附加信息,比较重要的信息有Cookie、Referer、User-Agent等。

请求体

请求体,一般承载的内容是POST请求中的表单数据,而对GET请求,请求体为空。

响应

响应,由服务端返回给客户端,可分为三部分:响应状态码(Response Status Code)、响应头(Response Headers)和响应体(Response Body)。

响应状态码表示服务器的响应状态,如200代表服务器正常响应,404代表页面未找到,500代表服务器内部发生错误。

响应头包含了服务器对请求的应答信息,如Content-Type、Server、Set-Cookie等。

响应体:响应的正文数据都在响应体中,比如请求网页时,响应体就是网页中的HTML代码。做爬虫请求网页后,要解析的内容就是响应体。

你可能感兴趣的:(网页请求与响应)