网络编程系列之一:Http协议介绍

Http协议介绍

  1. Http协议简介

    HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。
    我们把Http协议中通信的两方称作Client和Server(或Host),Client向Server端经过Http协议发送一个Request,Server端收到Request后经过一些处理返回Client一个Response,整个过程如下:
          网络编程系列之一:Http协议介绍_第1张图片

    HTTP协议的主要特点:

支持C/S(客户/服务器)模式。

简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST,每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。

无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

无状态:HTTP协议是无状态协议,无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。

2.URL详解

http://www.mywebsize.com/sj/test:id=8079?name=sviergn&x=true#stuff

Scheme: http
host:www.mywebsite.com
path:/sj/test
URL params:name=sviergn&x=true
Query String:name=sviergn&x=true
Anchor:stuff
  • scheme: 指定底层使用的协议(例如:http,https,ftp)
  • host:HTTP服务器的IP地址或者域名
  • port#:HTTP服务器的默认端口是80,这种情况下端口号可以省略。如果使用了别的端口,需要指明。http://www.mywebsize.com:8080/
  • path:访问资源的路径,是指在服务器里文件存储的路径
  • url-params
  • query-string:发送给http服务器的数据
  • anchor:锚,指向指定路径后的那个页面特定的地方

3.无状态的协议
http协议是无状态的:

同一个客户端的这次请求和上一次请求是没有对应关系,对http服务器来说,它并不知道俩个请求来自于同一个客户端。
解决方法:Cookie机制来维护状态

4.Request/Response,请求响应协议
我们在浏览器中输入URLhttp://www.cniao5.com/course/topic/3,在页面下右击->检查->NetWork->Headers 将会得到信息:

GET /course/topic/3 HTTP/1.1
Host: www.cniao5.com
Connection: keep-alive
Cache-Control: max-age=0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36
Referer: http://www.cniao5.com/
Accept-Encoding: gzip, deflate, sdch
Accept-Language: zh-CN,zh;q=0.8
Cookie: remember_token=270903|3d71200624c86ffefd93f9023192c00a89e83040; CNZZDATA1256106650=1161511032-1475145853-null%7C1477476921; session=dde6afe2-2e6f-4608-a70e-ece6829e7a21

我们把请求报文概括为下面格式:
       网络编程系列之一:Http协议介绍_第2张图片
通常来说一个HTTP请求报文由请求行、请求报头、空行、和请求数据4个部分组成。
请求行

请求行由请求方法,URL字段和HTTP协议的版本组成,格式如下:

Method   Request-URI  HTTP-Version   CRLF

  • 其中 Method表示请求方法;Request-URI是一个统一资源标识符;HTTP-Version表示请求的HTTP协议版本;CRLF表示回车和换行(除了作为结尾的CRLF外,不允许出现单独的CR或LF字符)。

    HTTP请求方法有8种,分别是GET、POST、DELETE、PUT、HEAD、TRACE、CONNECT
    、OPTIONS。其中PUT、DELETE、POST、GET分别对应着增删改查,对于移动开发最常用的就是POST和GET了。

    GET:请求获取Request-URI所标识的资源
    POST:在Request-URI所标识的资源后附加新的数据
    PUT:请求服务器存储一个资源,并用Request-URI作为其标识
    TRACE : 请求服务器回送收到的请求信息,主要用于测试或诊断
    CONNECT: HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。
    OPTIONS :请求查询服务器的性能,或者查询与资源相关的选项和需求

  • 请求数据不在GET方法中使用,而是在POST方法中使用。POST方法适用于需要客户填写表单(现在也常常用json)的场合,与请求数据相关的最常用的请求头是Content-Type和Content-Length。

我们在浏览器中输入URLhttp://www.cniao5.com/course/topic/3,在页面下右击->检查->NetWork->Headers 将会得到信息:

HTTP/1.1 200 OK
Server: nginx
Date: Wed, 26 Oct 2016 11:46:31 GMT
Content-Type: text/html; charset=utf-8
Transfer-Encoding: chunked
Connection: keep-alive
Vary: Accept-Encoding
Set-Cookie: session=dde6afe2-2e6f-4608-a70e-ece6829e7a21; Domain=.cniao5.com; Expires=Wed, 26-Oct-2016 13:46:31 GMT; HttpOnly; Path=/
Content-Encoding: gzip

响应报文的一般格式:
        网络编程系列之一:Http协议介绍_第3张图片
HTTP的响应报文由状态行、消息报头、空行、响应正文组成。
状态行

HTTP-Version  Status-Code  Reason-Phrase  CRLF

HTTP-Version表示服务器HTTP协议的版本;Status-Code表示服务器发回的响应状态代码;Reason-Phrase表示状态代码的文本描述。

常见的状态码如下:

  • 200 OK:客户端请求成功
  • 400 Bad Request:客户端请求有语法错误,不能被服务器所理解
  • 401 Unauthorized:请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
  • 403 Forbidden:服务器收到请求,但是拒绝提供服务
  • 404 :服务器资源不存在
  • 503 Server Unavailable:服务器当前不能处理客户端的请求,一段时间后可能恢复正常

消息报头分为通用报头、请求报头、响应报头、实体报头等。消息头由键值对组成,每行一对,关键字和值用英文冒号“:”分隔。

通用报头

既可以出现在请求报头,也可以出现在响应报头中

Date:表示消息产生的日期和时间
Connection:允许发送指定连接的选项,例如指定连接是连续的,或者指定“close”选项,通知服务器,在响应完成后,关闭连接
Cache-Control:用于指定缓存指令,缓存指令是单向的(响应中出现的缓存指令在请求中未必会出现),且是独立的(一个消息的缓存指令不会影响另一个消息处理的缓存机制)

请求报头

请求报头通知服务器关于客户端求求的信息,典型的请求头有:

  • Host:请求的主机名,允许多个域名同处一个IP地址,即虚拟主机
  • User-Agent:发送请求的浏览器类型、操作系统等信息
  • Accept:客户端可识别的内容类型列表,用于指定客户端接收那些类型的信息
  • Accept-Encoding:客户端可识别的数据编码
  • Accept-Language:表示浏览器所支持的语言类型
  • Connection:允许客户端和服务器指定与请求/响应连接有关的选项,例如这是为Keep-Alive则表示保持连接。
  • Transfer-Encoding:告知接收端为了保证报文的可靠传输,对报文采用了什么编码方式。

响应报头

用于服务器传递自身信息的响应,常见的响应报头:

  • Location:用于重定向接受者到一个新的位置,常用在更换域名的时候
  • Server:包含可服务器用来处理请求的系统信息,与User-Agent请求报头是相对应的

实体报头

实体报头用来定于被传送资源的信息,既可以用于请求也可用于响应。请求和响应消息都可以传送一个实体,常见的实体报头为:

  • Content-Type:发送给接收者的实体正文的媒体类型 Content-Lenght:实体正文的长度
  • Content-Language:描述资源所用的自然语言,没有设置则该选项则认为实体内容将提供给所有的语言阅读
  • Content-Encoding:实体报头被用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容的编码,因而要获得
  • Content-Type报头域中所引用的媒体类型,必须采用相应的解码机制
  • Last-Modified:实体报头用于指示资源的最后修改日期和时间 Expires:实体报头给出响应过期的日期和时间

4.最后给大家总结一下移动端用的最多的get请求和post请求的作用

  • GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连,如 EditPosts.aspx?name=test1&id=123456。POST方法是把提交的数据放在HTTP包得Body中。

  • GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST提交的数据没有限制。

    -GET提交的数据会带来安全问题。比如登录功能,GET方法提交数据必须在url之后拼接俩个key-value对,易被发现。

你可能感兴趣的:(android,面向对象,通信,http协议,网络编程)