【WebSocket】WebSocket长连接与反向代理

一、WebSocket协议


WebSocket是HTML5下一种新的协议。

它实现了浏览器与服务器全双工通信,能更好的节省服务器资源和带宽并达到实时通讯的目的。


它与HTTP一样通过已建立的TCP连接来传输数据,但是它和HTTP最大不同是:

1. WebSocket是一种双向通信协议。在建立连接后,WebSocket服务器端和客户端都能主动向对方发送或接收数据,就像Socket一样;

2. WebSocket需要像TCP一样,先建立连接,连接成功后才能相互通信。


WebSocket是HTML5出的东西(协议),也就是说HTTP协议没有变化,或者说没关系,但HTTP是不支持持久连接的(长连接,循环连接的不算)。

首先HTTP有1.1和1.0之说,也就是所谓的keep-alive,把多个HTTP请求合并为一个。

WebSocket其实是一个新协议,跟HTTP协议基本没有关系,只是为了兼容现有浏览器的握手规范而已,也就是说它是HTTP协议上的一种补充。


可以通过这样一张图理解:

它们有交集,但是并不是全部。

另外Html5是指的一系列新的API,或者说新规范,新技术。

Http协议本身只有1.0和1.1,而且跟Html本身没有直接关系。

通俗来说,你可以用HTTP协议传输非Html数据,就是这样。再简单来说,层级不一样


你可以把 WebSocket 看成是 HTTP 协议为了支持长连接所打的一个大补丁,它和 HTTP 有一些共性,是为了解决 HTTP 本身无法解决的某些问题而做出的一个改良设计。

在以前 HTTP 协议中所谓的 keep-alive connection 是指在一次 TCP 连接中完成多个 HTTP 请求,但是对每个请求仍然要单独发 header;所谓的 polling 是指从客户端(一般就是浏览器)不断主动的向服务器发 HTTP 请求查询是否有新数据。这两种模式有一个共同的缺点,就是除了真正的数据部分外,服务器和客户端还要大量交换 HTTP header,信息交换效率很低。它们建立的“长连接”都是伪.长连接,只不过好处是不需要对现有的 HTTP server 和浏览器架构做修改就能实现。

WebSocket 解决的第一个问题是,通过第一个 HTTP request 建立了 TCP 连接之后,之后的交换数据都不需要再发 HTTP request了,使得这个长连接变成了一个真.长连接。但是不需要发送 HTTP header就能交换数据显然和原有的 HTTP 协议是有区别的,所以它需要对服务器和客户端都进行升级才能实现。在此基础上 WebSocket 还是一个双通道的连接,在同一个 TCP 连接上既可以发也可以收信息。此外还有 multiplexing 功能,几个不同的 URI 可以复用同一个 WebSocket 连接。这些都是原来的 HTTP 不能做到的。

另外说一点技术细节,因为看到有人提问 WebSocket 可能进入某种半死不活的状态。这实际上也是原有网络世界的一些缺陷性设计。上面所说的 WebSocket 真.长连接虽然解决了服务器和客户端两边的问题,但坑爹的是网络应用除了服务器和客户端之外,另一个巨大的存在是中间的网络链路。一个 HTTP/WebSocket 连接往往要经过无数的路由,防火墙。

你以为你的数据是在一个“连接”中发送的,实际上它要跨越千山万水,经过无数次转发,过滤,才能最终抵达终点。在这过程中,中间节点的处理方法很可能会让你意想不到。

比如说,这些坑爹的中间节点可能会认为一份连接在一段时间内没有数据发送就等于失效,它们会自作主张的切断这些连接。在这种情况下,不论服务器还是客户端都不会收到任何提示,它们只会一厢情愿的以为彼此间的红线还在,徒劳地一边又一边地发送抵达不了彼岸的信息。而计算机网络协议栈的实现中又会有一层套一层的缓存,除非填满这些缓存,你的程序根本不会发现任何错误。这样,本来一个美好的 WebSocket 长连接,就可能在毫不知情的情况下进入了半死不活状态。

解决方案,WebSocket 的设计者们也早已想过,就是让服务器和客户端能够发送 Ping/Pong Frame(RFC 6455 - The WebSocket Protocol)。这种 Frame 是一种特殊的数据包,它只包含一些元数据而不需要真正的 Data Payload,可以在不影响 Application 的情况下维持住中间网络的连接状态。



二、Websocket优点

首先,Websocket是一个持久化的协议,相对于HTTP这种非持久的协议来说。

简单的举个例子吧,用目前应用比较广泛的PHP生命周期来解释。

1) HTTP的生命周期通过Request来界定,也就是一个Request 一个Response,那么HTTP1.0,这次HTTP请求就结束了。

在HTTP1.1中进行了改进,使得有一个keep-alive,也就是说,在一个HTTP连接中,可以发送多个Request,接收多个Response。

但是请记住 Request = Response , 在HTTP中永远是这样,也就是说一个request只能有一个response。而且这个response也是被动的,不能主动发起。


首先Websocket是基于HTTP协议的,或者说借用了HTTP的协议来完成一部分握手,在握手阶段是一样的。

首先我们来看个典型的Websocket握手:


熟悉HTTP的童鞋可能发现了,这段类似HTTP协议的握手请求中,多了几个东西。


这个就是Websocket的核心了,告诉Apache、Nginx等服务器:

注意啦,我发起的是Websocket协议,快点帮我找到对应的助理处理,不是那个HTTP。

首先,Sec-WebSocket-Key 是一个Base64 encode的值,这个是浏览器随机生成的,告诉服务器:你好,我要验证你是不是真的是Websocket助理。

然后,Sec_WebSocket-Protocol 是一个用户定义的字符串,用来区分同URL下,不同的服务所需要的协议。简单理解:今晚我要服务A,别搞错啦!

最后,Sec-WebSocket-Version 是告诉服务器所使用的Websocket Draft(协议版本),在最初的时候,Websocket协议还在 Draft 阶段,各种奇奇怪怪的协议都有,而且还有很多期奇奇怪怪不同的东西,什么Firefox和Chrome用的不是一个版本之类的,当初Websocket协议太多可是一个大难题。不过现在还好,已经定下来啦,大家都使用的一个东西。


然后服务器会返回下列东西,表示已经接受到请求, 成功建立Websocket啦!


格式依然是固定的,告诉客户端即将升级的是Websocket协议,而不是mozillasocket,lurnarsocket或者shitsocket。

然后,Sec-WebSocket-Accept 这个则是经过服务器确认,并且加密过后的 Sec-WebSocket-Key。

服务器:好啦好啦,知道啦,给你看我的ID CARD来证明行了吧!

后面的,Sec-WebSocket-Protocol 则是表示最终使用的协议。

至此,HTTP已经完成它所有工作了,接下来就是完全按照Websocket协议进行了。


那到底Websocket有什么鬼用,http long poll,或者ajax轮询不都可以实现实时信息传递么?!

Websocket的作用

在讲Websocket之前,顺带着讲下 long poll 和 ajax轮询 的原理。


ajax轮询 

首先是 ajax轮询 ,ajax轮询 的原理非常简单,让浏览器隔个几秒就发送一次请求,询问服务器是否有新信息。



long poll

ong poll 其实原理跟 ajax轮询 差不多,都是采用轮询的方式,不过采取的是阻塞模型(一直打电话,没收到就不挂电话),也就是说,客户端发起连接后,如果没消息,就一直不返回Response给客户端。直到有消息才返回,返回完之后,客户端再次建立连接,周而复始。


从上面可以看出其实这两种方式,都是在不断地建立HTTP连接,然后等待服务端处理,可以体现HTTP协议的另外一个特点,被动性

何为被动性呢,其实就是,服务端不能主动联系客户端,只能有客户端发起。

简单地说就是,服务器是一个很懒的冰箱(这是个梗)(不会、不能主动发起连接),但是上司有命令,如果有客户来,不管多么累都要好好接待。


从上面很容易看出来,不管怎么样,上面这两种都是非常消耗资源的。

ajax轮询 需要服务器有很快的处理速度和资源。(速度)

long poll 需要有很高的并发,也就是说同时接待客户的能力。(场地大小)

所以ajax轮询 和long poll 都有可能发生这种情况:



言归正传,我们来说Websocket。

通过上面这个例子,我们可以看出,这两种方式都不是最好的方式,需要很多资源。

一种需要更快的速度,一种需要更多的'电话'。这两种都会导致'电话'的需求越来越高。

HTTP还是一个无状态协议。通俗的说就是,服务器因为每天要接待太多客户了,是个健忘鬼,你一挂电话,他就把你的东西全忘光了,把你的东西全丢掉了。你第二次还得再告诉服务器一遍。所以在这种情况下出现了,Websocket出现了。


websocket解决了HTTP的这几个难题:

首先,被动性,当服务器完成协议升级后(HTTP->Websocket),服务端就可以主动推送信息给客户端了。

上面的情景可以做如下修改:

这样,只需要经过一次HTTP请求,就可以做到源源不断的信息传送了。

在程序设计中,这种设计叫做回调,即:你有信息了再来通知我,而不是我傻乎乎的每次跑来问你。

这样的协议解决了上面同步有延迟,而且还非常消耗资源的这种情况。


那么为什么他会解决服务器上消耗资源的问题呢?

其实我们所用的程序是要经过两层代理的,即HTTP协议在Nginx等服务器的解析下,然后再传送给相应的Handler(PHP等)来处理。

简单地说,我们有一个非常快速的接线员(Nginx),他负责把问题转交给相应的客服(Handler)

本身接线员基本上速度是足够的,但是每次都卡在客服(Handler)了,老有客服处理速度太慢,导致客服不够。

Websocket就解决了这样一个难题,建立后,可以直接跟接线员建立持久连接,有信息的时候客服想办法通知接线员,然后接线员再统一转交给客户。

这样就可以解决客服处理速度过慢的问题了。

同时,在传统的方式上,要不断的建立,关闭HTTP协议,由于HTTP是非状态性的,每次都要重新传输identity info(鉴别信息),来告诉服务端你是谁。

虽然接线员很快速,但是每次都要听这么一堆,效率也会有所下降的,同时还得不断把这些信息转交给客服,不但浪费客服的处理时间,而且还会在网路传输中消耗过多的流量/时间。

但是Websocket只需要一次HTTP握手,所以说整个通讯过程是建立在一次连接/状态中,也就避免了HTTP的非状态性,服务端会一直知道你的信息,直到你关闭请求,这样就解决了接线员要反复解析HTTP协议,还要查看identity info的信息。

同时由客户主动询问,转换为服务器(推送)有信息的时候就发送(当然客户端还是等主动发送信息过来的),没有信息的时候就交给接线员(Nginx),不需要占用本身速度就慢的客服(Handler)了。


至于怎么在不支持Websocket的客户端上使用Websocket?

答案是:不能

但是可以通过上面说的 long poll 和 ajax 轮询来模拟出类似的效果


三、nginx代理websocket应用


HTML5 是一个很宽广的概念,是对大量新 API 的总称。不存在 HTTP5 的概念,HTTP 最高的版本号是 1.1。简单来说,你可以完全抛开 HTML5 和 HTML4 的概念,只考虑浏览器要么支持 WebSocket,要么不支持。

WebSocket 跟其他 API 比较不一样的是,它不仅仅依赖于浏览器支持,同时要求服务器和代理(假若需要经过代理的话)支持。WebSocket 本质上跟 HTTP 完全不一样,只不过为了兼容性,WebSocket 的握手是以 HTTP 的形式发起的,如果服务器或者代理不支持 WebSocket,它们会把这当做一个不认识的 HTTP 请求从而优雅地拒绝掉。


WebSocket协议和http协议是不同的。

虽然这两个协议,都处于开放式系统网络交互模型中的第七层,而且都是基于第四层。

WebSocket协议被设计可以在http协议的80和443端口上支持http代理和中介功能。

nginx代理websocket,要将客户机和服务器之间的连接从HTTP/1.1转换为WebSocket,需要使用HTTP/1.1中提供的协议交换机制。

有一个微妙之处:由于“Upgrade”是一个逐跳的报头,它不会从客户端传递到代理服务器。

通过正向代理,客户端可以使用CONNECT方法来避免这个问题,但是这不适用于反向代理,因为客户端不知道任何代理服务器,并且需要在代理服务器上进行特殊处理。

从版本1.3.13开始,nginx实现了一种特殊的操作模式,如果代理服务器返回代码为101(交换协议)的响应,并且客户端通过请求中的“Upgrade”报头请求协议交换,则允许在客户端和代理服务器之间建立隧道。

如上所述,包括“Upgrade”和“Connection”在内的逐跳报头不会从客户端传递到代理服务器,因此,为了让被代理服务器知道客户端将协议切换到WebSocket的意图,必须传递这些报头:

一个更复杂的示例,其中发送到代理服务器的请求中“Connection”请求头的值取决于客户端请求头中是否存在“Upgrade”字段:


四、参考

nginx配置Websocket反向代理

https://soulchild.cn/1866.html


Nginx 配置支持 WebSocket

https://www.cnblogs.com/nethrd/p/9706847.html


WebSocket 是什么原理?为什么可以实现持久连接?

https://www.zhihu.com/question/20215561

websocket 实现长连接原理

https://blog.csdn.net/qq_35623773/article/details/87868682

轮询、长轮询、长连接、websocket

https://www.cnblogs.com/huchong/p/8595644.html


WebSocket 长连接应用场景

http://www.uml.org.cn/ajax/201712191.asp


服务器常见错误代码500、501、502、503、504、505

https://www.cnblogs.com/harlanzhang/p/6196370.html

你可能感兴趣的:(【WebSocket】WebSocket长连接与反向代理)