前端（五）浏览器（协议）篇

协议篇

1、从URL输入到页面展现到底发生什么？

总体来说分为以下几个过程:

（1）DNS服务器解析域名，找到对应服务器的IP地址;
（2）和服务器建立TCP三次握手连接；
（3）发送HTTP请求，服务器会根据HTTP请求到数据服务器取出相应的资源，并返回给浏览器；
（4）浏览器处理响应
- 加载：浏览器对一个html页面的加载顺序是从上而下的。
- 当加载到外部css文件、图片等资源，浏览器会再发起一次http请求，来获取外部资源。
- 当加载到js文件，html文档会挂起渲染（加载解析渲染同步）的线程，等待js文件加载、解析完毕才可以恢复html文档的渲染线程。
- 解析：解析DOM树和CSSDOM树。
- 渲染：构建渲染树，将DOM树进行可视化表示，将页面呈现给用户。

推荐 浪里行舟 文章从URL输入到页面展现到底发生什么？

2、浏览器如何解析渲染页面？

浏览器解析渲染页面分为一下五个步骤：

根据 HTML 解析出 DOM 树
根据CSS解析生成 CSS 规则树
结合 DOM 树和CSS 规则树，生成渲染树
根据渲染树计算每一个节点的信息
根据计算好的信息绘制页面

3、缓存

3.1、DNS缓存

1）DNS查询过程如下:

首先搜索浏览器自身的DNS缓存,如果存在，则域名解析到此完成。
如果浏览器自身的缓存里面没有找到对应的条目，那么会尝试读取操作系统的hosts文件看是否存在对应的映射关系,如果存在，则域名解析到此完成。
如果本地hosts文件不存在映射关系，则查找本地DNS服务器(ISP服务器,或者自己手动设置的DNS服务器),如果存在,域名到此解析完成。
如果本地DNS服务器还没找到的话,它就会向根服务器发出请求,进行递归查询。

2）DNS 属于哪个层级?工作在哪个层级?

DNS属于应用层协议, 至于TCP/UDP哪一层上面跑,DNS 默认端口是53,走 UDP

DNS 的解析的几个记录类型需要了解:

A: 域名直接到 IP
CNAME: 可以多个域名映射到一个主机,类似在 Github Page就用 CNAME 指向 -MX: 邮件交换记录,用的不多,一般搭建邮件服务器才会用到
NS: 解析服务记录,可以设置权重,指定谁解析
TTL: 就是生存时间(也叫缓存时间),一般的域名解析商都有默认值,也可以人为设置
TXT: 一般指某个主机名或域名的说明

3.2、CDN 缓存

什么是CDN

全称 Content Delivery Network,即内容分发网络。

摘录一个形象的比喻,来理解CDN是什么。

10年前，还没有火车票代售点一说，12306.cn更是无从说起。那时候火车票还只能在火车站的售票大厅购买，而我所在的小县城并不通火车，火车票都要去市里的火车站购买，而从我家到县城再到市里，来回就是4个小时车程，简直就是浪费生命。后来就好了，小县城里出现了火车票代售点，甚至乡镇上也有了代售点，可以直接在代售点购买火车票，方便了不少，全市人民再也不用在一个点苦逼的排队买票了。

简单的理解CDN就是这些代售点(缓存服务器)的承包商,他为买票者提供了便利,帮助他们在最近的地方(最近的CDN节点)用最短的时间(最短的请求时间)买到票(拿到资源),这样去火车站售票大厅排队的人也就少了。也就减轻了售票大厅的压力(起到分流作用,减轻服务器负载压力)。

用户在浏览网站的时候，CDN会选择一个离用户最近的CDN边缘节点来响应用户的请求，这样海南移动用户的请求就不会千里迢迢跑到北京电信机房的服务器（假设源站部署在北京电信机房）上了。

CDN缓存

关于CDN缓存,在浏览器本地缓存失效后,浏览器会向CDN边缘节点发起请求。类似浏览器缓存,CDN边缘节点也存在着一套缓存机制。CDN边缘节点缓存策略因服务商不同而不同，但一般都会遵循http标准协议，通过http响应头中的

Cache-control: max-age   //后面会提到
复制代码

复制代码的字段来设置CDN边缘节点数据缓存时间。

当浏览器向CDN节点请求数据时，CDN节点会判断缓存数据是否过期，若缓存数据并没有过期，则直接将缓存数据返回给客户端；否则，CDN节点就会向服务器发出回源请求，从服务器拉取最新数据，更新本地缓存，并将最新数据返回给客户端。

CDN服务商一般会提供基于文件后缀、目录多个维度来指定CDN缓存时间，为用户提供更精细化的缓存管理。

CDN 优势

CDN节点解决了跨运营商和跨地域访问的问题，访问延时大大降低。
大部分请求在CDN边缘节点完成，CDN起到了分流作用，减轻了源服务器的负载。

3.3、浏览器缓存(http缓存)

请看webfansplz 的文章实践这一次,彻底搞懂浏览器缓存机制

三级缓存原理 (访问缓存优先级)

先在内存中查找,如果有,直接加载。
如果内存中不存在,则在硬盘中查找,如果有直接加载。
如果硬盘中也没有,那么就进行网络请求。
请求获取的资源缓存到硬盘和内存。

浏览器缓存的分类

强缓存
协商缓存

浏览器再向服务器请求资源时,首先判断是否命中强缓存,再判断是否命中协商缓存!

浏览器缓存的优点

1.减少了冗余的数据传输

2.减少了服务器的负担，大大提升了网站的性能

3.加快了客户端加载网页的速度

强缓存

浏览器在加载资源时，会先根据本地缓存资源的 header 中的信息判断是否命中强缓存，如果命中则直接使用缓存中的资源不会再向服务器发送请求。
复制代码

这里的 header中的信息指的是expires 和 cahe-control

协商缓存

当强缓存没有命中的时候，浏览器会发送一个请求到服务器，服务器根据 header 中的部分信息来判断是否命中缓存。如果命中，则返回 304 ，告诉浏览器资源未更新，可使用本地的缓存。
复制代码

这里的 header 中的信息指的是Last-Modify/If-Modify-Since和 ETag/If-None-Match.

Last-Modified 与 ETag是可以一起使用的，服务器会优先验证 ETag，一致的情况下，才会继续比对 Last-Modified，最后才决定是否返回304。

总结

当浏览器再次访问一个已经访问过的资源时，它会这样做：
复制代码

1.看看是否命中强缓存，如果命中，就直接使用缓存了。
2.如果没有命中强缓存，就发请求到服务器检查是否命中协商缓存。
3.如果命中协商缓存，服务器会返回 304 告诉浏览器使用本地缓存。
4.否则，返回最新的资源。

参考文献：

前端性能优化之缓存利用

4、浏览器内核有哪些，移动端用的是哪个

Trident内核：IE,MaxThon,TT,The Word,360,搜狗浏览器等。[又称为MSHTML]
Gecko内核：Netscape6及以上版本，FF,MozillaSuite/SeaMonkey等；
Presto内核：Opera7及以上。[Opera内核原为：Presto，现为：Blink]
Webkit内核：Safari,Chrome等。[Chrome的:Blink(Webkit的分支)]

对于Android手机而言，使用率最高的就是Webkit内核。

协议篇

1、OSI七层网络模型

OSI七层模型	作用	对应协议	对应设备
应用层	它是计算机用户，以及各种应用程序和网络之间的接口	`HTTP`, `FTP`, `SMTP`, `POP3`	计算机设备
表示层	信息的语法语义以及它们的关系，如加密解密、转换翻译、压缩解压缩	IPX, LPP, XDP
会话层	建立、维护、管理应用程序之间的会话	`SSL`,`TLS`, `DAP`, `LDAP`
传输层	服务点编址，分段与重组、连接控制、流量控制、差错控制	`TCP`, `UDP`	防火墙
网络层	为网络设备提供逻辑地址，进行路由选择、分组转发	`IP` ，`ARP` ，`RARP` ，`ICMP` ，`IGMP`	路由器
数据链路层	物理寻址，同时将原始比特流转变为逻辑传输路线	`PPTP`, `ARP`, `RARP`	交换机
物理层	机械、电子、定时接口通道信道上的原始比特流传输	IEEE 802.2, Ethernet v.2, Internetwork	网卡

2、介绍下HTTP报文的组成部分？

请求报文：请求行、请求头、空行、请求体
响应报文：状态行、响应头、空行、响应体

以请求报文为例：

请求行: 这个好理解就是访问的方法+ 协议+ 访问的 URL 构成
请求头: key-value值，告诉服务端需要的内容
空行：告知服务端以下内容为请求体
请求体: 数据部分

请求报文知道,那你说说cookie是如何跟随请求的?

Cookie就是保存在 HTTP 协议的请求或者应答头部(Cookie 是由服务端生成),这样一路漂泊...

Cookie 隔离是什么,如何做;

cookie 隔离就是降低 header 的数据包含,以达到加快访问速度的目的

方案: 静态资源丢 CDN或者非主域来加载

3、常见的HTTP方法有哪些？

-GET：获取资源

POST：传输资源
PUT：更新资源
DELETE：删除资源
HEAD：获得报文首部

4、POST和GET的区别是什么？

1）GET在浏览器回退时是无害的，而POST会再次提交请求

2）GET请求会被浏览器主动缓存，而POST不会，除非手动设置

3）GET请求参数会被完整保留在浏览器的历史记录里，而POST中的参数不会被保留

4）POST比GET安全，因参数暴露在URL上

5）GET参数通过URL传递，POST放在Request body中

高级区别：

GET 的本质是「得」，而 POST的本质是「给」。GET 的内容可以被浏览器缓存，而POST的数据不可以。
get产生一个TCP数据包，一个是请求头，一个请求体的；post产生两个TCP数据包；
在一次请求中，get一次性完成，post在部分浏览器（除了火狐）需要发送两次信息，所以get比post更快，更有效率。
6) 补充补充一个get和post在缓存方面的区别：
- get请求类似于查找的过程，用户获取数据，可以不用每次都与数据库连接，所以可以使用缓存。
- post不同，post做的一般是修改和删除的工作，所以必须与数据库交互，所以不能使用缓存。因此get请求适合于请求缓存。

推荐文章 WebTechGarden 微信公众号的文章 99%的人都理解错了HTTP中GET与POST的区别

4.1、get和post分别进行几次数据交互

get请求过程：（2次交互）
- 浏览器请求tcp连接（第一次握手）
- 服务器答应进行tcp连接（第二次握手）
- 浏览器确认，并发送get请求头和数据（第三次握手，这个报文比较小，所以http会在此时进行第一次数据发送）
- 服务器返回200 ok响应。
post请求过程：（3次交互）
- 浏览器请求tcp连接（第一次握手）
- 服务器答应进行tcp连接（第二次握手）
- 浏览器确认，并发送post请求头（第三次握手，这个报文比较小，所以http会在此时进行第一次数据发送）
服务器返回100 continue响应
浏览器开始发送数据
服务器返回200 ok响应

5、HTTP1.1的持久链接？

HTTP协议采用“请求-应答”模式，当使用普通模式，即非keep-Alive模式时，每个请求/应答客户和服务器都要新一个连接，完成之后立即断开连接。
当使用keep-Alive模式（持久链接）时，keep-Alive功能使客户端到服务器端的连接持久有效，当出现服务器的后继请求时，keep-Alive避免重新建立连接

6、http和https的基本概念?

http: 超文本传输协议，是互联网上应用最为广泛的一种网络协议，是一个客户端和服务器端请求和应答的标准（TCP），用于从WWW服务器传输超文本到本地浏览器的传输协议，它可以使浏览器更加高效，使网络传输减少。

https: 是以安全为目标的HTTP通道，简单讲是HTTP的安全版，即HTTP下加入SSL层，HTTPS的安全基础是SSL，因此加密的详细内容就需要SSL。

https协议的主要作用是：建立一个信息安全通道，来确保数组的传输，确保网站的真实性。

7、HTTP 和 HTTPS 有何差异?

http传输的数据都是未加密的，也就是明文的，网景公司设置了SSL协议来对http协议传输的数据进行加密处理，简单来说https协议是由http和ssl协议构建的可进行加密传输和身份认证的网络协议，比http协议的安全性更高。
复制代码

主要的区别如下：

Https协议需要ca证书，费用较高。
http是超文本传输协议，信息是明文传输，https则是具有安全性的ssl加密传输协议。
使用不同的链接方式，端口也不同，一般而言，http协议的端口为80，https的端口为443
http的连接很简单，是无状态的；HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议，比http协议安全。

8、Https协议的工作原理

1）客户使用https url访问服务器，则要求web 服务器建立ssl链接。

2）web服务器接收到客户端的请求之后，会将网站的证书（证书中包含了公钥），返回或者说传输给客户端。

3）客户端和web服务器端开始协商SSL链接的安全等级，也就是加密等级。

4）客户端浏览器通过双方协商一致的安全等级，建立会话密钥，然后通过网站的公钥来加密会话密钥，并传送给网站。

5）web服务器通过自己的私钥解密出会话密钥。

6）web服务器通过会话密钥加密与客户端之间的通信。
复制代码

9、https协议的优点

使用HTTPS协议可认证用户和服务器，确保数据发送到正确的客户机和服务器；
HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议，要比http协议安全，可防止数据在传输过程中不被窃取、改变，确保数据的完整性。
HTTPS是现行架构下最安全的解决方案，虽然不是绝对安全，但它大幅增加了中间人攻击的成本。

10、https协议的缺点

https握手阶段比较费时，会使页面加载时间延长50%，增加10%~20%的耗电。
https缓存不如http高效，会增加数据开销。
SSL证书也需要钱，功能越强大的证书费用越高。
SSL证书需要绑定IP，不能再同一个ip上绑定多个域名，ipv4资源支持不了这种消耗。

11、HTTPS中的TLS/SSL是如何保护数据？

一般有两种形式,非对称加密,生成公钥和私钥,私钥丢服务器,公钥每次请求去比对验证;
更严谨的采用 CA(Certificate Authority),给密钥签名....

12、对称加密和非对称加密,能说说整个流程如何运转的么(HTTPS)

对称加密:

双方都有同样的密钥,每次通讯都要生成一个唯一密钥,速度很快
安全性较低且密钥增长的数量极快

非对称加密(一般用 RSA)

安全性很高,对资源消耗很大(CPU),目前主流的加密算法(基本用于交换密钥或签名,而非所有通讯内容)

CA(数字签名):

这个是为了防止中间人给偷换了造成数据被窃取而诞生的用一些权威机构颁布的算法来签名,权威机构做中间人,通讯过程都会跟机构核对一遍

13、http2.0

提升访问速度（可以对于，请求资源所需时间更少，访问速度更快，相比http1.0）
允许多路复用：多路复用允许同时通过单一的HTTP/2连接发送多重请求-响应信息。改善了：在http1.1中，浏览器客户端在同一时间，针对同一域名下的请求有一定数量限制（连接数量），超过限制会被阻塞。
二进制分帧：HTTP2.0会将所有的传输信息分割为更小的信息或者帧，并对他们进行二进制编码
首部压缩
服务器端推送

14、TCP和UDP的区别

（1）TCP是面向连接的，udp是无连接的即发送数据前不需要先建立链接。

（2）TCP提供可靠的服务,UDP不可靠交付。并且因为tcp可靠，面向连接，不会丢失数据因此适合大数据量的交换。

（3）TCP是面向字节流，UDP面向报文，并且网络出现拥塞不会使得发送速率降低。

（4）TCP只能是1对1的，UDP支持1对1,1对多。

（5）TCP的首部较大为20字节，而UDP只有8字节。

（6）TCP是面向连接的可靠性传输，而UDP是不可靠的。
复制代码

15、状态码

1XX: 一般用来判断协议更换或者确认服务端收到请求这些

100: 服务端收到部分请求,若是没有拒绝的情况下可以继续传递后续内容

101: 客户端请求变换协议,服务端收到确认
复制代码

2xx: 请求成功,是否创建链接,请求是否接受,是否有内容这些

200: (成功)服务器已成功处理了请求。

201: (已创建)请求成功并且服务器创建了新的资源。

202: (已接受)服务器已接受请求，但尚未处理。

204: (无内容)服务器成功处理了请求，但没有返回任何内容。
复制代码

3XX: 一般用来判断重定向和缓存

301: 所有请求已经转移到新的 url(永久重定向),会被缓存

302: 临时重定向,不会被缓存

304: 本地资源暂未改动,优先使用本地的(根据If-Modified-Since or If-Match去比对服务器的资源,缓存)
复制代码

4XX: 一般用来确认授权信息,请求是否出错,页面是否丢失

400: 请求出错

401: 未授权,不能读取某些资源

403: 阻止访问,一般也是权限问题

404: 页面丢失,资源没找到

408: 请求超时

415: 媒介类型不被支持，服务器不会接受请求。
复制代码

5XX: 基本都是服务端的错误

500: 服务端错误

502: 网关错误

504: 网关超时
复制代码

16、补充400和401、403状态码

(1)400状态码：请求无效

产生原因：

前端提交数据的字段名称和字段类型与后台的实体没有保持一致

前端提交到后台的数据应该是json字符串类型，但是前端没有将对象JSON.stringify转化成字符串。
复制代码

解决方法：

对照字段的名称，保持一致性

将obj对象通过JSON.stringify实现序列化
复制代码

(2)401状态码：当前请求需要用户验证

(3)403状态码：服务器已经得到请求，但是拒绝执行

17、三次握手、四次挥手？

推荐文章老錢的跟着动画来学习TCP三次握手和四次挥手

18、WebSocket的实现和应用

WebSocket是HTML5中的协议，支持持久连续，http协议不支持持久性连接。Http1.0和HTTP1.1都不支持持久性的链接，HTTP1.1中的keep-alive，将多个http请求合并为1个

19、Cookie、sessionStorage、localStorage的区别

共同点：都是保存在浏览器端，并且是同源的

Cookie：可以在浏览器和服务器端来回传递，存储容量小，只有大约4K左右

sessionStorage：仅在当前浏览器窗口关闭前有效，自然也就不可能持久保持，localStorage：始终有效，窗口或浏览器关闭也一直保存，因此用作持久数据；cookie只在设置的cookie过期时间之前一直有效，即使窗口或浏览器关闭。

localStorage：localStorage在所有同源窗口中都是共享的；cookie也是在所有同源窗口中都是共享的，不管窗口或者浏览器关闭与否都会始终生效

补充说明一下cookie的作用：

保存用户登录状态。例如将用户id存储于一个cookie内，这样当用户下次访问该页面时就不需要重新登录了，现在很多论坛和社区都提供这样的功能。
cookie还可以设置过期时间，当超过时间期限后，cookie就会自动消失。因此，系统往往可以提示用户保持登录状态的时间：常见选项有一个月、三个月、一年等。
跟踪用户行为。例如一个天气预报网站，能够根据用户选择的地区显示当地的天气情况。如果每次都需要选择所在地是烦琐的，当利用了cookie后就会显得很人性化了，系统能够记住上一次访问的地区，当下次再打开该页面时，它就会自动显示上次用户所在地区的天气情况。因为一切都是在后台完成，所以这样的页面就像为某个用户所定制的一样，使用起来非常方便
定制页面。如果网站提供了换肤或更换布局的功能，那么可以使用cookie来记录用户的选项，例如：背景色、分辨率等。当用户下次访问时，仍然可以保存上一次访问的界面风格。

20、路由实现的原理

两种模式 hash 和 history。

推荐寻找海蓝96的文章面试官: 你了解前端路由吗?

21、负载均衡

多台服务器共同协作，不让其中某一台或几台超额工作，发挥服务器的最大作用

http重定向负载均衡：调度者根据策略选择服务器以302响应请求，缺点只有第一次有效果，后续操作维持在该服务器
dns负载均衡：解析域名时，访问多个ip服务器中的一个（可监控性较弱）
反向代理负载均衡：访问统一的服务器，由服务器进行调度访问实际的某个服务器，对统一的服务器要求大，性能受到服务器群的数量