什么是http?
http是一种超文本传输协议。
什么是Http协议无状态协议?怎么解决Http协议无状态?
http协议自身不对请求和响应之间的通信状态进行保存。
无状态协议解决办法: 通过1.Cookie 2.通过Session会话保存
TCP/IP协议分为哪几层?每层的作用是什么?
四层:应用层,传输层,网络层和数据链路层
- 应用层:决定了向用户提供应用服务时通信的活动。比如FTP,DNS
- 传输层:两台计算机之间的数据传输。比如TCP,UDP
- 网络层:处理在网络i上流动的数据包。
- 数据链路层:用来处理连接网络的硬件部分。包括控制操作系统,硬件的设备驱动,NIC光纤等物理可见部分。
TCP/IP通信传输流
利用TCP/IP协议族进行网络通信时,会通过分层与对方进行通信。发送端从应用层往下走,接收端则从数据链路层往上走。
例如用http举例:
- 应用层:客户端在应用层发出一个http请求
- 传输层:TCP协议把从应用层接收到的数据(http报文)进行分割,并在各个报文上标记序号及端口号发送给网络层
- 网络层:增加作为通信目的地的mac地址后转发给数据链路层。
- 数据链路层:接收到数据,按照顺序向上层发送,一直到应用层。当传输到应用层,才算真正的接收到客户端的http请求。
发送端在层与层之间传输数据时,每经过一层必定会被打上一个属于该层所属的头部信息。反之,接收端在每经过一层时,就会把相应的首部去掉。
http三次握手?四次挥手?
-
三次握手:
为了确保将数据准确无误的送到目标处
三次握手指的是建立一次tcp连接需要发送三个数据包
1.客户端发送SYN=1(表示请求连接),并发送一个seq(随机码)
2.服务器由于收到SYN=1,知道是请求连接,返回一个ACK=1(表示确认),并同返回一个请求连接SYN=1,然后返回一个ack=seq+1(客户端随机码应答),且自己也返回一个seq(随机码)
3.客户端收到服务器的ack后验证,向服务器确认包发送ack=seq+1(服务器随机码应答)
4.服务器确认ack后建立连接,完成三次握手
-
四次挥手:
断开tcp连接可以是客户端发起,也可以是服务端发起。
1.客户端发送FIN=1(表示结束),并发送随机码seq=u
2.服务器端返回一个ACK=1(表示确认),并返回ack=u + 1,且也发生一个随机码seq=v
3.服务器再发出一个一个FIN=1,和seq=w,且重复发送上次内容
4.客户端返回一个ACK=1,然后返回随机码等于上次随机码加一seq=u+1,再返回ack=w+1
5.服务器端收到后结束连接,客户端也结束连接 为什么非要四次握手?
因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,"你发的FIN报文我收到了"。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。为什么TIME_WAIT状态还需要等2MSL后才能返回到CLOSED状态?
虽然按道理,四个报文都发送完毕,我们可以直接进入CLOSE状态了,但是我们必须假象网络是不可靠的,有可以最后一个ACK丢失。所以TIME_WAIT状态就是用来重发可能丢失的ACK报文。
什么是DNS?
提供域名到IP地址的解析服务。可以通过域名查找IP地址,也可以通过IP地址查找域名。
浏览器解析一个url的过程
1.整体流程:
2.dns解析
3..三次握手过程
4.发起Http请求
5.响应Http请求并得到HTML代码
6.浏览器解析HTML代码
7.浏览器对页面进行渲染呈现给用户
URI和URL的区别
- URI是以一种抽象的,高层次概念定义统一资源标识,而URL则是具体的资源标识的方式。URL是一种URI。
- 格式不同:URL的格式一般由下列三部分组成:第一部分是协议(或称为服务方式);第二部分是存有该资源的主机IP地址(有时也包括端口号);第三部分是主机资源的具体地址。URI一般由三部分组成:访问资源的命名机制;存放资源的主机名;资源自身的名称,由路径表示,着重强调资源。
http请求方法
- GET:用于请求访问已经被URI(统一资源标识符)识别的资源,可以通过URL传参给服务器
- POST:用于传输信息给服务器,主要功能与GET方法类似,但一般推荐使用POST方式
- PUT:传输文件,报文主体中包含文件内容,保存到对应URI位置
- HEAD:获得报文首部,与GET方法类似,只是不返回报文主体,一般用于验证URI是否有效
- DELETE:删除文件,与PUT方法相反,删除对应URI位置的文件
- OPTIONS:查询响应URI支持的HTTP方法
get和post请求的区别
- get侧重于从服务器获取数据,post侧重于向服务器发送数据
- get的参数放在url后面,post放在body中
- get受url长度限制,传输量小,效率低,post可以传输大量数据
- get对于浏览器回退是无害的,post回退会重新请求
- get请求可被缓存,可被保留在浏览器历史记录中,可以被收藏为书签。post请求不可被缓存,不可被保留在浏览器历史记录中,不可以被收藏为书签
- get 请求参数只允许使用ASCII字符,post请求无限制。
- post比get更加安全
可以参考http://www.w3school.com.cn/tags/html_ref_httpmethods.asp
Http协议由什么组成?
请求报文包括三部分:
(1).请求行:包含请求方法,URI,HTTP版本协议
(2).请求首部字段
(3).请求内容实体响应报文包含三部分:
(1).状态行:包含HTTP版本,状态码,状态码原因短语
(2).响应首部字段
(3).响应内容实体
http协议中,http1.0和http1.1的区别
- 持久连接
- 管线化
- 断点续传:实际上就是利用HTTP消息头使用分块传输编码,将实体主体分块传输
在http1.0中,当建立连接后,客户端发送一个请求,服务器端返回一个信息后就关闭连接,当浏览器下次请求的 时候又要建立连接,显然这种不断建立连接的方式,会造成很多问题。
内容编码的作用?有哪几种内容编码的方式?
编码提升传输速率,但是由于编码的操作需要计算机进行,所以会消耗更多的CPU。
内容编码方式:
gzip,compress,deflate,identity
内容协商?
内容协商是指客户端和服务器端就响应的资源内容进行协商,然后提供给客户端最合适的内容。
内容协商会以语言,字符集,编码方式等为基准判断响应的资源。
内容协商技术类型:
- 服务器驱动协商
- 客户端驱动协商
- 透明协商
9.常见的Http协议状态码
200:请求被正常处理
204:请求被受理但没有资源可以返回
206:客户端只是请求资源的一部分,服务器只对请求的部分资源执行GET方法,相应报文中通过Content-Range指定范围的资源。
301:永久性重定向
302:临时重定向
303:与302状态码有相似功能,只是它希望客户端在请求一个URI的时候,能通过GET方法重定向到另一个URI上
304:发送附带条件的请求时,条件不满足时返回,与重定向无关
307:临时重定向,与302类似,只是强制要求使用POST方法
400:请求报文语法有误,服务器无法识别
401:请求需要认证
403:请求的对应资源禁止被访问
404:服务器无法找到对应资源
500:服务器内部错误
503:服务器正忙
与http协作的web服务器
1.用单台虚拟机实现多个域名的注意事项?
域名通过DNS服务映射到IP地址。在相同的IP地址下,由于虚拟主机可以寄存多种不同主机名和域名的web网站,因此在发送http请求时,必须在首部Host内完整指定主机名或者域名的URI。
2.通信数据转发程序有哪些?
http通信时,除客户端和服务端以外,还有一些用于通信转发数据的程序:代理、网关、隧道。
- 代理: 具有转发功能的应用程序。位于客户端和服务器端的中间人角色,接收客户端发送的请求转发给服务器,也接收服务器端的响应并转发给客户端。
- 网关:转发其他服务器通信数据的服务器。接收到从客户端发送来的请求时,他就像自己拥有资源的原服务器一样对请求进行处理。有时客户端可能都不会察觉自己的通信目标是网关。
- 隧道:在相隔甚远的客户端和服务器端中间进行中转,并保持双方通信连接的应用程序。
代理:
- 缓存代理:
代理转发响应时,缓存代理会预先将资源的副本保存在代理服务器上。
当代理再次接收到同样的请求时,就可以不从原服务器获取资源,而是将之前缓存的资源作为响应返回 - 透明代理:
转发请求或者响应时,不对报文做任何加工的代理类型被称为透明代理。反之对报文进行加工的称为非透明代理。
网关:
网关能使通信道路上的服务器提供非http协议服务。
利用网关能提高通信的安全性。因为可以在客户端和网关之间的通信道路上加密以确保连接的安全。
隧道:
隧道的目的是确保客户端和服务器之间通信的安全。
保存资源的缓存:
缓存是指代理服务器或者客户端本地磁盘内保存的资源副本。利用缓存可以减少对服务器的访问,节省了通信流量和通信时间。
缓存服务器的优势在于可避免多次从源服务器转发资源。
客户端的缓存存放在客户端浏览器中,以IE为例,把客户端缓存成为临时网络文件。
10.Http协议首部字段
1、通用首部字段(请求报文与响应报文都会使用的首部字段)
- 请求首部字段
首部字段名 说明
Accept 用户代理可处理的媒体类型
Accept-Charset 优先的字符集
Accept-Encoding 优先的内容编码
Accept-Language 优先的语言(自然语言)
Authorization Web认证信息
Expect 期待服务器的特定行为
From 用户的电子邮箱地址
Host 请求资源所在服务器
If-Match 比较实体标记(ETag)
If-Modified-Since 比较资源的更新时间
If-None-Match 比较实体标记(与 If-Match 相反)
If-Range 资源未更新时发送实体 Byte 的范围请求
If-Unmodified-Since 比较资源的更新时间(与If-Modified-Since相反)
Max-Forwards 最大传输逐跳数
Proxy-Authorization 代理服务器要求客户端的认证信息
Range 实体的字节范围请求
Referer 对请求中 URI 的原始获取方
TE 传输编码的优先级
User-Agent HTTP 客户端程序的信息
3.响应首部字段
首部字段名 说明
Accept-Ranges 是否接受字节范围请求
Age 推算资源创建经过时间
ETag 资源的匹配信息
Location 令客户端重定向至指定URI
Proxy-Authenticate 代理服务器对客户端的认证信息
Retry-After 对再次发起请求的时机要求
Server HTTP 服务器的安装信息
Vary 代理服务器缓存的管理信息
WWW-Authenticate 服务器对客户端的认证信息
4.实体首部字段
首部字段名 说明
Allow 资源可支持的HTTP方法
Content-Encoding 实体主体适用的编码方式
Content-Language 实体主体的自然语言
Content-Length 实体主体的大小(单位:字节)
Content-Location 替代对应资源的URI
Content-MD5 实体主体的报文摘要
Content-Range 实体主体的位置范围
Content-Type 实体主体的媒体类型
Expires 实体主体过期的日期时间
Last-Modified 资源的最后修改日期时间
cache-control的值
缓存请求指令
- no-cache 不缓存过期的资源,强制向服务器再次验证。
- no-store 不缓存请求或者响应的任何内容
- max-age=[秒] 响应的最大age值
- max-stale=[秒]
- min-fresh
- no-transform
- only-if-cached
- cache-extension
缓存响应指令
- public
- private
- no-cache
- no-store
- no-transform
- must-revalidate
- proxy-revalidate
- max-age
- s-max-age 公共缓存服务器响应的最大age值
- cache-extension
Http与Https优缺点?
(1).通信使用明文不加密,内容可能被窃听,也就是被抓包分析
(2).不验证通信方身份,可能遭到伪装
(3).无法验证报文完整性,可能被篡改
Https就是Http加上加密处理(一般是SSL安全通信线路)+认证+完整性保护
Http与Https的区别:
- HTTP 的URL 以http:// 开头,而HTTPS 的URL 以https:// 开头
- HTTP 是不安全的,而 HTTPS 是安全的
- HTTP 标准端口是80 ,而 HTTPS 的标准端口是443
- 在OSI 网络模型中,HTTP工作于应用层,而HTTPS 的安全传输机制工作在传输层
- HTTP 无法加密,而HTTPS 对传输的数据进行加密
- HTTP无需证书,而HTTPS 需要CA机构wosign的颁发的SSL证书
Http优化
- 利用负载均衡优化和加速HTTP应用
- 利用HTTP Cache来优化网站
- TCP复用:TCP连接复用是将多个客户端的HTTP请求复用到一个服务器端TCP连接上,而HTTP复用则是一个客户端的多个HTTP请求通过一个TCP连接进行处理。前者是负载均衡设备的独特功能;而后者是HTTP 1.1协议所支持的新功能,目前被大多数浏览器所支持。
- 内容缓存:将经常用到的内容进行缓存起来,那么客户端就可以直接在内存中获取相应的数据了。
- 压缩:将文本数据进行压缩,减少带宽
- SSL加速(SSL Acceleration):使用SSL协议对HTTP协议进行加密,在通道内加密并加速
+TCP缓冲:通过采用TCP缓冲技术,可以提高服务器端响应时间和处理效率,减少由于通信链路问题给服务器造成的连接负担。
详情参考:
- http://blog.51cto.com/virtualadc/580832
- http://www.cnblogs.com/cocowool/archive/2011/08/22/2149929.html
Http协议有哪些特征?
1、支持客户/服务器模式;2、简单快速;3、灵活;4、无连接;5、无状态;
Cookie是否会被覆盖,localStorage是否会被覆盖
Cookie是可以覆盖的,如果重复写入同名的Cookie,那么将会覆盖之前的Cookie
如果要删除某个Cookie,只需要新建一个同名的Cookie,并将maxAge设置为0,并添加到response中覆盖原来的Cookie。注意是0而不是负数。负数代表其他的意义。
localStorage存储在一个对象中. 有键值对
什么是localStorage,在HTML5中,新加入了一个localStorage特性,这个特性主要是用来作为本地存储来使用的,解决了cookie存储空间不足的问题(cookie中每条cookie的存储空间为4k),localStorage中一般浏览器支持的是5M大小,这个在不同的浏览器中localStorage会有所不同。
localStorage的优势
1、localStorage拓展了cookie的4K限制
2、localStorage会可以将第一次请求的数据直接存储到本地,这个相当于一个5M大小的针对于前端页面的数据库,相比于cookie可以节约带宽,但是这个却是只有在高版本的浏览器中才支持的
localStorage的局限
1、浏览器的大小不统一,并且在IE8以上的IE版本才支持localStorage这个属性
2、目前所有的浏览器中都会把localStorage的值类型限定为string类型,这个在对我们日常比较常见的JSON对象类型需要一些转换
3、localStorage在浏览器的隐私模式下面是不可读取的
4、localStorage本质上是对字符串的读取,如果存储内容多的话会消耗内存空间,会导致页面变卡
5、localStorage不能被爬虫抓取到
localStorage与sessionStorage的唯一一点区别就是localStorage属于永久性存储,而sessionStorage属于当会话结束的时候,sessionStorage中的
键值对会被清空
HTTPS的工作原理
- 首先HTTP请求服务端生成证书,客户端对证书的有效期、合法性、域名是否与请求的域名一致、证书的公钥(RSA加密)等进行校验;
- 客户端如果校验通过后,就根据证书的公钥的有效, 生成随机数,随机数使用公钥进行加密(RSA加密);
- 消息体产生的后,对它的摘要进行MD5(或者SHA1)算法加密,此时就得到了RSA签名;
- 发送给服务端,此时只有服务端(RSA私钥)能解密。
-
解密得到的随机数,再用AES加密,作为密钥(此时的密钥只有客户端和服务端知道)。
access-control-allow设置为*的影响
不能携带cookie
Cookie和localStorage、sessionStorage的区别
Cookie
1、因为HTTP请求 无状态,所以需要cookie去维持客户端状态
2、过期时间 expire
3、cookie的生成方式
①、http response header 中的set-cookie
②、js中可以通过documentdocument.cookie可以读写cookie
4、仅仅作为浏览器存储(大小4kb左右,能力被localStorage替代)
5、cookie中的相关域名下面—— cdn 的流量损耗
6、httponly
localStorage
1、HTML5设计出来专门用于浏览器存储的
2、大小为5M左右
3、仅为客户端使用,不和服务器进行通信
4、接口封装好
5、浏览器本地缓存方案
6、永久有效
sessionStorage
1、会话级别的浏览器存储
2、大小为5M左右
3、仅在客户端使用,不和服务端进行通信
4、接口封装较好
5、对于表单信息的维护
6、关闭会话窗口失效