dojiangv

从输入url到页面加载完的过程中都发生了什么事情

http://blog.aijc.net/server/2015/11/03/%E4%BB%8E%E8%BE%93%E5%85%A5URL%E5%88%B0%E9%A1%B5%E9%9D%A2%E5%8A%A0%E8%BD%BD%E5%AE%8C%E7%9A%84%E8%BF%87%E7%A8%8B%E4%B8%AD%E9%83%BD%E5%8F%91%E7%94%9F%E4%BA%86%E4%BB%80%E4%B9%88%E4%BA%8B%E6%83%85/

这其实是一个经典的面试题了，都可以自由发挥各个方面，说出自己的理解，而且涉及的面也是巨多，就看怎么看待了。本篇就可以说是我对于这个问题的一些综合、总结；其中不会涉及深层次（硬件啊等）的一些东西，例如说按下按键发生了什么事情，关于这些更基础更深入的建议可以看下百度的文章从输入 URL 到页面加载完成的过程中都发生了什么事情？。

首先来看第一个点，输入的URL。

URL

URL，英文是Uniform / Universal Resource Locator，中文的翻译就是统一资源定位符，俗称网页地址，简短的说法是网址，用于完整地描述Internet上网页和其他资源的地址的一种标识方法。它从左到右由如下部分构成：

传送协议protocol：最常用的是HTTP协议（超文本传输协议），它也是目前WWW中应用最广的协议；其他也还有ftp、file、https、、mailto、git等，当然也有自定义的协议（私有协议），例如tencent等
主机host：通常为域名或者IP地址，当然在其前面还可以有连接到服务器所需的用户名和密码
端口号port：以数字形式表示，每种协议都有自己默认的端口号，例如http协议的默认端口号就是80，https的默认端口号就是443等
路径path：以“/”字元区别路径中的每一个目录名称，一般表示的就是主机上的一个目录或文件地址
查询query：以“?”字元为起点，每个参数以“&”隔开，再以“=”分开参数名称与其对应的值
片段fragment：也就是在浏览器环境下location的hash值，用于指定网络资源中的片断，一般用于定位到某个位置

参考：

统一资源定位符
什么是URL

介绍了URL，下边直说最简单的通过浏览器发起HTTP请求资源过程，没有代理，通过域名访问的情况。根据http://blog.csdn.net/iaiti/article/details/28339145中相关介绍，将要发生如下事情：

浏览器查询缓存，如果缓存存在跳到第9步
浏览器询问操作系统服务器的IP地址
操作系统做DNS查询，返回IP地址给浏览器
浏览器打开对服务器的TCP连接
浏览器通过TCP连接发送HTTP请求
浏览器接收HTTP响应并且可能关掉TCP连接，或者是重新使用连接处理新请求（也就是keepalive）
浏览器检查HTTP响应是否为一个重定向（3xx 结果状态码），一个验证请求（401），错误（4xx 5xx）等等，这些都是不同响应的正常处理（2xx）
如果响应可缓存，将存入缓存
浏览器解码响应（例如：如果它是gziped压缩）
浏览器决定如何处理这些响应（例如，它是HTML页面，一张图片，一段音乐）
浏览器展现响应，对未知类型还会弹出下载对话框（现在一般不会弹出了，用户对浏览器设置而定）

下边就来说下这个过程中一些关键点。

DNS查询得到IP地址

首先来看下DNS。

DNS

DNS，英文是Domain Name System，中文叫域名系统，是Internet的一项服务，他将域名和IP地址相互映射的一个分布式数据库，引入域名是为了解决IP地址不便于记忆这个问题的。所以说这时候就需要有DNS这样的服务来解决域名和IP地址是怎么映射的。

在DNS的定义中也说了他是一个分布式数据库，更通俗来讲的话就是有对应的域名服务器（装有DNS的主机），利用域名服务器来实现对应的名称解析。

要理解DNS，首先得知道域名；域名是为了识别主机名称和组织机构名称的一种具有分层的名称。

根域：也就是.，在上图中就是最顶部的那个，而对应的根域服务器，之前会有错误的认为根域名服务器只有13台，但实际上不是13个，而是13组，而根服务器目前则有504台，还会更多，目前是被编号为从A到M13个标号，他们是只有13个IP地址，这么多服务器通过任播Anycast技术，标号相同根服务器使用1个IP。而具体分布情况则可以查看http://root-servers.org/
顶级域：也叫一级域，主要分为四类：国家及地区顶级域（.cn, .jp等）、通用顶级域（.com, .edu, .net等）、基础设施顶级域（.arpa，之前属于通用顶级域）和测试顶级域（例如.测试）。
二级域：可变长度的个体或组织，以便在Internet上使用的注册的名称，这些名称一定会基于相应的顶级域，例如aijc.net。
其他还有三级域（子域，也就是从已注册的二级域名自定义派生的），还可以有四级域（主机或资源名称），当然还可以更多级。

下边继续来说下域名解析过程。

域名解析

进行DNS查询的主机或软件叫做DNS解析器，用户使用的工作站或电脑都属于解析器。域名解析就是利用DNS解析器得到对应IP过程，解析器会向域名服务器进行查询处理。

解析过程就是一个查询的过程，来一张来自http://xdays.me/dns%E5%8D%8F%E8%AE%AE%E8%AF%A6%E8%A7%A3.html的图：

假设用户在浏览器中输入的是www.google.com，大概过程：

下边的这几个步骤和上边图上的过程是一一对应的，但是在这之前还有一些步骤：

从浏览器缓存中查找域名www.google.com的IP地址
在浏览器缓存中没找到，就在操作系统缓存中查找，这一步中也会查找本机的hosts看看有没有对应的域名映射（当然已经缓存在系统DNS缓存中了）
在系统中也没有的话，就到你的路由器来查找，因为路由器一般也会有自己的DNS缓存

如果依旧找不到，接着对应图上的步骤继续（参考http://xdays.me/dns%E5%8D%8F%E8%AE%AE%E8%AF%A6%E8%A7%A3.html）：

用户电脑的解析器向LDNS（也就是Local DNS，互联网服务提供商ISP），发起域名解析请求，查询www.google.com的IP地址，这是一个递归查找过程
在缓存没有命中的情况下，LDNS向根域名服务器.查询www.google.com的IP地址，LDNS的查询过程是一个迭代查询的过程
根告诉LDNS，我不知道www.google.com对应的IP，但是我知道你可以问com域的授权服务器，这个域归他管
LDNS向com的授权服务器问www.google.com对应的IP地址
com告诉LDNS，我不知道www.google.com对应的IP，但是我知道你可以问google.com域的授权服务器，这个域归他管
LDNS向google.com的授权服务器问www.google.com对应的IP地址
google.com查询自己的ZONE文件（也称区域文件记录），找到了www.google.com对应的IP地址，返回给LDNS
LDNS本地缓存一份记录，把结果返回给用户电脑的解析器

在这之后，用户电脑的解析器拿到结果后，缓存在自己操作系统DNS缓存中，同时返回给浏览器，浏览器依旧会缓存一段时间。

上边有提到域名服务器会查询自己的ZONE文件，其实也就是常说的DNS记录，主要有几种类型：

A记录，用来指定域名对应的IPv4地址的记录
NS记录，也就是域名服务器的记录，如果需要将域名去指定某个域名服务器去解析的话，就需要NS记录
CNAME记录，域名的对应的别名，其实是另一个域名，实现与指向的域名相同访问效果
MX记录，邮件交换记录，如果需要建立邮箱服务，将指向的是邮件服务器地址的记录
AAAA记录，将主机名（域名）指向一个IPv6地址的记录
TXT记录，任意填写文本内容，通常用作SPF记录（反垃圾邮件）使用
SRV记录，记录哪台计算机提供了哪个服务的记录，主要用于服务器选择

当然还有一些其他记录类型（SOA、WKS、PTR、HINFO、MINFO、SIG、KEY、GPOS、NXT等），这里不再细说。

在DNS解析这里还涉及到了另外一个技术CDN，下边来介绍下：

CDN

CDN，英文Content Delivery Network，中文翻译是内容分发网络，目的就是通过现有的Internet中增加一新的网络架构，将网站内容发布到离用户最近的网络“边缘”，提高用户访问网站的速度，所以更像是增加了一层CACHE（缓存）层。从技术上全面优化由于网络宽带小、用户访问量大、网点分布不均匀等导致的用户访问网站响应速度慢的情况。

那他的实现原理是啥呢？其实主要是通过接管DNS来实现，注意上边DNS域名解析过程的那张图，在倒数第二步中（也就是第7步），可能需要更多过程来完成，这里就举一个例子，例如说上边要访问的域名是img.alicdn.com：

依旧是上边的第7步：

7）img.alicdn.com查找自己的ZONE文件，发现了一条CNAME记录，指向的是img.alicdn.com.danuoyi.alicdn.com.，通过dig img.alicdn.com可以得到这样的结果：

img.alicdn.com.     51969   IN  CNAME   img.alicdn.com.danuoyi.alicdn.com.

8）LDNS得到的不是具体的IP地址，即不是A记录，而是一条CNAME记录，别名地址是img.alicdn.com.danuoyi.alicdn.com.，所以LDNS重复上边的几步，不再细说，最终得到img.alicdn.com.danuoyi.alicdn.com.对应的其中一个IP地址返回给LDNS

这里需要细说的就是CDN的核心原理部分，也就是怎么从img.alibaba.com.danuoyi.tbcache.com.得到真正的离用户“近”的CDN节点的IP地址。

这路里拿一张来自http://www.51know.info/system_performance/cdn/cdn.html的图来看：

阿里是自建CDN的，然后就可以说阿里自己的CDN智能调度器返回了一个合适的IP地址给LDNS（CDN选择优质节点的过程，不一定说一定是最近的，更多的是一个综合策略，例如还会考虑网络成本、流量、源站负载等）。这个IP地址对应的是阿里CDN的其中一个CDN节点，可以说每个节点都可以认为是一个服务器。

CDN网络架构主要有两大部分组成：中心和边缘两部分。中心的话其实也就是CDN网管中心和DNS重定向解析中心，主要负责全局负载均衡；而边缘只要是指的分布在全球各地的节点，主要包含缓存服务器以及负载均衡器等组成。

当用户访问加入CDN服务的网站时，域名解析请求将最终交给全局负载均衡DNS进行处理。全局负载均衡DNS通过一组预先定义好的策略，将当时最接近用户的节点地址提供给用户，使用户能够得到快速的服务。同时，它还与分布在世界各地的所有CDN节点保持通信，搜集各节点的通信状态，确保不将用户的请求分配到不可用的CDN节点上，实际上是通过DNS做全局负载均衡。

对于普通的Internet用户来讲，每个CDN节点就相当于一个放置在它周围的WEB。通过全局负载均衡DNS的控制，用户的请求被透明地指向离他最近的节点，节点中CDN服务器会像网站的原始服务器一样，响应用户的请求。由于它离用户更近，因而响应时间必然更快。

每个CDN节点由两部分组成：负载均衡设备和高速缓存服务器

负载均衡设备负责每个节点中各个Cache的负载均衡，保证节点的工作效率；同时，负载均衡设备还负责收集节点与周围环境的信息，保持与全局负载DNS的通信，实现整个系统的负载均衡。

高速缓存服务器（Cache）负责存储客户网站的大量信息，就像一个靠近用户的网站服务器一样响应本地用户的访问请求。

CDN的管理系统是整个系统能够正常运转的保证。它不仅能对系统中的各个子系统和设备进行实时监控，对各种故障产生相应的告警，还可以实时监测到系统中总的流量和各节点的流量，并保存在系统的数据库中，使网管人员能够方便地进行进一步分析。通过完善的网管系统，用户可以对系统配置进行修改。

总结本章

从上边的分析可以知道，DNS查询得到IP地址还是一个复杂的过程的。主要过程就是通过设备的解析器将要访问的域名发送给各个级别的域名服务器，得到最终的IP地址（这中间可能还会涉及到CDN技术）。

参考：

https://zh.wikipedia.org/wiki/%E5%9F%9F%E5%90%8D%E7%B3%BB%E7%BB%9F
http://blog.csdn.net/crazw/article/details/8986504
http://xdays.me/dns%E5%8D%8F%E8%AE%AE%E8%AF%A6%E8%A7%A3.html
http://www.51know.info/system_performance/cdn/cdn.html
http://cstdlib.com/tech/2015/08/18/what-is-cdn/
http://kb.cnblogs.com/page/121664/

建立TCP连接

TCP是一种面向有连接的传输层协议。他可以保证两端（发送端和接收端）通信主机之间的通信可达。他能够处理在传输过程中丢包、传输顺序乱掉等异常情况；此外他还能有效利用宽带，缓解网络拥堵。

而建立TCP连接一开始都要经过三次握手，建立连接过程中会涉及TCP的标志位Flag，一共有6种标志：SYN(synchronize同步序号) ACK(acknowledgement 确认) PSH(push传送) FIN(finish结束) RST(reset重置) URG(urgent紧急)

还有额外的两个号码：Sequence number(顺序号码) Acknowledge number(确认号码)

三次握手过程：

第一次握手，请求建立连接，发送端发送连接请求报文，将SYN置为1，产生随机的顺序号seq=x
第二次握手，接收端收到发送端发过来的报文，由SYN为1可知发送端现在要建立联机。然后接收端会向发送端发送一个SYN为1和ACK为x+1的报文，同时设置了自己随机产生的一个随机的顺序号seq=y
第三次握手，发送端收到了发送过来的报文，需要检查一下返回的ACK是否是正确的（x+1）；若正确的话，发送端再次发送确认包，ACK为y+1，设置顺序号seq=x+1。

发送端在收到接收端返回的ACK，确认后也就意味着连接成功了，就可以发送数据了；而接收端则必须等到发送端发送的ACK确认后才可以发送数据。

在TCP连接建立完成之后就可以发送HTTP请求了。

参考：

http://www.seanyxie.com/wireshark%E6%8A%93%E5%8C%85%E5%9B%BE%E8%A7%A3-tcp%E4%B8%89%E6%AC%A1%E6%8F%A1%E6%89%8B%E5%9B%9B%E6%AC%A1%E6%8C%A5%E6%89%8B%E8%AF%A6%E8%A7%A3/
http://baike.baidu.com/view/1003841.htm
http://www.jellythink.com/archives/705

HTTP

HTTP，英文Hyper Text Transfer Protocol，也就是超文本传输协议的缩写，他互联网上最普遍使用的一种应用协议，他主要是为了从Web服务器传输超文本到浏览器而设计的协议，由请求和响应构成。他是一种无连接的协议，也就意味着限制每次连接只处理一个请求，服务端处理完成且收到客户端应答后立即断开连接；同时也是无状态的，也就意味着没有记忆能力，每次连接都需要带上需要的信息。

HTTP请求

完整的HTTP请求消息包含了：一个请求行、请求消息报头以及请求正文

请求行，以一个方法符号开头，以空格分开，后边跟着请求的URI以及协议版本号，格式：Method Request-URI HTTP-Version CRLF，例如 GET http://www.xxx.com/xx.html HTTP/1.1

其中Method表示请求方法，Request-URI是统一资源标识符，HTTP-Version表示请求的HTTP协议版本，CRLF表示回车和换行

请求方法主要有：GET（获得指定URL的数据） POST（请求服务器接收URI指定的文档作为可执行信息） HEAD（仅获取文档头部） PUT（请求服务器保存客户端传送过来的数据到URI指定文档） DELETE（请求服务器删除URI指定资源） TRACE（请求消息返回客户端，主要用于测试或诊断） OPTIONS（请求查询服务器性能或者查询与资源相关的选项和需求）

请求消息报头，请看下边关于消息报头的讲解
请求正文，注意，请求正文和请求消息报头之间会有一空行（只有CRLF的行）；类似name=XXX&pwd=XXXX的内容

来张HTTP请求图：

HTTP请求图

HTTP响应

再来看响应消息，也是由三部分构成：状态行、响应消息报头以及响应正文

状态行，格式如下：HTTP-Version Status-Code Reason-Phrase CRLF，例如，HTTP/1.1 200 OK

其中Status-Code，状态码，在HTTP1.1中定义了5类状态码，由三位数字组成，第一个数字定义的是响应类别：

1xx: 提供信息，表示请求以及被成功接收，需要继续处理

2xx: 肯定应答，表示请求已成功被服务器接收、理解并接受了

3xx: 重定向，代表了客户端需要进一步的操作才能完成请求，通常后续的请求地址会在本次响应Location域中指明

4xx: 客户端请求内存出现错误，妨碍了服务器处理。除非响应是一个HEAD请求，否则服务器返回一个解释当前错误状况以及是临时的还是永久的的实体正文内容。

5xx: 服务器错误，代表服务器在处理过程中发生了错误或者异常，也有可能是服务器无法完成对请求处理。除非这是一个HEAD请求，否则服务端应该响应一个包含解释当前错误状态以及是临时的还是永久的实体正文内容。

响应消息报头，参见下边关于消息报头的讲解
响应正文，同样，在正文和消息报头之间有一空行；内容就是服务器返回资源内容

来张HTTP响应图：

HTTP响应

HTTP消息报头

消息报头由众多报头域组成。每一个报头域都由名字＋“：”＋空格组成，消息报头域的名字是大小写无关的。主要包括普通报头、请求报头、响应报头和实体报头。

普通报头，常见普通报头有：
- Cache-Control，用于指定缓存指令，缓存指令是单向的（响应中出现的缓存指令在请求中未必会出现），且是独立的（一个消息的缓存指令不会影响另一个消息处理的缓存机制），HTTP1.0使用的类似的报头域为Pragma。请求时的缓存指令包括：no-cache（用于指示请求或响应消息不能缓存）、no-store、max-age、max-stale、min-fresh、only-if-cached;响应时的缓存指令包括：public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage.
- Date，表示消息产生的日期和时间
- Connection，允许发送指定连接的选项。例如指定连接是连续，或者指定“close”选项，通知服务器，在响应完成后，关闭连接
- 其他：Pragma Upgrade Trailer Via Warning Transfer-Encoding
请求报头，常见的有：
- Accept，用于指定客户端接受哪些类型的信息
- Accept-Charset，用于指定客户端接受的字符集。如果在请求消息中没有设置这个域，缺省是任何字符集都可以接受
- Accept-Encoding，类似于Accept，但是它是用于指定可接受的内容编码。如果请求消息中没有设置这个域服务器假定客户端对各种内容编码都可以接受
- Accept-Language，类似于Accept，但是它是用于指定一种自然语言如果请求消息中没有设置这个报头域，服务器假定客户端对各种语言都可以接受
- Authorization，主要用于证明客户端有权查看某个资源。当浏览器访问一个页面时，如果收到服务器的响应代码为401（未授权），可以发送一个包含Authorization请求报头域的请求，要求服务器对其进行验证
- Host，发送请求时，该报头域是必需的。Host请求报头域主要用于指定被请求资源的Internet主机和端口号，它通常从HTTP URL中提取出来的
- User-Agent，允许客户端将它的操作系统、浏览器和其它属性告诉服务器。不过，这个报头域不是必需的，如果我们自己编写一个浏览器，不使用User-Agent请求报头域，那么服务器端就无法得知我们的信息了
- 其他：Expect From If-Match If-Modified-Since If-None-Match If-Range If-Unmodified-Since Max-Forwards Proxy-Authorization Range Referer TE
响应报头，常见的有：
- Location，用于重定向接受者到一个新的位置。Location响应报头域常用在更换域名的时候
- Server，包含了服务器用来处理请求的软件信息。与User-Agent请求报头域是相对应的
- WWW-Authenticate，必须被包含在401（未授权的）响应消息中，客户端收到401响应消息时候，并发送Authorization报头域请求服务器对其进行验证时，服务端响应报头就包含该报头域
- 其他：Accept-Ranges Age ETag Proxy-Authenticate Retry-After Vary
实体报头，请求和响应都是可以传送实体的，一个实体由实体报头域和实体正文组成，但并不是说实体报头域和实体正文要在一起发送，可以只发送实体报头域。实体报头定义了关于实体正文（eg：有无实体正文）和请求所标识的资源的元信息

常见的实体报头：

Content-Encoding，被用作媒体类型的修饰符，它的值指示了已经被应用到实体正文的附加内容的编码，因而要获得Content-Type报头域中所引用的媒体类型，必须采用相应的解码机制。Content-Encoding主要用于记录文档的压缩方法
Content-Language，描述了资源所用的自然语言。没有设置该域则认为实体内容将提供给所有的语言阅读者
Content-Length，用于指明实体正文的长度，以字节方式存储的十进制数字来表示。即一个数字字符占一个字节，用其对应的ASCII码来存储传输
Content-Type，用于指明发送给接收者的实体正文的媒体类型
Expires，给出响应过期的日期和时间。为了让代理服务器或浏览器在一段时间以后更新缓存中(再次访问曾访问过的页面时，直接从缓存中加载，缩短响应时间和降低服务器负载)的页面，我们可以使用Expires实体报头域指定页面过期的时间
Last-Modified，用于指示资源的最后修改日期和时间
其他：Allow Content-Location Content-MD5 Content-Range

参考：

https://zh.wikipedia.org/wiki/%E8%B6%85%E6%96%87%E6%9C%AC%E4%BC%A0%E8%BE%93%E5%8D%8F%E8%AE%AE
https://zh.wikipedia.org/wiki/HTTP%E7%8A%B6%E6%80%81%E7%A0%81
http://blog.csdn.net/gueter/article/details/1524447
http://hao.jser.com/archive/8331/
http://www.cricode.com/1880.html
http://www.jianshu.com/p/e83d323c6bcc
https://www.zybuluo.com/yangfch3/note/167490

浏览器缓存

根据服务器响应的消息报头，来决定响应的内容是如何缓存的，这里呢就需要探讨下浏览器的缓存机制了。

首先一个要点，为啥要缓存，也就是说缓存有啥好处呢：

减少了数据传输，也就意味着减少网络带宽消耗，省钱
降低服务器压力，大大提高服务器性能
减少网络延迟，加快页面打开速度

有了好处就要看看浏览器是如何缓存的。

浏览器缓存规则

对于浏览器缓存而言，规则主要是在HTTP的消息报头和HTML页面的Meta标签中定义的。有新鲜度和校验值两个维度来定义缓存的具体细则的。

新鲜度，其实也就是过期机制，指定一个有效期。
校验值，主要是当发现不再新鲜的时候，用于再次请求的时候的校验机制，发现校验的结果不匹配的话就说明需要更新了，匹配的话就直接返回304状态码，代表没有修改。

浏览器缓存控制

之前在规则中说过，对于控制可以写在HTML页面的Meta标签中，例如：

 HTTP-EQUIV="Pragma" CONTENT="no-cache">

上边的代码就是告诉浏览器页面不缓存，但是这个支持情况不佳，而且缓存代理服务器肯定不支持，所以说不推荐。

下边重点来看和缓存相关的HTTP消息报头：

从上图可以看出两中不同的规则都对应的会有哪些消息报头，以及对应的类型和作用。这里主要细说的就是两组：

Cache-Control与Expires
Last-Modified与ETag

来看第一组，Cache-Control与Expires，他们的作用是一致的，都是控制有效期的。Expires的值是一个确定的日期时间，这个时间是格林威治时间（GMT），表明在这个日期时间之前都是可以使用缓存内容的，容易产生日期时间不一致（不同步）问题；而Cache-Control则可以控制更多优先级高于Expires。

这里仔细看下Cache-Control有用的响应头：

max-age=[秒]：表示在这个时间范围内缓存是新鲜的无需更新。类似Expires时间，不过这个时间是相对的，而不是绝对的。也就是某次请求成功后多少秒内缓存是新鲜的。
s-maxage=[秒]：类似max-age, 除了仅应用于共享缓存（如代理）。
public：标记认证的响应才能够被缓存。一般而言，需要认证的HTTP请求内容会自动私有化（不会被缓存）。
private：允许缓存专门为某一个用户存储响应，比方说在浏览器中；共享缓存一般不会，例如在代理中。
no-cache：每次在释放缓存副本之前都强制发送请求给源服务器进行验证，这在确保认证有效性上很管用（和public结合使用）或者保证内容必须是即时的，不得无视缓存的所有优点，如国内的微博、twitter等的刷新显示内容，必须不能有缓存啊。
no-store：强制缓存在任何情况下都不要保留任何副本。
must-revalidate：告诉缓存，我给你准备了一些关于新鲜度的信息，在表现的时候要严格遵循之。HTTP允许缓存在某些特定情况下返回过期数据，指定了这个属性，相对于告诉缓存，你丫必须严格遵循我的规则。
proxy-revalidate：类似must-revalidate，除了只能应用于代理缓存。

来一张公有缓存和私有缓存的区别图：

然后再看另一组Last-Modified与ETag，Last-Modified表明服务器该资源最后的修改时间，用于让浏览器知道本地缓存中副本是否是新鲜的，那为啥还需要ETag呢，主要是为了解决这几个问题：

某些服务器不能精确得到文件的最后修改时间，这样就无法通过最后修改时间来判断文件是否更新了。
某些文件的修改非常频繁，在秒以下的时间内进行修改，Last-Modified只能精确到秒。
一些文件的最后修改时间改变了，但是内容并未改变，此时该文件的缓存就无法被使用。

所以在HTTP1.1中加入了ETag，实体标识，他是服务器自动生成或者由开发者生成的对应的资源在服务器端的唯一标识。只有内容发生了改变这个值才会改变，这个值是类似于对文件进行MD5或者SHA1之后的结果。

那他们两组又会有啥子区别呢？下边请看：

配置Last-Modified/ETag的情况下，浏览器再次访问统一URI的资源，还是会发送请求到服务器询问文件是否已经修改，如果没有，服务器会只发送一个304回给浏览器，告诉浏览器直接从自己本地的缓存取数据；如果修改过那就整个数据重新发给浏览器；
Cache-Control/Expires则不同，如果检测到本地的缓存还是有效的时间范围内，浏览器直接使用本地副本，不会发送任何请求。

两组一起使用时，Cache-Control/Expires的优先级要高于Last-Modified/ETag。即当本地副本根据Cache-Control/Expires发现还在有效期内时，则不会再次发送请求去服务器询问修改时间（Last-Modified）或实体标识（Etag）了。一般情况下，使用Cache-Control/Expires会配合Last-Modified/ETag一起使用，因为即使服务器设置缓存时间，当用户点击“刷新”按钮时，浏览器会忽略缓存继续向服务器发送请求，这时Last-Modified/ETag将能够很好利用304，从而减少响应开销。

而对于浏览器缓存如何才能命中呢？这个根据不同的行为还有不同的结果，请看下图：

如果之前对两组的对比中说的那样，当按F5或者点击刷新的时候，会忽略Cache-Control/Expires的设置，也就是说会再次去向服务端请求，而Last-Modified/Etag还是有效的，服务器会根据情况判断返回304还是200，但是如果只有Cache-Control/Expires的话，服务端就不知道如何check，所以会返回完整资源了；而当用户使用Ctrl+F5进行强制刷新的时候，只是所有的缓存机制都将失效，重新从服务器拉去资源。

需要注意的是上边说的控制缓存的那些方法规则对于POST请求则无效的，因为POST请求是无法被缓存的；如果说HTTP响应头中不包含Last-Modified/Etag，也不包含Cache-Control/Expires的话，请求也无法被缓存。

参考：

http://www.alloyteam.com/2012/03/web-cache-2-browser-cache/
http://www.cnblogs.com/TankXiao/archive/2012/11/28/2793365.html
http://www.path8.net/tn/archives/2745
http://www.zhangxinxu.com/wordpress/2013/05/caching-tutorial-for-web-authors-and-webmasters/

渲染HTML

如果说响应的内容是HTML文档的话，就需要浏览器进行解析渲染呈现给用户。整个过程涉及两个方面：解析和渲染；这里可能会有一个疑问，一定是先解析后渲染的吗？对于现代浏览器，答案是否定的，因为为了达到更好的用户体验，浏览器的呈现引擎会力求尽快将内容显示到屏幕上；而不必等到整个HTML文档解析完毕之后再去构建渲染树然后布局渲染；也就是说这是一个渐进的过程。

对于整个呈现引擎而言，他的基本流程是这样的：

而对于主流的Webkit和Gecko而言，他们的流程还是不太一样的，术语也不大一样，但是大概意思是一样的。可以先看看他们的主流程图。

WebKit主流程：

Mozilla 的 Gecko 呈现引擎主流程：

下边就来看下整个过程，先不考虑JS脚本。

解析，构建对象模型（Object Model）

在渲染页面之前，需要构建DOM树和CSSOM树。构建的基础就需要解析，而这个解析构建的过程都可以这样描述：

Bytes → characters → tokens → nodes → object model.

所以这个过程就是对HTML进行解析构建出DOM，对CSS进行解析构建出CSSOM。

首先来看DOM，假设有这样的HTML页面：


  
     name="viewport" content="width=device-width,initial-scale=1">
     href="style.css" rel="stylesheet">
    </span>Critical Path<span class="nt" style="color:rgb(106,184,37);font-weight:700;">
  
  
    Hello web performance students!
     src="awesome-photo.jpg">

那浏览器会怎么处理呢？一张图来表示就是：

基本过程也就是：

Conversion转换：浏览器将获得的HTML内容（Bytes）基于他的编码转换为单个字符
Tokenizing分词：浏览器按照HTML规范标准将这些字符转换为不同的标记token。每个token都有自己独特的含义以及规则集
Lexing词法分析：分词的结果是得到一堆的token，此时把他们转换为对象，这些对象分别定义他们的属性和规则
DOM构建：因为HTML标记定义的就是不同标签之间的关系，这个关系就像是一个树形结构一样，例如：body对象的父节点就是HTML对象，然后段略p对象的父节点就是body对象。

最终的DOM树就是这样子的：

通过Chrome浏览器的开发者工具，我们可以看到这样的一些记录：

上边活动的记录就是上边解析HTML构建DOM所花费的时间。

再来看CSSOM，上边的HTML代码中，假设style.css内容如下：

body { font-size: 16px }
p { font-weight: bold }
span { color: red }
p span { display: none }
img { float: right }

和构建DOM的过程类似，我们需要将受到的CSS规则们转换为浏览器能够理解的东西CSSOM：

最终的CSSOM树就是：

要想知道解析CSS花了多长时间，看一下timeline：

注意上边的是在https://developers.google.com/web/fundamentals/performance/critical-rendering-path/?hl=en文章中介绍的内容，而内容是比较老的，最新的Chrome的开发者工具中，Timeline的记录中会有详细的过程：

构建渲染树（呈现树）

有了DOM和CSSOM，那么就可以通过他们来构建渲染树了：

注意结果就是渲染树是和DOM树是相对应的，但是不是一一对应的，因为非可视化的DOM元素不会插入到渲染树中，例如head元素；而如果元素的display属性的值是none的话，也不会出现在渲染树中。

渲染

有了渲染树，就可以进行渲染了，渲染的基本流程可以说是这样的：

也就是黄色的四个步骤：

计算CSS样式
构建渲染树
布局，主要定位坐标和大小，是否换行，各种position overflow z-index属性
调用操作系统Native GUI的API绘制内容

那上边的图中那么多线是啥意思呢？其实就是表示通过JS动态修改了DOM或者CSSOM，且导致了重新布局或者渲染。

这里就涉及了两个重要概念：Reflow和Repaint

Reflow，也称作Layout，中文叫回流，一般意味着元素的内容、结构、位置或尺寸发生了变化，需要重新计算样式和渲染树，这个过程称为Reflow
Repaint，中文重绘，意味着元素发生的改变只是影响了元素的一些外观之类的时候（例如，背景色，边框颜色，文字颜色等），此时只需要应用新样式绘制这个元素就OK了，这个过程称为Repaint

所以说Reflow的成本比Repaint的成本高得多的多。DOM树里的每个结点都会有reflow方法，一个结点的reflow很有可能导致子结点，甚至父点以及同级结点的reflow。

下面这些动作有很大可能会是成本比较高的：

增加、删除、修改DOM结点时，会导致Reflow或Repaint
移动DOM的位置，或是搞个动画的时候
内容发生变化
修改CSS样式的时候
Resize窗口的时候（移动端没有这个问题），或是滚动的时候
修改网页的默认字体时

注：display:none会触发reflow，而visibility:hidden只会触发repaint，因为没有发生位置变化。

基本上来说，reflow有如下的几个原因：

Initial，网页初始化的时候
Incremental，一些Javascript在操作DOM树时
Resize，其些元件的尺寸变了
StyleChange，如果CSS的属性发生变化了
Dirty，几个Incremental的reflow发生在同一个frame的子树上

解析和渲染总结

这里需要注意的一件事情就是在HTML解析过程中回去加载外链的CSS，但是不会影响继续解析HTML的；在外链CSS得到之后要解析CSS。从前面的介绍可知渲染的话是需要DOM和CSSOM一起构建出来渲染树，然后渲染出来的，也就是说默认情况下CSS是会阻塞渲染的，为啥说默认情况呢，难道还有不阻塞渲染的时候？答案是有的，通过media query就可以使得CSS资源是非阻塞渲染的。

JS脚本

那说完了DOM和CSSOM了，就该说说这个JS脚本了，首先来看一张加入了脚本的整个渲染过程的流程图：

可以看出，通过JS脚本可以通过DOM API和CSSOM API来才做DOM树和CSSOM树（或者说CSS规则树）；但是呢JS是会阻塞DOM的构建（除非显示的声明为异步async的）也会阻塞CSSOM的构建，也就意味着会推迟这个页面的渲染完成。

在页面中的脚本有两种情况，一种就是内嵌的，还有一种外链的。

对于脚本内嵌的情况，在解析HTML的过程中，直接执行脚本，这个时候会阻塞HTML解析来构建DOM，因为CSS不会修改DOM；还有一种情况那就是如果说正在脚本前面还有CSS的话，而此时CSSOM还未构建完成，那么浏览器就会推迟脚本的执行直至下载并构建好了CSSOM，而且在这个等待的过程中DOM的构建也会停止。所以说，在内嵌脚本之前不要有外链CSS，否则的话就会出现所谓的“CSS阻塞”，其实就是必须等到CSS加载完成解析构建CSSOM之后才会执行脚本，执行完脚本才会继续解析HTML构建DOM（这里Webkit则更智能一点，在执行脚本过程中发现引用了样式的话才暂停脚本的执行，等待CSS下载解析，然后再恢复）。

然后第二种情况，对于外链脚本而言，在解析HTML的过程中发现了外链的脚本，会发一个请求去得到脚本内容，但是这个过程是同步的，需要等待脚本下载完成且执行之后才会继续解析HTML构建DOM；但是对于现代浏览器在这个时候会生成第二个线程解析HTML文档，会继续下载资源，所以有多个外链脚本的话，会并行请求下载脚本内容，但是浏览器对于一个域的资源是有最大并行限制的，一般是6个，超过的就只能等待了。脚本虽然可以并行加载，但是执行的顺序是按照在页面中先后顺序执行的，执行的过程会阻塞后续解析构建渲染，同样也会阻止其他资源的下载。关于这方面JS加载对性能的影响可以看 http://www.alloyteam.com/2015/05/wang-ye-xing-neng-zhi-html-css-javascript/

渲染HTML总结

到这里解析HTML并渲染的整个过程算是完了，有一些具体的细节没有说，想要了解的话可以看下边参考中的链接。

参考：

http://www.html5rocks.com/zh/tutorials/internals/howbrowserswork/
http://coolshell.cn/articles/9666.html
http://www.jianshu.com/p/e305ace24ddf
http://www.jianshu.com/p/e141d1543143
https://developers.google.com/web/fundamentals/performance/critical-rendering-path/?hl=en
http://stackoverflow.com/questions/1795438/load-and-execution-sequence-of-a-web-page
http://coolshell.cn/articles/9749.html
http://www.51testing.com/html/38/225738-220986.html
http://javascript.ruanyifeng.com/bom/engine.html

总结

关于整个过程呢，只是说了一些我认为比较重要部分；而其他的例如浏览器根据不同的响应类型采取不同的策略（是下载，还是预览等）没有细说，当然并不是说不重要，因为涉及的实在是太广了，所以只是捡了部分来细说。

这里列一下《从输入URL到页面加载完的过程中都发生了什么事情》的一些参考链接：

http://network.51cto.com/art/201103/252335_all.htm
http://segmentfault.com/q/1010000000489803
http://www.guokr.com/question/554991/
http://fex.baidu.com/blog/2014/05/what-happen/
https://friendlybit.com/css/rendering-a-web-page-step-by-step/
http://www.zhihu.com/question/19645229

发布于: 2015年 11月 03日

你可能感兴趣的:(互联网)

算法在各领域的广泛应用：100 个实例全解析软件职业规划 AI&模型算法
一、互联网与信息技术领域搜索引擎算法：如谷歌的PageRank算法，用于根据网页的重要性和相关性对搜索结果进行排序，帮助用户快速找到所需信息。推荐系统算法：例如亚马逊和Netflix使用的协同过滤算法。根据用户的历史行为（购买、观看记录等）和其他相似用户的偏好，为用户推荐可能感兴趣的产品或内容。社交网络分析算法：用于分析社交网络中的用户关系，如Facebook通过算法发现用户的好友推荐、社区划分等
不多 bb，直接来看Java 全栈面试进阶宝典，保底拿下offer Java程序V Java java 面试 jvm
大家都知道，现在的Java面试是越来越难了！主要原因无非是两个：随着Java这个行业的兴起，不管是在家待业的、对自己现在工作不满意的、大学选错专业的、缺钱的、想自己学的等等这些人绝大部分都是选择了去学习Java！大量人才涌入，导致岗位竞争越来越大，面试也就越来越难！另外一个就是这两年的疫情影响，很多公司都宣布倒闭、裁员。加上互联网行业内卷的推动，面试造火箭工作拧螺丝已经是一个很常见的现象了！最近也
小白十分钟速通 Spring Boot 基础 Gao_雪 Spring spring boot 后端 java spring vscode
SpringBoot介绍随着Spring体系的不断庞大，加上现代互联网应用体积庞大，构建一个应用还是非常困难的，Spring团队重新打造了一个新的面向微服务的框架SpringBoot。严格来说SpringBoot不能是一个框架，它更是一个方案，Spring工程的快速上手方案，它极大的降低了JavaWeb工程的创建和运行和部署的难度。在过去这些都是Java工程师的老大难，所以说SpringBoot的
最新版！“非常详细的” 鸿蒙HarmonyOS Next应用开发学习路线！（从零基础入门到精通）不入流HarmonyOS开发 HarmonyOS 鸿蒙鸿蒙学习鸿蒙开发 harmonyos 移动开发前端学习 android
前言最新数据显示，在中国智能手机市场，鸿蒙操作系统的份额达到10%，鸿蒙开发者数量更是超过240万，鸿蒙生态已经与iOS、安卓形成了“三分天下”的格局，成为当下的风口。如今，为了抢占巨大的鸿蒙市场，Top20移动互联网公司中近半数已经启动了鸿蒙原生应用开发，其中包括支付宝、美团等各大巨头。鸿蒙的崛起，相关岗位需求迅速增长。就业市场中，鸿蒙人才紧缺，已成为炙手可热的宝贵资源。包括美团、京东、网易在内
解锁高性能Web应用：Gunicorn、Flask与Docker的高并发部署秘籍我是瓦力前端 gunicorn flask
引言在当今的互联网时代，高并发Web应用已成为许多企业的核心需求。无论是电商平台、社交网络还是实时数据分析系统，高并发能力直接影响到用户体验和业务成败。本文将带你深入探讨如何利用Gunicorn、Flask和Docker，实现高性能、高并发的Web应用部署。Gunicorn、Flask和Docker的基本概念Gunicorn：GreenUnicorn(简称Gunicorn)是一个PythonWSG
短视频时代，普通人如何保护个人隐私？——从SSL证书看数据安全安全
在短视频时代，每天数以亿计的用户上传内容、互动评论、甚至进行直播购物。然而，这些行为背后潜藏着隐私泄露的风险：账号密码被盗、支付信息被窃取、个人数据遭篡改……如何在这些场景中保护隐私？SSL证书作为互联网安全的基石，正扮演着关键角色。本文将从技术原理到实践建议，为你揭开SSL证书如何成为隐私保护的“隐形盾牌”。一、SSL证书：隐私保护的第一道防线SSL（SecureSocketsLayer）证书是
千问大模型携手超算互联网：算力驱动下的安全新征程安全
一、技术革命的新纪元：从“火种”到“燎原”2025年3月，中国国家超算互联网平台宣布接入阿里巴巴“千问QwQ-32B”大模型。这一事件，标志着人类算力资源整合迈入新阶段——超算中心不再仅是巨型计算机的集合，而是演化为承载智能的“数字大脑”。用户可通过平台免费调用百万级Token的计算资源，如同古希腊神话中普罗米修斯盗火予人，超算互联网正将“智能之火”播撒至科研、工业乃至普通开发者手中。然而，火种既
高并发系统的艺术：如何在流量洪峰中游刃有余架构
作者：京东物流赵勇萍前言我们常说的三高，高并发、高可用、高性能，这些技术是构建现代互联网应用程序所必需的。对于京东618备战来说，所有的中台系统服务，无疑都是围绕着三高来展开的。而对于京东庞大的客户群体，高并发的要求尤为重要。用户对在线服务的需求和期望不断提高，系统的并发处理能力成为衡量其性能和用户体验的关键指标之一。高并发系统不仅仅是大型互联网企业的专利，对于任何希望在市场中占据一席之地的公司来
数据分析大数据面试题大杂烩01 爱学习的菜鸟罢了大数据 flink 大数据面试 hive hadoop kafka
互联网:通过埋点实时计算用户浏览频次用优惠券等措施吸引用户,通过历史信息用非智能学习的title方式构造用户画像(抖音,京东)电信,银行统计营收和针对用户的个人画像:处理大量非实时数据政府:健康码,扫码之后确诊,找出与确诊对象有关联的人订单订单表(除商品以外所有信息),商品详情表,通过搜集用户title进行定制化推荐点击流数据通过埋点进行用户点击行为分析FLINK一般用来做实时SPARK一般用来做
Python 爬虫实战：艺术品市场趋势分析与交易平台数据抓取西攻城狮北 python 爬虫开发语言
一、引言在当今数字化时代，艺术品市场正经历着前所未有的变革。随着互联网技术的飞速发展，越来越多的艺术品交易转移到了线上平台，这为我们提供了海量的数据资源。通过Python爬虫技术，我们可以抓取艺术品交易平台上的数据，进而分析艺术品市场的趋势，为投资者、收藏家以及艺术爱好者提供有价值的参考。本文将带领读者深入探索Python爬虫在艺术品市场的应用。从爬虫的基本原理到实际代码实现，再到数据的清洗、分析
eBest AI Hub全场景接入Deepseek eBest数字化转型方案人工智能
一、技术赋能，智创未来Deepseek的强大基因将为eBest产品注入新的活力即时智能响应：融合海量行业智慧与互联网搜索精华，提供秒级智能建议；多模态理解能力：突破界限，无缝融合文本、代码与图像理解，精准解析用户的需求；进化式深度学习：不断学习，持续进化，为用户提供日益完善、超越期待的服务体验。二、全场景赋能，体验再次跃升1.智能报表-数据洞察，指尖掌控升级后的智能报表功能，能够根据查询和检
Cookie，Session，JWT .晚安. java web
Cookie，Session，JWT前言由于早期的网页被设计出来只是为了满足人们浏览网络资源的需求，几乎没有交互，所以HTTP在设计之初就是无状态的，无法携带信息。随着互联网的发展，为了满足人们对于网络交互的需求，需要一种技术来保存用户信息，用于登录认证等。目前常见的技术便是Cookie，Session，JWT。CookieCookie存储于客户端（浏览器），当用户访问一个页面时，客户端将用户填好
计算机毕业设计springboot基于BS的驾校在线学习考试系统43i2x9【附源码+数据库+部署+LW】゛花昔计算机毕设源码程序课程设计 spring boot 学习
本项目包含程序+源码+数据库+LW+调试部署环境，文末可获取一份本项目的java源码和数据库参考。系统的选题背景和意义选题背景：随着社会的发展和交通工具的普及，驾驶证成为了越来越多人的需求。然而，传统的驾校学习考试方式存在一些问题，如时间和空间限制、学习资源不足等。为了解决这些问题，基于BS（Browser/Server）架构的驾校在线学习考试系统应运而生。该系统利用互联网浏览器作为客户端，通过服
无网络entos7报错ImportError: /lib64/libm.so.6: version `GLIBC_2.27‘ not found更新glibc 夏离网络
最近在尝试使用sklearn的升级版cuml，因为是一台没有连接互联网的gpu机器，所以构建cuml环境过程很坎坷，需要各种将各种whl包在线下载后上传到服务器中。当我终于解决完包的互相依赖问题后，在importcuml时候遇到一个错误：ImportError:/lib64/libm.so.6:version`GLIBC_2.27’notfound(requiredby/anaconda3/env
【python】网络编程socket TCP UDP 草莓泰面包 python 网络 python tcp/ip
文章目录socket常用方法TCP客户端服务器UDP客户端服务器网络编程就是实现两台计算机的通信互联网协议族即通用标准协议，任何私有网络只要支持这个协议，就可以接入互联网。socketsocke模块的socket()函数importsocketsock=socket.socket(AddressFamily,type)参数说明：AddressFamily：指定套接字家族（AddressFamily
T-SQL语言的物联网尤宸翎包罗万象 golang 开发语言后端
T-SQL语言在物联网中的应用引言物联网（InternetofThings，IoT）是一个迅猛发展的领域，它将各种物理设备通过互联网连接起来，实现数据的实时采集和分析。随着物联网技术的不断发展，数据的规模和复杂性急剧提升，这对数据存储、处理和分析提出了更高的要求。在众多数据库编程语言中，T-SQL（Transact-SQL）以其强大而灵活的特性，成为物联网数据管理和分析中一种重要的工具。本文将探讨
泛目录程序：站群策略在SEO优化中的优势与应用奥顺互联_老张站群 php 数据库缓存搜索引擎
泛目录程序案例：站群策略在SEO优化中的优势与应用引言在当今竞争激烈的互联网环境中，搜索引擎优化（SEO）已成为企业提升在线可见性和流量的关键策略。泛目录和站群作为SEO优化中的两种重要策略，近年来备受关注。本文将通过具体案例，深入探讨这两种策略在SEO优化中的优势与应用。一、泛目录的定义与优势1.1泛目录的定义泛目录是指通过创建大量内容相关、结构相似的目录页面，覆盖广泛的搜索关键词，从而提升网站
网络安全还值得学习吗？黑客呀计算机网络安全网络工程师 web安全学习安全
在信息化时代，网络安全行业备受关注，可谓是万人瞩目。而且网络安全也被贴上了前景好、需求大、潜力广、就业好、薪资高等标签，那么网络安全真的值得学习吗?我们一起来看看吧。答案是肯定的，网络安全是非常值得学习的技术。市场需求：随着互联网的普及和数字化转型的加速，网络安全问题日益凸显。企业、政府和个人对网络安全的需求不断增长，这导致了网络安全专业人才的稀缺。因此，从市场需求的角度来看，网络安全专业具有较大
算力网络技术创新驱动生态协同发展智能计算研究中心其他
内容概要算力网络作为数字经济发展的核心基础设施，正经历从单一性能提升向体系化技术协同的范式转变。当前技术创新主要聚焦三大维度：在架构层面，通过异构计算、量子计算与神经形态计算的融合，突破传统芯片制程限制；在调度层面，依托分布式计算与流批处理技术，实现跨边缘节点、工业互联网平台与超算中心的资源动态编排；在生态层面，围绕能效管理、安全标准与算法优化构建全链条能力，支撑金融风险评估、基因测序等高复杂度场
深入解析：构建高效单页应用（SPA）的最佳实践与示例布兰妮甜 #Vue 单页应用 SPA Vue.js 前端
文章目录前言一、单页应用（SPA）的介绍二、单页应用（SPA）的优势三、构建单页应用（SPA）的基本步骤四、使用Vue.js构建一个简易的单页应用（SPA）：任务管理器结语前言随着互联网技术的发展，用户对于网页应用的交互性和响应速度提出了更高的要求。传统的多页面应用（MPA）在每次用户交互时需要重新加载整个页面，这不仅增加了服务器的负担，也降低了用户体验。而单页应用（SinglePageAppli
《Web 应用项目开发》课程心得体会：从理论到实战，开启 Web 开发新征程 m0_74824091 前端
在信息技术飞速发展的当下，Web应用已然渗透到生活的方方面面，从日常网购、社交娱乐，到在线办公、学习平台，无一不是Web应用的成果。怀着对互联网技术的热忱与憧憬，我踏入了《Web应用项目开发》这门课程，历经数月的沉浸式学习与实践，收获远超预期，犹如经历一场脱胎换骨的蜕变，以下便是我在这门课程中的全面心得体会。夯实基础：Web技术初相识课程伊始，仿若踏入一片未知的技术丛林，HTML、CSS和Java
软考高级架构师/分析师论文【论基于架构的软件设计方法/ABSD】 saikey0379 架构软考高级论文系统架构设计师系统分析师计算机软件资格考试 ABSD
一、摘要 2020年4月，某互联网公司开始了基础架构管理平台项目的实施，该项目主要为基础架构团队提供基础设施、中间件、负载均衡、任务管理等功能，我作为该项目的架构师，主要负责架构设计、架构评估等工作。本文以该项目为例，主要论述基于架构的软件设计方法在该项目中的具体应用与实现效果。在架构需求阶段，通过访谈、原型、JRP等方式获得了系统需求，并在标识构件后完成了需求评审。在架构设计阶段，对架构进行了
为什么Redis对大 Key（Large Key）和大对象不友好？怎样优化？风一样的树懒 redis 数据库缓存
你好，我是风一样的树懒，一个工作十多年的后端专家，曾就职京东、阿里等多家互联网头部企业。公众号“吴计可师”，已经更新了近百篇高质量的面试相关文章，喜欢的朋友欢迎关注点赞Redis对大Key（LargeKey）和大对象不友好，主要源于其内存管理模型、单线程架构和数据结构特性。以下从性能影响、内存管理、集群限制三个维度解析原因，并提供优化方案：一、Redis对大Key不友好的核心原因1.性能瓶颈单线程
所有网站都必须做域名备案吗？域名域名申请备案
在互联网的蓬勃发展进程中，网站如雨后春笋般涌现。然而，并非所有网站在上线前都需经历相同流程，其中网站域名备案这一关键环节，在特定情况下才成为必然要求。一、国内网站必须要做网站域名备案？从法规层面来看，我国有着明确且严格的规定。依据相关互联网管理法规，在境内提供非经营性互联网信息服务，必须办理备案。这一规定为绝大多数个人网站以及众多企业宣传展示类网站划定了清晰的准入门槛。举例而言，个人搭建的兴趣博客
Nginx配置 ngx_http_proxy_connect_module 模块及安装 huazhixuthink nginx 运维
1、配置完互联网yum源后，安装相关依赖软件包[root@serversoft]#yuminstall-ypatchpcrepcre-develmakegccgcc-c++opensslopenssh[root@serversoft]#yuminstallopenssl*2、解压缩软件，加载模块[root@serversoft]#lsnginx-1.20.2nginx-1.20.2.tar.gzn
亚马逊自养号测评，IP纯净度的重要性刘哥测评技术zcwz626 网络服务器 linux
在亚马逊自养号测评中，除了物理环境需模拟当地真实的物理配置，网络IP环境也非常重要。IP地址的重要性不容忽视。以下是对IP地址在亚马逊自养号测评中重要性的详细分析：一、IP地址的定义与类型IP地址是IP协议提供的统一地址格式，它为互联网上的每个网络和主机分配一个逻辑地址，以屏蔽物理地址的差异。IP地址可以分为静态和动态两种类型：静态IP地址：长期分配给计算机或网络设备的地址。使用专用线路接入互联网
SSL证书：网站安全的守护者 ssl证书
在互联网时代，网站安全至关重要。SSL证书，如同网站的安全卫士，默默守护着用户的数据安全，为网站构建起一道坚固的防线。如何申请SSL证书？登录JoySSL官网注册账号填写注册码【230930】有专属技术指导申请SSL证书的流程非常简单：选择证书类型：根据网站需求选择合适的SSL证书类型。生成CSR文件：在服务器上生成证书签名请求（CSR）文件。提交申请：将CSR文件提交给证书颁发机构（CA），并完
量子操作系统QNode OS横空出世，量子网络新时代开启！广拓科技网络量子计算
QNodeOS，这个在量子领域掀起波澜的名字，正是全球首个专门为量子网络设计的操作系统。它由荷兰代尔夫特理工大学、荷兰量子技术研究所（QuTech）、奥地利因斯布鲁克大学、法国国家信息与自动化研究所和法国国家科学研究中心组成的量子互联网联盟（QIA）研发而成，并于2025年3月12日在顶尖科学期刊《自然》上发表相关研究成果，正式宣告其问世。从理论层面来讲，量子网络一直是科学界梦寐以求的未来网络形态
CSS3 用户界面设计指南 froginwe11 开发语言
CSS3用户界面设计指南引言随着互联网的快速发展，用户界面设计已经成为网站和应用程序吸引和留住用户的关键因素之一。CSS3，作为Web开发中的核心技术之一，提供了丰富的工具和特性来改善用户界面。本文将深入探讨CSS3在用户界面设计中的应用，包括基本概念、常用技巧以及实际案例分析。CSS3用户界面基本概念1.媒体查询媒体查询（MediaQueries）是CSS3的一个重要特性，它允许开发者根据不同的
浅谈基于saas模式的ERP优劣以及未来发展分析微笑的曙光（StevenLi）业务发展 java mongodb sql
SaaS模式在ERP中的应用已经越来越广泛，尤其是在中小企业和初创企业中。SaaSERP通过云计算技术，将ERP系统部署在云端服务器上，企业用户只需通过互联网浏览器即可访问和使用，无需在本地安装和维护复杂的软件和硬件基础设施。这种模式大大降低了企业的初期投资成本，提高了业务的灵活性和响应速度。同时，SaaSERP还支持多租户架构，多个用户可以同时使用同一套系统而互不干扰，进一步提高了资源的利用率。
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号