HJSM

Web 和http协议

1.1HTTP服务的重要基础
1.1.1 用户访问网站基本流程
DNS hosts ---- 本地缓存-----LDNS----根DNS
1.1HTTP服务的重要基础
1.1.1用户访问网站基本流程
我们每天都会使用Web客户端上网浏览网页。最常见的为Web客户端就是谷歌浏览器等，如通用的微软Internet Explorer ( IE).以及技术人员偏爱的火狐浏览器、谷歌浏览器等。当我们在Web浏览器里输入网站地址(例如: baidu. com)时，很快就会看到网站的内容这一切似乎看起来很神奇，那么在其背后到底是怎样的实现流程呢?也许普通的上网者无需关注，，但作为一个 IT技术人员，特别是合格的Linux运维人员，就需要清晰的掌握了。
下面我们就来揭晓从客户端用户在web浏览器里输入网站地址，到看到网站内容的完整访问流程
第一步:客户端用户在浏览器里输入www. baidu. com网站地址，回车后，系统首先会查找系统本地的DNS缓存及hosts文件信息，确定是否存在ww. baidu. com域名对应的IP解析记录，如果有就直接获取IP地址，然后去访问这个IP地址对应域名www. baidu. com的服务器，一般第一次请求时，DNS 缓存是没有解析记录的，而hosts多在内部临时测试时使用。
第二步:如果客户端本地DNS缓存及hosts文件没有www. baidu. com 域名对应的解析记录，那么系统会把浏览器的解析请求发送给客户端本地设置的DNS服务器地址(通常称此DNS为LDNS,即Local DNS)解析，如果LDNS服务器的本地缓存有对应的解析记录就会直接返回IP地址给客户端。如果没有，则LDNS会负责继续请求其他的DNS服务器。
第三步: LDNS 从DNS系统的(”.”)根开始请求对www. baidu. com域名的解析，并针对各个层级的DNS服务器系统进行一系列的查找，最终会找到www. baidu. com域名对应的授权DNS服务器，而这个授权DNS服务器正是企业购买域名时用于管理域名解析的服务器，这个授权服务器会www. baidu. com对应的IP解析记录。如果此时没有，就表示企业的域名管理人员没有为www. baidu. com域名做解析设置，即网站还没架设好。
第四步:w ww… baidu. com域名的授权DNS服务器会把www… baidu. com对应的最终IP解析记录(例如: 1.1. 1.1)发给LDNS。
第五步: LDNS 把来自授权DNS服务器www. baidu. com对应的IP解析记录发给客户端浏览器，并且它会把该域名和IP的对应解析缓存起来，以便下一次更快地返回相同解析请求的记录，这些缓存记录在指定的时间(DNS TTL值控制)内不会过期。
第六步;客户端浏览器获取了www. baidu.com的对应IP地址，接下来，浏览器会请求获得IP地址对应的网站服务器，网站服务器接收到客户的请求并响应处理(此处的处理可能是数百台集群的服务器系统，也可能是一台云主机)，将客户请求的内容返回给客户端浏览器。到现在为止，一次访问浏览网页的完整过程就完成了。
提示:上述仅仅是客户端用户第一次访问网站的基本过程，连续访问后，系统本地和LDNS层级都会有缓存记录，再访问时流程就会有些变化，会直接取本地缓存记录，这样访问过程就很快了。
(1) 查看windows客户端本地缓存的DNS解析记录的命令
C: \Users\benet> ipconfig /displaydns //display the contents of the DNSResolve Cache
Windows IP配置
conf. wsm. 360. cn
记录名称. …: conf. wsm. 360. cn
记录类型…:1
生存时间：. . . . . . . : 26
数据长度：. . . . . . . : 4
部分. . . . … . : 答案
A（主机）记录. . . . . . .: 221.130.200.53
1.清除windows客户端本地缓存的DNS解析记录的命令
C:\Users\benet>ipconfig /flushdns
Windows IP 设置
已成功刷新DNS解析缓存
1.2.1HTTP协议
HTTP协议，全称为HyperText Transfer Protocol,中文名为超文本传输协议，是互联网中最常用的一种网络协议。HTTP的重要应用之一是www服务。设计HTTP协议最初的目的就是提供一种发布和HTML（一种页面标记语言）页面的方法。
HTTP协议是互联网上常用的通信协议之一。他有很多的应用，但最流行的就是用于Web浏览器和Web服务器之间的通信，即www应用或称Web应用。
WWW，全称为World Wide Web,常称为Web,中文译为“万维网”。它是目前互联网上最受用户欢迎的信息服务形式。HTTP协议的www服务应用的默认端口为80，另外一个加密的www服务应用https的默认端口为443，主要用于网银、支付等和钱相关的业务。
TCP:传输控制协议
UDP：用户数据报协议
1、TCP三次握手建立连接与四次挥手断开连接
建立连接∶
在socket未连接时，客户端和服务器双方都处于CLOSED状态，需要注意的地方是，只有客户端才能发起连接握手请求，服务端无法直接对客户端发起握手请求，当客户端需要对服务端传输数据的时候会会先服务端建立稳定可靠的连接。首先客户端需要对对服务端发起SYN握手请求并进入SYN_SEND状态，当服务端收到请求后回应一个SYN握手请求并附带回应同意ACK消息，随后服务端进入SYN_RECV状态，客户端回应服务端的SYN握手请求，所以回应ACK消息并进入ESTABLSHED状态，服务端收到客户端的ACK后也会进入ESTABLUSHED状态，此时，连接建立完成，服务端会进入RECV阻塞，客户端会进入准备发送数据阶段，只有当客户端发送完数据之后，服务端的阻塞状态才会被解除，并且继续执行后续操作，完成后会再次进入到RECV阻塞状态。
TCP优化∶把TCP无线向UDP靠拢
断开连接∶
在Socket连接后，客户端于服务端双方都可以在任意时刻关闭socket连接，此处假设客户端主动断开连接，现在客户端程序下达了close指令，程序会向服务端发送请求断开FIN消息，服务端收到FIN消息后会先回应ACK确认后再次回应FIN 消息并进入LASTACK状态，客户端收到FIN消息后回应ACK确认后进入TIME_WAIT状态，服务端收到ACK后确认断开并关闭socket描述符，而客户端需要保持TIME_WAIT状态，保持时长为2MLS（两个数据包最大生存时间的总和）
1）第一次握手：建立连接时，客户端A发送SYN包（SYN=j）到服务器B，并进入SYN_SEND状态，等待服务器B确认。

2）第二次握手：服务器B收到SYN包，必须确认客户A的SYN（ACK=j+1），同时自己也发送一个SYN包（SYN=k），即SYN+ACK包，此时服务器B进入SYN_RECV状态。

3）第三次握手：客户端A收到服务器B的SYN＋ACK包，向服务器B发送确认包ACK（ACK=k+1），此包发送完毕，客户端A和服务器B进入ESTABLISHED状态，完成三次握手。
1.2.2 HTTP协议版本
HTTP协议从诞生之初到现已经经历了若干个版本，其中最主要的版HTTP/1.0,HTTP/1.1.
HTTP/1. 0是第一个得到广泛使用的版本，而HTTP/1. 1为当前伸用的主流版本。
1、HTTP/1.0简介
HTTP/1.0是第一个得到广泛使用的HTTP版本，HTTP/1. 0在HTTP/0.9的基础上增加了HTTP请求头，可支持更多的请求方法，并且能对多媒体对象进行处理。HTTP/1. 0使得包含生动图片的Web页面和交互式表格成为可能，而正是这些页面和表格促使互联网被人们广泛地接受。HTTP/1.0规定浏览器与服务器只保持短暂的连接，浏览器的每次请求都需要与服务器建立个TCP连接，服务器完成请求处理后即断开TCP连接，服务器不跟踪每个客户，也不记录过去的请求。
2. HTTP/1.1 简介
HTTP 1.1的重点是修复HTTP设计中的缺陷，从可扩展性、缓存处理、带宽优化、持久连接、host头、错误通知、消息传递、内容协商等多个方面都做了相关改进。HTTP/1.1 是当前互联网主流的HTTP版本。
在连接方面，HTTP/1.1支持持久连接，在一个TCP连接上可以传送多个HTTP请求和响应，减少了建立和关闭连接的消耗和时间延迟。
在请求头方面，HTTP/1.1 增加了更多的请求头和响应头信息，用以增强HTTP功能。例如:host主机头功能，可以让Web浏览器使用主机头名来明确表示要访问服务器上的哪个Web站点，这样就可以使用Web服务器在同一个IP地址和端口号上配置多个虚拟Web站点。
HTTP/1.1的持久连接，也需要增加新的请求头来帮助实现，例如，Connection 请求头的值为Keep-Alive时，表示客户端通知服务器返回本次请求结果后保持连接; Connection 请求头的值为close时，表示客户端通知服务器返回本次请求结果后关闭连接。HTTP/1.1还提供了与身份认证、状态管理和Cache缓存等机制相关的请求头和响应头等。
1.2.3 HTTP请求方式
在HTTP通信中，每个HTTP请求报文都包含一个方法。用以告诉Web服务器端需要执行哪些具体的动作，这些动作包括：获取指定Web网页、提交内容到服务器、删除服务器上资源文件等，这些HTTP请求报文中包含的方法被称为HTTP请求方法：
HTTP方法有以下几种：
1、GET：客户端请求指定资源信息，服务器返回指定资源。
2、HEAD：只请求响应报文中的HTTP首部
3、POST：将客户端的数据交到服务器。
4、PUT:用户从客户端向服务器传送的数据取代指定的文档内容
5、DELETE：请求服务器删除Request-URL所标识的资源
6.MOVE:请求服务器将指定的页面移至另一个网络地址。
1.2.4 HTTP状态码
1、HTTP状态码介绍
HTTP状态码( HTTP Status Code)是用来表示Web服务器响应HTTP请求状态的数字代码。
每当Web客户端向Web服务器发送- 个HTTP请求时，Web服务器都会返回一个状态响应代码。这个状态码是一个三位数字代码，作用是告知Web客户端此次请求是否成功，或者是否要采取其他的动作方式。
HTTP 协议1.1版本中的状态码可以分为五大类。
状态码范围:
100~ 199:用于指定客户端相应的某些动作
200 ~299:.用于表示请求成功
300~ 399:用于已经移动的文件，并且常被包含在定位头信息中指定的地址信息
400~499:用于指出客户端的错误
500~ 599: 用于指出服务器的错误
HTTP响应的状态码种类很多，但是在实际生产环境中，经常遇到的状态码却不是很多，我们来看看常见的一些状态码。
200或300没有问题
出现400范围找客户端出现500找服务器
200 – OK :服务器成功返回页面，这是成功的HTTP请求返回的标准状态码
301 - Moved Permanently :永久跳转，所请求的网页将永久跳转到被设定的新位置，例如:从www. baidu. com跳转到www. taobao. com
403 - Forbidden ;禁止访问，虽然这个请求是合法的，但是服务器端因为匹配了预先设置的规则而拒绝响应客户端的请求，此类问题一般为服务器或服务权限配置不当。
404一Not Found :服务器找不到客户端请求的指定页面，可能是客户端请求了服务器上不存在的资源
500-- Internal Server Error :内部服务器错误，服务器遇到了意料不到的情况，不能完成客户的请求。这是一个较为笼统的报错，一般为服务器的设置或内部程序问题导致例如:SELinux开启，而又没有为HTTP设置规则许可，客户端访问就是500。
502一Bad Gateway :坏的网关，一般是代理服务器请求后端服务时，后端服务不可用或没有完成响应网关服务器。这通常为反向代理服务器下面的节点出问题所致。
503 一Service Unavailable:服务当前不可用，可能是服务器超载或停机维护导致的，或者是反向代理服务器后面没有可以提供服务的节点。
504 一Gateway Timeout :网关超时，一般是网关代理服务器请求后端服务时，后端服务没有在特定的时间内完成处理请求。多数是服务器过载导致没有在指定的时间内返回数据给前端代理服务器。
HTP状态码的命令行查看
可以通过curl命令，curl命令是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载，所以是综合传输工具，但按传统，习惯称curl为下载工具。作为一款强力工具，curl 支持包括HTTP、HTTPS、 ftp 等众多协议，还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。
[root@localhost ~]# curl -I www. baidu. com // -I:只显示请求头信息HTTP/1.1 200 OK
Server: openresty
Date: Thu, 22 Feb 2018 03:37:31 GMT
Content -Type: text/html; charset=utf-8
Content Length: 127686
Connection: keep-alive //保持连接
Vary: Accept Encoding //访问权限
Last -Modified: Thu, 22 Feb 2018 02:22:47 GMT //.上次最后修改时间
Vary: Accept-Encoding //访问状态
ETag: “5a8e2977-1f2c6”
X- Server: www. baidu. com
Accept- -Ranges: bytes
X- Server: izwz95kki96pw0j3ilyld1z
Acceot-Renges:bytes 是否接受字节范围的请求，该首部字段是用于告知客户端服务器是否能处理范围请求的，以指定获取服务器端某个部分资源，它可以指定字段值有两种，可处理范围请求时指定共为bytes，反之指定为none。
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform //控制缓存的行为
Private：仅向特定用户返回相应
No-cache：强制向原服务器再次验证
No-store:不会请求或相应任何内容
Proxy-revalidate：要求中间缓存服务器对缓存的相应有效性进行确认
No-transform：代理不可更改的媒体类型
Connection：keep-alive：保持连接，逐条首部，连接管理。在1.1之前的版本默认的都是非持久连接（短连接），如果想在旧版本的HTTP协议上维持持续连接，则需要制定Connection的值为Keep-alive
Content-Length：277 试题主体的大小（字节）首部字段Content-Length表明了实体主体部分的大小（单位是字节）。对实体主体进行内容编码传输时，不能再使用Content-ength首部字段。
Content-Type:text/html 实体主体的媒体类型
Date：“575e1f5c-115” 资源匹配的信息首部字段ETag能告知客户端实体标识。它是一种可将资源以字符串形式做唯一性标识的方式。服务器会为每份资源分配对应的ETag值
Last-Modified：Mon，13 Jun 2016 02:50:04 GMT //最后的修改时间
Pragma：no-cache 报文的指令无缓存强制向源服务器再次验证 no-cache指令的目的是为了防止从缓存中返回过期的资源，缓存会向源服务器进行有效期确认后处理资源。
Server： bfe/ 1.0.8.18 httpd服务器的安装信息
该首部字段告知客户端当前服务器上安装的HTTP服务器应用程序的信息。不单单会标出服务器上的软件应用名称，还有可能包括版本号和安装时启用的可选择。
1.2.5 HTTP报文
HTTP报文中有很多行内容，这些行的字段都是由一些ASCII码串组成，但各个字段的长度是不同的。HTTP报文可分为两种，一种是从Web客户端发往Web服务器的HTTP报文，称为请求报文( Request Message)。另外-种是从Web服务器发往Web客户端的报文，称为响应报文(Response Message) ，HTTP 的请求和响应报文的格式类似。

HTTP请求报文(Request Message) 介绍
HTTP请求报文由请求行、请求头部(header)、空行和请求报文主体几个部分组成
(1)请求行
请求行是请求报文的第一行，用来说明客户端想要做什么。内容由请求方法字段、URL字段和HTTP协议版本字段组成，它们之间用空格分隔。
(2)请求头部
请求头部由关键字/值对组成，每行一对，关键字和值用英文冒号“.”分隔。请求头部的作用是通过客户端把请求的相关信息告诉给服务器。与请求报文相关的最常用的请求头是Content- -Type和Content-Length。
(3)空行
最后一个请求头部信息之后是一个空行，通过发送回车符和换行符，通知Web服务器空行以下不会有请求头部的信息了。
(4)请求报文主体
请求报文主体中包括了要发送给Web服务器的数据信息。请求报文主体不会应用于HTTP的GET命令方法，而是应用于POST方法。POST 方法适用于需要客户填写表单的场合。
HTTP响应报文(Response Message)介绍
HTTP响应报文由起始行、响应头部(heder)、空行和响应报文主体这几个部分组成，和HTTP请求报文格式类似。
(1)起始行
响应报文的起始行也叫状态行，用来说明服务器响应客户端请求的状况。一般为协议及版本号、数字状态码、状态情况。例如: HTTP/1.1 200 OK
(2)响应头部
和请求报文类似，起始行的后面一般有若干个头部字段。每个头部字段都包含一个名字和一个值，两者之间用冒号分隔。头部结尾也是以一个空行结束的。常见的头部信息有:Content -Type: text/html; charset-utf-8等键值对
(3)空行
最后一个响应头部信息之后是一个空行，通过发送回车符和换行符，通知客户端空行下文无头部信息了。
(4) 响应报文主体
响应报文主体中装载了要返回给客户端的数据。这些数据可以是文本，也可以是二进制的(如图片、视频)。
Web服务器接受到请求后，返回-条HTTP响应报文，这条响应报文中包含了HTTP 的版本号(HTTP/1.1 )、成功的状态码( 200)、状态描述(OK)，以及若千个响应头部字段，，在所有这此内容之后跟着包含了所请求资源的响应主体。Content-Length首部说明响应主体的长度，Content-Type首部说明文档的MIME类型。
1.2.6HTTP协议原理及重点分析
HTTP协议属0SI模型中的第七层应用层协议。HTTP 协议的重要应用就是www服务应用。以HTTP协议进行通信时，需要有客户端(即终端用户)和服务器端(即Web服务器)，在Web客户端问Web服务器发送请求报文之前，先要通过TCP/IP协议在Web客户端和服务器之间建立一个TCP/IP连接。
整个HTTP协议请求的工作流程:
(1)终端客户在Web浏览器地址栏输人访问地址http://www. yunan. com/ index. html
(2) Web浏览器请求DNS服务器把域名www. yunan. com转换成Web服务器的IP地址，此处的解析过程就是DNS解析的原理流程。
(3) Web 浏览器将端口号(默认是80)从访问地址(URL)中解析出来。
(4) Web 浏器通过解析后的IP地址及端口号与Web服务器之间建立一条TCP连接。
(5)建立TCP连接后，Web 浏览器问Web服务器发送-一条HTTP请求报文。三次握手
(6) Web 服务器响应并读取浏览器的请求信息，然后返回一条HTTP响应报文。
(7) Web服务器关闭HTTP连接，关闭TCP连接，Web 浏览器显示访问的网站内容到屏幕上。1.3 HTTP资源
1.3.1媒体类型
互联网上的数据有很多不同的类型，Web 服务器会把通过Web传输的每个对象都打上MTME类型(即MIME type)的数据格式标签。最初设计MIME (Multipurpose Internet Mail Extension多用途因特网邮件扩展)是为了解决在不同的电子邮件系统之间搬移报文时存在的问题。MIME在电子邮件系统中工作得非常好，后来，HTTP 也支持了这个功能，用它来描述数据并标记不同的数据内容类型。
当Web服务器响应HTTP请求时，会为每一个HTTP对象数据加一个MIME类型。当Web浏览器获取到服务器返回的对象时，会去查看相关的MIME类型，并进行相应处理。
MIME类型存在于HTTP响应报文的响应头部信息里，它是种文本标记，表示种主要的对象类型和一个特定的子类型，中间由一条斜杠来分隔.
MIME类型文件类型
text/html html、 htm文本类型
text/css css文本类型
image/ xml xml文本类型
Image/ json 交互式文档
image/gif gif图像类型
image/ jpeg jpeg、 jpg图像类型
video/ mp4 MP4视频类型
video/quicktime mov视频
appl ication/javascript js文本类型
video/x -msvideo avi视频类型
常见的几种MIME类型还有很多
1.3.2 URL介绍
URL,全称为Uniform Resource Location,中文翻译为统一资源定位符，也被称为，网页地址(网址)。如同门牌一样，它是因特网上标准的资源唯一地址。通俗地说，URL 是Internet上用来描述信息资源的字符串，主要用在各种www客户端和服务器程序上。URL可以用一种统一的格式来描述各种信息资源，包括文件、服务器的地址和目录等。严格来讲，每个URL都是一个URI,它标识一个互联网资源，并指定对其进行操作或取得该资源的方法。
URL 的格式由下列三部分组成:
第一部分是协议，例如: http.
第三部分是主机资源的具体地址，如目录和文件名等，例如: teacher/index. html
第一部分和第二部分之间用“/ "符号隔开，第二部分和第三部分用“/”符号隔开。第一部分和第二部分是不可缺少的，第三部分可以省略。
1.3.3 UrI 介绍哪一个地方.
URI, 全称为Uniform Resource ldentifier, 中文翻译为统一资源标识符，是一个用于标识某一互联网资源名称的字符串。这个字符串在世界范围内唯一标识并定位某一个信息资源。互联网上每个可用的数据资源(如HTML、图片、视频等)皆通过统一资源标识符进行定位。
1.3.4静态页面资源
1、静态网页资源介绍
在网站设计中，纯粹HTML格式的网页(可以包含图片、视频、JS (前端功能实现)、css (样式)等)通常被称为“静态网页”，早期(大约2000年左右)的网站大多都是由静态网页制作的。静态网页是相对于动态网页而言的，是指没有后台数据库、不含程序(如PHP，JSP, ASP)、不可交互的网页。
2、静态网页资源特点
静态网页资源的特点是，开发者编写的是什么，它显示的就是什么，一旦编写完成，就不会有任何改变。静态网页的维护和更新相对比较麻烦，每个不同的网页都需要，单独编辑更新，静态网页一般适用于更新较少的宣传展示型网站(例如:酒、家具、水果等的宣传网站)，是早期(2000年左右)很多中小网站展示的形式。静态网页资源的对应程序及资源文件的常见扩展名为:
纯文本类程序或文件，如.htm. .html .xml.shtml…js…css等
图片类文件或数据文档，如jpg. gif…png…bmp…txt…doc…ppt等
视频类流媒体文件，如.mp4、.swt、avi…wmv…flv等。
静态网页资源有几个重要的特征:
(1)每个页面都有一几个重固定的URL地址，且URL一般以. html. .htm… shtml 等形式为后缀，而且地址中不含有问号”?”或“&”等特殊符号。
（2）网页内容一经发布到网站服务器上，无论是否有用户访问，每个页面的内容都是保存在网站服务器文件系统上也就是说，静态网页是实实在在保存在服务器上的文件实体，每个网页都，是一个独立的文件。
(3)网页内容是固定不变的，因此，容易被搜索引擎收录(容易被用户找到) (优点)。
（4)因为网页没有数据库的支持，所以在网站制作和维护方面的工作量较大，当网站信息量很大时，完全依靠静态网页比较困难(缺点)。
(5)网页的交互性较差，在程序的功能实现方面有较大的限制(缺点)。
(6)网页程序在用户浏览器端解析，如IE浏览器，程序解析效率很高，由于服务器端不进行解析，并且不需要读取数据库，因此服务器端可以接受更多的并发访问。当客户端向服务器请求数据时，服务器会直接从磁盘文件系统上返回数据(不做任何解析)，待客户端拿到数据后，在浏览器端解析并展现出来(优点)。
网站静态页面的特点就相当于在餐馆吃火锅，餐馆把原材料和工具都给你准备好，你自己只需要涮着吃就行，不需要大厨给你炒菜做菜了。因此，对于餐馆来讲，服务顾客的效率大大提高了。由于静态页面不需要在服务器端解析，因此服务器的压力也大大减轻了。
3、静态网页语言
常见的静态网页语言有HTML、JS、 CSS、XML，、 SHTML等。
回顾一下静态网页的核心特点，如下:
（1)程序在客户测览器端解析，不读取后端数据库，因此性能和效率很高。
(2)因为后端没有数据库支持，所以和用户的交互性较差，功能实现也很少。
4、有关静态网页的架构思想
在高并发、高访问量的场景下做架构优化，涉及的关键环节就是把动态网页转成静态网页，而不是直接请求数据库和动态服务器，并且可以把静态内容推送到前端缓存(或CDN)中提供服务，这样就可以提升用户体验，节约服务器和维护成本。
1.3.5动态网页资源
1、动态网页资源介绍
所谓的动态两页是与静态网页相对而言的，也就是说，动态网页的URL后缀不
是.htm、. html、. shtml、 . xml、. js、.CSS
等静态网页的常见扩展名形式，而
是asp.aspx. .php .is.do、.cgi等形式的，并且一般在动态网页网址中会有标志性
的符号”?，&”，此外，在大多数情况下后端都需要有数据库支持。
2、动态网页资源特点
(1)网页扩展名后缀常见为: .asp、 .aspx、 . php、. jsp、.do、 .cgi等。
(2)网页一般以数据库技术为基础，大大降低了网站维护的工作量。
(3)来用动态网页技术的网站可以实现更多的功能，如用户注册、用户登录、在线调查、投票、
用户管理、订单管理、发博文等。
(4)动态网页并不是独立存在于服务器上的网页文件，当用户请求服务器上的动态程序时，服
务器解析这些程序并可能通过读取数据库来返回一个完整的网页内容。
（5）动态网页中的“？”在搜索引擎的收录方面存在一定的问题，搜索引擎一般不会从一个网站
的数据库中访问全部网页，或者出于技术等方面的考虑，搜索一般不会夫抓取网址中”?”后
面的内容，因此在企业通过搜索引擎进行推广时，需要针对采用动态网页的网站做一定的技术处
理(伪静态技术)，以便适应搜索引擎的抓取要求。
程序在服务器端解析，这相当于顾客点餐，饭店厨师做饭做菜，耗时长、效率低.在这个过
程中，会消耗大量的CPU和内存、I/0等资源，并且多数还要提供读取数据库等服务，因此，其
访问效率远不如静态网页，在服务器端解析动态程序的服务常见的有PHP引擎Java容器(Tomcat.
Resin、Jboss Weblogic) 等。
3、有关动态网页的架构思想
一般来说，静态网页的性能效率是动态网页的10 -30倍.且动态网站效率很差，并发能力也
很低，在高并发场景中，应尽可能转换成静态网页提供服务。动态转静态几乎是所有高并发网站
必备的架构方案思路，也是高级架构师的职责所在。
此外，动态转静态也要根据业务需求设计，例如，对于更新频繁的网站，如果设计不好就可
能会产生数据不一致的情况，即用户看到的数据不是网站最新的内容，而是静态的内容，
1.3.6伪静态网页
1、伪静态网页介绍
顾名思义，伪静态就是通过某些技术(如rewrite)把动态网页的URL地址伪装成静态网页URL
地址，但实质上用户访问的还是动态网页，只不过看起来是符合静态网页地址特征的。因此，用
户及某些搜索引擎会误认为是静态网页。
2、伪静态网页特点
从网站的URL地址看，伪静态表面上看起来是静态内容(如地址结尾带html)，但这其实是通过
rewrite规则实现的URL地址重写。改写后的URL地址规范、美观，有利于搜索引擎抓取，以及
提升用户访问体验。因为伪静态网页还是动态网页，所以从性能上考虑，伪静态功能不但没有提
升网站性能，反而会降低网站的性能。
3、伪静态网页作用
由于搜索引擎无法正确读取带参数的动态网页内容，以致网页中很多具有丰富信息的页面无法被
搜索引擎收录，因此就有了伪静态技术。它的作用是把动态网贝URL改写成静态网页的URL,虽
然消除了动态网页中的参数，但是并不需要生成在任何网页，仅仅是改变了网页地址路径。这样
做的主要目的有两个，一是让搜索引擎收录网站内容，让更多的用户访问企业网站内容。二是提
升用户访问体验，动态地址带特殊符号等的URL看起来也不如静态网页地址舒服。
4、伪静态网页的缺点
动态网页伪装成静态网页，虽然可以让搜索引擎收录，并且可提升用户访问体验，但伪静态
网负并不能提升网站的访问效率，从理论上说还会降低网站的性能，没有动态转静态网页效率高，
不过，对于一些并发不是很大的网站来说，或者是使件资源充足的网站来说，伪静态还是一个不
错的功能。
现在很多大型的网站都来用了动态网页生成静态网页的技术，用于消除动态网页中的参数，
使搜索引擎收录更多的内容，达到优化网站的效果。当网站遇到访问瓶颈时，如果有技术力量将
动态网页转化成静态网页，那就再好不过了，但是，有些史新频率很快的业务并不适合这么做。
此外，如果将动态转为静态有很大难度，这时也可以考虑将其设置伪静态。
5、伪静态网页小结
(1)利用rewrite技术将动态网贝伪装成静态网页(URL地址改写)。
(2)便于搜索引擎搜录，提升用户访问量及用户体验。
(3)访问性能没有提升，并且转换成伪静态会消耗资源，因此性能反而会下降。
rewrite /index.html /index.php
(4)尽可能地将动态网页转换成真正的静态网页。
(5)并发量不是很大或动态更新过于频繁时，用rewrite实现伪静态也是不错的。
(6)传静态网贝的实现过程，一般由产品运营提出需求，开发和运维共同实现
1.4网站流量度量术语
1.4.1 IP
IP (独立IP)，即Internet Protocol,.这里指独立IP数，独立IP数是指不同IP地址的计算机访问网站时被计的总次数。独立IP数是衡量网站流量的一个重要指标。一般一天内（00：00-24：00)相同IP地址的客户端访问网站页面只会被计为一次，记录独立IP的时间可为一天或一个月，目前通用的标准为“一天”
假设有部分同学在局城网中同时打开了课工厂的网站（http:/www. kgc. cn)，请问对于网站是几个独立IP?答:是一个独立IP.这是因为，国内所有的公司几乎都是采用局城网共享上网的，即通过路由器NAT地址转换上网，每个计算机在局城网内的私有IP是不同的，但是在外网上就必须由路由器把每个私网地址转换成了路由器接口的固定公网IP(多IP映射智不考虑，
所以说，对于网站来说一天内多个相同IP的客户端访问会被计为一个独立IP.
1.4.2 PV
PV (访问量)甲Page View中文翻评为页面测览，即页面浏览量或单击量，不管客户端是不是相同，也不管IP是不是相同，用户只要访问网站页面就会被计算PV，一次计一个PV.
PV的具体度量方法就是从客户浏览器发出一个对Web服务器的请求( Request)，Web服务器
接到这个请求后，将该请求对应的网页(Page)发送给浏览器，这样就产生了一个PV。这里有一
个问题，就是只要这个请求发送给了浏览器，无论这个页面是否完全打开(或下载完成)，都会被
计数(1次为1个PV)，一-般为了防止用户快速刷PV,很多网站会把PV的统计程序放在页面的最
下面。
用PV衡量网站时，PV数反映的是浏览某网站的页面数量，每刷新一次页面也算一次。因此，
可以说PV数与来访用户的数量成正比，但PV数并不是真正的页面来访者数量，而是网站被访问
的页面数量，因为一个来访者可能产生多个PV。
PV (Page View)是网站被访间的页面数量的一个指标，但不能直接知道有多少人访问了这个
网站。
一个来访者访问网站。可能产生若干pv数但是独立IP数就只有1个.因此，如果对比-
个网站的独立IP数和PV数，不难看出，PV数一定会大于等于独立IP数，其比例视网站的业务
而定，对于分类门户，可能会达到10:1,甚至更多。
1.4.3 UV
UV(独文坊客)即Unique Visitor,. 同一个客户端(PC或移动端)访问网站被计为一一个访客。一天( 00:00-24:00)内相同的客户端访问同一个网站只计一次UV，UV一般是以客户端Cookie等技术作为统计依据的，实际统计会有误差。考虑到一台客户端计算机可能会有多人使用，因此UV (独立访客)实际上并不一定是独立的自然人访问。
1.4.4企业网站对IP、PV、UV的度量
1、对IP的度量
(1)分析所有Web服务器的访问日志信息，对IP地址段去重后计数，这是IT人员的基本计算手段。
(2)在网站的每一个(所有)页面结尾，嵌入JS等统计程序代码，待用户加载网页后，IP即传给统计IP的服务器，这种方法一般被第三方统计公司或在企业内部开发日志分析程序时使用。
(3)用第三方大家比较信任的统计工具，例如:谷歌的统计(GA)。
IP的统计方法简单、易用。因此，成了多数网站衡量网站流量的重要具指标之一。
2、对PV的度量
(1)分析Web服务的访问日志(需要排除JS. CSS及各种图片的日志信息),只计算HTML, PHIP等页面数量
(2)在网站的每一个页面结尾,嵌入JS等统计程序代码,待用户加载网页后,访问数量即传给统计PV的服务器,这种方法一般被第三方统计公司或在企业内部开发日志分析程序时使用
(3)用第三方大家比较信任的统计工具,例如:谷歌的统计(GA).
PV的统计方法也很简单、易用,因此也是多数网站衡量网站流量的重要指标之一。
2.对UV的度量
(1)通过客户端HTTP请求报文分析。
一个客户端会多次请求网站服务器,每次HTTP请求都会携带客户端自身的大量信息,比如:IP地址、请求发出的时间、浏览器版本、操作系统版本等。网站服务器对这些请求进行分析如果这些请求满足一些共同特征,比如来自同一个IP地址,且浏览器版本和操作系统版本相同,请求时间又相近等,那么就可以认为这些请求是来自于同一个客户端,那么多个页面访问也只算一个UV。共同特征的定义是由服务器方决定的。通常,用IP地址+其他特征共同来定义的情况较多。但此种度量方法无法解决以下问题,例如:多个人的计算机软硬件雷同,并且是一个公司或学校的人;多个人共用一个计算机等情况。
(2)通过Cookie鉴别。
当客户端第一次访问某个网站服务器时,网站服务器会给这个客户端的计算机发出一个Cookie,通常放在这个客户端计算机的C盘当中。在这个Cookie中会分配一个独一无二的编号,这其中会记录一些访问服务器的信息,如访问时间、访问了哪些页面等等。当你下次再访问这个服务器的时候,服务器就可以直接从你的计算机中找到上一次放进去的Cookie文件,并且对其进行一些更新,但那个独一无二的编号是不会变的。如果在定时间内,服务器发现2个来访者对应的是同一个编号,那么自然可以认为它来源于同一个来访者,于是就计算1个UV.
使用Cookic的方法要比分析客户端HTTP请求头部信息更精确些。但也存在一些问题,比如:有的客户端为保证更高级别的安全,关闭了Cookie的功能;或者是有些客户端设置了在退出页面时自动删除Cookie,或你经常自己去手动删除Cookie,那么这个方法就不那么精确了。
因此,以上两个方法都只能得到近似的UV,而不是绝对精确的。
UV的度量相对IP和PV来说,不但麻烦,而且要开发比较复杂的程序系统才能得到期望的结果,因此,在Linux运维领域大家提及得较少,一般企业市场及运营人员可能会更多关注网站的UV。
1.4.5 IP, PV、UV的区别
一个网站的独立IP数量要比网站实际访问的PV数量小得多。通常情况下(国内互联网环境下),网站的UV数也会大于独立IP数。PV数高说明访问的页面数多,但是不一定就代表来访者多;但PV数一定与来访者的数量成正比,不过, PV并不直接决定页面的真实来访者数量。比如在访问某网站时,一个人也可通过不断地刷新页面,制造出非常高的PV数。PV数多,用户访问网站页面的总数量多,通常服务器的压力会大一些
1.4.6并发连接

Request Per Second + Simul taneous Browser connection + Thinking Time = Concurrent User
Request Per Second:表示每秒的请求数RPS (吞吐量)
Simultaneous Browser connection:表示并发浏览连接数。SBC
Thinking Time:表示平均用户的思考时间
Concurrent User:表示网站并发用户总数

1.4.7其他服务并发连接

(1) QPS (Query Per Second,每秒查询率)
每秒查询率aPS是用于衡量一个特定的查询服务器在规定时间内所处理流量多少的标准。运维工作中, DNS系统及数据库等服务的查询性能经常用每秒查询率来衡量。
(2) IOPS (Input/Output Operations Per Second)
IOPS即每秒进行读与写(/)操作的次数,多用于数据库等场合,衡量随机访问的性能。存储端的TOPS性能和主机端的1/0是不同的, IOPS是指存储每秒可接受多少次主机发出的访问,主机的一次1/0需要多次访问存储才可以完成。例如,主机写入一个最小的数据块,也要经过“发送写入请求、写入数据、收到写入确认”

你可能感兴趣的:(安全,笔记,协议,http,web,协议)

10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
Git常用命令－修改远程仓库地址猿大师 Linux Java git java
查看远程仓库地址gitremote-v返回结果originhttps://git.coding.net/＊＊＊＊＊.git(fetch)originhttps://git.coding.net/＊＊＊＊＊.git(push)修改远程仓库地址gitremoteset-urloriginhttps://git.coding.net/＊＊＊＊＊.git先删除后增加远程仓库地址gitremotermori
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
webpack图片等资源的处理 dmengmeng
需要的loaderfile-loader（让我们可以引入这些资源文件）url-loader（其实是file-loader的二次封装）img-loader（处理图片所需要的）在没有使用任何处理图片的loader之前，比如说css中用到了背景图片，那么最后打包会报错的，因为他没办法处理图片。其实你只想能够使用图片的话。只加一个file-loader就可以，打开网页能准确看到图片。{test:/\.(p
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc