2019-04-29day43

静态网页资源

1、什么是静态网页资源

放在服务器上看到的是什么,显示的就是什么、一旦存在于服务器上,就不会有任何改变。

静态网页特点:

(1)图片、附件、视频,前端页面语言,html,。js,。css,等

(2)客户端解析(效率更高),而不是在服务端解析。 #性能优化关键

(3)后端没有数据库。

(4)地址里没有特殊符号,例如&&、?等。

(5)网页发布一旦完成,就不会改变(除非人工修改)。

(6)存储地点,存储在NFS这样的服务器里(共享存储)。

(7)内容来源(核心:用户上传:图片和视频等;程序员开发的代码(.html .js .css))

静态网页组员的对应程序及资源文件的常用扩展名为:

(1)纯文本类程序或文件,如htm、html、xml、shtml、js、css等。。

(2)图片类文件或数据文档,如jpg、gif、png、bmp、txt、doc、ppt等。

(3)视屏类流媒体文件,如mp4、swf、avi、wmv、flv等

有关静态网页的架构思想:

在高并发、高访问量的场景下做架构优化,涉及的关键环节就是把动态网页转出静态网页,而不直接请求数据库和动态服务器,并且可以把静态内容推送到前段缓存(或CDN)中提供服务,这样就可以提升用户体验,节约服务器的维护成本。

二、动态网页

所谓的动态网页是与静态网页相对而言的,也就是说,动态网页的URL后缀不是.htm、.html、.shtml、.xml、.js、.css等静态网页的常见后缀扩展名形式,而是以.asp、.aspx、.php、.jsp、.do、.cgi等形式作为后缀的,并且一般在动态网页网址中会有标志性的符号——“?,&”,此外在大多数情况下后端都需要有数据库支持等。

[图片上传失败...(image-d66afd-1556614396140)]

特点:

(1)网页扩展名后缀常见为:.asp .aspx .php .jsp .do .cgi等。

(2)网页一般为数据库技术为基础,大大降低了网站维护的工作量(优点。)

(3)采用动态网页技术的网站可以实现更多的功能,如用户注册、用户登录、在线调查哦、投票、用户管理、订单管理、发博文、发微信等等。

(4)动态网页并不是独立存在于服务器上的网页文件,当用户请求服务器上的动态程序时,服务器解析这些程序并可能读取数据库返回一个完整的网页内容。

(5)动态网页中的“?”的搜索引擎的收录方面存在一定的问题,搜索引擎一般不会从一个网站的数据库中访问全部网页或者处于技术等方面的考虑,搜索蜘蛛乙肝不会去抓取网址中“?”后面的内容,因此在企业通过搜索引擎进行推广时,需要针对采用动态页面的网站做一定的技术处理(伪静态技术),以便适应搜索引擎的抓取要求。

(6)程序在服务器端解析,这相当于顾客点餐,单点厨师做饭做菜,耗时长,效率低。由于程序在服务端解析,因此,会消耗大量的CPU和内存、I/O等资源,并且多数还要读取数据库等服务,因此,其访问效率远不如静态页面,在服务端解析动态程序的服务常见的有PHP引擎、Java容器(tomcat、resin、jboss、weblogic)。Python软件。

静态效率高

动态消耗资源大

三、伪静态

伪静态就是通过某些技术(如rewrite)把动态网页的URL地址伪装成静态网页URL地址,但实质上用户访问的是动态网页,只不过给用户看起来URL地址是符合

伪静态的缺点:

动态网页伪装静态网页,虽然可以让搜索引擎收录,并且可提升用户访问体验,但伪静态王亚伟并不能提升网站的访问效率性能,从理论上说还会降低网站的性能,没有动态转静态网页效率高,但是对于一些并发不是超大的情况来说,或者是硬件资源充足的情况来说,伪静态还是一个不错的实用功能,

(1) 伪静态网页小结利用rewrite技术将动态网页伪装成静态网页(URL地址改写。)

(2) 便于搜索引擎搜索提升用户访问量以及用户体验。

(3) 访问性能没有提升,冰球转换伪静态会消耗资源,因此性能反而会下降。

(4) 如果为了性能,就尽可能将动态网页转换成真正的静态页面。

(5) 并发量不是很大或者动态更新过于频繁的时候,用rewrite实现伪静态也是不错的。

(6) 伪静态网页的实现过程,一般是由运营产品提出需求,开发和运维共同实现的。

优化:

门户新闻业务:

新闻网站的特点是一旦发布完成,几乎不再改动网页内容。因此,对于新闻业务内容的静态化对比比较简单。

第一步:程序要支持发布动态内容转出静态功能。

第二步:运营编辑人员发布新闻网页(内容进数据库,图片、视频进入存储)后,后台程序立刻将动态网页生产静态文件(生产.html文件放到存储上)。

第三步:运维人员通过发布或事件触发把运营编辑生成的静态网页发布到事先搭建好的公司缓存集群服务器上,或者把静态内容同步到购买的全国所有CDN服务器节点上,然后,在提供给用户提供访问浏览。

2、视频网站业务

视频网站和新闻网站类似,特点都是一旦发布完成,几乎不会再改动网页内容。因此实现视频业务网站高效访问也很简单。

以优酷网站为例,用户在上传视频时,需要经历转码===>审核的通过(大概1个小时),然后一些热点视频也可能会被提前推送同步到CDN的核心节点或全国所有CDN服务器节点,用户访问时才会更快。

(1)凡是发布后不需要再改的网站业务,都可以直接静态化(1台顶10台动态)。

或者需要改也行,但是由公司内部人员也可以直接静态。

(2)用户上传修改(内容),然后对访问实时要求高。静态化最难的。

2.1让发布人能够实时看到,直接访问动态(查数据库和存储)。

2.2 让其他人浏览静态。

动态转静态实时:


image.png

四:网站度量
IP(Internet Protocol):一个带有公司IP的电脑访问
IP(独立IP)即Internet
Protocol,这里指独立IP数,独立IP数是指不同IP地址的计算机访问网站时被计算机的总次数。独立IP数是衡量网站流量的一个重要指标。一般一天内(00:00-24:00)相同IP地址的客户端访问网站页面只被计算为一次,记录独立IP的时间可为一天或一个月,目前通用的标准为“一天”。

PV:一个页面浏览,页面浏览量或点击量

UV:(独立访客)即Unique Visitor,通一台客户端(PC或移动端)访问网站被计算为一个访客。一天(00:00-24:00)内相同的客户端访问同一个网站只计算一次UV。UV一般是以客户端Cookie等技术作为统计依据的,实际统计会有误差。
考虑到一台客户端电脑可能会有多人使用的情况,因此,UV(独立访客)实际上并不一定是独立的自然人访问。

网站流量统计工具软件
PWIKI awstart ELK收集日志。
在线统计流量工具。

网站并发连接:
在面试过程中Linux运维人员经常会被问道:你的公司网站最大并发是多少?
那么到底什么是并发?怎么理解并发呢?
A种理解:网站服务器每秒能够接收的最大用户请求数。
B种理解:网站服务器每秒能够响应的最大用户请求数。
C种理解:网站服务器在单位时间内能够处理的最大链接数。

工作中统计并发:统计并发数的基本方法
1、 统计当下时刻的Linux的网络连接数并发,netstat –an|grep –I “est”| wc –l
2、 nginx web层activ status

每秒网站可以最大出力的连接数,叫做并发连接数。

IP/PV/并发/台数:1w/5-10w/50/0.5
30-100W 150-1000PV 1500-5000并发 15-50
期中机构15台,IP 10-30万 50-200万PV 最大并发1500-2000

Web服务软件:
1、静态软件:Nginx(Tengine)、Apache、Lighttpd
2、动态软件:PHP程序(PHP引擎)、JAVA程序(tomcat/resin/jboss/weblogic)\Python程序(Python)

我们主讲:
Nginx、PHP、TOMCAT(Tomcat)
PYTHON环境自学

CDN

  1. 内存访问
  2. 就近访问
  3. 相同的运营商(用户网通,访问网通服务器)

你可能感兴趣的:(2019-04-29day43)