Yahoo!
的
Exceptional Performance
团队为改善
Web
性能带来最佳实践。他们为此进行了一系列的实验、开发了各种工具、写了大量的文章和博客并在各种会议上参与探讨。最佳实践的核心就是旨在提高网站性能。
Excetional Performance
团队总结出了一系列可以提高网站速度的方法。可以分为
7
大类
34
条。包括内容、服务器、
cookie
、
CSS
、
JavaScript
、图片、移动应用等七部分。
其中内容部分一共十条建议:
一、内容部分
尽量减少
HTTP
请求
减少
DNS
查找
避免跳转
缓存
Ajxa
推迟加载
提前加载
减少
DOM
元素数量
用域名划分页面内容
使
frame
数量最少
避免
404
错误
1
、尽量减少
HTTP
请求次数
终端用户响应的时间中,有
80%
用于下载各项内容。这部分时间包括下载页面中的图像、样式表、脚本、
Flash
等。通过减少页面中的元素可以减少
HTTP
请求的次数。这是提高网页速度的关键步骤。
减少页面组件的方法其实就是简化页面设计。那么有没有一种方法既能保持页面内容的丰富性又能达到加快响应时间的目的呢?这里有几条减少
HTTP
请求次数同时又可能保持页面内容丰富的技术。
合并文件是通过把所有的脚本放到一个文件中来减少
HTTP
请求的方法,如可以简单地把所有的
CSS
文件都放入一个样式表中。当脚本或者样式表在不同页面中使用时需要做不同的修改,这可能会相对麻烦点,但即便如此也要把这个方法作为改善页面性能的重要一步。
CSS Sprites
是减少图像请求的有效方法。把所有的背景图像都放到一个图片文件中,然后通过
CSS
的
background-image
和
background-position
属性来显示图片的不同部分;
图片地图是把多张图片整合到一张图片中。虽然文件的总体大小不会改变,但是可以减少
HTTP
请求次数。图片地图只有在图片的所有组成部分在页面中是紧挨在一起的时候才能使用,如导航栏。确定图片的坐标和可能会比较繁琐且容易出错,同时使用图片地图导航也不具有可读性,因此不推荐这种方法;
内联图像是使用
data:URL scheme
的方法把图像数据加载页面中。这可能会增加页面的大小。把内联图像放到样式表(可缓存)中可以减少
HTTP
请求同时又避免增加页面文件的大小。但是内联图像现在还没有得到主流浏览器的支持。
减少页面的
HTTP
请求次数是你首先要做的一步。这是改进首次访问用户等待时间的最重要的方法。如同
Tenni Theurer
的他的博客
Browser Cahe Usage - Exposed!
中所说,
HTTP
请求在无缓存情况下占去了
40%
到
60%
的响应时间。让那些初次访问你网站的人获得更加快速的体验吧!
2
、减少
DNS
查找次数
域名系统(
DNS
)提供了域名和
IP
的对应关系,就像电话本中人名和他们的电话号码的关系一样。当你在浏览器地址栏中输入
[url]www.dudo.org[/url]
时,
DNS
解析服务器就会返回这个域名对应的
IP
地址。
DNS
解析的过程同样也是需要时间的。一般情况下返回给定域名对应的
IP
地址会花费
20
到
120
毫秒的时间。而且在这个过程中浏览器什么都不会做直到
DNS
查找完毕。
缓存
DNS
查找可以改善页面性能。这种缓存需要一个特定的缓存服务器,这种服务器一般属于用户的
ISP
提供商或者本地局域网控制,但是它同样会在用户使用的计算机上产生缓存。
DNS
信息会保留在操作系统的
DNS
缓存中(微软
Windows
系统中
DNS Client Service
)。大多数浏览器有独立于操作系统以外的自己的缓存。由于浏览器有自己的缓存记录,因此在一次请求中它不会受到操作系统的影响。
Internet Explorer
默认情况下对
DNS
查找记录的缓存时间为
30
分钟,它在注册表中的键值为
DnsCacheTimeout
。
Firefox
对
DNS
的查找记录缓存时间为
1
分钟,它在配置文件中的选项为
network.dnsCacheExpiration
(
Fasterfox
把这个选项改为了
1
小时)。
当客户端中的
DNS
缓存都为空时(浏览器和操作系统都为空),
DNS
查找的次数和页面中主机名的数量相同。这其中包括页面中
URL
、图片、脚本文件、样式表、
Flash
对象等包含的主机名。减少主机名的数量可以减少
DNS
查找次数。
减少主机名的数量还可以减少页面中并行下载的数量。减少
DNS
查找次数可以节省响应时间,但是减少并行下载却会增加响应时间。我的指导原则是把这些页面中的内容分割成至少两部分但不超过四部分。这种结果就是在减少
DNS
查找次数和保持较高程度并行下载两者之间的权衡了。
3
、避免跳转
跳转是使用
301
和
302
代码实现的。下面是一个响应代码为
301
的
HTTP
头:
HTTP/1.1 301 Moved Permanently
Location: [url]http://example.com/newuri[/url]
Content-Type: text/html
浏览器会把用户指向到
Location
中指定的
URL
。头文件中的所有信息在一次跳转中都是必需的,内容部分可以为空。不管他们的名称,
301
和
302
响应都不会被缓存除非增加一个额外的头选项,如
Expires
或者
Cache-Control
来指定它缓存。
<meat />
元素的刷新标签和
JavaScript
也可以实现
URL
的跳转,但是如果你必须要跳转的时候,最好的方法就是使用标准的
3XXHTTP
状态代码,这主要是为了确保“后退”按钮可以正确地使用。
但是要记住跳转会降低用户体验。在用户和
HTML
文档中间增加一个跳转,会拖延页面中所有元素的显示,因为在
HTML
文件被加载前任何文件(图像、
Flash
等)都不会被下载。
有一种经常被网页开发者忽略却往往十分浪费响应时间的跳转现象。这种现象发生在当
URL
本该有斜杠(
/
)却被忽略掉时。例如,当我们要访问
[url]http://astrology.yahoo.com/astrology[/url]
时,实际上返回的是一个包含
301
代码的跳转,它指向的是
[url]http://astrology.yahoo.com/astrology/[/url]
(注意末尾的斜杠)。在
Apache
服务器中可以使用
Alias
或者
mod_rewrite
或者
the DirectorySlash
来避免。
连接新网站和旧网站是跳转功能经常被用到的另一种情况。这种情况下往往要连接网站的不同内容然后根据用户的不同类型(如浏览器类型、用户账号所属类型)来进行跳转。使用跳转来实现两个网站的切换十分简单,需要的代码量也不多。尽管使用这种方法对于开发者来说可以降低复杂程度,但是它同样降低用户体验。一个可替代方法就是如果两者在同一台服务器上时使用
Alias
和
mod_rewrite
和实现。如果是因为域名的不同而采用跳转,那么可以通过使用
Alias
或者
mod_rewirte
建立
CNAME
(保存一个域名和另外一个域名之间关系的
DNS
记录)来替代。
4
、可缓存的
AJAX
Ajax
经常被提及的一个好处就是由于其从后台服务器传输信息的异步性而为用户带来的反馈的即时性。但是,使用
Ajax
并不能保证用户不会在等待异步的
JavaScript
和
XML
响应上花费时间。在很多应用中,用户是否需要等待响应取决于
Ajax
如何来使用。例如,在一个基于
Web
的
Email
客户端中,用户必须等待
Ajax
返回符合他们条件的邮件查询结果。记住一点,“异步”并不异味着“即时”,这很重要。
为了提高性能,优化
Ajax
响应是很重要的。提高
Ajxa
性能的措施中最重要的方法就是使响应具有可缓存性,具体的讨论可以查看
Add an Expires or a Cache-Control Header
。其它的几条规则也同样适用于
Ajax
:
Gizp
压缩文件
减少
DNS
查找次数
精简
JavaScript
避免跳转
配置
ETags
让我们来看一个例子:一个
Web2.0
的
Email
客户端会使用
Ajax
来自动完成对用户地址薄的下载。如果用户在上次使用过
Email web
应用程序后没有对地址薄作任何的修改,而且
Ajax
响应通过
Expire
或者
Cacke-Control
头来实现缓存,那么就可以直接从上一次的缓存中读取地址薄了。必须告知浏览器是使用缓存中的地址薄还是发送一个新的请求。这可以通过为读取地址薄的
Ajax URL
增加一个含有上次编辑时间的时间戳来实现,例如,
&t=11900241612
等。如果地址薄在上次下载后没有被编辑过,时间戳就不变,则从浏览器的缓存中加载从而减少了一次
HTTP
请求过程。如果用户修改过地址薄,时间戳就会用来确定新的
URL
和缓存响应并不匹配,浏览器就会重要请求更新地址薄。
即使你的
Ajxa
响应是动态生成的,哪怕它只适用于一个用户,那么它也应该被缓存起来。这样做可以使你的
Web2.0
应用程序更加快捷。
5
、推迟加载内容
你可以仔细看一下你的网页,问问自己“哪些内容是页面呈现时所必需首先加载的?哪些内容和结构可以稍后再加载?
把整个过程按照
onload
事件分隔成两部分,
JavaScript
是一个理想的选择。例如,如果你有用于实现拖放和动画的
JavaScript
,那么它就以等待稍后加载,因为页面上的拖放元素是在初始化呈现之后才发生的。其它的例如隐藏部分的内容(用户操作之后才显现的内容)和处于折叠部分的图像也可以推迟加载
工具可以节省你的工作量:
YUI Image Loader
可以帮你推迟加载折叠部分的图片,
YUI Get utility
是包含
JS
和
CSS
的便捷方法。比如你可以打开
Firebug
的
Net
选项卡看一下
Yahoo
的首页。
当性能目标和其它网站开发实践一致时就会相得益彰。这种情况下,通过程序提高网站性能的方法告诉我们,在支持
JavaScript
的情况下,可以先去除用户体验,不过这要保证你的网站在没有
JavaScript
也可以正常运行。在确定页面运行正常后,再加载脚本来实现如拖放和动画等更加花哨的效果。
6
、预加载
预加载和后加载看起来似乎恰恰相反,但实际上预加载是为了实现另外一种目标。预加载是在浏览器空闲时请求将来可能会用到的页面内容(如图像、样式表和脚本)。使用这种方法,当用户要访问下一个页面时,页面中的内容大部分已经加载到缓存中了,因此可以大大改善访问速度。
下面提供了几种预加载方法:
无条件加载:触发
onload
事件时,直接加载额外的页面内容。以
Google.com
为例,你可以看一下它的
spirit image
图像是怎样在
onload
中加载的。这个
spirit image
图像在
google.com
主页中是不需要的,但是却可以在搜索结果页面中用到它。
有条件加载:根据用户的操作来有根据地判断用户下面可能去往的页面并相应的预加载页面内容。在
search.yahoo.com
中你可以看到如何在你输入内容时加载额外的页面内容。
有预期的加载:载入重新设计过的页面时使用预加载。这种情况经常出现在页面经过重新设计后用户抱怨“新的页面看起来很酷,但是却比以前慢”。问题可能出在用户对于你的旧站点建立了完整的缓存,而对于新站点却没有任何缓存内容。因此你可以在访问新站之前就加载一部内容来避免这种结果的出现。在你的旧站中利用浏览器的空余时间加载新站中用到的图像的和脚本来提高访问速度。
7
、减少
DOM
元素数量
一个复杂的页面意味着需要下载更多数据,同时也意味着
JavaScript
遍历
DOM
的效率越慢。比如当你增加一个事件句柄时在
500
和
5000
个
DOM
元素中循环效果肯定是不一样的。
大量的
DOM
元素的存在意味着页面中有可以不用移除内容只需要替换元素标签就可以精简的部分。你在页面布局中使用表格了吗?你有没有仅仅为了布局而引入更多的
<div>
元素呢?也许会存在一个适合或者在语意是更贴切的标签可以供你使用。
YUI CSS utilities
可以给你的布局带来巨大帮助:
grids.css
可以帮你实现整体布局,
font.css
和
reset.css
可以帮助你移除浏览器默认格式。它提供了一个重新审视你页面中标签的机会,比如只有在语意上有意义时才使用
<div>
,而不是因为它具有换行效果才使用它。
DOM
元素数量很容易计算出来,只需要在
Firebug
的控制台内输入:
document.getElementsByTagName('*').length
那么多少个
DOM
元素算是多呢?这可以对照有很好标记使用的类似页面。比如
Yahoo!
主页是一个内容非常多的页面,但是它只使用了
700
个元素(
HTML
标签)。
8
、根据域名划分页面内容
把页面内容划分成若干部分可以使你最大限度地实现平行下载。由于
DNS
查找带来的影响你首先要确保你使用的域名数量在
2
个到
4
个之间。例如,你可以把用到的
HTML
内容和动态内容放在
[url]www.example.org[/url]
上,而把页面各种组件(图片、脚本、
CSS)
分别存放在
statics1.example.org
和
statics.example.org
上。
你可在
Tenni Theurer
和
Patty Chi
合写的文章
Maximizing Parallel Downloads in the Carpool Lane
找到更多相关信息。
9
、使
iframe
的数量最小
ifrmae
元素可以在父文档中插入一个新的
HTML
文档。了解
iframe
的工作理然后才能更加有效地使用它,这一点很重要。
<iframe>
优点:
解决加载缓慢的第三方内容如图标和广告等的加载问题
Security sandbox
并行加载脚本
<iframe>
的缺点:
即时内容为空,加载也需要时间
会阻止页面加载
没有语意
10
、不要出现
404
错误
HTTP
请求时间消耗是很大的,因此使用
HTTP
请求来获得一个没有用处的响应(例如
404
没有找到页面)是完全没有必要的,它只会降低用户体验而不会有一点好处。
有些站点把
404
错误响应页面改为“你是不是要找
***
”,这虽然改进了用户体验但是同样也会浪费服务器资源(如数据库等)。最糟糕的情况是指向外部
JavaScript
的链接出现问题并返回
404
代码。首先,这种加载会破坏并行加载;其次浏览器会把试图在返回的
404
响应内容中找到可能有用的部分当作
JavaScript
代码来执行。