Yahoo!团队实践分享:网站性能优化的34条黄金守则(一) 内容
Yahoo!的 Exceptional Performance 团队为改善 Web 性能带来最佳实践。他们为此进行了
一系列的实验、开发了各种工具、写了大量的文章和博客并在各种会议上参与探讨。最佳实
践的核心就是旨在提高网站性能。
Excetional Performance 团队总结出了一系列可以提高网站速度的方法。可以分为7
大类34条。包括内容、服务器、 cookie、 CSS、 JavaScript、图片、移动应用等七部分。
其中内容部分一共十条建议:
一、 内容部分
• 尽量减少 HTTP 请求
• 减少 DNS 查找
• 避免跳转
• 缓存 Ajxa
• 推迟加载
• 提前加载
• 减少 DOM 元素数量
• 用域名划分页面内容
• 使 frame 数量最少
• 避免404错误
1、尽量减少 HTTP 请求次数
终端用户响应的时间中,有80%用于下载各项内容。这部分时间包括下载页面中的图
像、样式表、脚本、 Flash 等。通过减少页面中的元素可以减少 HTTP 请求的次数。这是提
高网页速度的关键步骤。
减少页面组件的方法其实就是简化页面设计。那么有没有一种方法既能保持页面内容
的丰富性又能达到加快响应时间的目的呢?这里有几条减少 HTTP 请求次数同时又可能保
持页面内容丰富的技术。
合并文件是通过把所有的脚本放到一个文件中来减少 HTTP 请求的方法,如可以简单地把
所有的 CSS 文件都放入一个样式表中。当脚本或者样式表在不同页面中使用时需要做不同
的修改,这可能会相对麻烦点,但即便如此也要把这个方法作为改善页面性能的重要一步。
CSS Sprites 是减少图像请求的有效方法。把所有的背景图像都放到一个图片文件中,然后
通过 CSS 的 background-image 和 background-position 属性来显示图片的不同部分;
图片地图是把多张图片整合到一张图片中。虽然文件的总体大小不会改变,但是可以减少
HTTP 请求次数。图片地图只有在图片的所有组成部分在页面中是紧挨在一起的时候才能使
用,如导航栏。确定图片的坐标和可能会比较繁琐且容易出错,同时使用图片地图导航也不
具有可读性,因此不推荐这种方法;
内联图像是使用 data:URL scheme 的方法把图像数据加载页面中。这可能会增加页面的大
小。把内联图像放到样式表(可缓存)中可以减少 HTTP 请求同时又避免增加页面文件的
大小。但是内联图像现在还没有得到主流浏览器的支持。
减少页面的 HTTP 请求次数是你首先要做的一步。这是改进首次访问用户等待时间的
最重要的方法。如同 Tenni Theurer 的他的博客 Browser Cahe Usage - Exposed!中所说,
HTTP 请求在无缓存情况下占去了40%到60%的响应时间。让那些初次访问你网站的人获得
更加快速的体验吧!
2、减少 DNS 查找次数
域名系统( DNS)提供了域名和 IP 的对应关系,就像电话本中人名和他们的电话
号码的关系一样。当你在浏览器地址栏中输入 www.dudo.org 时, DNS 解析服务器就会返
回这个域名对应的 IP 地址。 DNS 解析的过程同样也是需要时间的。一般情况下返回给定域
名对应的 IP 地址会花费20到120毫秒的时间。而且在这个过程中浏览器什么都不会做直到
DNS 查找完毕。
缓存 DNS 查找可以改善页面性能。这种缓存需要一个特定的缓存服务器,这种服
务器一般属于用户的 ISP 提供商或者本地局域网控制,但是它同样会在用户使用的计算机
上产生缓存。DNS 信息会保留在操作系统的 DNS 缓存中 (微软 Windows 系统中 DNS Client
Service)。 大多数浏览器有独立于操作系统以外的自己的缓存。由于浏览器有自己的缓存记
录,因此在一次请求中它不会受到操作系统的影响。
Internet Explorer 默认情况下对 DNS 查找记录的缓存时间为30分钟,它在注册表中
的键值为 DnsCacheTimeout。 Firefox 对 DNS 的查找记录缓存时间为1分钟,它在配置文件
中的选项为 network.dnsCacheExpiration( Fasterfox 把这个选项改为了1小时)。
当客户端中的 DNS 缓存都为空时(浏览器和操作系统都为空), DNS 查找的次数和
页面中主机名的数量相同。这其中包括页面中 URL、图片、脚本文件、样式表、 Flash 对象
等包含的主机名。减少主机名的数量可以减少 DNS 查找次数。
减少主机名的数量还可以减少页面中并行下载的数量。减少 DNS 查找次数可以节省
响应时间,但是减少并行下载却会增加响应时间。我的指导原则是把这些页面中的内容分割
成至少两部分但不超过四部分。这种结果就是在减少 DNS 查找次数和保持较高程度并行下
载两者之间的权衡了。
3、避免跳转
跳转是使用301和302代码实现的。下面是一个响应代码为301的 HTTP 头:
HTTP/1.1 301 Moved Permanently
Location: http://example.com/newuri
Content-Type: text/html
浏览器会把用户指向到 Location 中指定的 URL。头文件中的所有信息在一次跳转中
都是必需的,内容部分可以为空。不管他们的名称, 301和302响应都不会被缓存除非增加
一个额外的头选项,如 Expires 或者 Cache-Control 来指定它缓存。 <meat />元素的刷新标
签和 JavaScript 也可以实现 URL 的跳转,但是如果你必须要跳转的时候,最好的方法就是
使用标准的3XXHTTP 状态代码,这主要是为了确保“后退”按钮可以正确地使用。
但是要记住跳转会降低用户体验。在用户和 HTML 文档中间增加一个跳转,会拖延
页面中所有元素的显示,因为在 HTML 文件被加载前任何文件(图像、 Flash 等)都不会被
下载。
有一种经常被网页开发者忽略却往往十分浪费响应时间的跳转现象。这种现象发生在
当 URL 本 该 有 斜 杠 ( / ) 却 被 忽 略 掉 时 。 例 如 , 当 我 们 要 访 问
http://astrology.yahoo.com/astrology 时,实际上返回的是一个包含301代码的跳转,它指
向的是 http://astrology.yahoo.com/astrology/ (注意末尾的斜杠)。 在 Apache 服务器中可
以使用 Alias 或者 mod_rewrite 或者 the DirectorySlash 来避免。
连接新网站和旧网站是跳转功能经常被用到的另一种情况。这种情况下往往要连接网
站的不同内容然后根据用户的不同类型(如浏览器类型、用户账号所属类型)来进行跳转。
使用跳转来实现两个网站的切换十分简单,需要的代码量也不多。尽管使用这种方法对于开
发者来说可以降低复杂程度,但是它同样降低用户体验。一个可替代方法就是如果两者在同
一台服务器上时使用 Alias 和 mod_rewrite 和实现。如果是因为域名的不同而采用跳转,那
么可以通过使用 Alias 或者 mod_rewirte 建立 CNAME(保存一个域名和另外一个域名之间
关系的 DNS 记录)来替代。
4、可缓存的 AJAX
Ajax 经常被提及的一个好处就是由于其从后台服务器传输信息的异步性而为用户带
来的反馈的即时性。但是,使用 Ajax 并不能保证用户不会在等待异步的 JavaScript 和 XML
响应上花费时间。在很多应用中,用户是否需要等待响应取决于 Ajax 如何来使用。例如,
在一个基于 Web 的 Email 客户端中,用户必须等待 Ajax 返回符合他们条件的邮件查询结果。
记住一点, “异步”并不异味着“即时”,这很重要。
为了提高性能,优化 Ajax 响应是很重要的。提高 Ajxa 性能的措施中最重要的方法就
是使响应具有可缓存性,具体的讨论可以查看 Add an Expires or a Cache-Control Header。
其它的几条规则也同样适用于 Ajax:
Gizp 压缩文件
减少 DNS 查找次数
精简 JavaScript
避免跳转
配置 ETags
让我们来看一个例子:一个 Web2.0的 Email 客户端会使用 Ajax 来自动完成对用户地
址薄的下载。如果用户在上次使用过 Email web 应用程序后没有对地址薄作任何的修改,
而且 Ajax 响应通过 Expire 或者 Cacke-Control 头来实现缓存,那么就可以直接从上一次的
缓存中读取地址薄了。必须告知浏览器是使用缓存中的地址薄还是发送一个新的请求。这可
以通过为读取地址薄的 Ajax URL 增加一个含有上次编辑时间的时间戳来实现,例如,
&t=11900241612等。如果地址薄在上次下载后没有被编辑过,时间戳就不变,则从浏览器
的缓存中加载从而减少了一次 HTTP 请求过程。如果用户修改过地址薄,时间戳就会用来
确定新的 URL 和缓存响应并不匹配,浏览器就会重要请求更新地址薄。
即使你的 Ajxa 响应是动态生成的,哪怕它只适用于一个用户,那么它也应该被缓
存起来。这样做可以使你的 Web2.0应用程序更加快捷。
5、推迟加载内容
你可以仔细看一下你的网页,问问自己“哪些内容是页面呈现时所必需首先加载
的?哪些内容和结构可以稍后再加载?
把整个过程按照 onload 事件分隔成两部分, JavaScript 是一个理想的选择。例如,
如果你有用于实现拖放和动画的 JavaScript,那么它就以等待稍后加载,因为页面上的拖放
元素是在初始化呈现之后才发生的。其它的例如隐藏部分的内容(用户操作之后才显现的内
容)和处于折叠部分的图像也可以推迟加载
工具可以节省你的工作量: YUI Image Loader 可以帮你推迟加载折叠部分的图片,
YUI Get utility 是包含 JS 和 CSS 的便捷方法。比如你可以打开 Firebug 的 Net 选项卡看一
下 Yahoo 的首页。
当性能目标和其它网站开发实践一致时就会相得益彰。这种情况下,通过程序提高
网站性能的方法告诉我们,在支持 JavaScript 的情况下,可以先去除用户体验,不过这要
保证你的网站在没有 JavaScript 也可以正常运行。在确定页面运行正常后,再加载脚本来
实现如拖放和动画等更加花哨的效果。
6、预加载
预加载和后加载看起来似乎恰恰相反,但实际上预加载是为了实现另外一种目标。
预加载是在浏览器空闲时请求将来可能会用到的页面内容(如图像、样式表和脚本)。 使用
这种方法,当用户要访问下一个页面时,页面中的内容大部分已经加载到缓存中了,因此可
以大大改善访问速度。
下面提供了几种预加载方法:
无条件加载:触发 onload 事件时,直接加载额外的页面内容。以 Google.com 为例,你可
以看一下它的 spirit image 图像是怎样在 onload 中加载的。这个 spirit image 图像在
google.com 主页中是不需要的,但是却可以在搜索结果页面中用到它。
有条件加载:根据用户的操作来有根据地判断用户下面可能去往的页面并相应的预加载页面
内容。在 search.yahoo.com 中你可以看到如何在你输入内容时加载额外的页面内容。
有预期的加载:载入重新设计过的页面时使用预加载。这种情况经常出现在页面经过重新设
计后用户抱怨“新的页面看起来很酷,但是却比以前慢”。问题可能出在用户对于你的旧站点
建立了完整的缓存,而对于新站点却没有任何缓存内容。因此你可以在访问新站之前就加载
一部内容来避免这种结果的出现。在你的旧站中利用浏览器的空余时间加载新站中用到的图
像的和脚本来提高访问速度。
7、减少 DOM 元素数量
一个复杂的页面意味着需要下载更多数据,同时也意味着 JavaScript 遍历 DOM 的
效率越慢。比如当你增加一个事件句柄时在500和5000个 DOM 元素中循环效果肯定是不一
样的。
大量的 DOM 元素的存在意味着页面中有可以不用移除内容只需要替换元素标签就
可以精简的部分。你在页面布局中使用表格了吗?你有没有仅仅为了布局而引入更多的
<div>元素呢?也许会存在一个适合或者在语意是更贴切的标签可以供你使用。
YUI CSS utilities可以给你的布局带来巨大帮助:grids.css可以帮你实现整体布局,
font.css 和 reset.css 可以帮助你移除浏览器默认格式。它提供了一个重新审视你页面中标
签的机会,比如只有在语意上有意义时才使用<div>,而不是因为它具有换行效果才使用它。
DOM 元素数量很容易计算出来,只需要在 Firebug 的控制台内输入:
document.getElementsByTagName('*').length
那么多少个 DOM 元素算是多呢?这可以对照有很好标记使用的类似页面。比如
Yahoo!主页是一个内容非常多的页面,但是它只使用了700个元素( HTML 标签)。
8、根据域名划分页面内容
把页面内容划分成若干部分可以使你最大限度地实现平行下载。由于 DNS 查找带来
的影响你首先要确保你使用的域名数量在2个到4个之间。例如,你可以把用到的 HTML 内
容和动态内容放在 www.example.org 上,而把页面各种组件(图片、脚本、 CSS)分别存放
在 statics1.example.org 和 statics.example.org 上。
你可在 Tenni Theurer 和 Patty Chi 合写的文章 Maximizing Parallel Downloads in the
Carpool Lane 找到更多相关信息。
9、使 iframe 的数量最小
ifrmae 元素可以在父文档中插入一个新的 HTML 文档。了解 iframe 的工作理然后才
能更加有效地使用它,这一点很重要。
<iframe>优点:
• 解决加载缓慢的第三方内容如图标和广告等的加载问题
• Security sandbox
• 并行加载脚本
<iframe>的缺点:
• 即时内容为空,加载也需要时间
• 会阻止页面加载
• 没有语意
10、 不要出现404错误
HTTP 请求时间消耗是很大的,因此使用 HTTP 请求来获得一个没有用处的响应(例
如404没有找到页面)是完全没有必要的,它只会降低用户体验而不会有一点好处。
有些站点把404错误响应页面改为“你是不是要找***”,这虽然改进了用户体验但是同
样也会浪费服务器资源(如数据库等)。 最糟糕的情况是指向外部 JavaScript 的链接出现问
题并返回404代码。首先,这种加载会破坏并行加载;其次浏览器会把试图在返回的404响
应内容中找到可能有用的部分当作 JavaScript 代码来执行。
Yahoo!团队实践分享:网站性能优化的34条黄金守则(二) 服务器
除了在网站在内容上的改进外,在网站服务器端上也有需要注意和改进的地方,它们包括:
• 使用内容分发网络