网站代码优6化--清理、精减垃圾代码

  清理垃*圾代*码是指删除页*面中的多余代*码。一个页*面经过垃*圾代*码清理后,可以删除接近80%的多余代*码。然而,什么样的代*码才是垃*圾代*码呢?

  1.垃*圾代*码

  垃*圾代*码就是指删除后不会影响页*面正常显示的非必要的代*码。这些代*码占据着庞大的空间,不但消耗用*户下*载页*面的时间,还占用搜索*引擎巨大的存储空间,增加搜索*引擎分析数据的时间。然而,这么庞大的垃*圾代*码是如何产生的呢?

  2.垃*圾代*码的产生

  一般情况下,我们会使用网页制作软*件制作网页,如FrontPage、Word及Dreamweaver。这些网页制作软*件在制作网页的时候,会生成相应的HTML代*码,其中大部分是必要的,而有一小部分则是可有可无的,这就是所谓的垃*圾代*码。因此,避免产生垃*圾代*码最好的办法就是以手工编写代*码的方式制作网页。

  即使是同样内容的网页,使用不同的网页制作软*件进行制作,所产生的代*码也会存在很大的区别。在没有掌握手工编写代*码前,可以使用Dreamweaver制作网页,完成后再清理其中的垃*圾代*码。

  3.垃*圾代*码的清理

  〇空格

  空格字符是网页中最常见的垃*圾代*码。但此处讨论的空格字符并非HTML语言中的“ ”标签,而是指在代*码编辑环境下敲击键盘上的空格键所产生的符号。网页中每个空格都相当于一个字符,因此,空格字符也会占用巨大的空间。初步同济,空格字符约占用页*面总体积的1.5%。也就是说,一个100KB的页*面中,其中1.5KB是空格字符。本文由长春鑫通桥架http://www.ccxtqj.com推荐分享。

  空格字符通常会出现在每行代*码的开始和结束处,还有就是空行中。

  (1)每行代*码开始前的空格字符:是网页制作软*件生成代*码时,默认产生的缩进字符。

  (2)每行代*码结束处的空格字符:是编辑HTML代*码时,不小心加上的。只要我们在每行代*码的结束位置向右移动光标,如果光标不换行,则说明该页*面还存在空格字符。

  (3)空白行:在编写代*码时,常利用空行或者注释对不同功能模块进行分隔,这样就产生了空白行。

  对于页*面中不同位置上的空格字符,清理的方式也有所不同,下面介绍几种常用的空格字符清理方法。

  每行代*码开始前的空格字符

  对于每行代*码开始钱的空格字符,可以使用Dreamweaver或者EditPlus等软*件进行清理。具体操作步骤如下:

  (1)转至HTML代*码编辑模式(如果是Dreamweaver);

  (2)按Ctrl+A选择全部代*码;

  (3)使用组合键Shift+Tab,直至删除所有空格为止。

  如下图的代*码1是清理空格前的效果,而代*码2则是清理空格字符后的效果。

网站代码优6化--清理、精减垃圾代码_第1张图片

    对于空行中空格字符的清理,只能手工逐行去掉。

  (1)首先,使用鼠标选择空行;

  (2)再按Delete键,即可删除空行。

  每行代*码结尾处的空格字符对于每行代*码介绍处的空格字符,我们可以使用Editplus或者其他文笔编辑软*件的替换功能进行清理:

  (1)用鼠标选择“>”+“一个空格字符”,即“>”;

  (2)再按Ctrl+F,就会弹出一个窗口;

  (3)“替换”处填上“>”,再点击“全部替换”即可。

  页*面经过清理空格字符后,大概可以删除70%左右的垃*圾代*码。也就是说,空格字符的代*码量大概占总垃*圾代*码的70%,还有30%左右的垃*圾代*码分布在默认属性、注释语句及空语句中。

  〇默认属性

  在利用网页制作软*件制作网页时,通常会产生一些默认属性的代*码。例如,我们在HTML代*码中不添加左对齐属性,页*面中的内容也是以左对齐的方式显示的,所以代*码中的左对齐属性是可以删除的。

  在页*面中,还有很多其他属性都是默认属性,以下是比较常见的。

  (1)align=“left”:横向居左对齐属性值,默认情况下文章或者图片都是横向居左对齐的。

  (2)valign=“middle”:竖向居中对齐属性值,默认情况下文章或者图片都是竖向居中对齐的。

  (3)size=“3”:文字大小属性值,默认情况下是3号字体。

  (4)target=”_self“:新页*面打开属性值,默认情况下网页中文本的字体颜色是黑色。

  利用Dreamweaver的替换功能,可以完成对默认属性代*码的替换。在“查找”中填上要替换的默认属性代*码,“替换”处留空白,还可以在“查找范围”上选择替换范围,然后点击“替换全部”就可以删除“产照范围”内所有指定的默认属性代*码。

  〇注释语句

  注释语句是用于对代*码功能或作用进行说明的语句,注释语句里的内容对于普通用*户来说就是不可见的。即普通用*户在页*面中是看不到HTML代*码中注释标签里的内容。

  在制作网页的时候,我们或多或上会添加注释语句一增强代*码的可读性。但是,过多的注释语句会占用大量的存储空间。不仅如此,如果在注释标签里添加大量的关键字,还会被搜索*引擎认为是堆砌关键字,从而对网站进行惩*罚。

  所以,在添加注释语句时,我们要坚守一个原则:绝不添加哪些即使删除后也不会影响网页源代*码可读性的注释语句。

  〇空语句

  垃*圾代*码清理的最后一步就是删除代*码中的空语句。简单地说,空语句就是指标签间不存在任何内容的语句。

  空语句的清理主要针对即使删除后也不会影响页*面正常显示的标签。但有一部标签是不能删除的(如<tr>、<td>),否则页*面将会出现错乱。

  手工编写HTML代*码是搜索*引擎优化从业者必须具备的基本技能。如果你已经具备手工编写HTML代*码的能力,就应该有限采用手工编写代*码的方式制作网页。

  经过垃*圾代*码清理后,页*面中70%以上的多余代*码已经被清楚,但是,精简代*码的工作并没有完成。接下来就是暂缓HTML中的长标签,以及对CSS,JavaScript进行优化,


你可能感兴趣的:(网站代码优6化--清理、精减垃圾代码)