了解siteMap(附:Google Sitemap 生成工具使用说明)

摘抄: http://www.google.com/support/webmasters/bin/topic.py?topic=8476

 

1. 了解有关站点地图的详情

 

在以下情况下,站点地图特别有用:

  • 网站含动态内容。
  • 您的网站中包含在 Googlebot 抓取过程中不易发现的网页,例如含有富 AJAX 或图片内容的网页。
  • 网站为新网站且指向该网站的链接不多。(Googlebot 会跟随链接从一个网页到另一个网页抓取网页,因此,如果您的网站没有很好地链接,我们可能很难发现它。)
  • 网站有大量内容页存档,这些内容页彼此之间没有很好地链接,或根本就没有链接。

2. 创建站点地图

      站点点地图所含网址的一般指南

  • 一个站点地图可以包含一个网址列表或站点地图列表。
  • 如果您的站点地图包含另一组站点地图,您应将自己的站点地图另存为站点地图索引文件,并使用该文件类型专用的 XML 格式。每个站点地图索引文件最多可以列出 50,000 个站点地图。
  • 一个站点地图文件包含的网址不得超过 50,000 个,且未压缩时不得大于 10MB。如果您的站点地图超过了这些限值,请将其拆分为几个小的站点地图。这些限制条件有助于确保您的网络服务器不会因向 Google 提供大文件而超载。
  • 使用相同的语法指定所有网址。例如,如果您指定网站的位置为 http://www.example.com/,则网址列表中不应包含以 http://example.com/ 开头的网址。如果您指定网站的位置为 http://example.com/,则网址列表中不应包含以 http://www.example.com/ 开头的网址。
  • 请不要在网址中包含会话 ID。
  • 请不要在站点地图中包含直接图片网址。Google 不会将图片直接编入索引中,而是将显示图片的网页编入索引。站点地图中包含的直接图片网址不会编入索引。
  • 站点地图网址必须进行编码,以便于所在的网络服务器进行读取。另外,它只可以包含 ASCII 字符,不能包含大写 ASCII 字符、某些控制码或特殊字符(如 * 和 {} 等)。如果您的站点地图网址包含这些字符,在您试图添加该网址时就会显示错误消息。

    根据 Sitemap 协议创建站点地图

        Google 可支持多种格式的站点地图,但我们建议您根据 Sitemap 协议来创建站点地图,这是因为相同的文件也可能提交给其他搜索引擎,例如 MSN 和 Yahoo!,这些搜索引擎都是 sitemaps.org 的成员。

       您可通过以下多种方式创建站点地图:

    根据文本文件创建站点地图

 

    您可以向 Google 提供一个简单的文本文件,文件中的每行只包含一个网址。例如:

http://www.example.com/file1.htmlhttp://www.example.com/file2.html

    要获得最佳效果,请按照以下指南操作:

  • 由于 Google 会完全按照您所提供的网址来尝试进行抓取,因此,您必须指定完整的网址。
  • 每个文本文件最多可包含 50,000 个网址。如果您的网站所含的网址数量超过 50,000 个,那么,您可将列表分成多个文本文件,然后分别添加每个文件。
  • 文本文件必须使用 UTF-8 编码。您可在保存文件时设置此项(例如,在记事本中,此项会在"另存为"对话框的"编码"菜单中列出)。
  • 文本文件不应包含网址列表以外的任何信息。
  • 文本文件不应包含任何页眉或页脚信息。
  • 您可以对文本文件任意命名。Google 建议您将文件的扩展名设置为 .txt,以表明该文件为文本文件(例如 sitemap.txt)。

     您应将此文本文件上传到您的服务器。创建此文件后,您可将其作为站点地图来进行提交。此过程虽然需要手动执行,但如果您对编写网络服务器的脚本或管理网络服务器还不熟悉,那么,此过程是最简单同时也可能是最有效的方法。

 

3. 提交站点地图或更新已提交的站点地图

      如果您用支持的格式创建了一个站点地图,可以通过 Google 网站管理员工具将它提交给 Google。这样可以让 Google 向您提供实用的状态信息和统计信息。

      通过 Google 网站管理员工具提交站点地图

     

     在开始之前,请确保您已在自己的网站管理员工具帐户中添加并验证了以下网站:

  • 站点地图所在的网站
  • 站点地图中引用其网址的网站
  1. 将站点地图上传到您的网站。
  2. 在网站管理员工具主页上,点击所需的网站。
  3. 网站配置下,点击站点地图
  4. 在文本框中填写指向站点地图的路径(例如,如果您的站点地图位于 http://www.example.com/sitemap.xml,请键入 sitemap.xml)。
  5. 点击提交站点地图

    通过 robots.txt 文件提交站点地图

   

    您可通过向 robots.txt 文件添加以下行(将示例网址更新为自己的站点地图的完整路径)的方式通知 Google 以及其他搜索引擎有关您站点地图的信息:

Sitemap: http://example.com/Sitemap 位置.xml

   此指令不受 User-agent 行的影响,因此,您可将其放置在您文件中的任意位置。如果您有站点地图索引文件,可以加入该文件的位置。您无需一一列出索引文件中所列的各个站点地图。

   

你可能感兴趣的:(python,搜索引擎,网络协议,脚本,Google)