百度sitemap协议

百度sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。

百度sitemap支持标准的XML格式sietmap文件以及文本格式的sitemap文件,如果您有多个sitemap文件,还可以使用sitemap索引文件提交。
Sitemaps 协议格式由 XML 标记组成。Sitemap 的所有数据数值应为转义过的。文件本身应为 UTF-8 编码。

Sitemap 索引文件必须:

    * 以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
    * 每个 Sitemap 包含一个<sitemap> 条目作为 XML 父标记。
    * 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。

XML格式举例:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
     <url>
       <loc>http://www.example.com/</loc>
       <lastmod>2009-01-01</lastmod>
       <changefreq>always</changefreq>
       <priority>1.0</priority>
     </url>
</urlset>

XML标签说明:

属性

是否必填项

说明
<urlset> 必填 声明支持的协议。
<url>         必填 每个网址记录的父标记。
<loc>         必填 该页的网址。该值必须少于256个字符。
<lastmod> 可选 该文件上次修改的日期。
<changefreq> 可选 页面可能发生更改的频率。有效值为:

    * always
    * hourly
    * daily
    * weekly
    * mothly
    * yearly
    * never

<priority> 可选 此网页的优先级。有效值范围从 0.0 到 1.0。

转义字符说明:

XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误,转义字符中的"&"无需再转,具体参见下表。
字符 转义后的字符
和(and) & &amp;
单引号 ' &apos;
双引号 " &quot;
大于号 > &gt;
小于号 < &lt;

文本格式sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。此文本文件需要遵循以下指南:

    * 文本文件每行都必须有一个网址。网址中不能有换行。
    * 您必须指定完整的网址,包括 http。
    * 每个文本文件最多可包含 50,000 个网址,并且不得超过 10MB(10,485,760 字节)。如果网站所包含的网址超过 50,000 个,则可将列表分割成多个文本文件,然后分别添加每个文件。
    * 文本文件需使用 UTF-8 编码。
    * 文本文件不应包含网址列表以外的任何信息。

文本文件的示例条目如下所示:
http://www.example.com/catalog?item=1
http://www.example.com/catalog?item=11

使用sitemap索引文件(对多个sitemap文件)说明:

您可以提供多个 Sitemap 文件,但每个 Sitemap 文件包含的网址不得超过 50,000 个,并且文件不得超过 10MB(10,485,760 字节)。如果您愿意,可以使用 gzip 压缩 Sitemap 文件,以减少带宽要求;但是解压缩后的 Sitemap 文件不得超过 10MB。如果要列出 50,000 个以上的网址,您需要创建多个 Sitemap 文件。

Sitemap 索引文件必须: Sitemap 索引文件必须:

    * 以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记作为结束。
    * 每个 Sitemap 包含一个<sitemap> 条目作为 XML 父标记。
    * 每个 <sitemap> 父标记包含一个 <loc> 子标记条目。

sitemap索引文件标签说明:
属性

是否必填项

说明
<sitemapindex> 必填 压缩文件中所有sitemap的相关信息
<sitemap> 必填 压缩文件中个别sitemap的相关信息
<loc>         必填 识别sitemap的位置
<lastmod> 可选 识别相对sitemap文件的修改时间

你可能感兴趣的:(xml,搜索引擎,百度)