利用Python生成sitemap脚本

在网站seo中,有时候需要我们提交网站地图到搜索引擎中,用以提高搜索排名等
由于平时用Google比较多,所以我将以谷歌搜索引擎为例
注:根据Google官方提供的说明,每一个sitemap的xml文件中最大只支持5w个url,大小不超过50M,可根据需求进行修改
下面,我将python语言自动生成sitemap的xml文件

# -*- coding:utf-8 -*-

import datetime
import re


# def get_url():
#     with open('D:\\Excel\\sitemap\\可用.txt', 'r', encoding='UTF-8') as f:
#         list1 = []
#         for i in f:
#             line = i.strip()
#             list1.append(line)

#         return list1


def creat_xml(filename, url_list):  # 生成sitemap所需要的xml方法
    header = '\n'
    file = open(filename, 'a', encoding='utf-8')
    file.writelines(header)
    file.close()

    for url in url_list:
        times = datetime.datetime.now().strftime("%Y-%m-%dT%H:%M:%S+00:00")
        urls = re.sub(r"&", "&", url)  # 注意这里,在URL中如果含有&将会出错,所以需要进行转义

        # 这个是生成的主体,可根据需求进行修改
        ment = "  \n    %s\n    %s\n    weekly\n    0.8\n  \n" % (urls, times)

        file = open(filename, 'a', encoding='utf-8')
        file.writelines(ment)
        file.close()

    last = ""
    file = open(filename, 'a', encoding='utf-8')
    file.writelines(last)
    file.close()


if __name__ == '__main__':
    # url_list = get_url()
    url_list = ['https://search.google.com', 'https://www.google.com', 'https://translate.google.cn']
    creat_xml("D:\\Excel\\sitemap\\test1.xml", url_list)

以下是生成后的结果:


利用Python生成sitemap脚本_第1张图片
test.png

你可能感兴趣的:(利用Python生成sitemap脚本)