10000+ppt免费下载领取(python爬取全站ppt)

个人公众号 yk 坤帝
后台回复 ppt模板 领取ppt

1.缘由

前几天参加一个活动,需要制作ppt,制作完之后ppt模板死活不能让人满意。然后就去网上找模板,有些比较适合ppt模板还是收费的,这…,有点恶心,哈哈哈!!

今天教大家如何使用python爬虫爬取1万份『ppt模板』,以后制作ppt再也不怕了没有模板了!!!

2.相关介绍

网站:

https://sc.chinaz.com/ppt/free.html

10000+ppt免费下载领取(python爬取全站ppt)_第1张图片
一共702页,每页20个ppt模板

2.爬虫思路

先遍历每一页,获取每一页ppt模板的url。
根据ppt模板的url获取下载地址。
最后根据下载地址将文件下载到本地。

3.遍历每一页
10000+ppt免费下载领取(python爬取全站ppt)_第2张图片
获取ppt模板url和类型

# 个人公众号 yk 坤帝
# 后台回复 ppt模板 领取ppt
for i in range(15):
    response = requests.get('https://sc.chinaz.com/ppt/free_' + str(i)  + '.html')
    response.encoding = 'utf-8'

    page_text = response.text

    tree = etree.HTML(page_text)

    div_list = tree.xpath('//div[@class="bot-div"]')
    for div in div_list:
        href ='https://sc.chinaz.com' + div.xpath('./a/@href')[0]
        title = div.xpath('./a/text()')[0]

保存ppt的url和类型
10000+ppt免费下载领取(python爬取全站ppt)_第3张图片

4.下载保存

获取下载地址:
10000+ppt免费下载领取(python爬取全站ppt)_第4张图片

# 个人公众号 yk 坤帝
# 后台回复 ppt模板 领取ppt
res = requests.get(href)
tree = etree.HTML(res.text)

url = tree.xpath('//div[@class="download-url"]/a[1]/@href')[0]
print(url)
ppt = requests.get(href).content

if not os.path.exists('ppt模板'):
    os.mkdir('ppt模板')

with open('ppt模板/' + title + '.rar', 'wb') as file:
    file.write(ppt)
print(title + ':下载完毕!!!!!!')

10000+ppt免费下载领取(python爬取全站ppt)_第5张图片
5.批量下载

for i in range(15):
    response = requests.get('https://sc.chinaz.com/ppt/free_' + str(i)  + '.html')

通过设置遍历的页数,实现批量下载

6.10000+ppt模板素材随用随取

通过python编程实现爬取10000+ppt模板素材,以后再也不用担心制作ppt没有模板了!
10000+ppt免费下载领取(python爬取全站ppt)_第6张图片

10000+ppt模板下载

对源码感兴趣的,跟我私聊领取。

个人公众号 yk 坤帝
后台回复 ppt模板 领取ppt

你可能感兴趣的:(爬虫,python,xpath,脚本语言,爬虫,ppt)