acg456漫画网站爬虫


import requests
import json
from urllib import request
import os
import time

for pn in range(1,182):                             #共1-100章
    pn = '%03d' %pn                                #三位数补零
    url = 'http://www.acg456.com/ajax/Common.ashx?op=getPics&cid=1810&serial=&path=%s' % pn #取得每一章网页
    #print(url)
    res = requests.get(url)
    #print(res.text)
    jsonfile = json.loads(res.text)  #字串转json格式
    #print(jsonfile)
    allpic = jsonfile['data']       #只取data的资料

    os.mkdir(pn)   #创建每一里的目录
    time.sleep(10)

    n = 1
    for i in allpic:
        request.urlretrieve(i,'%s\\%s.jpg' %(pn,n))  #i是图片网址
        n = n + 1

print('程式已执行结束')

你可能感兴趣的:(python)