Python简单爬取电影磁力链接

Python简单爬取电影磁力链接

网页的链接:http://www.ygdy8.net/html/gndy/dyzz/list_23_2.html
打开你想要的电影:http://www.ygdy8.net/html/gndy/dyzz/20181124/57807.html
找到下载地址:
在这里插入图片描述

代码:
import requests#网络请求模块
import re #提取数据
for n in range(1, 187):
# 网址
a_url = ‘http://www.ygdy8.net/html/gndy/dyzz/list_23_’ + str(n) + ‘.html’
#打印检查页面链接
print(a_url)
打印出的网页链接:

一共186页
在这里插入图片描述

for n in range(1, 2):
    # 网址
    a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_' + str(n) + '.html'
    #print(a_url)
    html_1 = requests.get(a_url)
    html_1.encoding='gb2312'
    print(html_1.status_code) #200
    re.findall #列表
    detil_list=re.findall('在这里插入图片描述
#拼接网址:

    for m in detil_list:
        b_url = 'http://www.ygdy8.net'+m
        html_2 = requests.get(b_url)
        html_2.encoding = 'gb2312'  # 网站格式‘gb2312’,防乱码
        #print(b_url)

提取完整下载链接代码:

ftp=re.findall('.*?',html_2.text)
        print(ftp)#打印列表html_2

Python简单爬取电影磁力链接_第1张图片
打印到txt文本代码:

        with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:
            #写入本地 write写文本
           f.write(ftp[0]+'\n')

Python简单爬取电影磁力链接_第2张图片
把txt文本的链接复制到迅雷下载即可。

最终代码:

import  requests#网络请求
import re#提取数据

def xb(pages):
   for n in range (1,pages):
      #网址
      a_url = 'http://www.ygdy8.net/html/gndy/dyzz/list_23_'+str(n)+'.html'
      #print(a_url)
      html_1=requests.get(a_url)
      html_1.encoding = 'gb2312'
     # print(html_1.status_code) #200
      #print(html_1.text)  #查看网页源代码
      # re.findall 列表
      detil_list=re.findall('.*?',html_2.text)
         #print(ftp)打印查看
         with open('C:\\Users\\张云强\\Desktop\\test\\dytt.txt','a',encoding='utf-8')as f:
            #写入本地 write写文本
            f.write(ftp[0]+'\n')
   xb(20)

你可能感兴趣的:(Python简单爬取电影磁力链接)