Python爬虫实现电影资源下载方法

本人python运行环境:
IDE丨pycharm2.3
版本丨Python3.6
系统丨Windows 10
爬虫目的与思路:
实现目的与思路:
目的:
实现对电影目标url的解析与下载,由于第三方vip解析,只提供在线观看,隐藏想实现对目标视频的下载。
思路:
1.在百度搜索全名解析得到解析网站:jx.618g.com?/url=[电影播放地址]。
2.首先拿到想要看的电影url,通过第三方vip视频解析网站进行解析。
3.通过抓包,模拟浏览器发送正常请求。
4.通过拿到缓存ts文件,下载视频ts文件。
5.最后通过转换为mp4文件,即可实现正常播放。
主要代码:

import requests
from multiprocessing import Pool
def download(i):
    url = 'https://vip.okokbo.com/20180319/FITtZ17w/1000kb/hls/OdGD6663%03d.ts' % i

    print(url)
    r = requests.get(url)
    ret = r.content
    with open('./kankan/{}'.format(url[-11:]),'wb') as f:
        f.write(ret)

if __name__ == '__main__':
    pool = Pool(15)
    for i in range(10):
        pool.apply_async(download, args=(i, ))

    pool.close()
    pool.join()

总结:
1.视频缓存ts文件这里都是一些缓存视频文件,每个只有几秒钟播放,最后需要合并成一个mp4格式的视频,就可以正常播放,默认高清下载。
2.注意这里的进度因为使用多进程下载,进度仅供参考,没有确切显示进度,可以进文件夹查看正常进度,可以理解为显示一次进度,下载一个ts文件。
3.ts文件下载完后,在命令提示符中用copy /b *.ts [填写你下载的文件名] .mp4。
特别说明如果哪里有问题请及时指出来,欢迎大家指正错误,此爬虫项目只用于入门,请不要用其盈利。否则,后果自负!!!

你可能感兴趣的:(Python)