python 爬取图片_Python实现千图成像:从图片爬取到图片合成

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第1张图片

千图成像:用N张图片拼凑成一张图片。

实现原理:先将所要成像的图片转化成马赛克图片,然后从图库中用对应颜色的图片替换相应色块。

图库中的图片处理:标记图库中每张图片的混合颜色,用于替换目标色块,并记录每张图片的特征用于成像,增加成像质量。

起源

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第2张图片

德莱文

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第3张图片

图片局部

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第4张图片

英雄联盟-微博

很久前在刷微博的时候看到了这条,被他给震撼到了,图片是由LOL近千张皮肤图片组合构成的(难道这是用ps做的,还是一张张拼的,应该不可能吧),就在昨天突然就想起了这个事,就决定也做一个,随即便展开了行动。

搜到了这篇文章,看了下图片的构成,决定先取得所有皮肤的图片再说吧!便又开始了爬虫!

运行环境:

Python3.6.5 , pycharm-2018-1-2 , win10

爬虫思路

皮肤图片的来源问题,首先到官网去找了找,想到了道聚城皮肤专卖区,其中正好有所有我们需要的图片。

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第5张图片

通过F12锁定图片取得了第一张图片的URL(https://game.gtimg.cn/images/daoju/app/lol/medium/2-122015-9.jpg)

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第6张图片

以此类推便可取得多个皮肤的URL,发现只有图中红框处不同

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第7张图片

尝试着改变红框内的数字,在改变后三位(122015-->122001)时,获得了另一张诺手的皮肤,基本可以确定后三位为皮肤编号,前面的数字为英雄编号,且皮肤编号必须为三位。

看到这里你可能会有所疑问,为什么不直接正则获取所需图片的URL呢?为什么要大费周章的寻找规律?

因为这个翻页式网站比较特殊,在翻页时URL并不会改变,所以无法通过常用方法获取所有皮肤。

那估计又有人要提出使用selenium库来模拟人使用浏览器获取所有图片,但是这会造成爬取图片的速度大大下降,只能作为下策(在这过程中了解到了八爪鱼,发现其原理类似于selenium,是模拟人操控浏览器,速度也是不容直视,虽然它能爬取近98%的网站),在博主能力有限的情况下选择了寻找规律之旅!

如果你有好的方法解决这个问题,可以在评论处提出,十分感谢!

接下来在知道了规律的情况下,那么如何获取每个不同英雄的编号呢?在其他博主的引导下,发现LoL资料库中有所有英雄的头像,通过F12的慢慢查找,发现了这个js文件!

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第8张图片

查看其preview,便可得到所有英雄编号,并测试发现可用!比如Ashe艾希的第一个皮肤对应编号按规律应该是22001,所以URL就是https://game.gtimg.cn/images/daoju/app/lol/medium/2-22001-9.jpg,

测试发现确实成功了!

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第9张图片

好了,到此为止网页分析到此结束了,终于可以编写代码了。

代码框架

1、获取英雄编号及皮肤编号(说明:关于皮肤编号并未找到每个英雄皮肤的数量,所以设置成查找所有001到015的图片,当然也可以更多020也行)

2、将编号导入图片URL(https://game.gtimg.cn/images/daoju/app/lol/medium/2-****-9.jpg )中, 生成Url_list。

3,根据URL来下载对应图片,并保存到本地。

4、完整代码

import requestsimport reimport os# # # # # # # # # # # # # ## title:获取LOL英雄皮肤图像  ## author:简书 Wayne_Dream  ## date:2018-7-5           ## # # # # # # # # # # # # #defgetHero_data():    try:        headers = {            'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'        }        url = 'http://lol.qq.com/biz/hero/champion.js'        r = requests.get(url, headers=headers)        r.raise_for_status()        r.encoding = r.apparent_encoding        text = r.text        hero_id = re.findall(r'"id":"(.*?)","key"', text)        hero_num = re.findall(r'"key":"(.*?)"', text)        return hero_id, hero_num    except:        return '卧槽,获取英雄编码失败!'defgetUrl(hero_num):    part1 = 'https://game.gtimg.cn/images/daoju/app/lol/medium/2-'    part3 = '-9.jpg'    skin_num = []    Url_list = []    for i in range(1, 21):        i = str(i)        if len(i) == 1:            i = '00'+i        elif len(i) == 2:            i = '0'+i        else:            continue        skin_num.append(i)    for hn in hero_num:        for sn in skin_num:            part2 = hn + sn            url = part1 + part2 + part3            Url_list.append(url)    print('图片URL获取成功')    return Url_listdefPicName(hero_id, path):    pic_name_list = []    for id in hero_id:        for i in range(1, 21):            pic_name = path + id + str(i) + '.jpg'            pic_name_list.append(pic_name)    return pic_name_listdefDownloadPic(pic_name_list, Url_list):    count = 0    n = len(Url_list)    try:        for i in range(n):            headers = {                'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'            }            res = requests.get(Url_list[i], headers=headers).content            if len(res) < 100:                count += 1                print('\r当前进度:{:.2f}%'.format(100*(count/n)), end='')            else:                with open(pic_name_list[i], "wb") as f:                    f.write(res)                    count += 1                    print('\r当前进度:{:.2f}%'.format(100*(count/n)), end='')    except:        return '卧槽,获取图片失败!'if __name__ == '__main__':    print('author:简书 Wayne_Dream:')    print('https://www.jianshu.com/u/6dd4484b4741')    input('请输入任意字符开始爬虫:')    if os.path.exists('D:\LOLimg_wayne\\') == False:        path = r'D:\LOLimg_wayne\\'        os.mkdir(path)        hero_id, hero_num = getHero_data()        Url_list = getUrl(hero_num)        pic_name_list = PicName(hero_id, path)        print('正在下载图片,请稍等。。。')        print('在' + path + '下查看...')        DownloadPic(pic_name_list, Url_list)        print('图片下载完毕')    else:        path = r'D:\LOLimg_wayne\\'        hero_id, hero_num = getHero_data()        Url_list = getUrl(hero_num)        pic_name_list = PicName(hero_id, path)        print('正在下载图片,请稍等。。。')        print('在' + path + '下查看...')        DownloadPic(pic_name_list, Url_list)        print('图片下载完毕')

好了,到这里我们已经完成了LOL全皮肤的获取,接下来进行最有意思的一步,千图成像!

千图成像

初级阶段我们先使用一款国外的合成软件。

软件下载地址:

https://fmedda.com/en/download

如果打不开,那就搜索“foto-mosaik-edda”下载即可!

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第10张图片

打开后界面是这样的。

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第11张图片

先选第一步

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第12张图片

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第13张图片

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第14张图片

再选第二步create photo mosaic

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第15张图片

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第16张图片

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第17张图片

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第18张图片

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第19张图片

效果图:

局部:

如果想直接尝试一下千图成像的,可到百度网盘下载我爬取到的皮肤图集:https://pan.baidu.com/s/19PywbOV1dBwr7r7bzsMhmw 密码:5arb

- END -

原文链接:

https://www.jianshu.com/p/c963370cd8df

文源网络,仅供学习之用。如有侵权,联系删除。

往期精彩

74119bcd674b2b6f493a191f2279c3a6.png

◆  50款开源工具你都用过吗?

◆  python+C、C++混合编程的应用

◆  python网络爬虫的基本原理详解

◆  Python自动操控excel,一小时解决你一天的工作

◆  如何用Python增强Excel,减少处理复杂数据的痛苦?

python 爬取图片_Python实现千图成像:从图片爬取到图片合成_第20张图片

你可能感兴趣的:(python,爬取图片)