CelebA-HQ的jpg格式版转化

1.从Google drive上下载img_celaba.7z
https://drive.google.com/drive/folders/0B7EVK8r0v71peklHb0pGdDl6R28
2.因为数据集是分卷压缩的,所以需要合并再解压缩

cat img_celeba.7z.0** > img_celeba.7z

把合并得到的img_celeba.7z解压缩得到img_celeba文件夹,内有202599张jpg图片.
3.从Google drive上下载CelebA_hq_deltas
https://drive.google.com/drive/folders/0B4qLcYyJmiz0TXY1NG02bzZVRGs
文件夹内有30个zip文件,不需要解压缩.
这两个资源如果没有用外网下载不了,可以自行查找百度云资源.不要找错了,不是img_align_celeba.zip.
4.从celeba官网的下载地址或者别的地方下载list_landmarks_celeba.txt,很容易找到的。
5.下载github上这位仁兄的h5tool.py,他的才能直接得到jpg文件,另外一个大兄弟的得到的是hdf5文件
https://github.com/willylulu/celeba-hq-modified
6.将h5tool.py,img_celeba,list_landmarks_celeba.txt和CelebA_hq_deltas文件夹放到同一目录下,然后创建save文件夹

mkdir celeba-hq
cd celeba-hq
mkdir celeba-64
mkdir celeba-128
mkdir celeba-256
mkdir celeba-512
mkdir celeba-1024

如果你只想要某一种尺寸的图,这个可以在代码里修改.
6.修改h5tool.py里读取两个数据文件夹和txt文件的路径,使h5tool.py能正确读到文件
7.运行h5tool.py,点开save文件夹,见证奇迹.

python h5tool.py create_celeba_hq 123456.h5 ./ ./

这样得到的高清图很多是有噪点的,后来我发现在h5too.py的第400行左右有一个apply delta image的等式.
我取消添加delta image,也就是不令img = img + delta,而是直接img = img.这样就能得到没有噪点的高清图了.
不明白为什么要加delta.
最后,如果不修改代码的话生成的图片名称和原低清图不一致,这个很容易改,直接将process_func函数返回的idx改成orig_file就好了.另外,作者生成的图片是从索引7000多开始的,这样最后会少7000多张图.估计是他生成时中断过忘记改回从0开始了.

你可能感兴趣的:(数据集)