weixin_39715538

gan处理自己的数据集_使用StyleGAN训练自己的数据集.md

1 数据准备

执行StyleGAN的最大难点在于准备数据集，不像其他的GAN可以接受文件夹输入，它只能接收.tfrecords作为输入，它将每张图片不同分辨率存储为数组。因此，输入文件必须是完美正态分布的，通过特定的dataset_tools.py工具将图片转成.tfrecords，这会导致实际存储尺寸达到原图的19倍。

注意：

StyleGAN的数据集必须由相同的方式组成，$512\times 512$ 或 $1024\times 1024$( $513\times 513$就不行)

必须是相同的颜色空间，不能既有sRGB又有灰度图JPGs。

文件类型必须是与你要重新训练的模型所使用的图像格式相同的，比如，你不能用PNG图片来重新训练一个用JPG格式图像的模型。

不可以有细微的错误，比如CRC校验失败。

2 准备脸部数据从Danbooru2018的metadata的JSON文件中抽取所有的图像子集的ID，如果需要指定某个特定的Danbooru标签,使用jq以及shell脚本

将原图裁剪。可以使用nagadomi的人脸裁剪算法，普通的人脸检测算法无法适用于这个卡通人脸。

删除空文件，单色图，灰度图，删掉重名文件

转换成JPG格式

将所有图片上采样到目标分辨率即$512\times 512$，可以使用 waifu2x

将所有图像转换成 $512\times 512$的sRGB JPG格式图像

8.可以人工筛选出质量高的图像，使用findimagedupes删除近似的图像，并用预训练的GAN Discriminator过滤掉部分。

使用StyleGAN的data_tools.py将图片转换成tfrecords

目标是将此图

转换成

下面使用了一些脚本进行数据处理，可以使用danbooru-utility协助。

2.1 裁剪

原始的Danbooru2018可以使用磁链下载，提供了JSON的metadata，被压缩到metadata/2*和目录结构为{original,512px}/{0-999}/$ID.{png,jpg}。可以使用Danbooru2018512像素版本在整个SFW图像集上的训练，但是将所有图像缩放到512像素并非明智之举，因为会丢失大量面部信息，而保留高质量面部图像是个挑战。可以从512px/目录下的文件名中直接抽取SFW IDs，或者从metadata中抽取id和rating字段并存入某个文件。

10find ./512px/ -type f | sed -e 's/.*\/$[[:digit:]]*$\.jpg/\1/'

# 967769

# 1853769

# 2729769

# 704769

# 1799769

# ...

tar xf metadata.json.tar.xz

cat metadata/* | jq '[.id, .rating]' -c | fgrep '"s"' | cut -d '"' -f 2 # "

# ...

可以安装和使用lbpcascade_animeface以及opencv，使用简单的一个脚本lbpcascade_animeface issue来裁剪图像。在Danbooru图像上表现惊人，大概有90%的高质量面部图像，5%低质量的，以及5%的错误图像(没有脸部)。也可以通过给脚本更多的限制，比如要求$256\times 256px$区域，可以消除大部分低质量的面部和错误。以下是crop.py

34import cv2

import sys

import os.path

def detect(cascade_file, filename, outputname):

if not os.path.isfile(cascade_file):

raise RuntimeError("%s: not found" % cascade_file)

cascade = cv2.CascadeClassifier(cascade_file)

image = cv2.imread(filename)

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

gray = cv2.equalizeHist(gray)

## Suggested modification: increase minSize to '(250,250)' px,

## increasing proportion of high-quality faces & reducing

## false positives. Faces which are only 50x50px are useless

## and often not faces at all.

faces = cascade.detectMultiScale(gray,

# detector options

scaleFactor = 1.1,

minNeighbors = 5,

minSize = (50, 50))

i=0

for (x, y, w, h) in faces:

cropped = image[y: y + h, x: x + w]

cv2.imwrite(outputname+str(i)+".png", cropped)

i=i+1

if len(sys.argv) != 4:

sys.stderr.write("usage: detect.py \n")

sys.exit(-1)

detect(sys.argv[1], sys.argv[2], sys.argv[3])

IDs可以和提供的lbpcascade_animeface脚本使用xargs结合起来，但是这样还是太慢，使用并行策略xargs --max-args=1 --max-procs=16或者参数parallel更有效。lbpcascade_animeface脚本似乎使用了所有的GPU显存，但是没有可见的提升，我发现可以通过设置CUDA_VISIBLE_DEVICES=""来禁用GPU(此步骤还是使用多核CPU更有效)。

一切就绪之后，可以按照如下方式在整个Danbooru2018数据子集上使用并行的面部图像切割

11cropFaces() {

BUCKET=$(printf "%04d" $(( $@ % 1000 )) )

ID="$@"

CUDA_VISIBLE_DEVICES="" nice python ~/src/lbpcascade_animeface/examples/crop.py \

~/src/lbpcascade_animeface/lbpcascade_animeface.xml \

./original/$BUCKET/$ID.* "./faces/$ID"

}

export -f cropFaces

mkdir ./faces/

cat sfw-ids.txt | parallel --progress cropFaces

2.2 上采样和使用GAN的Discriminator进行数据清洗

在训练GAN一段时间之后，重新用Disciminator对真实的数据点进行排序。通常情况下，被Disciminator判定最低得分的图片通常也是质量较差的，可以移除，这样也有助于提升GAN。然后GAN可以在新的干净数据集上重新训练，得以提升GAN。

由于对图像排序是Disciminator默认会做的事，所有不需要额外的训练或算法。下面是一个简单的ranker.py脚本，载入StyleGAN的.pkl模型，然后运行图片名列表，并打印D得分

22import os

import pickle

import numpy as np

import PIL.Image

import dnnlib

import dnnlib.tflib as tflib

import config

import sys

def main():

tflib.init_tf()

_G, D, _Gs = pickle.load(open(sys.argv[1], "rb"))

image_filenames = sys.argv[2:]

for i in range(0, len(image_filenames)):

img = np.asarray(PIL.Image.open(image_filenames[i]))

img = img.reshape(1, 3,512,512)

score = D.run(img, None)

print(image_filenames[i], score[0][0])

if __name__ == "__main__":

main()

使用示例如下

15find /media/gwern/Data/danbooru2018/characters-1k-faces/ -type f | xargs -n 9000 --max-procs=1 \

python ranker.py results/02086-sgan-portraits-2gpu/network-snapshot-058662.pkl \

| tee portraitfaces-rank.txt

fgrep /media/gwern/ 2019-04-22-portraitfaces-rank.txt | \

sort --field-separator ' ' --key 2 --numeric-sort | head -100

# .../megurine.luka/7853120.jpg -708.6835

# .../remilia.scarlet/26352470.jpg -707.39856

# .../z1.leberecht.maass..kantai.collection./26703440.jpg -702.76904

# .../suzukaze.aoba/27957490.jpg -700.5606

# .../jack.the.ripper..fate.apocrypha./31991880.jpg -700.0554

# .../senjougahara.hitagi/4947410.jpg -699.0976

# .../ayase.eli/28374650.jpg -698.7358

# .../ayase.eli/16185520.jpg -696.97845

# .../illustrious..azur.lane./31053930.jpg -696.8634

# ...

你可以选择删除一定数量，或者最靠近末尾的TOP N%的图片。同时也应该检查最靠前的TOP的图像，有些十分异常的也需要删除。可以使用ranker.py提高生成的样本质量，简单示例。

2.3 质量检测和数据增强

我们可以对图像质量进行人工校验，逐个浏览成百上千的图片，使用findimagedupes -t 99%来寻找近似相近的面部。在Danbooru2018中，可以有600-700000张脸，这已足够训练StyleGAN并且最终数据集有点大，会增加19倍。

但是如果我们需要在单一特征的小数据集上做，数据增强就比较有必要了。不需要做上下/左右翻转了，StyleGAN内部有做。我们可以做的是，颜色变换，锐化，模糊，增加/减小对比度，裁剪等操作。

2.4 上采样和转换

将图像转换成JPG可以大概节省33%的存储空间。但是切记，StyleGAN模型只接收在与其训练时所使用的相同的图片格式，像FFHQ数据集所使用的是PNG.

鉴于dataset_tool.py脚本在转换图片到tfrecords时太诡异，最好是打印每个处理完的图片，一旦程序崩溃，可以排错。对dataset_tool.py的简单修改如下:

7with TFRecordExporter(tfrecord_dir, len(image_filenames)) as tfr:

order = tfr.choose_shuffled_order() if shuffle else np.arange(len(image_filenames))

for idx in range(order.size):

print(image_filenames[order[idx]])

img = np.asarray(PIL.Image.open(image_filenames[order[idx]]))

if channels == 1:

img = img[np.newaxis, :, :] # HW => CHW

3 训练模型

参数配置

train/training_loop.py:关键配置参数是training_loop.py的112行起。关键参数

G_smoothing_kimg 和D_repeats(影响学习的动态learning dynamics),

network_snapshot_ticks(多久存储一次中间模型)

resume_run_id: 设置为latest

resume_kimg.注意，它决定了模型训练的阶段，如果设置为0，模型会从头开始训练而无视之前的训练结果，即从最低分辨率开始。如果要做迁移学习，需要将其设置为一个足够高的数目，如10000，这样一来，模型就可以在最高分辨率，如$512\times 512$的阶段开始训练。

建议将minibatch_repeats = 5改为minibatch_repeats = 1。此处我怀疑ProGAN/StyleGAN中的梯度累加的实现，这样会使得训练过程更加稳定、更快。

注意，一些参数如学习率，会在train.py中被覆盖。最好是在覆盖的地方修改，

train.py (以前是config.py):设置GPU的数目，图像分辨率，数据集，学习率，水平翻转/镜像数据增强，以及minibatch-size。(此文件包含了ProGAN的一些配置参数，你并不是突然开启了ProGAN)。学习率和minbatch通常不用管(除非你想在训练的末尾阶段降低学习率以提升算法能力)。图像分辨率/dataset/mirroring需要设置，如

1desc += '-faces'; dataset = EasyDict(tfrecord_dir='faces', resolution=512); train.mirror_augment = True

此处设置了$512\times 512$的脸部数据集，我们前面创建的datasets/faces，启用mirror。假如没有8个GPU，必须修改-preset以匹配你的GPU数量，StyleGAN不会自动修改的。对于两块 2080ti，设置如下

3desc += '-preset-v2-2gpus'; submit_config.num_gpus = 2; sched.minibatch_base = 8; sched.minibatch_dict = \

{4: 256, 8: 256, 16: 128, 32: 64, 64: 32, 128: 16, 256: 8}; sched.G_lrate_dict = {512: 0.0015, 1024: 0.002}; \

sched.D_lrate_dict = EasyDict(sched.G_lrate_dict); train.total_kimg = 99000

最后的结果会被保存到results/00001-sgan-faces-2gpu(00001代表递增ID,sgan因为使用的是StyleGAN而非ProGAN,-faces是训练的数据集,-2gpu即我们使用的多GPU)。

4 运行过程

相比于训练其他GAN，StyleGAN更稳定更好训练，但是也容易出问题。

4.1 Crashproofing

StyleGAN容易在混合GPU(1080ti+Titan V)上训练时崩溃，低版本的Tensorflow上也是，可以升级解决。如果崩溃了，代码无法自动继续上一次的训练迭代次数，需要手工在training_loop.py中修改resume_run_id为最后崩溃时的迭代次数。建议将此处的resume_run_id参数修改为resume_run_id=latest。

4.2 调节学习率

学习率这个是最重要的超参数之一：在小batch size数据过大的更新会极大破坏GAN的稳定性和最终结果。论文在FFHQ数据集上，8个GPU，32的batch size时使用的学习率是0.003，但是在我们的动画数据集上，batch size=8更低的学习率效果更好。学习率与batch size非常相关，越难的数据集学习率应该更小。

4.3 G/D的均衡

在后续的训练中，如果G没有产生很好的进步，没有朝着0.5的损失前进(而对应的D的损失朝着0.5大幅度缩减)，并且在-1.0左右卡住或者其他的问题。此时，有必要调节G/D的均衡了。有几种方法可以完成此事，最简单的办法是在train.py中调节sched.G_lrate_dict的学习率参数。

需要时刻关注G/D的损失，以及面部图像的perceptual质量，同时需要基于面部图像以及G/D的损失是否在爆炸或者严重不均衡而减小G和D的学习率(或者只减小D的学习率)。我们设想的是G/D的损失在一个确定的绝对损失值，同时质量有肉眼可见的提高，减小D的学习率有助于保持与G的均衡。当然如果超出你的耐心，或者时间不够，可以考虑同时减小D/G的学习率达到一个局部最优。

默认的0.003的学习率可能在达到高质量的面部和肖像图像时变得太高，可以将其减小三分之一或十分之一。如果任然不能收敛，D可能太强，可以单独的将其能力降低。由于训练的随机性和损失的相对性，可能需要在修改参数之后的很多小时或者很多天之后才能看到效果。

4.4 跳过FID指标

一些指标用来计算日志。FID指标是ImageNet CNN的计算指标，可能在ImageNet中重要的特性在你的特定领域中其实是不相关的，并且一个大的FID如100是可以考虑的，FIDs为20或者增大都不太是个问题或者是个有用的指导，还不如直接看生成的样本呢。建议直接禁用FIDs指标(训练阶段并没有，所以直接禁用是安全的)。

可以直接通过注释metrics.run的调用来禁用

5@@ -261,7 +265,7 @@ def training_loop()

if cur_tick % network_snapshot_ticks == 0 or done or cur_tick == 1:

pkl = os.path.join(submit_config.run_dir, 'network-snapshot-%06d.pkl' % (cur_nimg // 1000))

misc.save_pkl((G, D, Gs), pkl)

# metrics.run(pkl, run_dir=submit_config.run_dir, num_gpus=submit_config.num_gpus, tf_config=tf_config)

4.5 BLOB(斑块)和CRACK(裂缝)缺陷

训练过程中，blobs(可以理解为斑块)时不时出现。这些blobs甚至出现在训练的后续阶段，在一些已经生成的高质量图像上，并且这些blob可能是与StyleGAN独有的(至少没有在其他GAN上出现过这个blob)。这些blob如此大并且刺眼。这些斑块出现的原因未知，据推测可能是$3\times 3$的卷积层导致的；可能使用额外的$1\times 1$卷积或者自相关层可以消除这个问题。

如果斑块出现得太频繁或者想完全消除，降低学习率达到一个局部最优可能有用。

训练动漫人物面部时，我看到了其他的缺陷，看起来像裂缝或者波浪或者皮肤上的皱纹，它们会一直伴随着训练直至最终。在小数据集做迁移学习时会经常出现。与blob斑块相反，我目前怀疑裂缝的出现是过拟合的标识，而非StyleGAN的一种特质。当G开始记住最终的线条或像素上的精细细节的噪音时，目前的仅有的解决方案是要么停止训练要么增加数据。

4.6 梯度累加

ProGAN/StyleGAN的代码宣称支持梯度累加，这是一种形似大的minibatch训练(batch_size=2048)的技巧，它通过不向后传播每个minibatch，但是累加多个minibatch，然后一次执行的方式实现。这是一种保持训练稳定的有效策略，增加minibatch尺寸有助于提高生成图像的质量。

但是ProGAN/StyleGAN的梯度累加的实现在Tensorflow或Pytorch中并没有类似的，以我个人的经验来看，最大可以加到4096，但是并没有看到什么区别，所以我怀疑这个实现是错误的。

下面是我训练的动漫人脸的模型，训练了21980步，在2100万张图像上，38个GPU一天，尽管还没完全收敛，但是效果很好。

训练效果

5 采样

5.1 PSI/Truncation Trick

截断技巧$\phi$ 是所有StyleGAN生成器的最重要的超参数。它用在样本生成阶段，而非训练时。思路是，编辑latent 向量z，一个服从N(0,1)分布的向量，会自动删除所有大于特定值，比如0.5或1.0的变量。这看起来会避免极端的latent值，或者删除那些与G组合不太好的latent值。G不会生成与每个latent值在+1.5SD的点生成很多数据点。

代价便是这些依然是全部latent变量的何方区域，并且可以在训练期间被用来覆盖部分数据分布。因而，尽管latent变量接近0的均值才是最准确的模型，它们仅仅是全部可能的产生图像的数据空间上的一小部分。因而，我们可以从全部的无限制的正态分布$N(0,1)$上生成latent变量，也既可以截断如$+1SD或者+0.7SD$。

$\omega =0$时，多样性为0，并且所有生成的脸都是同一个角度(棕色眼睛，棕色头发的校园女孩，毫无例外的)，在$\omega \pm 0.5$时有更多区间的脸，在$\omega \pm 1.2$时会看到大量的多样性的脸/发型/一致性,但是也能看到大量的伪造像/失真像.参数$\omega$会极大地影响原始的输出。$\omega =1.2$时，得到的是异常原始但是极度真实或者失真。$\omega =0.5$时，具备一致连贯性，但是也很无聊。我的大部分采样，设置$\omega =0.7$可以得到最好的均衡。(就个人来说$\omega =1.2$时，采样最有趣)

5.2 随机采样

StyleGAN有个简单的脚本prtrained_example.py下载和生成单张人脸，为了复现效果，它在模型中指定了RNG随机数的种子，这样它会生成特定的人脸。然而，可以轻易地引入使用本地模型并生成，比如说1000张图像，指定参数$\omega =0.6$(此时会产生高质量图像，但是图像多样性较差)并保存结果到results/example-{0-999}.png

25import os

import pickle

import numpy as np

import PIL.Image

import dnnlib

import dnnlib.tflib as tflib

import config

def main():

tflib.init_tf()

_G, _D, Gs = pickle.load(open("results/02051-sgan-faces-2gpu/network-snapshot-021980.pkl", "rb"))

Gs.print_layers()

for i in range(0,1000):

rnd = np.random.RandomState(None)

latents = rnd.randn(1, Gs.input_shape[1])

fmt = dict(func=tflib.convert_images_to_uint8, nchw_to_nhwc=True)

images = Gs.run(latents, None, truncation_psi=0.6, randomize_noise=True, output_transform=fmt)

os.makedirs(config.result_dir, exist_ok=True)

png_filename = os.path.join(config.result_dir, 'example-'+str(i)+'.png')

PIL.Image.fromarray(images[0], 'RGB').save(png_filename)

if __name__ == "__main__":

main()

5.3 Karras et al 2018图像

此图像展示了使用1024像素的FFHQ 脸部模型(以及其他)，使用脚本generate_figure.py生成随机样本以及style noise的方面影响。此脚本需要大量修改来运行我的512像素的动漫人像。

代码使用$\omega=1.0$截断，但是面部在$\omega=0.7$的时候看起来更好(好几个脚本都是用了truncation_psi=,但是严格来说，图3的draw_style_mixiing_figure将参数$\omega$隐藏在全局变量sythesis_kwargs中)

载入模型需要被换到动漫面部模型

需要将维度$1024\rightarrow 512$，其他被硬编码(hardcoded)的区间(ranges)必须被减小到521像素的图像。

截断技巧图8并没有足够的足够的面部来展示latent空间的用处，所以它需要被扩充来展示随机种子和面部图像，以及更多的$\omega$值。

bedroom/car/cat样本应该被禁用

代码改动如下

54url_cars = 'https://drive.google.com/uc?id=1MJ6iCfNtMIRicihwRorsM3b7mmtmK9c3' # karras2019stylegan-cars-512x384.pkl

url_cats = 'https://drive.google.com/uc?id=1MQywl0FNt6lHu8E_EUqnRbviagS7fbiJ' # karras2019stylegan-cats-256x256.pkl

-synthesis_kwargs = dict(output_transform=dict(func=tflib.convert_images_to_uint8, nchw_to_nhwc=True), minibatch_size=8)

+synthesis_kwargs = dict(output_transform=dict(func=tflib.convert_images_to_uint8, nchw_to_nhwc=True), minibatch_size=8, truncation_psi=0.7)

_Gs_cache = dict()

def load_Gs(url):

- if url not in _Gs_cache:

- with dnnlib.util.open_url(url, cache_dir=config.cache_dir) as f:

- _G, _D, Gs = pickle.load(f)

- _Gs_cache[url] = Gs

- return _Gs_cache[url]

+ _G, _D, Gs = pickle.load(open("results/02051-sgan-faces-2gpu/network-snapshot-021980.pkl", "rb"))

+ return Gs

#----------------------------------------------------------------------------

# Figures 2, 3, 10, 11, 12: Multi-resolution grid of uncurated result images.

@@ -85,7 +82,7 @@ def draw_noise_detail_figure(png, Gs, w, h, num_samples, seeds):

canvas = PIL.Image.new('RGB', (w * 3, h * len(seeds)), 'white')

for row, seed in enumerate(seeds):

latents = np.stack([np.random.RandomState(seed).randn(Gs.input_shape[1])] * num_samples)

- images = Gs.run(latents, None, truncation_psi=1, **synthesis_kwargs)

+ images = Gs.run(latents, None, **synthesis_kwargs)

canvas.paste(PIL.Image.fromarray(images[0], 'RGB'), (0, row * h))

for i in range(4):

crop = PIL.Image.fromarray(images[i + 1], 'RGB')

@@ -109,7 +106,7 @@ def draw_noise_components_figure(png, Gs, w, h, seeds, noise_ranges, flips):

all_images = []

for noise_range in noise_ranges:

tflib.set_vars({var: val * (1 if i in noise_range else 0) for i, (var, val) in enumerate(noise_pairs)})

- range_images = Gsc.run(latents, None, truncation_psi=1, randomize_noise=False, **synthesis_kwargs)

+ range_images = Gsc.run(latents, None, randomize_noise=False, **synthesis_kwargs)

range_images[flips, :, :] = range_images[flips, :, ::-1]

all_images.append(list(range_images))

@@ -144,14 +141,11 @@ def draw_truncation_trick_figure(png, Gs, w, h, seeds, psis):

def main():

tflib.init_tf()

os.makedirs(config.result_dir, exist_ok=True)

- draw_uncurated_result_figure(os.path.join(config.result_dir, 'figure02-uncurated-ffhq.png'), load_Gs(url_ffhq), cx=0, cy=0, cw=1024, ch=1024, rows=3, lods=[0,1,2,2,3,3], seed=5)

- draw_style_mixing_figure(os.path.join(config.result_dir, 'figure03-style-mixing.png'), load_Gs(url_ffhq), w=1024, h=1024, src_seeds=[639,701,687,615,2268], dst_seeds=[888,829,1898,1733,1614,845], style_ranges=[range(0,4)]*3+[range(4,8)]*2+[range(8,18)])

- draw_noise_detail_figure(os.path.join(config.result_dir, 'figure04-noise-detail.png'), load_Gs(url_ffhq), w=1024, h=1024, num_samples=100, seeds=[1157,1012])

- draw_noise_components_figure(os.path.join(config.result_dir, 'figure05-noise-components.png'), load_Gs(url_ffhq), w=1024, h=1024, seeds=[1967,1555], noise_ranges=[range(0, 18), range(0, 0), range(8, 18), range(0, 8)], flips=[1])

- draw_truncation_trick_figure(os.path.join(config.result_dir, 'figure08-truncation-trick.png'), load_Gs(url_ffhq), w=1024, h=1024, seeds=[91,388], psis=[1, 0.7, 0.5, 0, -0.5, -1])

- draw_uncurated_result_figure(os.path.join(config.result_dir, 'figure10-uncurated-bedrooms.png'), load_Gs(url_bedrooms), cx=0, cy=0, cw=256, ch=256, rows=5, lods=[0,0,1,1,2,2,2], seed=0)

- draw_uncurated_result_figure(os.path.join(config.result_dir, 'figure11-uncurated-cars.png'), load_Gs(url_cars), cx=0, cy=64, cw=512, ch=384, rows=4, lods=[0,1,2,2,3,3], seed=2)

- draw_uncurated_result_figure(os.path.join(config.result_dir, 'figure12-uncurated-cats.png'), load_Gs(url_cats), cx=0, cy=0, cw=256, ch=256, rows=5, lods=[0,0,1,1,2,2,2], seed=1)

+ draw_uncurated_result_figure(os.path.join(config.result_dir, 'figure02-uncurated-ffhq.png'), load_Gs(url_ffhq), cx=0, cy=0, cw=512, ch=512, rows=3, lods=[0,1,2,2,3,3], seed=5)

+ draw_style_mixing_figure(os.path.join(config.result_dir, 'figure03-style-mixing.png'), load_Gs(url_ffhq), w=512, h=512, src_seeds=[639,701,687,615,2268], dst_seeds=[888,829,1898,1733,1614,845], style_ranges=[range(0,4)]*3+[range(4,8)]*2+[range(8,16)])

+ draw_noise_detail_figure(os.path.join(config.result_dir, 'figure04-noise-detail.png'), load_Gs(url_ffhq), w=512, h=512, num_samples=100, seeds=[1157,1012])

+ draw_noise_components_figure(os.path.join(config.result_dir, 'figure05-noise-components.png'), load_Gs(url_ffhq), w=512, h=512, seeds=[1967,1555], noise_ranges=[range(0, 18), range(0, 0), range(8, 18), range(0, 8)], flips=[1])

+ draw_truncation_trick_figure(os.path.join(config.result_dir, 'figure08-truncation-trick.png'), load_Gs(url_ffhq), w=512, h=512, seeds=[91,388, 389, 390, 391, 392, 393, 394, 395, 396], psis=[1, 0.7, 0.5, 0.25, 0, -0.25, -0.5, -1])

修改完之后，可以得到一些有趣的动漫人脸样本。

上图是随机样本

上图是使用风格混合样本。展示了编辑和差值(第一行是风格，左边列代表了要转变风格的图像)

上图展示了使用阶段技巧的。10张随机面部，$\omega$区间为$[1,0.7,0.5,0.25,-0.25,-0.5,-1]$展示了在多样性/质量/平均脸之间的妥协。

6 视频

6.1 训练剪辑

最简单的样本时在训练过程中产生的中间结果，训练过程中由于分辨率递增和更精细细节的生成，样本尺寸也会增加，最后视频可能会很大(动漫人脸大概会有14MB)，所以有必要做一些压缩。使用工具pngnq+adg或者将它们转成JPG格式(图像质量会降低)，在PNG图像上使用FFmpeg将训练过程中的图像转成视频剪辑。

9cat $(ls ./results/*faces*/fakes*.png | sort --numeric-sort) | ffmpeg -framerate 10 \ # show 10 inputs per second

-i - # stdin

-r 25 # output frame-rate; frames will be duplicated to pad out to 25FPS

-c:v libx264 # x264 for compatibility

-pix_fmt yuv420p # force ffmpeg to use a standard colorspace - otherwise PNG colorspace is kept, breaking browsers (!)

-crf 33 # adequate high quality

-vf "scale=iw/2:ih/2" \ # shrink the image by 2x, the full detail is not necessary & saves space

-preset veryslow -tune animation \ # aim for smallest binary possible with animation-tuned settings

./stylegan-facestraining.mp4

6.2 差值

原始的ProGAN仓库代码提供了配置文件来生成差值视频的，但是在StyleGAN中被移除了，Cyril Diagne的替代实现(已经没法打开了)提供了三种视频

random_grid_404.mp4:标准差值视频，在latent空间中简单的随机游走。修改这些所有变量变量并做成动画，默认会作出$2\times 2$一共4个视频。几个差值视频可以从这里看到

interpolate.mp4:粗糙的风格混合视频。生成单一的源面部图，一个二流的差值视频，在生成之前在latent空间中随机游走，每个随机步，其粗糙(coarse)/高级(high-level)风格噪音都会从随机步复制到源面部风格噪音数据中。对于面部来说，源面部会被各式各样地修改，比如方向、面部表情，但是基本面部可以被识别。

下面是video.py代码

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195import os

import pickle

import numpy as np

import PIL.Image

import dnnlib

import dnnlib.tflib as tflib

import config

import scipy

def main():

tflib.init_tf()

# Load pre-trained network.

# url = 'https://drive.google.com/uc?id=1MEGjdvVpUsu1jB4zrXZN7Y4kBBOzizDQ'

# with dnnlib.util.open_url(url, cache_dir=config.cache_dir) as f:

## NOTE: insert model here:

_G, _D, Gs = pickle.load(open("results/02047-sgan-faces-2gpu/network-snapshot-013221.pkl", "rb"))

# _G = Instantaneous snapshot of the generator. Mainly useful for resuming a previous training run.

# _D = Instantaneous snapshot of the discriminator. Mainly useful for resuming a previous training run.

# Gs = Long-term average of the generator. Yields higher-quality results than the instantaneous snapshot.

grid_size = [2,2]

image_shrink = 1

image_zoom = 1

duration_sec = 60.0

smoothing_sec = 1.0

mp4_fps = 20

mp4_codec = 'libx264'

mp4_bitrate = '5M'

random_seed = 404

mp4_file = 'results/random_grid_%s.mp4' % random_seed

minibatch_size = 8

num_frames = int(np.rint(duration_sec * mp4_fps))

random_state = np.random.RandomState(random_seed)

# Generate latent vectors

shape = [num_frames, np.prod(grid_size)] + Gs.input_shape[1:] # [frame, image, channel, component]

all_latents = random_state.randn(*shape).astype(np.float32)

import scipy

all_latents = scipy.ndimage.gaussian_filter(all_latents, [smoothing_sec * mp4_fps] + [0] * len(Gs.input_shape), mode='wrap')

all_latents /= np.sqrt(np.mean(np.square(all_latents)))

def create_image_grid(images, grid_size=None):

assert images.ndim == 3 or images.ndim == 4

num, img_h, img_w, channels = images.shape

if grid_size is not None:

grid_w, grid_h = tuple(grid_size)

else:

grid_w = max(int(np.ceil(np.sqrt(num))), 1)

grid_h = max((num - 1) // grid_w + 1, 1)

grid = np.zeros([grid_h * img_h, grid_w * img_w, channels], dtype=images.dtype)

for idx in range(num):

x = (idx % grid_w) * img_w

y = (idx // grid_w) * img_h

grid[y : y + img_h, x : x + img_w] = images[idx]

return grid

# Frame generation func for moviepy.

def make_frame(t):

frame_idx = int(np.clip(np.round(t * mp4_fps), 0, num_frames - 1))

latents = all_latents[frame_idx]

fmt = dict(func=tflib.convert_images_to_uint8, nchw_to_nhwc=True)

images = Gs.run(latents, None, truncation_psi=0.7,

randomize_noise=False, output_transform=fmt)

grid = create_image_grid(images, grid_size)

if image_zoom > 1:

grid = scipy.ndimage.zoom(grid, [image_zoom, image_zoom, 1], order=0)

if grid.shape[2] == 1:

grid = grid.repeat(3, 2) # grayscale => RGB

return grid

# Generate video.

import moviepy.editor

video_clip = moviepy.editor.VideoClip(make_frame, duration=duration_sec)

video_clip.write_videofile(mp4_file, fps=mp4_fps, codec=mp4_codec, bitrate=mp4_bitrate)

# import scipy

# coarse

duration_sec = 60.0

smoothing_sec = 1.0

mp4_fps = 20

num_frames = int(np.rint(duration_sec * mp4_fps))

random_seed = 500

random_state = np.random.RandomState(random_seed)

w = 512

h = 512

#src_seeds = [601]

dst_seeds = [700]

style_ranges = ([0] * 7 + [range(8,16)]) * len(dst_seeds)

fmt = dict(func=tflib.convert_images_to_uint8, nchw_to_nhwc=True)

synthesis_kwargs = dict(output_transform=fmt, truncation_psi=0.7, minibatch_size=8)

shape = [num_frames] + Gs.input_shape[1:] # [frame, image, channel, component]

src_latents = random_state.randn(*shape).astype(np.float32)

src_latents = scipy.ndimage.gaussian_filter(src_latents,

smoothing_sec * mp4_fps,

mode='wrap')

src_latents /= np.sqrt(np.mean(np.square(src_latents)))

dst_latents = np.stack(np.random.RandomState(seed).randn(Gs.input_shape[1]) for seed in dst_seeds)

src_dlatents = Gs.components.mapping.run(src_latents, None) # [seed, layer, component]

dst_dlatents = Gs.components.mapping.run(dst_latents, None) # [seed, layer, component]

src_images = Gs.components.synthesis.run(src_dlatents, randomize_noise=False, **synthesis_kwargs)

dst_images = Gs.components.synthesis.run(dst_dlatents, randomize_noise=False, **synthesis_kwargs)

canvas = PIL.Image.new('RGB', (w * (len(dst_seeds) + 1), h * 2), 'white')

for col, dst_image in enumerate(list(dst_images)):

canvas.paste(PIL.Image.fromarray(dst_image, 'RGB'), ((col + 1) * h, 0))

def make_frame(t):

frame_idx = int(np.clip(np.round(t * mp4_fps), 0, num_frames - 1))

src_image = src_images[frame_idx]

canvas.paste(PIL.Image.fromarray(src_image, 'RGB'), (0, h))

for col, dst_image in enumerate(list(dst_images)):

col_dlatents = np.stack([dst_dlatents[col]])

col_dlatents[:, style_ranges[col]] = src_dlatents[frame_idx, style_ranges[col]]

col_images = Gs.components.synthesis.run(col_dlatents, randomize_noise=False, **synthesis_kwargs)

for row, image in enumerate(list(col_images)):

canvas.paste(PIL.Image.fromarray(image, 'RGB'), ((col + 1) * h, (row + 1) * w))

return np.array(canvas)

# Generate video.

import moviepy.editor

mp4_file = 'results/interpolate.mp4'

mp4_codec = 'libx264'

mp4_bitrate = '5M'

video_clip = moviepy.editor.VideoClip(make_frame, duration=duration_sec)

video_clip.write_videofile(mp4_file, fps=mp4_fps, codec=mp4_codec, bitrate=mp4_bitrate)

import scipy

duration_sec = 60.0

smoothing_sec = 1.0

mp4_fps = 20

num_frames = int(np.rint(duration_sec * mp4_fps))

random_seed = 503

random_state = np.random.RandomState(random_seed)

w = 512

h = 512

style_ranges = [range(6,16)]

fmt = dict(func=tflib.convert_images_to_uint8, nchw_to_nhwc=True)

synthesis_kwargs = dict(output_transform=fmt, truncation_psi=0.7, minibatch_size=8)

shape = [num_frames] + Gs.input_shape[1:] # [frame, image, channel, component]

src_latents = random_state.randn(*shape).astype(np.float32)

src_latents = scipy.ndimage.gaussian_filter(src_latents,

smoothing_sec * mp4_fps,

mode='wrap')

src_latents /= np.sqrt(np.mean(np.square(src_latents)))

dst_latents = np.stack([random_state.randn(Gs.input_shape[1])])

src_dlatents = Gs.components.mapping.run(src_latents, None) # [seed, layer, component]

dst_dlatents = Gs.components.mapping.run(dst_latents, None) # [seed, layer, component]

def make_frame(t):

frame_idx = int(np.clip(np.round(t * mp4_fps), 0, num_frames - 1))

col_dlatents = np.stack([dst_dlatents[0]])

col_dlatents[:, style_ranges[0]] = src_dlatents[frame_idx, style_ranges[0]]

col_images = Gs.components.synthesis.run(col_dlatents, randomize_noise=False, **synthesis_kwargs)

return col_images[0]

# Generate video.

import moviepy.editor

mp4_file = 'results/fine_%s.mp4' % (random_seed)

mp4_codec = 'libx264'

mp4_bitrate = '5M'

video_clip = moviepy.editor.VideoClip(make_frame, duration=duration_sec)

video_clip.write_videofile(mp4_file, fps=mp4_fps, codec=mp4_codec, bitrate=mp4_bitrate)

if __name__ == "__main__":

main()

fine_503.mp4：一个精细风格混合视频。

7 模型

7.1 动漫人脸

训练的基准模型的数据来源是上面的数据预处理和训练阶段介绍过。是一个在218794张动漫人脸上，使用512像素的StyleGAN训练出来的，数据时所有Danboru2017数据集上裁剪的，清洗、上采样，并训练了21980次迭代，38个GPU天。

下载(推荐使用最近的portrait StyleGAN,除非需要特别剪切的脸部)

随机样本在2019年2月14日随机生成的，使用了一个极大的$\omega=1.2$(165MB,JPG)

8 迁移学习

特定的动漫人脸模型迁移学习到特定角色是很简单的：角色的图像太少，无法训练一个好的StyleGAN模型，同样的，采样不充分的StyleGAN的数据增强也不行，但是由于StyleGAN在所有类型的动漫人脸训练得到，StyleGAN学习到足够充分的特征空间，可以轻易地拟合到特定角色而不会出现过拟合。

制作特定脸部模型时，图像数量越多越好，但是一般n=500-5000足矣，甚至n=50都可以。论文中的结论

尽管StyleGAN的 generator是在人脸数据集上训练得到的，但是其embeding算法足以表征更大的空间。论文中的图表示，虽然比不上生成人脸的效果，但是依然能获得不错的高质量的猫、狗甚至油画和车辆的表征如果说连如此不同的车辆都可以被成功编码进人脸的StyleGAN，那么很显然latent空间可以轻易地对一个新的人脸建模。因此，我们可以判断训练过程可能与学习新面孔不太相关，这样任务就简单许多。

由于StyleGAN目前是非条件生成网络也没有在限定领域文本或元数据上编码，只使用了海量图片，所有需要做的就是将新数据集编码，然后简单地在已有模型基础上开始训练就可以了。

准备新数据集

编辑train.py,给-desc行重新赋值

正确地给resume_kimg赋值，resume_run_id="latest"

开始运行python train.py，就可以迁移学习了

主要问题是，没法从头开始(第0次迭代)，我尝试过这么做，但是效果不好并且StyleGAN看起来可能直接忽视了预训练模型。我个人假设是，作为ProGAN的一部分，在额外的分辨率或网络层上增长或消退，StyleGAN简单的随机或擦除新的网络层并覆盖它们，这使得这么做没有意义。这很好避免，简单地跳过训练进程，直接到期望的分辨率。例如，开始一个512像素的数据集训练时，可以在training_loop.py中设置resume_king=7000。这会强行让StyleGAN跳过所有的progressing growing步骤，并载入全部的模型。如何校验呢？检查第一幅吐下你给(fakes07000.png或者其他的)，从之前的任何的迁移学习训练完成，它应当看起来像是原始模型在训练结束时的效果。接下来的训练样本应该表现出原始图像快速适应(变形到)新数据集(应该不会出现类似fakes0000.png的图像，因为这表明是从头开始训练)

8.1 动漫人脸模型迁移到特定角色人脸

第一个迁移的角色是 Holo，使用了从Danboru2017的数据集中筛选出来的Holo面部图像，使用waifu2x缩放到512像素，手工清理，并做数据增强，从3900张增强到12600张图像，同时使用了镜像翻转，因为Holo面部是对称的。使用的预训练模型是2019年2月9号的一个动漫人脸模型，尚未完全收敛。

值得一提的是，这个数据集之前用ProGAN来训练的，但是几周的训练之后，ProGAN严重过拟合，并产生崩坏。

训练过程相当快，只有几百次迭代之后就可以看到肉眼可见的Holo的脸部图了。

StyleGAN要成功得多，尽管有几个失败的点出现在动漫人脸上。事实上，几百次迭代之后，它开始过拟合这些裂缝/伪影/脏点。最终使用的是迭代次数为11370的模型，而且依然有些过拟合。我个人认为总数n(数据增强之后)，Holo应该训练训练更长时间(FFHQ数据集的1/7)，但是显然不是。可能数据增强并没有太大价值，又或者要么多样性编码并没那么有用，要么这些操作有用，但是StyleGAN已经从之前的训练中学习到，并且需要更多真实数据来理解Holo的面部。

11370次迭代的模型下载

8.2 动漫人脸迁移到FFHQ人脸

如果StyleGAN可以平滑地表征动漫人脸，并使用参数$\omega$承载了全局的如头发长度+颜色属性转换，参数$\omega$可能一种快速的方式来空值单一角色的大尺度变化。例如，性别变换，或者动漫到真人的变换？(给定图像/latent向量，可以简单地改变正负号来将其变成相反的属性，这可以每个随机脸相反的版本，而且如果有人有编码器，就可以自动地转换了)。

数据来源：可以方便的使用FFHQ下载脚本，然后将图像下采样到512像素，甚至构建一个FFHQ+动漫头像的数据集。

最快最先要做的是，从动漫人脸到FFHQ真人脸的迁移学习。可能模型无法得到足够的动漫知识，然后去拟合，但是值得一试。早期的训练结果如下，有点像僵尸

97次迭代(ticks)之后，模型收敛到一个正常的面孔，唯一可能保留的线索是一些训练样本中的过度美化的发型。

8.3 动漫脸—>动漫脸+FFHQ脸

下一步是同时训练动漫脸和FFHQ脸模型，尽管开始时数据集的鲜明的不同，将会是正的VS负的$\omega$最终导致划分为真实VS动漫，并提供一个便宜并且简单的方法来转换任意脸部图像。

简单的合并512像素的FFHQ脸部图像和521像素的动漫脸部，并从之前的FFHQ模型基础上训练(我怀疑，一些动漫图像数据仍然在模型中，因此这将会比从原始的动漫脸部模型中训练要快一点)。我训练了812次迭代，11359-12171张图像，超过2个GPU天。

它确实能够较好地学习两种类型的面孔，清晰地分离样本如下

但是，迁移学习和$\omega$采样的结果是不如意的，修改不同领域的风格混合，或者不同领域之间的转换的能力有限。截断技巧无法清晰地解耦期望的特征(事实上，多种$\omega$ 没法清晰对应什么)。

StyleGAN的动漫+FFHQ的风格混合结果。

9 逆转StyleGAN来控制和修改图像

一个非条件GAN架构，默认是单向的：latent向量z从众多$N(0,1)$变量中随机生成得到的，喂入GAN，并输出图像。没有办法让非条件GAN逆向，即喂入图像输出其latent。

最直接的方法是转向条件GAN架构，基于文本或者标签embeding。然后生成特定特征，戴眼镜，微笑。当前无法操作，因为生成一个带标签或者embedding并且训练的StyleGAN需要的不是一点半点的修改。这也不是一个完整的解决方案，因为它无法在现存的图像进行编辑。

对于非条件GAN，有两种实现方式来逆转G。

神经网络可以做什么，另外一个神经网络就可以学到逆操作。Donahue 2016,Donahue Simonyan 2019.如果StyleGAN学习到了$z$到图像的映射，那么训练第二个神经网络来监督学习从图像到$z$的映射，

你可能感兴趣的:(gan处理自己的数据集)

k8s nginx ingress原理解读鲫鱼哥 nginx kubernetes
阅读本文需要以下知识为前提了解k8s基本架构，k8s基本资源清单用自己的k8s实验环境首先了解ingress解决了什么问题k8s内部项目暴露外部访问，只用一个固定端口,暴露多个服务。相对于：LoadBlancerService、NodePortService更灵活更方便。pod漂移后的ip变化，自动识别podip修改nginx配置不用reload加载实现灰度发布（根据流量或者http请求头进行灰度
5分钟了解 Golang 的快速编译俞凡 DeepNoMind 程序人生
Golang通过一系列技术选择提升编译速度，包括简化依赖管理、高效的工具链、无预处理器、简单的语言设计以及增量编译等，这些策略使得Golang成为了开发人员的首选，尤其适合云计算等需要快速开发的领域。原文：GoSpeed:UnlockingtheSecretsofGo’sRapidCompilationGolang在开发过程中曾经发生过一件有趣的事，那就是是否需要优先考虑编译速度，Golang团队
Python虚拟环境介绍 weixin_34150224 python 操作系统
在使用Python语言的时候我们使用pip来安装第三方包，但是由于pip的特性，系统中只能安装每个包的一个版本。但是在实际项目开发中，不同项目可能需要第三方包的不同版本，Python的解决方案就是虚拟环境。顾名思义，虚拟环境就是虚拟出来的一个隔离的Python环境，每个项目都可以有自己的虚拟环境，用pip安装各自的第三方包，不同项目之间也不会存在冲突。创建虚拟环境需要一些工具，本文将会介绍这些工具
01背包与完全背包：正序Or倒叙遍历背包数究竟什么区别社恐不参团算法动态规划
01背包与完全背包：正序Or倒叙遍历背包数究竟什么区别第一次写，真的菜鸡的感性理解，如有理解错误之处，希望评论区多多指导刚开始学背包问题，虽然背代码很容易，但是着实蒙蔽此篇小文希望给新手一些帮助，放代码！//01背包问题for(inti=1;i>v>>w;//边输入边处理for(intj=m;j>=v;j--)//倒叙遍历背包数f[j]=max(f[j],f[j-v]
全面掌握React：2025年学习路径指南 chenNorth。前端 react react.js 学习前端
文章目录第一步：Web开发的基石——JavaScript与TypeScript第二步：Web设计的核心——HTML与CSS第三步：进入React的世界第四步：用TailwindCSS进行样式设计第五步：用Shadcn/UI增强你的UI第六步：用ReactHookForm处理表单第七步：用Next.js提升你的技能第八步：用Remix掌握全栈开发第九步：ReactNative+Expo：轻松开发移动
Linux系统python虚拟环境及HanLP部署段智华
在Linux系统中运行HanLP，要安装部署一个Python的虚拟环境，实现Python2与Python3的版本共存，Python虚拟环境与JavaJVM虚拟机的共存，HanLP是面向生产环境的多语种NLP工具包，HanLp的标记是一只蝴蝶，蝴蝶象征着蝴蝶效应、非线性与混沌理论——虽然微小，但足以改变世界！（《自然语言处理入门》图书作者何晗）Linuxopenssl、libssl-dev等模块安装
Haskell语言的编程范式编程|诗人包罗万象 golang 开发语言后端
Haskell语言的编程范式及其魅力引言Haskell是一种纯粹的函数式编程语言，自1987年首次发布以来，它一直在学术界和工业界保持着相对高的关注度。Haskell的编程范式与传统的命令式编程有着显著的不同，提供了一种更加优雅和强大的方式来处理计算和数据。本文将详细探讨Haskell语言的编程范式、其核心特性、以及在实际应用中的优势和局限性。一、编程范式的概念编程范式是指编程语言使用的基本风格或
零碎的知识点（十二）：卷积神经网络CNN通道数的理解！墨绿色的摆渡人零碎知识点 cnn 深度学习神经网络
卷积神经网络CNN通道数的理解！通道数的核心概念解析1.通道数的本质2.单张灰度图的处理示例：3.批量输入的处理通道与批次的关系：4.RGB三通道输入的处理计算过程：示例：5.通道数的实际意义6.可视化理解(1)单通道输入（灰度图）的过滤器(2)三通道输入（RGB）的过滤器总结通道数的核心概念解析1.通道数的本质在卷积神经网络中，通道数（Channels）表示不同过滤器的数量。每个通道对应一个独立
Anaconda 虚拟环境和 Python 虚拟环境主要的区别张biubiu python 开发语言
在PyCharm中配置Anaconda虚拟环境和Python虚拟环境主要的区别在于环境的管理方式和用途。下面我会分别解释这两种虚拟环境的特点，并说明它们的差异。1.Anaconda虚拟环境Anaconda是一个针对数据科学、机器学习等应用领域优化的Python发行版，它提供了Python、R和大量的科学计算和数据处理包（如NumPy、Pandas、SciPy、Matplotlib等）的集成，且方便
vue3+vite+Electron构建跨平台应用 vitenode Electron electron javascript 前端
1.搭建第一个electron-vite项目electron-vite是一个新型构建工具，旨在为Electron提供更快、更精简的开发体验。它主要由五部分组成：一套构建指令，它使用Vite打包你的代码，并且它能够处理Electron的独特环境，包括Node.js和浏览器环境。集中配置主进程、渲染器和预加载脚本的Vite配置，并针对Electron的独特环境进行预配置。为渲染器提供快速模块热替换（H
麒麟系统常见问题 steven~~~ 新浪微博
1安装vscodedeb文件kylin@kylin:~/lyn/software$sudodpkg-icode_1.88.1-1712771838_amd64.debdpkg:处理归档code_1.88.1-1712771838_amd64.deb(–install)时出错：软件包体系结构(amd64)与本机系统体系结构(arm64)不符在处理时有错误发生：code_1.88.1-17127718
【详细讲解】hive优化 songqq27 大数据 hive
1、开启本地模式大多数的HadoopJob是需要Hadoop提供的完整的可扩展性来处理大数据集的。不过，有时Hive的输入数据量是非常小的。在这种情况下，为查询触发执行任务消耗的时间可能会比实际job的执行时间要多的多。对于大多数这种情况，Hive可以通过本地模式在单台机器上处理所有的任务。对于小数据集，执行时间可以明显被缩短。用户可以通过设置hive.exec.mode.local.auto的值
# Nacos学习 Jeff-Jiang java 阿里云后端
1、Nacos是什么？Nacos是一个应用，阿里巴巴开发并开源的一个项目，主要用于微服务架构中的服务发现、配置管理和服务治理。2、Nacos能够做什么，有什么功能？Nacos是一个用于构建云原生应用的动态服务发现、配置和服务管理平台。以下是Nacos的主要功能:服务发现与管理：服务注册：服务提供者可以在Nacos上注册自己的服务，包括服务的名称、地址、端口等信息。服务发现：服务消费者可以通过Nac
Serverless Architecture Boilerplate 使用教程谢璋声Shirley
ServerlessArchitectureBoilerplate使用教程serverless-architecture-boilerplate:package::zap::rocket:BoilerplatetoorganizeanddeploybigprojectsusingAWSAPIGatewayandAWSLambdawithServerlessFramework项目地址:https:/
在 Python 中如何删除文本文件中的特定行信息科技云课堂 python
目录：方法1：按照行号删除行方法2：通过匹配内容删除行方法3：删除包含特定字符串的行方法4：删除文件中最短的行在本文中，将介绍使用Python从文本文件中删除行的几种方法。由于Python没有提供删除文件中特定行的直接方法，因此有必要找到我们自己的方法。文中示例使用的文本文件“1.txt”内容如下：穿针引线无忧无虑无地自容学习三位一体原来如此落叶归根相见恨晚惊天动地滔滔不绝相濡以沫方法1：按照行号
斯坦福吴恩达-深度学习和机器学习全套视频+课件！ Alexquyun 人工智能机器学习深度学习 python
这些课程专为已有一定基础（基本的编程知识，熟悉Python、对机器学习有基本了解），想要尝试进入人工智能领域的计算机专业人士准备。介绍显示：“深度学习是科技业最热门的技能之一，本课程将帮你掌握深度学习。”学生将可以学习到深度学习的基础，学会构建神经网络，并用在包括吴恩达本人在内的多位业界顶尖专家指导下创建自己的机器学习项目。DeepLearningSpecialization对卷积神经网络(CNN
Oracle备份恢复工作：Oracle数据库的导出与导入。杨云龙666 数据库
当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障(硬件故障、软件故障、网络故障、进程故障和系统故障)影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库该处理称为数据库恢复，而要进行数据库的恢复必须要有数据库的备份工作。1整库导出与导入注意：（整库导出与导入：数据量比较大，耗
python将自己的代码文件封装成库没有名字233 python 开发语言
Python,封装相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel将Python代码文件封装成库的步骤1.创建项目目录结构首先，我们需要创建一个项目目录，用于存放我们的代码文件和库文件。可以按照以下结构创建：登录后复制my_library/├──my_module
kakfa-消息不丢失华东算法王（原聪明的小孩子 facebook twitter 机器学习新浪微博微信公众平台
Kafka作为一个分布式流处理平台，设计时就高度关注消息的可靠性和不丢失，确保在分布式环境下即使发生故障，消息也不会丢失。Kafka的消息不丢失主要依赖以下几个机制：1.消息持久化Kafka保证消息在磁盘上的持久化，即使在系统崩溃的情况下，消息仍然可以恢复。这一机制是Kafka消息不丢失的基础。•写入日志文件：每个Kafka分区都将消息按顺序追加到磁盘上的日志文件中（logsegment）。这种顺
Java 阻塞队列（BlockingQueue）实战与原理详解吴冰_hogan juc java 网络协议网络
引言在多线程编程中，BlockingQueue是一种非常有用的同步工具，它不仅提供了线程安全的队列访问方式，还能够自动处理生产者和消费者之间的阻塞行为。本文将基于提供的文档内容，深入探讨BlockingQueue的工作原理及其在实际应用中的使用方法，并详细介绍几种常见的BlockingQueue实现。一、阻塞队列基础1.1定义与特性BlockingQueue是一个接口，定义了支持阻塞插入和移除操作
DeepSeek-V3模型：软件测试智能化的新篇章与挑战霍格沃兹测试开发学社测试人社区测试开发软件测试人工智能
在这个技术日新月异的时代，人工智能（AI）的每一次革新都在悄然改变着我们的生活和工作方式。最近，DeepSeekAI公司推出的DeepSeek-V3模型，凭借其卓越的文本处理能力、高效的推理速度以及多任务处理能力，为软件测试行业带来了一场前所未有的智能化变革。今天，我们就来深入探讨一下DeepSeek-V3在软件测试中的应用以及它所面临的挑战。智能化测试的新篇章DeepSeek-V3模型在软件测试
CPU缓存架构详解与Disruptor高性能内存队列实战吴冰_hogan juc 缓存架构 java
引言现代计算机系统的性能很大程度上取决于CPU与内存之间的交互效率。随着处理器技术的发展，CPU的速度远超主内存，为了弥补这种速度差异，引入了多级高速缓存（Cache）。然而，在多核环境下，缓存一致性成为了一个重要的问题。本文将详细介绍CPU缓存架构的工作原理、面临的挑战及解决方案，并探讨Disruptor这一高性能内存队列的设计理念和实际应用。1.CPU缓存架构详解1.1CPU高速缓存概念CPU
Java中的注解与反射：深入理解getAnnotation(Class＜T＞ annotationClass)方法 AllenBright #Java基础 java 开发语言
Java的注解（Annotation）是一种元数据机制，它允许我们在代码中添加额外的信息，这些信息可以在编译时或运行时被读取和处理。结合Java的反射机制（Reflection），我们可以在运行时动态地获取类、方法、字段等元素上的注解信息。本文将深入探讨getAnnotation(ClassannotationClass)方法的使用和原理，帮助读者更好地理解Java中的注解与反射机制。1.什么是g
微服务架构设计基础之立方体模型 weixin_34349320 后端前端系统架构 ViewUI
背景对于现在的微服务架构的应用来说，对大量并发的及时响应是一项制胜能力。据用户行为分析平台统计，随行付的某一款APP产品每日请求就达到上千万次用户请求、加解密服务3000万次/日等等。这些微服务每时每刻在处理如此高强度的请求，对数据层的应对能力要求极高。如果我们把对速度的需求放在复杂的分布式数据架构背景下，是很难想象如何让应用应对如此巨大的数据访问量的。但很幸运，我们有方法做到。即立方体模型。立方
自定义数据集使用scikit-learn中的包实现线性回归方法对其进行拟合辞落山 scikit-learn 线性回归 python
1.引言简要介绍线性回归模型及其在机器学习中的应用。2.创建自定义数据集通过生成一个简单的自定义数据集来模拟问题。可以使用numpy生成数据。importnumpyasnpimportmatplotlib.pyplotasplt#生成自定义数据np.random.seed(42)X=2*np.random.rand(100,1)y=4+3*X+np.random.randn(100,1)3.使用s
信息系统部分知识（了解就行应该很少考）一个比较菜的程序猿软考架构师架构
信息系统架构ISA是指对一特定内容里的信息进行统筹、规划、设计、安排等一系列有机处理的活动。架构是对系统的抽象，通过描述元素、元素的外部可见属性、元素之间的关系来反映，架构由多个结构组成，结构是从功能角度描述元素之间的关系。任何软件都有建构，但不一定有文档元素机器行为的集合构成架构的内容，体现系统有哪些元素、元素有哪些功能、元素之间如何链接互动。在静态(宏观、总体结构)动态(关键行为)抽象架构具有
能说说MyBatis的工作原理吗？ java1234_小锋 java java 开发语言
大家好，我是锋哥。今天分享关于【能说说MyBatis的工作原理吗？】面试题。希望对大家有帮助；能说说MyBatis的工作原理吗？1000道互联网大厂Java工程师精选面试题-Java资源分享网MyBatis是一个流行的持久化框架，它简化了数据库操作，通过映射SQL语句与Java对象之间的关系，使得开发者可以专注于业务逻辑，而不需要处理大量的数据库底层操作。它的工作原理主要围绕以下几个核心概念：1.
自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测知识鱼丸 machine learning 逻辑回归算法机器学习
1.数据准备首先，我们需要一些示例数据。在这个例子中，我们将生成一些简单的二维数据点，并为其分配标签。2.定义逻辑回归模型接下来，我们定义一个简单的逻辑回归模型。3.训练模型定义损失函数和优化器，然后进行模型训练。4.保存模型训练完成后，我们可以保存模型的状态字典。5.加载模型并进行预测加载保存的模型，并进行预测。importtorchimporttorch.nnasnnimporttorch.o
构建响应式管理后台系统（Python + Django + Bootstrap）后端架构魔术骑士 python django bootstrap Python
在本文中，我们将使用Python编程语言结合Django和Bootstrap框架来构建一个响应式管理后台系统。我们将使用Django作为后端框架，处理数据和业务逻辑，并使用Bootstrap作为前端框架，实现用户界面的设计和布局。环境设置和项目创建首先，确保你已经安装了Python和Django。在命令行中运行以下命令来创建一个新的Django项目：$django-adminstartprojec
使用numpy自定义数据集使用tensorflow框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预辞落山 numpy tensorflow 逻辑回归
1.引言逻辑回归（LogisticRegression）是一种常见的分类算法，广泛应用于二分类问题。在本篇博客中，我们将使用numpy生成一个简单的自定义数据集，并使用TensorFlow框架构建和训练逻辑回归模型。训练完成后，我们会保存模型，并演示如何加载保存的模型进行预测。2.创建自定义数据集首先，我们使用numpy生成一个简单的二分类数据集，包含两个特征和对应的标签。标签0表示负类，标签1表
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {