飞桨PaddlePaddle

基于飞桨PaddlePaddle实现BigGAN生成动漫图像——为艺术创作赋能

作为学力不足、码力有余的深度学习业余玩家，笔者在工作中忙里偷闲，借助AI Studio的免费GPU继续自己对于生成对抗网络落地应用的相关研究。尽管深度学习已在工业生成中广泛应用，但作为研究重头的视觉效果极佳的GAN的图像生成，却在应用中遇到了瓶颈。适逢AI Studio组织GAN相关的复现课程，笔者投入其中获取到了BigGAN模型结构的搭建方法，在膜拜于BigGAN强大的视觉表现效果时，开始踏上将国外独立研究者预训练的动漫BigGAN转换到PaddlePaddle中进行更深入探索的道路。因为PaddlePaddle的动态图更便于在模型各个推理位置进行调试和修改。

当然，使用预训练模型对于平民玩家也是不得已而为之，效果这么好的模型，要训练出来也不是一件轻松的事，所以我们只好在已经训练好的模型上玩耍了。本次实验使用的BigGAN模型与常规的BigGAN并无大的不同，但是研究者通过添加各种训练的trick让模型能生成绝妙的动漫图片，引发了笔者对BigGAN落地的可能性的思考，于是便有了这一篇文章的写就。

本项目更多的实验过程和结果可以到以下项目玩耍查看：

https://aistudio.baidu.com/aistudio/projectdetail/1141070

BigGAN的简介

GAN模型因为生成效果极佳，从而自2014年以来该领域技术发展非常快。但是直到BigGAN出来前，实现从ImageNet之类的复杂数据集中生成高分辨率、多样化的图像一直是一个难以实现的目标。于是，研究员们在土豪Nvidia的大量资源供给下，以超多GPU、超大批次的方式训练GAN模型，研究出GAN训练不稳定的原因。最终研究员们将正交正则化和“截断技巧”两种解决方案应用其中，并宣告完整版本BigGAN的诞生。不过在笔者看来，“大规模”对实验取得成功做的贡献要大得多。

BigGAN的接棒者

1. 同一团队的后续杰作

在BigGAN之后，出现了BigBiGAN，是研究团队先前的研究BiGAN同BigGAN的结合。BigBiGAN，相较于BigGAN，增加了Bi（双向），让鉴别器判断编码器产生的潜向量以及随机潜向量生成的图像是否都为真。不过这项研究并未引起如BigGAN一般的轰动，而BigGAN的加强版BigGANDeep通过将残差层内含的卷积层增加，反而更能引起研究者兴趣些。

2. 可对比的其它科研相关成果

如果将BigGAN看作是“按类生成”模型中的的霸主，那StyleGAN及其二代StyleGAN2便可谓是风格的混合与解耦相关的生成模型中的强者，最近爆火的人像迪士尼卡通化的原理便是基于此。不过相较于BigGAN，这两个模型在空间变换相当复杂的多图像中表现贫弱。或许，将StyleGAN的style潜向量解耦层嵌入BigGAN可以得到兼具二者优点的模型。

BigGAN的原理

简单思路

BigGAN的模型基线是Self Attention GAN，其本质不是算法的提升而是算力的提升，模型本身原理与Self Attention GAN是差不多的。研究者通过以下手段来逐渐实现BigGAN的绝佳效果：

1. 首先增加基线模型（Self Attention GAN）的batch_size，做出这一更改后，研究者立即就在训练过程中发现更好的生成结果。只是简单地将批量大小增加8倍，竟能使现有技术的Inception Score提高了46%。研究者推测这是因为每个批次覆盖了更多的模式，能为两个网络提供更好的梯度。这种缩放虽然能够在更少的迭代中取得更好的效果，但不可忽略的副作用是使得训练变得不稳定而容易完全崩溃。

2. 将每层中的宽度（通道数）增加50%，即大约两倍于两个模型中的参数数量。这一改变使得Inception Score进一步提高21%。研究者推断这是由于模型的容量需要随着数据集的复杂性而增加。不过，加倍深度似乎不会对使用ImageNet作为数据集的模型产生相同的影响，反而会降低性能。

放缩

当batch_size增大到原来8倍的时候，生成性能上的Inception Score提高了 46%。原论文中推测这可能是每个batch覆盖更多模式（即更多图像变化的可能）的结果，为生成和判别两个网络提供更好的梯度。增大batch_size还会带来在更少的时间训练出更好性能的模型，但增大batch_size同时会使得模型在训练上稳定性下降。

除了以上方法，它们的卷积网络用的通道数是还是原有方法的2-4倍，对复杂数据增加了模型的容量，增加宽度，乃至后面提出的BigGAN-Deep 增加了深度，通过残差+瓶颈网络，进一步提高了效果，更快的收敛。不过副作用是训练不稳定，容易崩。与此同时在网络中，使用了一层自注意力，每层都是用SN谱归一化，这同原来的Self Attention GAN并无太大区别。

分层潜在空间

模型的输入，也就是潜向量z（通过正态分布采样获得），研究者们不仅在底层输入潜向量z的一部分，还在中间的每个残差块都输入z的不同部分。

以生成128x128的图片为例，每个残差块对应一个z块，初始的全连接输入也需要一个。总共需要6个，若整个z的维度是120, 也就是每一部分输入的部分z的维度是20。

正如图所示，BigGAN在先验分布z的嵌入上做了改进，普遍的GAN都是将z作为输入直接嵌入生成网络，而 BigGAN 将潜向量z送到G的多个层而不仅仅是初始层，这实际降低了内存占用和训练成本，并使得训练更加可控。

如下图，将潜向量z分成多块，然后和条件标签c连接后一起送入到生成网络的各个层中，对于生成网络的每一个残差块又可以进一步展开为右图的结构。可以看到潜向量z的块和条件标签c在残差块下是通过合并操作后送入批次归一化层，其中这种嵌入是共享嵌入，线性投影到每个层的偏置和权重上。

而这种条件嵌入连带分类嵌入的特殊批次归一化，使得生成图像的类别可控。

截断技巧

虽然训练的时候用正态分布采样的潜向量z作为输入，但是研究者在测试采样的时候，通过调整幅度高于所选阈值的值落入阈值内来截断 z向量，使得单个样品质量的改善。代价是整体样品品种的减少。如下图截断强度增加，生成的狗狗也愈发相似，右侧是将截断应用于模型后产生饱和度伪影而导致的较差结果。

一般情况下，普通的截断只能有16%的优秀图像生成的成功率，否则就会出现上述的伪影。研究者通过引入正交正则化，使得截断约束更为松弛，成功率也达到了60%。该正则化公式如下：

笔者学力不足，对这一块倒是没有过深追究，因为仅仅是不含截断的BigGAN生成的动漫图像就已经很惊艳众人。

累加批次归一化

动漫版BigGAN使用的批次归一化（BatchNorm）和常见的稍微有一些不一样，称为累加批次归一化。在训练的过程中，这种归一化并不会通过滑动平均的方式逐渐存储均值和方差，而是每一批次都重新计算均值和方差。这种方式之所以可行的原因是，动漫版BigGAN训练的每个batch_size实在是太大了，大到一个批次里计算出来的均值和方差与实际整个数据集的均值和方差偏差不会太大。不过这也是训练过程中，在训练结束后需要再多此统计均值和方差将这两个值固定下来，使得小批次也能正常使用这个训练好的模型。这一点被动漫版BigGAN的研究者给一时疏忽掉了，以至于插值的结果非常糟糕。笔者发现了这个问题，并向他们提出，有幸帮助他们解决了一个大麻烦。

在飞桨上玩转模型

1. 从其它框架上将模型迁移到飞桨

在模型的搭建之初，笔者参考了其他研究者用PyTorch复现的BigGAN的模型架构，结果是万万没想到啊，训练出这个精妙的动漫生成模型的大神研究者，用的BigGAN模型与平时所见还有些迥异，甚至一些算子都不一样，便令人有些头疼。谁不想要一个能一键生成、轻松玩耍的模型呢？

可惜它不是。笔者只好开始了漫漫的算子对齐路。这个部分并不算是技术含量很高的地方，更加偏向于重复劳动。因为原模型是其它框架的静态图模型实现，对于笔者这个早已遁入动态图的选手来说，确实是一件劳心费力的事，好在模型的构成相对线性，没有造成太大麻烦。

在对齐算子后还要进行一番检验，需要先把权重转换为PaddlePaddle模型的权重，一般用NumPy作为二者权重转换的桥梁。通过hook手段记录中间输出，进行层层对比。也是一件相当繁琐的事情，因此还发现原模型使用的谱归一化与常见的谱归一化配置还不太一样，笔者不得不又去补了补课，重新实现了一份谱归一化的代码。当两边中间输出皆为接近0的结果时，笔者心中才松了口气。

2. 模型搭建

终于到了这一步，搭建推理玩耍用的模型，真是令人激动得搓手。为了实验时避免过多的变数，笔者将推理用的模型中使用的批次归一化（BatchNorm）和谱归一化（SpectralNorm）中本来每一次推理都会改变重新计算的值固定。

此次实验完成时使用的是PaddlePaddle 1.8.4动态图模式，不过不用担心，从1.8.4到2.0也很轻松转换的。

1、生成器的结构代码

import paddle
import paddle.fluid as fluid
from paddle.fluid import layers, dygraph as dg

class Generator(dg.Layer): # not trainable
    def __init__(self, code_dim=128, n_class=1000, chn=96, blocks_with_attention="B4", resolution=512):
        super().__init__()

        def GBlock(in_channel, out_channel, n_class, z_dim, use_attention):
            return ResBlock(in_channel, out_channel, n_class=n_class, z_dim=z_dim, use_attention=use_attention)

        self.embed_y = dg.Linear(n_class, 128, bias_attr=False)

        self.chn = chn
        self.resolution = resolution 
        self.blocks_with_attention = set(blocks_with_attention.split(",")) 
        self.blocks_with_attention.discard('')

        gblock = []
        in_channels, out_channels = self.get_in_out_channels()
        self.num_split = len(in_channels) + 1

        z_dim = code_dim//self.num_split + 128
        self.noise_fc = SpectralNorm(dg.Linear(code_dim//self.num_split, 4 * 4 * in_channels[0]))

        self.sa_ids = [int(s.split('B')[-1]) for s in self.blocks_with_attention]

        for i, (nc_in, nc_out) in enumerate(zip(in_channels, out_channels)):
            gblock.append(GBlock(nc_in, nc_out, n_class=n_class, z_dim=z_dim, use_attention=(i+1) in self.sa_ids))
        self.blocks = dg.LayerList(gblock)

        self.output_layer_bn = BatchNorm(1 * chn, epsilon=1e-5)
        self.output_layer_conv = SpectralNorm(dg.Conv2D(1 * chn, 3, [3, 3], padding=1))

    def get_in_out_channels(self):
        resolution = self.resolution
        if resolution == 1024:
            channel_multipliers = [16, 16, 8, 8, 4, 2, 1, 1, 1]
        elif resolution == 512:
            channel_multipliers = [16, 16, 8, 8, 4, 2, 1, 1]
        elif resolution == 256:
            channel_multipliers = [16, 16, 8, 8, 4, 2, 1]
        elif resolution == 128:
            channel_multipliers = [16, 16, 8, 4, 2, 1]
        elif resolution == 64:
            channel_multipliers = [16, 16, 8, 4, 2]
        elif resolution == 32:
            channel_multipliers = [4, 4, 4, 4]
        else:
            raise ValueError("Unsupported resolution: {}".format(resolution))
        in_channels = [self.chn * c for c in channel_multipliers[:-1]]
        out_channels = [self.chn * c for c in channel_multipliers[1:]]
        return in_channels, out_channels

    def forward(self, input, class_id, input_class_emb=False):
        if isinstance(input, list):
            codes = [input[0]]
            codes += [input[2*i+1:2*i+3] for i in range(len(input)//2)]
        else:
            codes = layers.split(input, self.num_split, 1)
        if not input_class_emb:
            class_emb = self.embed_y(class_id)  # 128
        else:
            class_emb = class_id
        out = self.noise_fc(codes[0])
        out = layers.transpose(layers.reshape(out,(out.shape[0], 4, 4, -1)),(0, 3, 1, 2))
        for i, (code, gblock) in enumerate(zip(codes[1:], self.blocks)):
            if isinstance(input, list):
                condition = [layers.concat([c, class_emb], 1) for c in code]
            else:
                condition = layers.concat([code, class_emb], 1)
            out = gblock(out, condition)

        out = self.output_layer_bn(out)
        out = layers.relu(out)
        out = self.output_layer_conv(out)

        return (layers.tanh(out) + 1) / 2

笔者修改了模型前向生成过程中传入潜向量的手段，使得模型能够控制更多层次的生成。

2、插值函数

import os
import numpy as np
import paddle.fluid as fluid
from paddle.fluid import layers, dygraph as dg
from PIL import Image
from tqdm import tqdm
from .model import model_cache

from sys import stdout

class RandomState(object):
    rng = None
rds = RandomState

def std_gen(batch_size=8, seed=None):
    with dg.no_grad():
        model_cache.train_mode = False
        model_cache.initialized = False
        if seed is not None:
            rds.rng = np.random.RandomState(seed)
        elif rds.rng is None:
            rds.rng = np.random
        G = model_cache.G
        x_np = rds.rng.randn(batch_size,140).astype('float32')
        y_np = rds.rng.randint(0,1000,size=[batch_size]).astype('int64')
        x = dg.to_variable(x_np)
        y = dg.to_variable(y_np)
        y_hot = layers.one_hot(layers.unsqueeze(y,[1]), depth=1000)
        img_pd = G(x, y_hot)
        img = np.uint8(img_pd.numpy().clip(0,1)*255)
        imgs = []
        for i in range(len(img)):
            imgs += [Image.fromarray(img[i].transpose([1,2,0]))]
        return imgs

在加载预训练模型后，使用std_gen函数，如：


# 运行模型的标准生成输出过程 Run Output Process of Model's Standard Generation 
import numpy as np
from PIL import Image
from IPython.display import display

def concat_imgs_bsz8(imgs):
    np_imgs = [np.asarray(img) for img in imgs]
    img1 = np.concatenate(np_imgs[:4], 1)
    img2 = np.concatenate(np_imgs[4:], 1)
    img = Image.fromarray(np.concatenate([img1, img2], 0))
    return img.resize([img.size[0]//2, img.size[1]//2])

imgs = std_gen(8, seed=233)
for i, img in enumerate(imgs):
    img.save(f'data/std_seed233_{str(i).zfill(3)}.png')
display(concat_imgs_bsz8(imgs))

生成如下结果：

通过改变不同的随机数种子，可以获取到更多的可能。

当时这第一次采样出现的结果就深深震撼到了笔者，虽然还有一些小小的缺陷，但是，这不就是明晃晃的绘画素材吗？如果说ArtBreeder网站上生成人身立绘是1，那动漫版的BigGAN可谓是x。不仅可以生成各角度人物，还可以生成又没的动漫自然场景和宏伟的动漫式建筑。

这可是蕴含着几百个G的动漫图片数据集的模型，使用它生成动漫图片，选择自己中意的，再进行一些修改，对于画师来讲，可不就成了极佳的生产力工具嘛。

3. 更多的可能

首先，读者们是否还记得文章开始时展示的动图。没错，那就是在多张生成图片中进行插值产生的绝妙效果。

另外，大家可还记得BigGAN的潜向量是分多层注入的，也就是说，可以固定一些层级，只改变另一些层级的潜变量，达到部分特征修改的能力。经实验，越往底层，图像的形状变化越大；越往顶层，图像的变化越发集中在颜色上。可以想象，你生成了一张蛮不错的图片，但对颜色却不太满意，此时你只需要改变输入较高层的潜向量，便可以只改变颜色而不改变图像内容。妙不可言~

总结与思考

1. BigGAN的一些缺陷

虽然说BigGAN生成的结果相当精妙绝伦，但却都过于不可控制。究其原因，是输入的潜向量维度过小，140维的潜向量还要分割为每层20维的潜向量，此时的向量便是高度抽象的。不像StyleGAN及StyleGAN2,虽然训练时每层输入是相同的512维潜向量或两个512维潜向量交叉混合输入，但实际相当于512*14（256x256）乃至更多的维度的输入，这与生成的图像flatten后的维度并没有差多少，所以易于将真实图像进行编码。如果将这种方法引入BigGAN，凭借BigGAN生成的多样性，应该能使得模型的可能性更上一层楼。

2. 应用的可能性

在文中笔者有提到，动漫BigGAN可以方便画师思考创意。不过笔者更希望一个模型能是所有人都能玩上一玩的模型，如果前面说的提升的可能能成真的话，未来或许有这样的应用：

1) 随便画几个圈代表头和四肢，模型生成指定姿态的图像，若同时输入角色人脸等特征，生成也会是同一个角色。

2) 输入线稿和多个彩色点，生成线稿上色结果。

3) 遮盖真实图像部分，模型进行补全。

BigGAN已经彰显了一种潜在可能，那么全民“会画”的时代还远吗？

如在使用过程中有问题，可加入飞桨官方QQ群进行交流：1108045677。

如果您想详细了解更多飞桨的相关内容，请参阅以下文档。

·飞桨开源框架项目地址·

GitHub:

https://github.com/PaddlePaddle/PaddlePaddle

Gitee:

https://Gitee.com/PaddlePaddle/PaddlePaddle

·飞桨官网地址·

https://www.paddlepaddle.org.cn/

OpenBayes 一周速览丨ShowUI专注GUI自动化，可解析屏幕截图和用户指令；U-MATH数据集上线
公共资源速递5个数据集：U-MATH数学推理数据集AlMedicalChatbot医学对话数据集Tecnalia电子设备废物高光谱数据集WaterlooExploration大规模图像质量评估数据库WasteClassification可回收物及生活垃圾分类数据集3个教程：一键部署QwQ-32B-PreviewHunyuanVideo腾讯混元文生视频DemoShowUl：专注GUI自动化的视觉-语
AI生成前端页面：解放前端开发，拥抱AI时代的高效前端
在数字时代，效率是企业和个人的核心竞争力。而对于前端开发人员来说，重复性工作和繁琐的代码编写常常成为效率提升的瓶颈。幸运的是，随着人工智能技术的飞速发展，一个新的时代已经到来——AI代码生成器（例如ScriptEcho）的出现，正以前所未有的方式改变着前端开发的格局。本文将探讨人工智能在日常应用中的广泛影响，并着重介绍如何利用AI技术，例如ScriptEcho，来提升前端开发效率，从而更好地应对当
Vue 3.5 中的 useId：深入解析与应用实践程序员
随着Vue3.5的发布，开发者们迎来了许多新特性和改进。其中，useId是一个备受关注的工具函数，它为开发者提供了一种简单而高效的方式来生成唯一的ID。本文将深入解析useId的实现原理、使用场景以及在实际项目中的应用实践。一、什么是useId？useId是Vue3.5中引入的一个CompositionAPI函数，用于生成唯一的ID。它的主要用途是为组件或DOM元素分配唯一的标识符，避免在SSR（
AI赋能职业发展：程序员的未来之路前端
程序员，这个充满挑战和机遇的职业，正站在技术浪潮的潮头。一方面，蓬勃发展的科技不断催生着新的编程语言、框架和技术，要求程序员持续学习，快速适应；另一方面，激烈的行业竞争也使得程序员需要不断提升自身技能，才能在竞争中脱颖而出。然而，AI技术的崛起为程序员的职业发展带来了新的希望，它不仅能提升效率，还能帮助程序员拓展技能，应对未来的挑战。本文将探讨AI技术，特别是像ScriptEcho这样的AI辅助工
BOE（京东方）"向新2025”年终媒体智享会落地深圳 "屏”实力赋能产业创新发展数据库
12月27日，BOE（京东方）“向新2025”年终媒体智享会的收官之站在创新之都深圳圆满举行，为这场为期两周、横跨三地的年度科技盛会画上了完美句号。活动期间，全面回顾了BOE（京东方）2024年在多个关键领域取得的卓越成绩，深入剖析其在六大维度构建的“向新”发展格局，精彩呈现了以“屏”为核心搭建起的技术引领、伙伴赋能以及绿色发展等平台，全方位赋能全球生态合作伙伴，充分彰显BOE（京东方）作为全球领
高效员工培训：AI赋能企业发展新纪元前端
在当今竞争激烈的商业环境中，员工是企业最宝贵的资产。高效的员工培训不仅能提升员工技能，提高工作效率，更能增强企业核心竞争力，推动企业持续发展。然而，传统的员工培训模式往往存在效率低下、成本高昂、缺乏互动性等诸多问题。例如，传统的线下培训需要耗费大量时间和资源，难以满足员工个性化学习需求，培训效果评估也缺乏客观数据支撑。面对这些挑战，人工智能（AI）技术的应用为企业员工培训带来了革命性的变革，为构建
技术选型指南：Web、原生、混合开发的对比前端
随着移动互联网的飞速发展，开发者在选择应用开发方式时，经常面临纯Web开发、原生开发和混合开发的技术决策。每种开发方式都有其独特的优势和适用场景，开发者需根据项目需求、性能要求及跨平台能力做出合适的选择。本文将详细分析这三种开发方式的特点、实现原理及适用场景，同时推荐一些开源框架，并讲解微信小程序的实现方式。我们还将通过简单的代码示例，帮助大家更直观地理解这些技术。一、纯Web开发定义：纯Web开
Linux内核编译出来的Image文件解析物随心转嵌入式开发 linux
一、内核镜像image介绍Image:是在Linux内核编译时，使用objcopy去掉vmlinux中的一些符号表等信息后，生成的仅包含可执行二进制数据的内核镜像。Image是一个可引导的内核镜像文件，它包含了Linux内核和一些启动参数，所以可直接引导Linux启动。不过Image没有经过压缩(itisUncompressedkernelimage)因此也比较大在很多下，我们需要构造自定义的Li
FORCE 原动力大会｜火山引擎边缘云亮点干货先知晓！人工智能边缘计算机器人
AI技术战场上，唯快不破？在经历了早期的热闹之后，AI大模型的能力和价值维度已经不再浮于表面。IDC最新发布的《中国智算服务市场（2023下半年）跟踪》报告显示，受国内生成式AI技术飞速发展的影响，GenAI（生成式AI）IaaS市场在2023年实现爆发式增长，在AI+云计算领域有双向积累的公司获得先发优势。火山引擎一跃成为GenAIIaaS领域市场份额最大的云厂商。只有真正实现大模型的深度融合，
开启智能创作新时代，GLM-4-Plus为你定制！人工智能
引言：为什么高效的内容创作如此重要？在当前竞争激烈的市场环境中，内容创作已成为品牌成功的重要支柱。无论是撰写营销文案、博客文章、社交媒体帖子，还是制作广告，优质的内容不仅能够帮助品牌吸引目标受众的注意力，还能有效促进产品和服务的转化。然而，创作高质量内容却常常需要投入大量时间和精力，这使得很多内容创作者感到力不从心。高效创作正成为现代内容创作者的迫切需求。如果你也为高效创作而苦恼，那么今天我们将为
传感器融合(UWB+IMU+超声波)，使用卡尔曼滤波器和3种不同的多点定位算法(最小二乘、递归最小二乘和梯度下降)研究（Matlab代码实现）科研_研学社算法 matlab 开发语言
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述一、引言二、传感器介绍（一）UWB（超宽带）（二）IMU（惯性测量单元）（三）超声波传感器三、定位算法（一）卡尔曼滤波器（二）多点定位算法1.最小二乘法2.递归最小二乘法3.梯度下降法四、系统架构五、实验设计六、结果与讨论七、结论2运行结果3参考文献
探索AI API版本管理与流式传输实现 qwe54165a4wd 人工智能 java 数据库 python
在现代软件开发中，API版本管理是一个关键的主题，尤其是在涉及到AIAPI的场景。API版本的变更会影响到服务的稳定性和功能的兼容性。因此，理解API版本管理的基本原理和具体实现，对于开发者来说至关重要。技术背景介绍API版本管理涉及到如何在不破坏现有客户端代码的情况下，逐步引入新的功能和改进。这对于AI服务尤为重要，因为AI模型和算法的更新频率相对较高。本文将重点介绍AIAPI版本的管理原则，并
基于Ubuntu(x86)系统和STM32(Keil)编写C程序分别进行编程、验证迷信的兔子 ubuntu stm32 单片机 linux keil mdk
文章目录实验内容一、基本概念（一）、全局变量（二）、局部变量（三）、堆和栈二、编程验证（一）、基于Ubuntu用Linux系统编写C程序（二）、基于STM32用Keil编写C程序三、归纳分析四、总结五、参考文献实验内容实验内容：编写一个C程序，重温全局变量、局部变量、堆、栈等概念，在Ubuntu(x86)系统和STM32(Keil)中分别进行编程、验证（STM32通过串口printf信息到上位机串
OpenBayes 一周速览｜一键部署Qwen2.5-Coder，0编程经验实现代码生成自由！
公共资源速递5个数据集：Coil-100图像数据集Muharaf手写阿拉伯文数据集CollectiveActivity集体活动视频数据集MultimodalSpectroscopic化学多模光谱数据集CDFSOD-benchmark跨域小样本对象检测基准数据集3个教程：一键部署Qwen2.5-CoderInkSight将手写文字数字化DemoGLM-4-Voice端到端中英语音对话模型访问官网立即
如何一步步形成“代码屎山”——前端开发中的痛点与反思前端
引言在一个大型项目中，随着功能不断扩展、需求不断变化、人员不断更替，代码的质量和可维护性可能会逐渐恶化，最终演变成所谓的“代码屎山”。你一定对代码屎山的形成和后果有深刻的体会。那么，究竟是什么原因导致了代码屎山的形成？如何在开发过程中避免掉进这一陷阱？本文将从多个角度剖析这一问题，并提出一些解决方案，希望能帮助大家减少开发中的痛苦，提升代码质量。第一章：什么是“代码屎山”？在正式探讨代码屎山的形成
论文阅读：Deep Bilateral Learning for Real-Time Image Enhancement-google-hdrnet-slicing SetMaker 论文阅读
项目地址:https://gitcode.com/google/hdrnethdrnet作为超分领域的经典文章，由google提出主要用来用轻量化的方法来实现高分辨率的图像生成，hdrnet结合cnn可以让更高分辨率的图像部署在板端。如图所示，原始图像比如4k图像，首先分为两个主要模块：grid和guide。grid就是对应图上面的那一条特征提取网络，具体来说，原始图像经过下采样之后，默认256分
弹性云在业务环境中的实际应用和优势有什么服务器
在当今这个瞬息万变的商业时代，企业面临着前所未有的挑战与机遇。为了保持竞争力并实现持续增长，企业不仅需要创新的产品和服务，还需要一个灵活、高效且成本可控的IT基础设施来支撑其业务运营。正是在这样的背景下，弹性云作为云计算技术的核心优势之一，正逐步成为企业业务环境中的关键组成部分。一、弹性云的实际应用弹性云的最大特点在于其能够根据业务需求的实时变化，动态地调整计算资源、存储资源和网络资源。这种高度灵
深入剖析Vue的provide与inject：如何实现跨层级数据共享后端
引言在Vue开发中，provide与inject是两个非常有用的特性，它们常用于父子组件关系之外的跨层级数据传递。相比于props和$emit的传统方式，provide和inject可以更轻松地在多个组件之间传递数据，尤其是在深层嵌套的组件树中。它们在Vue2.2版本首次引入，Vue3中也得到了进一步的优化。尽管provide和inject的使用看起来非常简单，但其背后隐藏了复杂的实现原理。在这篇
小明，谈谈Vue组件动态加载有哪些方式程序员
动态加载组件可以显著提高应用的性能，优化用户体验，尤其是在大型应用中，合理的组件加载策略尤为重要。本文将探讨几种在Vue中实现组件动态加载的具体方案。1.异步组件Vue允许将组件定义为异步组件，从而在需要时动态加载它们。这可以通过使用import()函数来实现，具体示例如下：constAsyncComponent=()=>import('./components/MyComponent.vue')
未来前端发展方向：深度探索与技术前瞻前端
未来前端发展方向：深度探索与技术前瞻在数字化浪潮席卷全球的今天，前端开发作为连接用户与数字世界的桥梁，其重要性不言而喻。随着技术的不断进步和市场的不断变化，前端开发领域正经历着前所未有的变革。今天，我们将深入探讨未来前端发展的几个关键方向，为前端开发者们提供有价值的参考。一、性能优化与用户体验性能优化一直是前端开发的核心议题之一。在未来，随着用户对于应用响应速度和流畅性的要求越来越高，性能优化将变
StarRocks Lakehouse 快速入门——Apache Iceberg
导读：StarRocksLakehouse快速入门旨在帮助大家快速了解湖仓相关技术，内容涵盖关键特性介绍、独特的优势、使用场景和如何与StarRocks快速构建一套解决方案。最后大家也可以通过用户真实的使用场景来了解StarRocksLakehouse的最佳实践！ApacheIceberg介绍ApacheIceberg是一种为大规模、复杂数据集设计的开源表格式，这些数据集跨越了PB级别的数据。最初
小明，谈谈你对Vue nextTick的理解程序员
一、nextTick的实现细节在Vue中，nextTick是一个重要的异步操作工具，用于在DOM更新完成后执行回调函数。其实现依赖于微任务机制，以确保操作在下一个“事件循环”中执行。以下是nextTick的具体实现过程：任务队列：当调用nextTick时，Vue会将回调函数存入一个数组（任务队列）中。每次触发数据变化时，这个队列会被处理。微任务调度：Vue首先尝试使用Promise.resolve
小明，谈谈你对Vue 虚拟dom的理解程序员
Vue.js的虚拟DOM（VirtualDOM）是为了提高前端性能和开发体验而引入的一种技术。Vue.js虚拟DOM的大致实现虚拟DOM的定义虚拟DOM是一种JavaScript对象，它用来描述用户界面（UI）的结构和内容。每个虚拟DOM节点（VNode）代表一个真实的DOM元素或组件实例。//VNode示例constvnode={tag:'div',data:{id:'app'},childre
StarRocks on AWS Graviton3，实现 50% 以上性价比提升大数据数据库数据湖云计算云服务
在数据时代，企业拥有前所未有的大量数据资产，但如何从海量数据中发掘价值成为挑战。数据分析凭借强大的分析能力，可从不同维度挖掘数据中蕴含的见解和规律，为企业战略决策提供依据。数据分析在营销、风险管控、产品优化等领域发挥着关键作用,帮助企业提高运营效率、优化业务流程、发现新商机、增强竞争力。低成本高效率的完成对海量数据的分析，及时准确的释放数据价值，已成为企业赢得竞争优势的利器。StarRockson
ChatGPT 绘图的工作原理
ChatGPT的绘图功能结合了自然语言处理（NLP）和图像生成的技术，这种综合能力依赖于预训练模型（如GPT-4）和图像生成模型（如DALL-E）之间的紧密协作。ChatGPT本质上是一个大规模的语言模型，但通过与图像生成模型集成，它得以执行基于描述生成图像的任务。接下来，我们将从模型架构、训练方法、推理机制和一些技术挑战等方面，详细讨论ChatGPT进行绘图的工作原理。
OpenVoiceV2：零样本跨语言语音克隆技术，支持多种风格控制智慧医疗 AIGC 语音识别人工智能语音克隆
1openvoicev2介绍语音克隆技术近年来取得了显著进展，但现有方法通常存在着局限性，例如无法灵活控制语音风格、需要大量多语言数据进行训练、生成速度慢等等。为了克服这些挑战，MyShell.ai团队推出了全新的语音克隆技术OpenVoiceV2，它能够在无需额外训练的情况下，仅凭少量参考音频，就能够克隆任何人的声音，并支持多种语音风格控制，以及快速高效的跨语言语音生成。论文地址：http://
2017-SIGGRAPH-Google,MIT-(HDRNet)Deep Bilateral Learning for Real-Time Image Enhancements WX Chen HDR技术深度学习神经网络机器学习
双边网格本质上是一个可以保存边缘信息的3维的数据结构。对于一张2维图片,在2维空间中增加了一维代表像素的强度slice操作(上采样)BilateralGuidedUpsampling这篇文章用双边网格实现图像的操作算子的加速。算法的核心思想是将一幅高分辨率的图像通过下采样转换成一个双边网格,在双边网格中每个格子就是一个图像的仿射变换算子,它的原理是在空间与值域相近的区域内,相似输入图像的亮度经算子
一篇文章掌握WebService服务、工作原理、核心组件、主流框架 java15655057970 服务器前端 linux
目录1、WebService定义解决问题：2、WebService的工作原理2.1实现一个完整的Web服务包括以下步骤2.2调用方式3、WebService的核心组件3.1XML3.2SOAP3.3WSDL3.4UDDI4、主流框架4.1AXIS(已淘汰)4.2XFire4.3CXF5、Soap协议详解1.Soap协议是什么2.认识Soap3.结论4.SOAP小总结6、WSDL详解1.types2
使用scorecardpy库计算woe分箱和iv值亲持红叶机器学习风控相关算法人工智能机器学习
woe分箱_iv值计算基于scorecardpy库，乳腺癌数据集importpandasaspdimportnumpyasnpfromsklearn.datasetsimportload_breast_cancerimportscorecardpyasscfromtqdmimportnotebookcancer=load_breast_cancer()df=pd.DataFrame(cancer.
用diff 生成patch文件的命令/方法 fcf1990501 LINUX系统
linuxdiff命令diff命令可以比较两个相同文件进而生成patch文件使用如下命令获得命令的帮助didff--help使用以下option-u,-UNUM,--unified[=NUM]outputNUM(default3)linesofunifiedcontext-r,--recursiverecursivelycompareanysubdirectoriesfound-N,--new-f
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb