童、一

第九周周报

学习目标：

ViTGAN代码

吴恩达深度学习

学习内容：

GAN

DCGAN

ViTGAN

NLP

学习时间：

10.31-11.4

学习产出：

一、GAN

了解了GAN的网络结构并编写代码

'''
数据准备
'''
transform = transforms.Compose([
    transforms.ToTensor(),  # 0-1归一化，channel,high,weight的设置然后转化为Tensor
    transforms.Normalize(0.5, 0.5)  # 均值和方差是0.5，是数据处于(-1,1)
])
train_ds = torchvision.datasets.MNIST('data', train=True, transform=transform, download=True)  # 使用上面的transform来转换数据
dataloader = torch.utils.data.DataLoader(train_ds, batch_size=64, shuffle=True)
'''
定义生成器
'''
# 输入长度为100的噪声(生态分布随机数)
# 输出为(28,28,1)的图片
class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.main = nn.Sequential(
            nn.Linear(100, 256),
            nn.ReLU(),
            nn.Linear(256, 512),
            nn.ReLU(),
            nn.Linear(512, 28 * 28),
            nn.Tanh()
        )
        print('gen-init')
    def forward(self, x):  # x表示长度为100的noise输入
        img = self.main(x)
        img = img.view(-1, 28, 28, 1)  # 28*28的图片
        print('gen-forward')
        return img
#  输入为(28,28,1)的图片，输出为二分类的概率值，输出使用sigmoid激活
class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.main = nn.Sequential(
            nn.Linear(28 * 28, 512),
            nn.LeakyReLU(),
            nn.Linear(512, 256),
            nn.LeakyReLU(),
            nn.Linear(256, 1),
            nn.Sigmoid()
        )
        print('dis-init')
    def forward(self, x):
        x = x.view(-1, 28 * 28)  # 将图片展平
        x = self.main(x)
        print('dis-forward')
        return x
device = 'cuda' if torch.cuda.is_available() else 'cpu'
gen = Generator().to(device)
dis = Discriminator().to(device)
# 优化器
d_optim = torch.optim.Adam(dis.parameters(), lr=0.0001)
g_optim = torch.optim.Adam(gen.parameters(), lr=0.0001)
# 损失函数
loss_fn = torch.nn.BCELoss()
def gen_img_plot(model, test_input):
    # np.squeeze：从数组的形状中删除单维度条目，即把shape中为1的维度去掉,在这里是去掉通道数
    prediction = np.squeeze(model(test_input).detach().cpu().numpy())
    # print('prediction：', prediction)
    fig = plt.figure(figsize=(4, 4))
    for i in range(16):  # 绘制16张子图
        plt.subplot(4, 4, i + 1)  # 4行4列,i+1是图的位置
        plt.imshow((prediction[i] + 1) / 2)  # tanh输出的值为(-1,1),将tanh设置为(0,1)
        plt.axis('off')  # 关闭坐标轴
    plt.show()
test_input = torch.randn(16, 100, device=device)  # 返回一个符合均值为0，方差为1的正态分布（标准正态分布）中填充随机数的张量(16行，100列)
D_loss = []
G_loss = []
for epoch in range(20):
    d_epoch_loss = 0
    g_epoch_loss = 0
    count = len(dataloader)  # 返回批次数，值938
    print('count：', count)
    for step, (img, _) in enumerate(dataloader):  # img和_可以理解为x和y
        img = img.to(device)
        size = img.size(0)  # 返回图片的维度(一个batch有64张图片)，值64
        print('size：',size)
        random_noise = torch.randn(size, 100, device=device)  # 创建张量，作为generator的输入
        # 判别器
        # 真实图像
        d_optim.zero_grad()  # 将鉴别器梯度归零
        real_output = dis(img)  # 判别器输入真实图片，real_output是对真实图片的预测结果（希望是1，即为真）
        # print('real_output：', real_output)
        # 使用loss_fn计算real_output的损失，将real_output与torch.ones_like(real_output)这个全为1的矩阵进行比较计算损失
        d_real_loss = loss_fn(real_output, torch.ones_like(real_output))  # 判别器在真实图像上的损失
        print('d_real_loss', d_real_loss.item())
        d_real_loss.backward()  # 计算梯度

        # 生成图像
        gen_img = gen(random_noise)  # 生成图片
        fake_output = dis(gen_img.detach())  # 判别器输入生成图片，fake_output是对生成图片的预测结果（希望全为0，即为假）,detach()：截断梯度，即不让生成器的梯度更新
        d_fake_loss = loss_fn(fake_output, torch.zeros_like(fake_output))  # 判别器在生成图像上的损失
        print('d_fake_loss：', d_fake_loss.item())
        d_fake_loss.backward()  # 计算梯度

        d_loss = d_real_loss + d_fake_loss
        print('d_loss：', d_loss)
        d_optim.step()  # 根据梯度和学习率进行更新
        # 生成器
        g_optim.zero_grad()
        fake_output = dis(gen_img)  # 得到对生成图像的输出
        g_loss = loss_fn(fake_output, torch.ones_like(fake_output))  # 生成器的损失；对生成器来说，希望生成的图像被判定为1
        print('g_loss', g_loss.item())
        g_loss.backward()
        g_optim.step()
        with torch.no_grad():
            d_epoch_loss += d_loss
            g_epoch_loss += g_loss
    with torch.no_grad():
        d_epoch_loss /= count
        g_epoch_loss /= count
        D_loss.append(d_epoch_loss)
        G_loss.append(g_epoch_loss)
        print('Epoch：', epoch)
        gen_img_plot(gen, test_input)

二、DCGAN

了解了DCGAN最主要的转置卷积并编写了DCGAN的代码

1、处理噪声MappingNetwork

manualSeed = 999  # 随机数种子
random.seed(manualSeed)  # 生成随机数
torch.manual_seed(manualSeed)  # 设置CPU生成随机数的种子，方便下次复现实验结果。
dataroot = './data/anime'
workers = 2  # 数据加载器加载数据的线程数
batch_size = 128
image_size = 64  # 输入图片尺寸
nc = 3  # 输入图片的通道数
nz = 100  # 潜在空间的长度
ngf = 64  # 与通过生成器进程的特征映射深度有关
ndf = 64  # 设置通过鉴别器传播的特征映射的深度
num_epochs = 100  # 训练轮数
lr = 0.0002  # 学习率
beta1 = 0.5  # Adam优化器参数beta1
ngpu = 1  # gpu数量
dataset = dataset.ImageFolder(root=dataroot,
                           transform=transforms.Compose([
                               transforms.Resize(image_size),
                               transforms.CenterCrop(image_size),
                               transforms.ToTensor(),
                               transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),
                           ]))
# 加载数据
dataloader = torch.utils.data.DataLoader(dataset, batch_size=batch_size,shuffle=True, num_workers=workers)
# 设置gpu训练
device = torch.device('cuda:0' if (torch.cuda.is_available() and ngpu > 0) else 'cpu')
# 权重初始化
def weights_init(m):
    classname = m.__class__.__name__  # 首先用self.__class__将实例变量指向类，然后再去调用__name__类属性
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)  # 初始化权重为正态分布
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)  # 初始化偏差
# 生成器

class Generator(nn.Module):
    def __init__(self, ngpu):
        super(Generator, self).__init__()
        self.ngpu = ngpu
        self.main = nn.Sequential(
            # 转置卷积，输入通道数为100的噪声,输出64 * 8的张量，卷积核4x4，stride=1，padding=0
            nn.ConvTranspose2d( nz, ngf * 8, 4, 1, 0, bias=False),
            # Batch归一化处理
            nn.BatchNorm2d(ngf * 8),
            nn.ReLU(True),
            # state size. (ngf*8) x 4 x 4
            nn.ConvTranspose2d(ngf * 8, ngf * 4, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ngf * 4),
            nn.ReLU(True),
            # state size. (ngf*4) x 8 x 8
            nn.ConvTranspose2d(ngf * 4, ngf * 2, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ngf * 2),
            nn.ReLU(True),
            # state size. (ngf*2) x 16 x 16
            nn.ConvTranspose2d(ngf * 2, ngf, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ngf),
            nn.ReLU(True),
            # state size. (ngf) x 32 x 32
            nn.ConvTranspose2d(ngf, nc, 4, 2, 1, bias=False),
            nn.Tanh()
            # state size. (nc) x 64 x 64,即输出通道为3，尺寸为64*64的图
        )
    def forward(self, input):
        return self.main(input)
class Discriminator(nn.Module):
    def __init__(self,ngpu):
        super(Discriminator, self).__init__()
        self.ngpu = ngpu
        self.main = nn.Sequential(
            # 卷积，输出通道数为3，输出通道数为64，卷积核4x4，stride=2，padding=1，input is (nc) x 64 x 64
            nn.Conv2d(nc, ndf, 4, 2, 1, bias=False),
            # negative_slope-控制负斜率的角度。默认值：1e-2,当inplace = True 时,nn.ReLU会修改输入对象的值作为输出，而不是创建一个新的对象。
            nn.LeakyReLU(0.2, inplace=True),
            # state size. (ndf) x 32 x 32
            nn.Conv2d(ndf, ndf * 2, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ndf * 2),
            nn.LeakyReLU(0.2, inplace=True),
            # state size. (ndf*2) x 16 x 16
            nn.Conv2d(ndf * 2, ndf * 4, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ndf * 4),
            nn.LeakyReLU(0.2, inplace=True),
            # state size. (ndf*4) x 8 x 8
            nn.Conv2d(ndf * 4, ndf * 8, 4, 2, 1, bias=False),
            nn.BatchNorm2d(ndf * 8),
            nn.LeakyReLU(0.2, inplace=True),
            # state size. (ndf*8) x 4 x 4
            nn.Conv2d(ndf * 8, 1, 4, 1, 0, bias=False),
            nn.Sigmoid()
        )
    def forward(self, input):
        return self.main(input)
generator = Generator(ngpu).to(device)
# Handle multi-gpu if desired
if (device.type == 'cuda') and (ngpu > 1):
    generator = nn.DataParallel(generator, list(range(ngpu)))
# Apply the weights_init function to randomly initialize all weights
#  to mean=0, stdev=0.2.
generator.apply(weights_init)
# Print the model
print(generator)
discriminator = Discriminator(ngpu).to(device)
# Handle multi-gpu if desired
if (device.type == 'cuda') and (ngpu > 1):
    discriminator = nn.DataParallel(discriminator, list(range(ngpu)))
# Apply the weights_init function to randomly initialize all weights
#  to mean=0, stdev=0.2.
discriminator.apply(weights_init)
# Print the model
print(discriminator)
# 定义损失函数
criterion = nn.BCELoss()
real_label = 1
fake_label = 0
d_optim = optim.Adam(discriminator.parameters(), lr=lr, betas=(beta1, 0.999))
g_optim = optim.Adam(generator.parameters(), lr=lr, betas=(beta1, 0.999))
# 噪声
fixed_noise = torch.randn(64, nz, 1, 1, device=device)
img_list = []
D_loss = []
G_loss = []
iters = 0
if __name__ == '__main__':
    real_batch = next(iter(dataloader))
    # 64张图
    plt.figure(figsize=(8, 8))
    plt.axis('off')
    plt.title('Training Images')
    # np.transpose：将数据格式由（channels,imagesize,imagesize）转化为（imagesize,imagesize,channels），make_grid(real_batch[0].to(device)[:64]：将64张图组成网格
    plt.imshow(
        np.transpose(vutils.make_grid(real_batch[0].to(device)[:64], padding=2, normalize=True).cpu(), (1, 2, 0)))
    for epoch in range(num_epochs):
        for i, img in enumerate(dataloader, 0):
            # 鉴别器
            # 真实图像
            d_optim.zero_grad()
            img = img[0].to(device)
            size = img.size(0)  # 返回batch中图片的数量
            # 给定fill_value和size，创建一个矩阵元素全为fill_value的大小为size的tensor。b_size：指定输出tensor的形状,real_label：将tensor填充为1
            label = torch.full((size,), real_label, dtype=torch.float, device=device)  # 类似torch.ones_like(real_output)
            real_output = discriminator(img).view(-1)
            d_real_loss = criterion(real_output, label)
            d_real_loss.backward()
            D_x = real_output.mean().item()  # 真实图像中鉴别器图像判断的平均概率
            # 生成图像
            noise = torch.randn(size, nz, 1, 1, device=device)
            gen_img = generator(noise)
            label.fill_(fake_label)  # 全0矩阵
            d_fake_output = discriminator(gen_img.detach()).view(-1)
            d_fake_loss = criterion(d_fake_output, label)
            d_fake_loss.backward()
            D_G_z1 = d_fake_output.mean().item()  # 生成图像中鉴别器图像判断的平均概率
            d_loss = d_real_loss + d_fake_loss
            d_optim.step()
            # 生成器
            g_optim.zero_grad()
            label.fill_(real_label)
            g_fake_output = discriminator(gen_img).view(-1)
            g_loss = criterion(g_fake_output, label)
            g_loss.backward()
            D_G_z2 = g_fake_output.mean().item()  # 生成器图像概率
            g_optim.step()
            if i % 50 == 0:
                print('[%d/%d][%d/%d]\tLoss_D: %.4f\tLoss_G: %.4f\tD(x): %.4f\tD(G(z)): %.4f / %.4f'
                      % (epoch, num_epochs, i, len(dataloader),
                         d_loss.item(), g_loss.item(), D_x, D_G_z1, D_G_z2))

            G_loss.append(g_loss.item())
            D_loss.append(d_loss.item())

            if (iters % 500 == 0) or ((epoch == num_epochs - 1) and (i == len(dataloader) - 1)):
                with torch.no_grad():
                    gen_img = generator(fixed_noise).detach().cpu()
                img_list.append(vutils.make_grid(gen_img, padding=2, normalize=True))

            iters += 1
    plt.figure(figsize=(10, 5))
    plt.title("Generator and Discriminator Loss During Training")
    plt.plot(G_loss, label="G")
    plt.plot(D_loss, label="D")
    plt.xlabel("iterations")
    plt.ylabel("Loss")
    plt.legend()
    plt.show()
    # %%capture
    fig = plt.figure(figsize=(8, 8))
    plt.axis("off")
    ims = [[plt.imshow(np.transpose(i, (1, 2, 0)), animated=True)] for i in img_list]
    ani = animation.ArtistAnimation(fig, ims, interval=1000, repeat_delay=1000, blit=True)

    HTML(ani.to_jshtml())
    # Grab a batch of real images from the dataloader
    # Plot the real images
    plt.figure(figsize=(15, 15))
    plt.subplot(1, 2, 1)
    plt.axis("off")
    plt.title("Real Images")
    plt.imshow(
        np.transpose(vutils.make_grid(real_batch[0].to(device)[:64], padding=5, normalize=True).cpu(), (1, 2, 0)))
    # Plot the fake images from the last epoch
    plt.subplot(1, 2, 2)
    plt.axis("off")
    plt.title("Fake Images")
    plt.imshow(np.transpose(img_list[-1], (1, 2, 0)))
    plt.show()

ViTGAN

了解了ViTGAN的生成器和鉴别器内容，知道了各个函数及类的作用

Generator

1、MappingNetwork

# 噪声处理的MappingNetwork
class MappingNetwork(nn.Module):
    def __init__(self,
                 z_dim,  # Input latent (Z) dimensionality, 0 = no latent.
                 c_dim,  # Conditioning label (C) dimensionality, 0 = no label.
                 w_dim,  # Intermediate latent (W) dimensionality.
                 num_ws=None,  # Number of intermediate latents to output, None = do not broadcast.
                 num_layers=8,  # Number of mapping layers.
                 embed_features=None,  # Label embedding dimensionality, None = same as w_dim.
                 layer_features=None,  # Number of intermediate features in the mapping layers, None = same as w_dim.
                 activation='lrelu',  # Activation function: 'relu', 'lrelu', etc.
                 lr_multiplier=0.01,  # Learning rate multiplier for the mapping layers.
                 w_avg_beta=0.995,  # Decay for tracking the moving average of W during training, None = do not track.
                 **kwargs
                 ):
        super().__init__()
        self.z_dim = z_dim  # 噪声维度，z_dim=latent_dim
        self.c_dim = c_dim  # 条件标签的维度，c_dim=0
        self.w_dim = w_dim  # 中间层的维度，w_dim=hidden_size，hidden_size=hidden_features, default=384,
        self.num_ws = num_ws  # num_ws=None，不广播
        self.num_layers = num_layers  # num_layers=style_mlp_layers，default=8,
        self.w_avg_beta = w_avg_beta  # 训练期间跟踪W的移动平均值的衰减，w_avg_beta=None

        if embed_features is None:
            embed_features = w_dim
        if c_dim == 0:
            embed_features = 0
        if layer_features is None:
            layer_features = w_dim
        features_list = [z_dim + embed_features] + [layer_features] * (num_layers - 1) + [w_dim]

        if c_dim > 0:
            self.embed = FullyConnectedLayer(c_dim, embed_features)
        for idx in range(num_layers):
            in_features = features_list[idx]
            out_features = features_list[idx + 1]
            layer = FullyConnectedLayer(in_features, out_features, activation=activation, lr_multiplier=lr_multiplier)
            setattr(self, f'fc{idx}', layer)

        if num_ws is not None and w_avg_beta is not None:
            self.register_buffer('w_avg', torch.zeros([w_dim]))

    def forward(self, z, c=None, truncation_psi=1, truncation_cutoff=None, skip_w_avg_update=False):
        # Embed, normalize, and concat inputs.
        x = None
        with torch.autograd.profiler.record_function('input'):
            if self.z_dim > 0:
                assert z.shape[1] == self.z_dim
                x = normalize_2nd_moment(z.to(torch.float32))
            if self.c_dim > 0:
                assert c.shape[1] == self.c_dim
                y = normalize_2nd_moment(self.embed(c.to(torch.float32)))
                x = torch.cat([x, y], dim=1) if x is not None else y

        # Main layers.
        for idx in range(self.num_layers):
            layer = getattr(self, f'fc{idx}')
            x = layer(x)

        # Update moving average of W.更新训练期间跟踪W的移动平均值
        if self.w_avg_beta is not None and self.training and not skip_w_avg_update:
            with torch.autograd.profiler.record_function('update_w_avg'):
                self.w_avg.copy_(x.detach().mean(dim=0).lerp(self.w_avg, self.w_avg_beta))

        # Broadcast.
        if self.num_ws is not None:
            # record_function：用户自定义“范围”，用with把一段代码包起来统计
            with torch.autograd.profiler.record_function('broadcast'):
                # repeat：
                x = x.unsqueeze(1).repeat([1, self.num_ws, 1])

        # Apply truncation.
        if truncation_psi != 1:
            with torch.autograd.profiler.record_function('truncate'):
                assert self.w_avg_beta is not None
                if self.num_ws is None or truncation_cutoff is None:
                    x = self.w_avg.lerp(x, truncation_psi)
                else:
                    x[:, :truncation_cutoff] = self.w_avg.lerp(x[:, :truncation_cutoff], truncation_psi)
        # print('MappingNetwork__x：', x)
        # print('MappingNetwork__x：', x.shape)
        return x

2、Encoder

（1）GeneratorTransformerEncoderBlock

class GeneratorTransformerEncoderBlock(nn.Module):
    def __init__(self,
                 hidden_size=384,
                 sln_paremeter_size=384,
                 drop_p=0.,
                 forward_expansion=4,
                 forward_drop_p=0.,
                 **kwargs):
        super().__init__()
        self.sln = SLN(hidden_size, parameter_size=sln_paremeter_size)
        self.msa = MultiHeadAttention(hidden_size, **kwargs)
        self.dropout = nn.Dropout(drop_p)
        self.feed_forward = FeedForwardBlock(hidden_size, expansion=forward_expansion, drop_p=forward_drop_p)

    def forward(self, hidden, w):
        res = hidden
        hidden = self.sln(hidden, w)
        hidden = self.msa(hidden)
        hidden = self.dropout(hidden)
        hidden += res

        res = hidden
        hidden = self.sln(hidden, w)
        self.feed_forward(hidden)
        hidden = self.dropout(hidden)
        hidden += res
        return hidden

(2)SLN：自调制层归一化

# Self-Modulated LayerNorm：自调制层归一化
class SLN(nn.Module):
    def __init__(self, input_size, parameter_size=None, **kwargs):
        super().__init__()
        if parameter_size == None:
            parameter_size = input_size
        assert (input_size == parameter_size or parameter_size == 1)
        self.input_size = input_size
        self.parameter_size = parameter_size
        self.ln = nn.LayerNorm(input_size)
        self.gamma = FullyConnectedLayer(input_size, parameter_size, bias=False)
        self.beta = FullyConnectedLayer(input_size, parameter_size, bias=False)
        # self.gamma = nn.Linear(input_size, parameter_size, bias=False)
        # self.beta = nn.Linear(input_size, parameter_size, bias=False)

    def forward(self, hidden, w):
        assert (hidden.size(-1) == self.parameter_size and w.size(-1) == self.parameter_size)
        gamma = self.gamma(w).unsqueeze(1)
        beta = self.beta(w).unsqueeze(1)
        ln = self.ln(hidden)
        return gamma * ln + beta

（3）MultiHeadAttention：自注意力计算，如果是鉴别器那么使用L2距离，生成器正常计算

class MultiHeadAttention(nn.Module):
    def __init__(self, emb_size=384, num_heads=4, dropout=0, discriminator=False, **kwargs):
        super().__init__()
        self.emb_size = emb_size
        self.num_heads = num_heads
        self.discriminator = discriminator
        # fuse the queries, keys and values in one matrix
        self.qkv = nn.Linear(emb_size, emb_size * 3)
        self.att_drop = nn.Dropout(dropout)
        self.projection = nn.Linear(emb_size, emb_size)
        if self.discriminator:
            self.qkv = spectral_norm(self.qkv)
            self.projection = spectral_norm(self.projection)
        
    def forward(self, x, mask=None):
        # split keys, queries and values in num_heads
        qkv = rearrange(self.qkv(x), "b n (h d qkv) -> (qkv) b h n d", h=self.num_heads, qkv=3)
        queries, keys, values = qkv[0], qkv[1], qkv[2]
        # 如果是鉴别器那么计算L2距离
        if self.discriminator:
            # calculate L2-distances
            energy = torch.cdist(queries.contiguous(), keys.contiguous(), p=2)
        else:
            # sum up over the last axis
            # 'bhqd, bhkd -> bhqk'语义解释如下：输入a_tensor: 4维数组，下标为bhqd,输入b_tensor: 4维数组，下标为bhkd,输出output：4维数组，下标为bhqk。
            # 隐含语义：输入a,b下标中相同的bh，是求和的下标，对应上面的例子2的公式
            energy = torch.einsum('bhqd, bhkd -> bhqk', queries, keys) # batch, num_heads, query_len, key_len

        if mask is not None:
            fill_value = torch.finfo(torch.float32).min
            energy.mask_fill(~mask, fill_value)
            
        scaling = self.emb_size ** (1/2)
        att = F.softmax(energy, dim=-1) / scaling
        att = self.att_drop(att)
        # sum up over the third axis
        out = torch.einsum('bhal, bhlv -> bhav ', att, values)
        out = rearrange(out, "b h n d -> b n (h d)")
        out = self.projection(out)
        return out

（4）siren网络，用作Generator输出后对patch的处理

# SIREN
# Code for SIREN is taken from https://colab.research.google.com/github/vsitzmann/siren/blob/master/explore_siren.ipynb
'''
ModulatedLinear调制模块 是用于将二维位置信息映射到模型特征中，增加模型细节，就是里面的傅里叶编码（Fourier Embedding）
Fourier特征网络告诉我们，若是把坐标(x,y)变换到频域，将频域坐标输入网络中，则网络的表征能力变强了
如果不经过傅里叶变换，那么得到的图像和形状等非常模糊，而进行傅里叶变换之后，可以重建清晰的图像。
Fourier域上的特征确实比空域特征更能表征高频细节
'''
class ModulatedLinear(nn.Module):
    def __init__(self, in_channels, out_channels, style_size, bias=False, demodulation=True, **kwargs):
        super().__init__()
        self.in_channels = in_channels
        self.out_channels = out_channels
        self.style_size = style_size
        self.scale = 1 / np.sqrt(in_channels)
        self.weight = nn.Parameter(
            torch.randn(1, out_channels, in_channels, 1)
        )
        self.modulation = None
        if self.style_size != self.in_channels:
            self.modulation = FullyConnectedLayer(style_size, in_channels, bias=False)
        self.demodulation = demodulation

    def forward(self, input, style):
        batch_size = input.shape[0]
        if self.style_size != self.in_channels:
            style = self.modulation(style)  # 调制
        style = style.view(batch_size, 1, self.in_channels, 1)
        weight = self.scale * self.weight * style

        if self.demodulation:
            demod = torch.rsqrt(weight.pow(2).sum([2]) + 1e-8)
            weight = weight * demod.view(batch_size, self.out_channels, 1, 1)

        weight = weight.view(
            batch_size * self.out_channels, self.in_channels, 1
        )

        img_size = input.size(1)
        input = input.reshape(1, batch_size * self.in_channels, img_size)
        out = F.conv1d(input, weight, groups=batch_size)
        out = out.view(batch_size, img_size, self.out_channels)

        return out

# 使用Siren网络用作隐层神经表示
class SineLayer(nn.Module):
    def __init__(self, in_features, out_features, style_size, bias=False,
                 is_first=False, omega_0=30, weight_modulation=True, **kwargs):
        super().__init__()
        self.omega_0 = omega_0
        self.is_first = is_first

        self.in_features = in_features
        self.weight_modulation = weight_modulation
        # 用于对encoder的输出图像进行处理
        if weight_modulation:
            self.linear = ModulatedLinear(in_features, out_features, style_size=style_size, bias=bias, **kwargs)
        else:
            self.linear = ResLinear(in_features, out_features, style_size=style_size, bias=bias, **kwargs)
        self.init_weights()

    def init_weights(self):
        with torch.no_grad():
            if self.is_first:
                if self.weight_modulation:
                    self.linear.weight.uniform_(-1 / self.in_features,
                                                1 / self.in_features)
                else:
                    self.linear.linear.weight.uniform_(-1 / self.in_features,
                                                       1 / self.in_features)
            else:
                if self.weight_modulation:
                    self.linear.weight.uniform_(-np.sqrt(6 / self.in_features) / self.omega_0,
                                                np.sqrt(6 / self.in_features) / self.omega_0)
                else:
                    self.linear.linear.weight.uniform_(-np.sqrt(6 / self.in_features) / self.omega_0,
                                                       np.sqrt(6 / self.in_features) / self.omega_0)

    def forward(self, input, style):
        return torch.sin(self.omega_0 * self.linear(input, style))  # 用Sin函数作为激活函数的全连接网络


class Siren(nn.Module):
    def __init__(self, in_features, hidden_size, hidden_layers, out_features, style_size, outermost_linear=False,
                 first_omega_0=30, hidden_omega_0=30., weight_modulation=True, bias=False, **kwargs):
        super().__init__()

        self.net = []
        self.net.append(SineLayer(in_features, hidden_size, style_size,
                                  is_first=True, omega_0=first_omega_0,
                                  weight_modulation=weight_modulation, **kwargs))

        for i in range(hidden_layers):
            self.net.append(SineLayer(hidden_size, hidden_size, style_size,
                                      is_first=False, omega_0=hidden_omega_0,
                                      weight_modulation=weight_modulation, **kwargs))

        if outermost_linear:
            if weight_modulation:
                final_linear = ModulatedLinear(hidden_size, out_features,
                                               style_size=style_size, bias=bias, **kwargs)
            else:
                final_linear = ResLinear(hidden_size, out_features, style_size=style_size, bias=bias, **kwargs)

            with torch.no_grad():
                if weight_modulation:
                    final_linear.weight.uniform_(-np.sqrt(6 / hidden_size) / hidden_omega_0,
                                                 np.sqrt(6 / hidden_size) / hidden_omega_0)
                else:
                    final_linear.linear.weight.uniform_(-np.sqrt(6 / hidden_size) / hidden_omega_0,
                                                        np.sqrt(6 / hidden_size) / hidden_omega_0)

            self.net.append(final_linear)
        else:
            self.net.append(SineLayer(hidden_size, out_features,
                                      is_first=False, omega_0=hidden_omega_0,
                                      weight_modulation=weight_modulation, **kwargs))

        self.net = nn.Sequential(*self.net)

    def forward(self, coords, style):
        coords = coords.clone().detach().requires_grad_(True)  # allows to take derivative w.r.t. input
        # output = self.net(coords, style)
        output = coords
        for layer in self.net:
            output = layer(output, style)
        return output

（5)GeneratorViT

   class GeneratorViT(nn.Module):
    def __init__(self,
                 style_mlp_layers=8,
                 patch_size=4,
                 latent_dim=32,
                 hidden_size=384,
                 sln_paremeter_size=1,
                 image_size=32,
                 depth=4,
                 combine_patch_embeddings=False,
                 combined_embedding_size=1024,
                 forward_drop_p=0.,
                 bias=False,
                 out_features=3,
                 out_patch_size=4,
                 weight_modulation=True,
                 siren_hidden_layers=1,
                 **kwargs):
        super().__init__()
        self.hidden_size = hidden_size

        self.mlp = MappingNetwork(z_dim=latent_dim, c_dim=0, w_dim=hidden_size, num_layers=style_mlp_layers,
                                  w_avg_beta=None)  # 输出一个16x384的tensor

        num_patches = int(image_size // patch_size) ** 2  # 64
        self.patch_size = patch_size  # 4
        self.num_patches = num_patches
        self.image_size = image_size  # 32
        self.combine_patch_embeddings = combine_patch_embeddings  # 将encode输出后分散的patch组合在一起，default=False
        self.combined_embedding_size = combined_embedding_size  # default=384
        self.out_patch_size = out_patch_size  # 3
        self.out_features = out_features  # 4
        # 输入的位置编码
        self.pos_emb = nn.Parameter(torch.randn(num_patches, hidden_size))
        self.transformer_encoder = GeneratorTransformerEncoder(depth,
                                                               hidden_size=hidden_size,
                                                               sln_paremeter_size=sln_paremeter_size,
                                                               drop_p=forward_drop_p,
                                                               forward_drop_p=forward_drop_p,
                                                               **kwargs)
        self.sln = SLN(hidden_size, parameter_size=sln_paremeter_size)
        if combine_patch_embeddings:  # False
            # print('combine_patch_embeddings is true')
            self.to_single_emb = nn.Sequential(
                FullyConnectedLayer(num_patches * hidden_size, combined_embedding_size, bias=bias, activation='gelu'),
                nn.Dropout(forward_drop_p),
            )

        self.lff = LFF(self.hidden_size)

        self.siren_in_features = combined_embedding_size if combine_patch_embeddings else self.hidden_size
        self.siren = Siren(in_features=self.siren_in_features, out_features=out_features,
                           style_size=self.siren_in_features, hidden_size=self.hidden_size, bias=bias,
                           hidden_layers=siren_hidden_layers, outermost_linear=True,
                           weight_modulation=weight_modulation, **kwargs)

        self.num_patches_x = int(image_size // self.out_patch_size)

    def fourier_input_mapping(self, x):
        return self.lff(x)

    # 傅里叶位置编码
    def fourier_pos_embedding(self, device):
        # Create input pixel coordinates in the unit square
        coords = np.linspace(-1, 1, self.out_patch_size, endpoint=True)
        pos = np.stack(np.meshgrid(coords, coords), -1)
        pos = torch.tensor(pos, dtype=torch.float, device=device)
        result = self.fourier_input_mapping(pos).reshape([self.out_patch_size ** 2, self.hidden_size])
        return result.to(device)

    def repeat_pos(self, hidden):
        pos = self.fourier_pos_embedding(hidden.device)
        result = repeat(pos, 'p h -> n p h', n=hidden.shape[0])  # 将pos扩充维度

        return result

    # encoder输出后的特征图经过SLN后在经过一个LFF处理后进行傅里叶编码处理然后输入siren模型中进行操作使encoder输出的特征图更加平滑，即论文中使用的隐层神经表示
    def forward(self, z):
        w = self.mlp(z) # 1、MLP
        pos = repeat(torch.sin(self.pos_emb), 'n e -> b n e', b=z.shape[0])  # 扩充维度
        hidden = self.transformer_encoder(pos, w)   # 2、GeneratorTransformerEncoderBlock,特征图输出

        if self.combine_patch_embeddings:
            # Output [batch_size, combined_embedding_size]
            hidden = self.sln(hidden, w).view((z.shape[0], -1))
            hidden = self.to_single_emb(hidden)
        else:
            # Output [batch_size*num_patches, hidden_size]
            hidden = self.sln(hidden, w).view((-1, self.hidden_size))   # 3、SLN

        pos = self.repeat_pos(hidden)   # 3、siren网络的输入(LFF)

        result = self.siren(pos, hidden)    # 4、隐层神经处理

        model_output_1 = result.view(
            [-1, self.num_patches_x, self.num_patches_x, self.out_patch_size, self.out_patch_size, self.out_features])
        model_output_2 = model_output_1.permute([0, 1, 3, 2, 4, 5])
        model_output = model_output_2.reshape([-1, self.image_size ** 2, self.out_features])

        # print(model_output)
        print(model_output.shape)
        return model_output

3、训练

代码中参数等不重要的部分去掉了

if __name__ == '__main__':
    # 单独从siren网络生成图片而不经过patch
    if combine_patch_embeddings:
        #print(1111)
        out_patch_size = image_size
        combined_embedding_size = combine_patch_embeddings_size
    else:
        #print(2222)
        out_patch_size = patch_size # 4
        combined_embedding_size = hidden_size   # 384

    siren_in_features = combined_embedding_size # siren输入的特征图
    transform = transforms.Compose(
        [transforms.ToTensor(),
         transforms.Normalize((0., 0., 0.), (1., 1., 1.))
         ])
    trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
                                            download=False, transform=transform)
    trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size,
                                              shuffle=False, num_workers=2
    # Experiments
    if generator_type == "vitgan":
        # print(111)
        # Create the Generator
        Generator = GeneratorViT(patch_size=patch_size,
                                 image_size=image_size,
                                 style_mlp_layers=style_mlp_layers,
                                 latent_dim=latent_dim,
                                 hidden_size=hidden_size,
                                 combine_patch_embeddings=combine_patch_embeddings,
                                 combined_embedding_size=combined_embedding_size,
                                 sln_paremeter_size=sln_paremeter_size,
                                 num_heads=num_heads,
                                 depth=depth,
                                 forward_drop_p=dropout_p,
                                 bias=bias,
                                 weight_modulation=weight_modulation,
                                 siren_hidden_layers=siren_hidden_layers,
                                 demodulation=demodulation,
                                 out_patch_size=out_patch_size,
                                 ).to(device)

        print(Generator)
        # use the modules apply function to recursively apply the initialization
        # 应用权重
        Generator.apply(init_normal)
        num_patches_x = int(image_size // out_patch_size)
        # 加载训练好的参数
        if os.path.exists(f'{experiment_folder_name}/weights/Generator.pth'):
            Generator = torch.load(f'{experiment_folder_name}/weights/Generator.pth')
        wandb.watch(Generator)
    	elif generator_type == "cnn":
        cnn_generator = CNNGenerator(hidden_size=hidden_size, latent_dim=latent_dim).to(device)
        print(cnn_generator)
        cnn_generator.apply(init_normal)
        if os.path.exists(f'{experiment_folder_name}/weights/cnn_generator.pth'):
            cnn_generator = torch.load(f'{experiment_folder_name}/weights/cnn_generator.pth')
        wandb.watch(cnn_generator)
    # Create the three types of discriminators
    if discriminator_type == "vitgan":
        Discriminator = ViT(discriminator=True,
                            patch_size=patch_size * 2,
                            stride_size=patch_size,
                            n_classes=1,
                            num_heads=num_heads,
                            depth=depth,
                            forward_drop_p=dropout_p,
                            ).to(device)

        print(Discriminator)

        Discriminator.apply(init_normal)

        if os.path.exists(f'{experiment_folder_name}/weights/discriminator.pth'):
            Discriminator = torch.load(f'{experiment_folder_name}/weights/discriminator.pth')

        wandb.watch(Discriminator)

    elif discriminator_type == "cnn":
        cnn_discriminator = CNN().to(device)

        print(cnn_discriminator)

        cnn_discriminator.apply(init_normal)

        if os.path.exists(f'{experiment_folder_name}/weights/discriminator.pth'):
            cnn_discriminator = torch.load(f'{experiment_folder_name}/weights/discriminator.pth')

        wandb.watch(cnn_discriminator)

    elif discriminator_type == "stylegan2":
        stylegan2_discriminator = StyleGanDiscriminator(image_size=32).to(device)

        print(stylegan2_discriminator)

        # stylegan2_discriminator.apply(init_normal)

        if os.path.exists(f'{experiment_folder_name}/weights/discriminator.pth'):
            stylegan2_discriminator = torch.load(f'{experiment_folder_name}/weights/discriminator.pth')

        wandb.watch(stylegan2_discriminator)

    # Training

    os.makedirs(f"{experiment_folder_name}/weights", exist_ok=True)
    os.makedirs(f"{experiment_folder_name}/samples", exist_ok=True)

    # Loss function
    criterion = nn.BCEWithLogitsLoss()

    if discriminator_type == "cnn":
        discriminator = cnn_discriminator
    elif discriminator_type == "stylegan2":
        discriminator = stylegan2_discriminator
    elif discriminator_type == "vitgan":
        discriminator = Discriminator

    if generator_type == "cnn":
        params = cnn_generator.parameters()
    else:
        params = Generator.parameters()

    # 优化器
    optim_g = torch.optim.Adam(lr=lr, params=params, betas=beta)
    optim_d = torch.optim.Adam(lr=lr_dis, params=discriminator.parameters(), betas=beta)
    ema = ExponentialMovingAverage(params, decay=0.995)     # 滑动平均

    fixed_noise = torch.FloatTensor(np.random.normal(0, 1, (16, latent_dim))).to(device)

    # 鉴别器判断生成器生成图像时，损失函数进行计算时使用的全0矩阵
    discriminator_f_img = torch.zeros([batch_size, 3, image_size, image_size]).to(device)

    trainset_len = len(trainloader.dataset) # 50000
    # print('trainset_len：',trainset_len)

    step = 0

    for epoch in range(epochs):
        for batch_id, batch in enumerate(trainloader):
            step += 1

            # Train discriminator

            # 鉴别器，真实图像
            # Forward + Backward with real images
            r_img = batch[0].to(device) # torch.Size([16, 3, 32, 32])
            # print('r_img：',r_img.shape)
            r_logit = discriminator(r_img).flatten()
            r_label = torch.ones(r_logit.shape[0]).to(device)
            # 鉴别器损失
            lossD_real = criterion(r_logit, r_label)
            # 鉴别器bCR损失
            lossD_bCR_real = F.mse_loss(r_logit, discriminator(r_img, do_augment=False))

            # Forward + Backward with fake images
            # 噪声
            latent_vector = torch.FloatTensor(np.random.normal(0, 1, (batch_size, latent_dim))).to(device)  # torch.Size([16, 32])
            # print('latent_vector',latent_vector.shape)

            if generator_type == "vitgan":
                f_img = Generator(latent_vector)    # 生成器的生成图像,torch.Size([16, 1024, 3])
                # print('f_img1：',f_img.shape)
                f_img = f_img.reshape([-1, image_size, image_size, out_features])   # torch.Size([16, 32, 32, 3])
                # print('f_img2：',f_img.shape)
                f_img = f_img.permute(0, 3, 1, 2)   # torch.Size([16, 3, 32, 32])
                # print('f_img3：',f_img.shape)
            else:
                model_output = cnn_generator(latent_vector)
                f_img = model_output

            # assert（断言）用于判断一个表达式，在表达式条件为 false 的时候触发异常。
            assert f_img.size(0) == batch_size, f_img.shape
            assert f_img.size(1) == out_features, f_img.shape
            assert f_img.size(2) == image_size, f_img.shape
            assert f_img.size(3) == image_size, f_img.shape

            f_label = torch.zeros(batch_size).to(device)
            # Save the a single generated image to the discriminator training data
            # batch_size_history_discriminator：True,查看lossD_fake_history使用
            if batch_size_history_discriminator:
                discriminator_f_img[step % batch_size] = f_img[0].detach()
                f_logit_history = discriminator(discriminator_f_img).flatten()
                lossD_fake_history = criterion(f_logit_history, f_label)
            else:
                lossD_fake_history = 0
            # Train the discriminator on the images, generated only from this batch
            # 生成器生成图像
            f_logit = discriminator(f_img.detach()).flatten()
            # 鉴别器在生成图像上的损失
            lossD_fake = criterion(f_logit, f_label)

            lossD_bCR_fake = F.mse_loss(f_logit, discriminator(f_img, do_augment=False))
            # print('lossD_bCR_fake:',lossD_bCR_fake)
            # 噪声
            f_noise_input = torch.FloatTensor(np.random.rand(*f_img.shape) * 2 - 1).to(device)
            f_noise_logit = discriminator(f_noise_input).flatten()
            lossD_noise = criterion(f_noise_logit, f_label)

            # 鉴别器损失计算
            lossD = lossD_real * 0.5 + \
                    lossD_fake * 0.5 + \
                    lossD_fake_history * lambda_lossD_history + \
                    lossD_noise * lambda_lossD_noise + \
                    lossD_bCR_real * lambda_bCR_real + \
                    lossD_bCR_fake * lambda_bCR_fake

            optim_d.zero_grad()
            lossD.backward()
            optim_d.step()

            # Train Generator
            # 生成器
            if generator_type == "vitgan":
                f_img = Generator(latent_vector)
                f_img = f_img.reshape([-1, image_size, image_size, out_features])
                f_img = f_img.permute(0, 3, 1, 2)
            else:
                model_output = cnn_generator(latent_vector)
                f_img = model_output

            assert f_img.size(0) == batch_size
            assert f_img.size(1) == out_features
            assert f_img.size(2) == image_size
            assert f_img.size(3) == image_size

            f_logit = discriminator(f_img).flatten()
            r_label = torch.ones(batch_size).to(device)
            lossG_main = criterion(f_logit, r_label)

            lossG_diversity = diversity_loss(f_img) * lambda_diversity_penalty  # lambda_diversity_penalty=0，带惩罚的梯度计算
            lossG = lossG_main + lossG_diversity  # 生成器损失

            optim_g.zero_grad()
            lossG.backward()
            optim_g.step()
            ema.update()

            if batch_id % 20 == 0:
                print(f'epoch {epoch}/{epochs}; batch {batch_id}/{int(trainset_len / batch_size)}')
                print(f'Generator: {"{:.3f}".format(float(lossG_main))}, ' + \
                      f'Gen(diversity): {"{:.3f}".format(float(lossG_diversity))}, ' + \
                      f'Dis(real): {"{:.3f}".format(float(lossD_real))}, ' + \
                      f'Dis(fake): {"{:.3f}".format(float(lossD_fake))}, ' + \
                      f'Dis(fake_history): {"{:.3f}".format(float(lossD_fake_history))}, ' + \
                      f'Dis(noise) {"{:.3f}".format(float(lossD_noise))}, ' + \
                      f'Dis(bCR_fake): {"{:.3f}".format(float(lossD_bCR_fake * lambda_bCR_fake))}, ' + \
                      f'Dis(bCR_real): {"{:.3f}".format(float(lossD_bCR_real * lambda_bCR_real))}')

                # Plot 8 randomly selected samples
                
        # if step % sample_interval == 0:
        if generator_type == "vitgan":
            Generator.eval()
            # img_siren.eval()
            vis = Generator(fixed_noise)
            vis = vis.reshape([-1, image_size, image_size, out_features])
            vis = vis.permute(0, 3, 1, 2)
        else:
            model_output = cnn_generator(fixed_noise)
            vis = model_output

        assert vis.shape[0] == fixed_noise.shape[
            0], f'vis.shape[0] is {vis.shape[0]}, but should be {fixed_noise.shape[0]}'
        assert vis.shape[1] == out_features, f'vis.shape[1] is {vis.shape[1]}, but should be {out_features}'
        assert vis.shape[2] == image_size, f'vis.shape[2] is {vis.shape[2]}, but should be {image_size}'
        assert vis.shape[3] == image_size, f'vis.shape[3] is {vis.shape[3]}, but should be {image_size}'

        vis.detach().cpu()
        vis = make_grid(vis, nrow=4, padding=5, normalize=True)
        writer.add_image(f'Generated/epoch_{epoch}', vis)
        wandb.log({'examples': wandb.Image(vis)})

        vis = T.ToPILImage()(vis)
        vis.save(f'{experiment_folder_name}/samples/vis{epoch}.jpg')
        if generator_type == "vitgan":
            Generator.train()
            # img_siren.train()
        else:
            cnn_generator.train()
        print(f"Save sample to {experiment_folder_name}/samples/vis{epoch}.jpg")

        # Save the checkpoints.
        if generator_type == "vitgan":
            torch.save(Generator, f'{experiment_folder_name}/weights/Generator.pth')
            # torch.save(img_siren, f'{experiment_folder_name}/weights/img_siren.pth')
        elif generator_type == "cnn":
            torch.save(cnn_generator, f'{experiment_folder_name}/weights/cnn_generator.pth')
        torch.save(discriminator, f'{experiment_folder_name}/weights/discriminator.pth')
        print("Save model state.")

    writer.close()

由于没有经验，第一次训练时loss一直不变因此将学习率调小十倍变成了0.0001，因此生成图片的效果与论文不一致，且loss没有收敛。

三、深度学习

学习了吴恩达深度学习的最后一门课序列模型，了解了RNN、NLP、Word Embedding、序列模型和注意力机制。

1、RNN

判断一句话中的单词是否是人名：
在零时刻构造一个激活值⁰，通常是零向量，然后将单词的独热向量编码输入第一个神经网络，计算a¹

然后计算y¹

将激活值一直往下传完成前向传播得到结果。

2、Word Embedding

使用一定数量的单词构成词汇表，然后将词汇表中的单词使用one-hot编码表示

使用一定数量的特征词（如300个），通过对词汇表中单词进行判断得到每个单词与特征词的相关性从而得到嵌入矩阵E。

你可能感兴趣的:(周报,深度学习,神经网络,自然语言处理)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
Humanize 项目教程尤嫒冰
Humanize项目教程humanizeAJSlibraryforaddinga“humantouch”todata.项目地址:https://gitcode.com/gh_mirrors/humani/humanize项目介绍Humanize是一个开源项目，旨在将机器生成的文本转换为更加自然、人性化的文本。该项目通过先进的算法和自然语言处理技术，使得AI生成的内容更加贴近人类的表达方式，从而提高
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
18W26-殿下筱筱殿下
被一个写手关注了。本来这是两个人的空间，像被安了摄像头一样。他也在写周报，挺有意思的，两个都还活着的人，在不同的城市，写着各自的故事。潦草的生活。创意行当就是这样，听着黑胶爵士写着稿，灵感来的时候感觉满天空都在放礼花，拿出去被毙了就想骂娘。充分交流、摆正心态，我佛渡所有人。前晚梦到一个超级有创意的烟花，是自带弧形轨迹的，在天空中兜一大圈，边兜边绽放，在喊你看。昨晚梦到回家路上碰见C罗儿子在踢球，拍
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&