盼小辉丶

PyTorch深度学习实战（33）——条件生成对抗网络(Conditional Generative Adversarial Network, CGAN)

PyTorch深度学习实战（33）——条件生成对抗网络

- 0. 前言
- 1. 条件生成对抗网络
- - 1.1 模型介绍
  - 1.2 模型与数据集分析
- 2. 实现条件生成对抗网络
- 小结
- 系列链接

0. 前言

条件生成对抗网络 (Conditional Generative Adversarial Network, CGAN) 是一种生成对抗网络 (Generative Adversarial Network, GAN)，旨在通过给定特定条件信息的情况下生成符合条件的合成数据。这种网络结构通常用于生成图片、音频、文本等多种类型的数据。条件生成网络的核心思想是将条件信息与潜在空间中的噪声向量进行联合建模，以生成与条件一致的输出。常见的条件信息可以是类别标签、文本描述、图像特征等，这些信息可以指导网络生成具有特定属性、风格或类别的数据样本。在本节中，将构建 CGAN 根据条件向量生成指定性别的人脸图像。

1. 条件生成对抗网络

1.1 模型介绍

条件生成对抗网络 (Conditional Generative Adversarial Network, CGAN) 是生成对抗网络的一种扩展，它同时接受噪声数据和条件数据作为输入，以控制生成的数据样本。与标准的生成对抗网络 (Generative Adversarial Network, CGAN)不同，输入到 CGAN 的随机噪声向量和条件向量一起传递到生成网络中，以生成具有所需特征的样本，条件向量可以是数字或对象的标签，这样生成网络可以控制生成出来的图像具有特定的属性，例如，猫或狗的图像，或戴眼镜的人的图像。
条件生成网络由两部分组成：生成网络和判别网络。生成网络负责接收条件信息和噪声向量，通过一系列的神经网络层逐步生成合成数据。判别网络则用于评估生成的数据与真实数据之间的差异，以辨别生成数据的真实性。生成网络和判别网络通过对抗训练的方式相互竞争和改进，从而提高生成网络的性能。
条件生成网络的应用非常广泛。例如，在图像生成领域，条件生成网络可以根据特定的类别标签生成具有特定特征或风格的图像；在文本生成领域，条件生成网络可以根据给定的文本描述生成相应的文本段落或文章。

1.2 模型与数据集分析

为了训练对抗生成网络，我们需要了解本节所用的数据集，本节同样使用在 DCGAN 一节中介绍的人脸图像数据集，下载地址：https://pan.baidu.com/s/1dvDCBLSGwblg57p9RDBEJQ，提取码：y9fi。数据集包含男性和女性的面部图像及其相应的标签，在本节中，我们将学习如何根据随机噪声与条件向量生成指定性别的人脸图像，模型训练策略如下：

将图像标签转换为独热编码格式
将标签通过嵌入层以生成每个类别的多维表示
生成随机噪声并与嵌入层输出相连接
训练模型

2. 实现条件生成对抗网络

接下来，使用 PyTorch 根据以上分析实现条件生成对抗网络，构建条件生成对抗网络根据噪声和条件向量生成指定类别图像。

(1) 导入相关库：

from torchvision import transforms
import torchvision.utils as vutils
import cv2, numpy as np
import torch
import os
from glob import glob
from PIL import Image
from torch import nn, optim
from torch.utils.data import DataLoader, Dataset
from matplotlib import pyplot as plt
device = "cuda" if torch.cuda.is_available() else "cpu"

(2) 创建数据集和数据加载器。

存储男性和女性图像路径：

female_images = glob('male_female_face_images/females/*.jpg')
male_images = glob('male_female_face_images/males/*.jpg')

裁剪图像，只保留面部区域并丢弃图像中的其他部分。首先，使用级联滤波器识别图像中的人脸：

face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

OpenCV 提供了 4 个级联分类器用于人脸检测，可以从 OpenCV 官方下载这些级联分类器文件：

haarcascade_frontalface_alt.xml (FA1)
haarcascade_frontalface_alt2.xml (FA2)
haarcascade_frontalface_alt_tree.xml (FAT)
haarcascade_frontalface_default.xml (FD)

创建两个新文件夹(一个对应男性，另一个对应女性图像)并将所有裁剪的人脸图像转储到相应的文件夹中：

if not os.path.exists('cropped_faces_female'):
    os.mkdir('cropped_faces_female')
if not os.path.exists('cropped_faces_male'):
    os.mkdir('cropped_faces_male')

for i in range(len(female_images)):
    img = cv2.imread(female_images[i],1)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)
    for (x,y,w,h) in faces:
        img2 = img[y:(y+h),x:(x+w),:]
    cv2.imwrite('cropped_faces_female/'+str(i)+'.jpg', img2)
for i in range(len(male_images)):
    img = cv2.imread(male_images[i],1)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    faces = face_cascade.detectMultiScale(gray, 1.3, 5)
    for (x,y,w,h) in faces:
        img2 = img[y:(y+h),x:(x+w),:]
    cv2.imwrite('cropped_faces_male/'+str(i)+'.jpg', img2)

定义要对每个图像执行的转换：

transform=transforms.Compose([
                               transforms.Resize(64),
                               transforms.CenterCrop(64),
                               transforms.ToTensor(),
                               transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5)),
                           ])

创建 Faces 数据集类，返回图像和其中人物的相应性别：

class Faces(Dataset):
    def __init__(self, folders):
        super().__init__()
        self.folderfemale = folders[0]
        self.foldermale = folders[1]
        self.images=sorted(glob(self.folderfemale))+sorted(glob(self.foldermale))
    def __len__(self):
        return len(self.images)
    def __getitem__(self, ix):
        image_path = self.images[ix]
        image = Image.open(image_path)
        image = transform(image)
        gender = np.where('female' in str(image_path),1,0)
        return image, torch.tensor(gender).long()

创建数据集对象 ds 和数据加载器：

ds = Faces(folders=['cropped_faces_female/*.jpg','cropped_faces_male/*.jpg'])
dataloader = DataLoader(ds, batch_size=64, shuffle=True, num_workers=8)

(3) 定义权重初始化函数，使权重的分布较小：

def weights_init(m):
    classname = m.__class__.__name__
    if classname.find('Conv') != -1:
        nn.init.normal_(m.weight.data, 0.0, 0.02)
    elif classname.find('BatchNorm') != -1:
        nn.init.normal_(m.weight.data, 1.0, 0.02)
        nn.init.constant_(m.bias.data, 0)

(4) 定义判别网络模型类。

定义模型架构：

class Discriminator(nn.Module):
    def __init__(self, emb_size=32):
        super(Discriminator, self).__init__()
        self.emb_size = 32
        self.label_embeddings = nn.Embedding(2, self.emb_size)
        self.model = nn.Sequential(
            nn.Conv2d(3,64,4,2,1,bias=False),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Conv2d(64,64*2,4,2,1,bias=False),
            nn.BatchNorm2d(64*2),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Conv2d(64*2,64*4,4,2,1,bias=False),
            nn.BatchNorm2d(64*4),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Conv2d(64*4,64*8,4,2,1,bias=False),
            nn.BatchNorm2d(64*8),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Conv2d(64*8,64,4,2,1,bias=False),
            nn.BatchNorm2d(64),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Flatten()
        )
        self.model2 = nn.Sequential(
            nn.Linear(288,100),
            nn.LeakyReLU(0.2,inplace=True),
            nn.Linear(100,1),
            nn.Sigmoid()
        )
        self.apply(weights_init)

在模型类中，CGAN 使用附加参数 emb_size，emb_size 表示将输入类别标签转换成的嵌入尺寸，并将转换后的嵌入存储为 label_embeddings。将输入类别标签从独热编码形式转换为高维嵌入，以便模型具有更高的调整自由度以处理不同的类别。虽然模型类与 DCGAN 类似，不同之处在于，CGAN 还需要初始化另一个用于执行分类任务的模型 model2。

定义前向计算方法 forward，将图像和图像的标签作为输入：

    def forward(self, input, labels):
        x = self.model(input)
        y = self.label_embeddings(labels)
        input = torch.cat([x, y], 1)
        final_output = self.model2(input)
        return final_output

在 forward 方法中，获取第一个模型的输出 self.model(input) 和通过 label_embeddings 传递标签的输出，然后将这些输出连接起来。接下来，将连接后的输出传递给第二个模型 self.model2，从而获取判别网络的输出。
self.model2 的输入维度为 288，因为 self.model 的每个数据样本输出结果有 256 个值，然后将其与输入类别标签的 32 个嵌入值连接起来，因此总共有 256 + 32 = 288 个输入值传递给 self.model2。

(5) 定义生成网络类 Generator。

定义 __init__ 方法：

class Generator(nn.Module):
    def __init__(self, emb_size=32):
        super(Generator,self).__init__()
        self.emb_size = emb_size
        self.label_embeddings = nn.Embedding(2, self.emb_size)

在以上代码中，使用 nn.Embedding 将 2D 输入(类别标签)转换为 32 维向量 (self.emb_size)：

        self.model = nn.Sequential(
            nn.ConvTranspose2d(100+self.emb_size,64*8,4,1,0,bias=False),
            nn.BatchNorm2d(64*8),
            nn.ReLU(True),
            nn.ConvTranspose2d(64*8,64*4,4,2,1,bias=False),
            nn.BatchNorm2d(64*4),
            nn.ReLU(True),
            nn.ConvTranspose2d(64*4,64*2,4,2,1,bias=False),
            nn.BatchNorm2d(64*2),
            nn.ReLU(True),
            nn.ConvTranspose2d(64*2,64,4,2,1,bias=False),
            nn.BatchNorm2d(64),
            nn.ReLU(True),
            nn.ConvTranspose2d(64,3,4,2,1,bias=False),
            nn.Tanh()
        )

在以上代码中，利用 nn.ConvTranspose2d 执行上采样得到图像作为输出。

应用权重初始化：

        self.apply(weights_init)

定义前向计算方法 forward，将随机噪声 (input_noise) 和输入标签 (labels) 作为输入生成图像输出：

    def forward(self,input_noise,labels):
        label_embeddings = self.label_embeddings(labels).view(len(labels), self.emb_size, 1, 1)
        input = torch.cat([input_noise, label_embeddings], 1)
        return self.model(input)

实例化生成网络与判别网络对象：

generator = Generator().to(device)
discriminator = Discriminator().to(device)

(6) 定义函数 noise() 生成随机噪声并将其注册到设备中：

def noise(size):
    n = torch.randn(size, 100, 1, 1, device=device)
    return n.to(device)

(7) 定义判别网络训练函数 discriminator_train_step()。

判别网络包含 4 个输入，真实图像 (real_data)、真实图像标签 (real_labels)、生成图像 (fake_data)、生成图像标签 (fake_labels)、损失函数 (loss) 和优化器 (d_optimizer)：

def discriminator_train_step(real_data, real_labels, fake_data, fake_labels, loss, d_optimizer):
    d_optimizer.zero_grad()

在以上代码中，重置判别网络对应的梯度。

计算对应于真实数据预测 (prediction_real) 的损失值，将 real_data 和 real_labels 通传递到判别网络中，输出的预测结果与期望值 (torch.ones(len(real_data),1).to(device)) 进行比较，得到损失 error_real 后执行反向传播：

    prediction_real = discriminator(real_data, real_labels)
    error_real = loss(prediction_real, torch.ones(len(real_data), 1).to(device))
    error_real.backward()

计算对应于生成数据预测 (prediction_fake) 的损失值，将 fake_data 和 fake_labels 传递到判别网络中，输出的预测结果与期望 (torch.zeros(len(fake_data),1).to(device)) 进行比较，得到损失 error_fake 后执行反向传播：

    prediction_fake = discriminator(fake_data, fake_labels)
    error_fake = loss(prediction_fake, torch.zeros(len(fake_data), 1).to(device))
    error_fake.backward()

更新权重并返回损失值：

    d_optimizer.step()
    return error_real + error_fake

(8) 定义生成网络训练函数，将生成图像 (fake_data) 和生成图像标签 (fake_labels) 作为输入传递：

def generator_train_step(fake_data, fake_labels, loss, g_optimizer):
    g_optimizer.zero_grad()
    prediction = discriminator(fake_data, fake_labels)
    error = loss(prediction, torch.ones(len(fake_data), 1).to(device))
    error.backward()
    g_optimizer.step()
    return error

generator_train_step 函数类似于 discriminator_train_step，不同之处在于 generator_train_step 函数的期望输出是 torch.ones(len(fake_data),1).to(device))。

(9) 定义生成网络和判别网络模型对象、损失优化器和损失函数：

discriminator = Discriminator().to(device)
generator = Generator().to(device)
loss = nn.BCELoss()
d_optimizer = optim.Adam(discriminator.parameters(), lr=0.0002, betas=(0.5, 0.999))
g_optimizer = optim.Adam(generator.parameters(), lr=0.0002, betas=(0.5, 0.999))
fixed_noise = torch.randn(64, 100, 1, 1, device=device)
fixed_fake_labels = torch.LongTensor([0]*(len(fixed_noise)//2) + [1]*(len(fixed_noise)//2)).to(device)
loss = nn.BCELoss()

n_epochs = 80
img_list = []
d_loss_epoch = []
g_loss_epoch = []

在以上代码中，定义 fixed_fake_labels 时，指定一半图像对应类别 0，另一半对应于类别 1，并定义 fixed_noise 用于根据随机噪声生成图像。

(10) 训练模型。

遍历批图像及其标签：

for epoch in range(n_epochs):
    N = len(dataloader)
    d_loss_items = []
    g_loss_items = []
    for bx, (images, labels) in enumerate(dataloader):

初始化 real_data 和 real_labels：

        real_data, real_labels = images.to(device), labels.to(device)

初始化 fake_data 和 fake_labels：
fake_labels = torch.LongTensor(np.random.randint(0, 2, len(real_data))).to(device)
fake_data = generator(noise(len(real_data)), fake_labels)
fake_data = fake_data.detach()

使用 discriminator_train_step 函数训练判别网络以计算判别网络损失 (d_loss)：

        d_loss = discriminator_train_step(real_data, real_labels, fake_data, fake_labels, loss, d_optimizer)

重新利用生成网络生成图像 (fake_data) 和图像标签 (fake_labels) 并使用 generator_train_step 函数训练生成网络，计算生成网络损失 (g_loss)：

        fake_labels = torch.LongTensor(np.random.randint(0, 2, len(real_data))).to(device)
        fake_data = generator(noise(len(real_data)), fake_labels).to(device)
        g_loss = generator_train_step(fake_data, fake_labels, loss, g_optimizer)

记录模型训练过程中的关键指标：

        d_loss_items.append(d_loss.item())
        g_loss_items.append(g_loss.item())
    d_loss_epoch.append(np.average(d_loss_items))
    g_loss_epoch.append(np.average(g_loss_items))

训练完成后，测试模型生成图像：

    if (epoch+1) % 20 == 0:
        with torch.no_grad():
            fake = generator(fixed_noise, fixed_fake_labels).detach().cpu()
            imgs = vutils.make_grid(fake, padding=2, normalize=True).permute(1,2,0)
            img_list.append(imgs)
            plt.imshow(imgs)
            plt.show()

在以上代码中，将噪声 (fixed_noise) 和标签 (fixed_fake_labels) 传递给生成网络以生成图像，训练结束后，模型的输出结果如下所示：

从上图中，我们可以看到前 32 幅图像对应男性图像，而后 32 幅图像对应女性图像。

小结

条件生成对抗网络通过整合条件信息和潜在空间噪声，能够根据特定的条件生成具有一定属性或风格的合成数据，为许多创造性和应用型任务提供了强大的工具和手段。本节中，介绍了条件生成对抗网络的基本原理，并利用 PyTorch 实现条件生成对抗网络生成指定性别的人脸图像。

系列链接

PyTorch深度学习实战（1）——神经网络与模型训练过程详解
PyTorch深度学习实战（2）——PyTorch基础
PyTorch深度学习实战（3）——使用PyTorch构建神经网络
PyTorch深度学习实战（4）——常用激活函数和损失函数详解
PyTorch深度学习实战（5）——计算机视觉基础
PyTorch深度学习实战（6）——神经网络性能优化技术
PyTorch深度学习实战（7）——批大小对神经网络训练的影响
PyTorch深度学习实战（8）——批归一化
PyTorch深度学习实战（9）——学习率优化
PyTorch深度学习实战（10）——过拟合及其解决方法
PyTorch深度学习实战（11）——卷积神经网络
PyTorch深度学习实战（12）——数据增强
PyTorch深度学习实战（13）——可视化神经网络中间层输出
PyTorch深度学习实战（14）——类激活图
PyTorch深度学习实战（15）——迁移学习
PyTorch深度学习实战（16）——面部关键点检测
PyTorch深度学习实战（17）——多任务学习
PyTorch深度学习实战（18）——目标检测基础
PyTorch深度学习实战（19）——从零开始实现R-CNN目标检测
PyTorch深度学习实战（20）——从零开始实现Fast R-CNN目标检测
PyTorch深度学习实战（21）——从零开始实现Faster R-CNN目标检测
PyTorch深度学习实战（22）——从零开始实现YOLO目标检测
PyTorch深度学习实战（23）——使用U-Net架构进行图像分割
PyTorch深度学习实战（24）——从零开始实现Mask R-CNN实例分割
PyTorch深度学习实战（25）——自编码器(Autoencoder)
PyTorch深度学习实战（26）——卷积自编码器(Convolutional Autoencoder)
PyTorch深度学习实战（27）——变分自编码器(Variational Autoencoder, VAE)
PyTorch深度学习实战（28）——对抗攻击(Adversarial Attack)
PyTorch深度学习实战（29）——神经风格迁移
PyTorch深度学习实战（30）——Deepfakes
PyTorch深度学习实战（31）——生成对抗网络(Generative Adversarial Network, GAN)
PyTorch深度学习实战（32）——DCGAN详解与实现

你可能感兴趣的:(深度学习,pytorch,生成对抗网络)

大模型学习完整路径（一站式汇总），从零基础到精通！新手友好级指南 Python程序员罗宾学习语言模型知识图谱人工智能数据库 java
如果读者朋友不想深入学习大模型，则了解提示词的使用原则也可以了。要是既不想深入学习，又要做大模型相关的项目，则对于工程同学来说，学习RAG也能把大模型玩转起来。前排提示，文末有大模型AGI-CSDN独家资料包哦！先来一张整体结构图，越是下面部分，越是基础：可以按以下步骤学习：1.理解基础概念需要了解深度学习的基本原理和常见术语，如神经网络、梯度下降、反向传播、监督学习、无监督学习、分类、回归、聚类
基于Python开发的使用多个单视图特征融合的基于图卷积网络（GCN）的肺结节检测系统的示例 go5463158465 python 深度学习算法 python 迁移学习开发语言
以下是一个基于Python开发的使用多个单视图特征融合的基于图卷积网络（GCN）的肺结节检测系统的示例。我们将使用PyTorch和torch_geometric库来实现图卷积网络，并模拟数据进行演示。步骤概述数据准备：模拟生成多个单视图的肺结节特征数据，并构建图数据。特征融合：将多个单视图特征进行融合。图卷积网络构建：构建一个简单的图卷积网络模型。模型训练：使用训练数据对模型进行训练。模型评估：使
基于YOLOv5、FaceNet与KNN的人脸识别系统 reset2021 人脸识别系统 YOLO facenet knn 人脸检测
步骤1：环境配置安装依赖库：安装Python3.x安装TensorFlow、Keras、OpenCV等深度学习库获取数据集：收集训练用的多个人脸图像（每个用户至少几十张）将图像按用户分类存放在data/train/user1,user2等文件夹中步骤2：训练YOLO模型配置YOLO数据集：创建一个data.yaml文件，配置您的数据集路径和标签train:./data/train/images/v
第G9周：ACGAN理论与实战 OreoCC GAN
>-**本文为[365天深度学习训练营]中的学习记录博客**>-**原作者：[K同学啊]**本人往期文章可查阅：深度学习总结我的环境：语言环境：Python3.11编译器：PyCharm深度学习环境：Pytorchtorch==2.0.0+cu118torchvision==0.18.1+cu118显卡：NVIDIAGeForceGTX1660论文地址：ConditionalImageSynthe
【OpenCV】OpenCV 中各模块及其算子的详细分类 de之梦-御风 OpenCV4Net .net 技术 opencv 分类人工智能
OpenCV的最新版本包含了500多个算子，这些算子覆盖了图像处理、计算机视觉、机器学习、深度学习、视频分析等多个领域。为了方便使用，OpenCV将这些算子分为多个模块，每个模块承担特定的功能。以下是OpenCV中各模块及其算子的详细分类：1.核心模块（Core）功能：提供基础数据结构（如Mat）、数学运算、内存管理、输入输出等基本操作。常用算子：数学运算：cv::add,cv::subtract
DeepSeek混合精度训练核心技术解析与实践指南燃灯工作室 Deepseek 数据挖掘语音识别计算机视觉目标检测机器学习人工智能
1.主题背景1.1Why混合精度训练（价值）混合精度训练通过结合FP16和FP32数据格式，在保证模型精度的前提下实现：40-60%显存占用降低（ResNet50案例：从7.8GB降至4.2GB）1.5-3倍训练速度提升（BERT-Large案例：从8h缩短至5h）突破大模型训练显存瓶颈（GPT-3训练显存需求从3TB降至1.8TB）1.2行业定位属于深度学习基础设施层的训练优化技术，处于模型开发
Engineering A Large Language Model From Scratch UnknownBody 语言模型人工智能自然语言处理
本文是LLM系列文章，针对《EngineeringALargeLanguageModelFromScratch》的翻译。从头开始设计一个大语言模型摘要1引言2Atinuke算法3结果4相关工作5讨论6结论摘要自然语言处理（NLP）中深度学习的激增导致了创新技术的发展和发布，这些技术能够熟练地理解和生成人类语言。Atinuke是一种基于Transformer的神经网络，通过使用独特的配置来优化各种语
AI：重塑未来的深度探索与实践 2501_90713682 人工智能科技微信
在21世纪的科技洪流中，人工智能（AI）不仅是技术进步的象征，更是推动社会变革的关键力量。从理论突破到实践应用，AI正以前所未有的深度和广度，重塑着我们的生产、生活方式以及社会结构。本文旨在深入探讨AI的核心技术、广泛应用、未来趋势、面临的挑战以及应对策略，为读者提供一个全面、深入且富有前瞻性的视角。一、AI核心技术：深度学习与智能进化的基石AI的核心在于其强大的数据处理与学习能力，这主要得益于深
深度学习（5）-卷积神经网络 yyc_audio 深度学习 cnn 人工智能
我们将深入理解卷积神经网络的原理，以及它为什么在计算机视觉任务上如此成功。我们先来看一个简单的卷积神经网络示例，它用干对MNIST数字进行分类。这个任务在第2章用密集连接网络做过，当时的测试精度约为97.8%。虽然这个卷积神经网络很简单，但其精度会超过第2章的密集连接模型。代码8-1给出了一个简单的卷积神经网络。它是conv2D层和MaxPooling2D层的堆叠，你很快就会知道这些层的作用。我们
深度学习（2)-深度学习关键网络架构 yyc_audio 人工智能机器学习深度学习
关键网络架构深度学习有4种类型的网络架构：密集连接网络、卷积神经网络、循环神经网络和Transformer。每种类型的模型都是针对特定的输入模式，网络架构包含了关于数据结构的假设，即模型搜索的假设空间。某种架构能否解决某个问题，完全取决于问题的数据结构与所选的网络架构假设之间是否匹配。这些不同类型的网络可以很容易组合起来，实现更大的多模式模型，就像拼乐高积木一样。某种程度上来说，深度学习的层就是信
深度学习-2：tensorflow 入门以及简单的线性拟合 wangs0622 深度学习 tensorflow 深度学习 tensorflow 线性回归
摘要：介绍tensorflow入门使用tensorflow实现简单的线性回归tensorflow入门知识参考：https://www.tensorflow.org/get_started/get_started载入tensorflow的标准语句：importtensorflowastftensortensor物理上的翻译是张量。tensor是tensorflow的基本核心数据单元，tensor可以
Transformer大模型实战教师学生架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer大模型实战教师学生架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来近年来，随着深度学习技术的飞速发展，自然语言处理（NLP）领域取得了显著的进步。其中，Transformer模型作为一种基于自注意力机制的深度神经网络结构，因其优越的性能和灵活的适用性，在NLP任务中得到了广泛应用。然而，Trans
AI环境初识网络飞鸥 AI 人工智能
在搭建AI环境时，当前流行的技术涉及多个方面，包括开发框架、深度学习库、硬件支持以及具体的应用技术等。以下是一些主要的技术趋势和流行技术：一、开发框架与深度学习库TensorFlow：由谷歌开发的一个开源机器学习库，广泛用于研究和生产环境。它提供了强大的张量计算能力和灵活的架构，支持广泛的机器学习和深度学习算法。PyTorch：由Facebook推出，也是一个广受欢迎的开源机器学习库。PyTorc
覆盖从供应、生产、销售到运营的全过程，引领行业数智化转型新方向的智慧快消开源了 AI服务老曹开源人工智能自动化音视频能源
智慧快消视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒，省去繁琐重复的适配流程，实现芯片、算法、应用的全流程组合，从而大大减少企业级应用约95%的开发成本。基于多年的深度学习技术研究和业务应用为基础，集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体，是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
金融大模型应用的机遇与挑战 Python程序员罗宾金融人工智能语言模型数据库自然语言处理
大模型本质特征大模型通常指大语言模型（LargeLanguageModel，LLM），是基于深度学习算法的自然语言处理技术，是通用大模型。大模型也在从单一自然语言处理模态向语音、图像等多模态大模型演进。目前国内外推出了众多的大模型，国内就不下上百款，也因此被称为“百模大战”或“千模大战”。但很多所谓的“大模型”仅是叫“大模型”而已，不管参数量多少，都不能称为真正的大模型。参数量是大模型的一个特征，
pytorch torch.triu函数介绍 qq_27390023 pytorch 人工智能 python
torch.triu是PyTorch提供的一个函数，用于生成矩阵的上三角部分。它的名称来源于"triangularupper"（上三角形），作用是将矩阵的下三角部分置为零，只保留对角线及其上方的元素。函数签名torch.triu(input,diagonal=0)→Tensor参数input:输入的张量，一般是一个二维矩阵（Tensor）。diagonal:对角线的偏移量，默认值为0。当diago
深度强化学习算法在金融交易决策中的优化应用【附数据】算法与数据算法
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
基于深度学习的股票短期趋势预测模型设计与实现【附代码】算法与数据深度学习人工智能
，我们首先对股票的基本交易数据进行了清洗和预处理，包括去除异常值、填补缺失值等。同时，我们还挖掘了多个可能影响股票价格走势的因子，如成交量、市盈率、市净率等，并将这些因子作为特征加入到数据集中。通过特征工程，我们进一步扩展了数据集，提高了模型的输入质量。在模型构建方面，我们采用了LSTM网络来处理时间序列数据。LSTM网络具有记忆功能，能够捕捉数据中的长期依赖关系，这对于股票价格走势的预测至关重要
DeepSeek 与网络安全：AI 在网络安全领域的应用与挑战一ge科研小菜菜人工智能运维网络
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言在当今数字化时代，网络安全已成为国家、企业和个人面临的重要挑战。从传统的病毒、木马攻击，到高级持续性威胁（APT）、零日漏洞和供应链攻击，网络威胁的形式日益复杂。与此同时，人工智能（AI）技术的快速发展正在为网络安全提供全新的解决方案，而DeepSeek作为AI领域的新兴力量，也正在探索如何利用深度学习和大规模语言模型（LLM）加强网络安
手撸 chatgpt 大模型:单词向量化编码和绝对位置编码算法 coding 迪斯尼 chatgpt 算法人工智能大语言模型
在上一节中，我们将每个单词转换为一个表示数字的标记（token）。现在，我们需要将这个数字映射到一个向量上，这个向量称为嵌入（embedding）。在深度学习中，所有无法通过传统数据结构描述的对象都会被用一个向量表示，例如图像、语音、单词、音频等。最初，向量中的各个字段会被初始化为随机数，然后通过大量的数据和深度学习模型来训练这些向量。训练过程逐步改变向量字段的值，从而使这些字段包含某种“知识”。
AIGC从入门到实战：ChatGPT 需要懂得写提示词的人 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AIGC从入门到实战：ChatGPT需要懂得写提示词的人第1章:AIGC概述1.1AIGC的基本概念AIGC（AI-GeneratedContent），即人工智能生成内容，是指利用人工智能技术，如生成对抗网络（GAN）、变分自编码器（VAE）等，生成具有高质量、多样化、个性化的文本、图像、音频等多媒体内容。AIGC技术已经广泛应用于内容创作、智能推荐、游戏开发、虚拟现实等多个领域，极大地提升了内容
F.interpolate函数 dringlestry 深度学习图片分辨率改变
F.interpolate是PyTorch中用于对张量（通常是图像数据）进行插值操作的函数，常用于调整张量的大小，例如改变图像的分辨率。它支持多种插值方法，包括最近邻插值、双线性插值和三次插值等。语法torch.nn.functional.interpolate(input,size=None,scale_factor=None,mode='nearest',align_corners=None)
生成对抗网络(GAN)：从概念到代码实践(附代码) 全栈你个大西瓜人工智能计算机视觉人工智能 GAN 网络对抗学习手势识别生成器与鉴别器生成对抗网络
第一章：计算机视觉中图像的基础认知第二章：计算机视觉：卷积神经网络(CNN)基本概念(一)第三章：计算机视觉：卷积神经网络(CNN)基本概念(二)第四章：搭建一个经典的LeNet5神经网络(附代码)第五章：计算机视觉：神经网络实战之手势识别(附代码)第六章：计算机视觉：目标检测从简单到容易(附代码)第七章：MTCNN人脸检测技术揭秘：原理、实现与实战(附代码)第八章：探索YOLO技术：目标检测的高
目前（2025年2月）计算机视觉（CV）领域一些表现优异的深度学习模型空空转念深度学习系列计算机视觉深度学习人工智能
按任务类型分类介绍：图像分类CoCa：结合对比学习和生成学习，通过对比损失对齐图像和文本嵌入，并使用标题生成损失预测文本标记。它在图像分类、跨模态检索和图像描述等任务中表现出色，且仅需极少的任务特定微调。PaLI：这是一个多模态模型，结合了40亿参数的视觉Transformer（ViT）和多种大型语言模型（LLM），并在包含100多种语言的100亿图像和文本数据集上进行训练。PaLI在图像描述、视
Python——生成AIGC图像朱剑君 AIGC 人工智能 python
文章目录一、背景介绍二、效果图展示三、完整代码四、分步解释五、实用建议1）提示词技巧2）性能优化3）常见问题处理4）扩展功能建议六、注意事项1.硬件要求2.法律合规3.模型安全一、背景介绍AIGC（AI-GeneratedContent），即由人工智能生成的内容，涵盖了文本、图像、音频、视频等各种形式。通过深度学习、生成对抗网络（GAN）和扩散模型等技术，AIGC能够生成高度逼真、具有艺术性的内容
图像处理：模拟色差的生成何以为皇图像处理人工智能
图像处理：模拟色差的实战案例在做瓷砖瑕疵检测的过程中，需要检测色差。但在实际生产环境中，瓷砖色差检测的数据量较少，无法直接获取足够的数据来训练和优化深度学习模型。于是就考虑通过人为生成色差数据的方式来扩充数据集，进行色差的模拟。1.什么是色差？色差（ColorDifference）是指两种颜色之间的视觉差异。在色彩科学中，CIEDE2000是目前最先进的色差计算方法之一。然而，CIEDE1976也
python工具——pypinyin 汉字转换拼音 xiaoming0018 python python list
把汉字转成拼音后可以进行深度学习分类，做内容识别1.安装pipinstallpypinyin将汉字转换为拼音并生成slug字符串importpypinyinfrompypinyinimportStylecontent=pypinyin.slug('汉语拼音')print(content)#E:\python\>pythonpinyin.py#han-yu-pin-yin修改分隔字符串importp
AI如何预测比赛结果：体育预测技术全解析翱翔的猪脑花人工智能
利用人工智能技术构建一个完整的体育预测系统，涵盖数据收集、模型构建到部署应用的完整流程。一、系统架构设计1.整体架构数据采集层数据处理层模型训练层预测服务层应用展示层2.技术选型Python3.8+TensorFlow/PyTorchScikit-learnPandas/NumpyFlask/FastAPI二、数据收集与处理1.数据源集成python复制importrequestsimportpa
淘系图搜API接入与使用全解析数据小爬虫.网站开发-Brad 各大电商平台api 国际平台API 1688 python 算法前端框架需求分析 AI编程
淘系图搜API接入与使用全解析一、接口概述淘系图搜API（即淘宝/天猫以图搜货接口）允许开发者通过上传商品图片，获取淘宝平台上的相似商品列表。其核心技术基于阿里巴巴的深度学习模型，支持服饰、家居、3C等多品类识别，广泛应用于比价、找同款、商品推荐等场景。二、接入准备资质要求：企业开发者需提供营业执照、应用场景说明（如“电商比价工具”）。个人开发者权限受限，建议通过第三方API服务商（如数位、Dat
深度学习革命背后：DBN、AlexNet、GAN 等神级架构，究竟藏着怎样的 AI 崛起密码？（附deepseek） universe_code 人工智能 python 深度学习经验分享
深度学习革命**3.深度学习革命（2006年至今）****2006年：深度学习奠基——深度信念网络（DBN）****2012年：AlexNet崛起****2014年：架构创新潮****生成对抗网络（GAN）****残差网络（ResNet）****Transformer****总结**补充（deepseek）一、核心技术原理1.**混合专家架构（MoE）**2.**多头潜在注意力（MLA）**3.*
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro