Cai-Gbro

2.1 LeNet（霹雳吧啦Wz笔记）

代码链接：

deep-learning-for-image-processing/pytorch_classification/Test1_official_demo at 58cb021d67b8c77ce1d703322e159cd7c6d73b0b · WZMIAOMIAO/deep-learning-for-image-processing (github.com)

model.py

import torch.nn as nn
import torch.nn.functional as F


class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, 5)  # in_channels, out_channels, kernel_size
        self.pool1 = nn.MaxPool2d(2, 2)  # kernel_size, stride
        self.conv2 = nn.Conv2d(16, 32, 5)
        self.pool2 = nn.MaxPool2d(2, 2)
        self.fc1 = nn.Linear(32 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = F.relu(self.conv1(x))  # input(3, 32, 32) output(16, 28, 28)
        x = self.pool1(x)  # output(16, 14, 14)
        x = F.relu(self.conv2(x))  # output(32, 10, 10)
        x = self.pool2(x)  # output(32, 5, 5)
        x = x.view(-1, 32 * 5 * 5)  # output(32*5*5)
        x = F.relu(self.fc1(x))  # output(120)
        x = F.relu(self.fc2(x))  # output(84)
        x = self.fc3(x)  # output(10)
        return x

代码解读

class LeNet(nn.Module):
    def __init__(self):
        super(LeNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, 5)  # in_channels, out_channels, kernel_size
        self.pool1 = nn.MaxPool2d(2, 2)  # kernel_size, stride
        self.conv2 = nn.Conv2d(16, 32, 5)
        self.pool2 = nn.MaxPool2d(2, 2)
        self.fc1 = nn.Linear(32 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

结构定义

class LeNet(nn.Module):

定义一个类，继承来自于nn.Module这个父类

def __init__(self):

定义初始化函数

super(LeNet, self).__init__()

解决在多重继承中继承父类方法可能出现的一系列问题，涉及到多继承一般都会使用到这个函数。

self.conv1 = nn.Conv2d(3, 16, 5)

定义第一个卷积层，

第一个参数是输入特征层的深度，因为这里是彩色图片有R、G、B，三个通道，所以通道数量是3.

采用了16个卷积核，所以输出通道是16个，

卷积核的尺寸是5 X 5 的，所以这里是5。

self.pool1 = nn.MaxPool2d(2, 2)

表示使用2×2的池化核进行下采样，步长为2，进行最大池化操作。

正向传播过程

 def forward(self, x):
        x = F.relu(self.conv1(x))  # input(3, 32, 32) output(16, 28, 28)
        x = self.pool1(x)  # output(16, 14, 14)
        x = F.relu(self.conv2(x))  # output(32, 10, 10)
        x = self.pool2(x)  # output(32, 5, 5)
        x = x.view(-1, 32 * 5 * 5)  # output(32*5*5)
        x = F.relu(self.fc1(x))  # output(120)
        x = F.relu(self.fc2(x))  # output(84)
        x = self.fc3(x)  # output(10)
        return x

这里的x就是pytorch tensor的通道排列顺序：

如下：

x = F.relu(self.conv1(x))

因为输入的是(3, 32, 32)这样的图片，根据经卷积后的矩阵尺寸大小计算公式：

N = (W − F + 2P ) / S + 1

又，矩阵经卷积操作后的尺寸由以下几个因数决定：

输入图片大小 W×W

Filter大小 F×F

步长 S

padding的像素数 P

（32 - 5 + 0 ）/1 +1 = 28

经过这个公式算出来是28，又因为用了16个卷积核，所以输出是16个通道，

所以输出图片的尺寸是(16, 28, 28)

x = self.pool1(x)

此处接受上一个卷积层的输出，即一个大小为(16, 28, 28)的图片，

因为池化层不影响深度，只改变宽高，所以把这个图片的宽高缩小两倍

输出(16, 14, 14)大小的图片。

下一层也是一样，就不重复。

x = x.view(-1, 32 * 5 * 5)

因为全连接需要的数据格式是一维向量，所以这个函数把把大小为(32, 5, 5)的图片，拉成32 * 5 * 5长度的向量。这里的-1代表第一个维度自动推理，也就是那个batch。

进入全连接层：

self.fc1 = nn.Linear(32 * 5 * 5, 120)

因为第一层的节点个数是120，所以这里的参数就是(32 * 5 * 5, 120)

self.fc2 = nn.Linear(120, 84)

因为第二层的输入是第一层的输出，又第一层有120个节点，第二层自己有84个节点，

所以参数是(120, 84)

self.fc3 = nn.Linear(84, 10)

同理这一层的输入是上一层的输出，上一层是84个节点，

又由于我们这里是分十类，所以最后的输出必须是10

所以参数是(84, 10)

参考下图（leNet结构里全连接层各数据表示情况）

这里的n就是32 * 5 * 5，当然我画的是两层的情况，leNet有三层。

不考虑第二层，只把第一层和第三层连接起来，然后输出，

那m就是84，k就是10

为什么这里最后没用softmax函数呢：

因为在训练网络时，在进行计算卷积交叉熵的过程中，在它的内部已经实现了更加高效的softmax方法

如图：

train.py

import torch
import torchvision
import torch.nn as nn
from model import LeNet
import torch.optim as optim
import torchvision.transforms as transforms
import numpy as np
import matplotlib.pyplot as plt


def main():
    transform = transforms.Compose(
        [transforms.ToTensor(),
         transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

    # 50000张训练图片
    # 第一次使用时要将download设置为True才会自动去下载数据集
    train_set = torchvision.datasets.CIFAR10(root='./data', train=True,
                                             download=False, transform=transform)
    train_loader = torch.utils.data.DataLoader(train_set, batch_size=36,
                                               shuffle=True, num_workers=0)

    # 10000张验证图片
    # 第一次使用时要将download设置为True才会自动去下载数据集
    val_set = torchvision.datasets.CIFAR10(root='./data', train=False,
                                           download=False, transform=transform)
    val_loader = torch.utils.data.DataLoader(val_set, batch_size=5000,
                                             shuffle=False, num_workers=0)
    val_data_iter = iter(val_loader)
    val_image, val_label = next(val_data_iter)

    classes = ('plane', 'car', 'bird', 'cat',
               'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

    net = LeNet()
    loss_function = nn.CrossEntropyLoss()
    optimizer = optim.Adam(net.parameters(), lr=0.001)

    for epoch in range(5):  # loop over the dataset multiple times

        running_loss = 0.0
        for step, data in enumerate(train_loader, start=0):
            # get the inputs; data is a list of [inputs, labels]
            inputs, labels = data

            # zero the parameter gradients
            optimizer.zero_grad()

            # forward + backward + optimize
            outputs = net(inputs)
            loss = loss_function(outputs, labels)
            loss.backward() 
            optimizer.step()

            # print statistics
            running_loss += loss.item()
            if step % 500 == 499:  # print every 500 mini-batches
                with torch.no_grad():  
                    outputs = net(val_image)  # [batch, 10]
                    predict_y = torch.max(outputs, dim=1)[1]  
                    accuracy = torch.eq(predict_y, val_label).sum().item() / val_label.size(0)  

                    print('[%d, %5d] train_loss: %.3f  test_accuracy: %.3f' %
                          (epoch + 1, step + 1, running_loss / 500, accuracy))  
                    running_loss = 0.0

    print('Finished Training')

    save_path = './Lenet.pth'
    torch.save(net.state_dict(), save_path)

# # 简单展示数据集中的图片，随机展示4张图片并输出标签
# def imshow(img):
#     # denormalize 反标准化，将图片转化为正常格式
#     img = img / 2 + 0.5  # 前面transform部分进行标准化 output = (input=0.5)/0.2;此处为反标准化input=output*o.5+0.5=output/2+0.5
#     nping = img.numpy()
#     plt.imshow(np.transpose(nping, (1, 2, 0)))  # H*W*C,图片原始shape格式
#     plt.show()
#
# # print labels
# print(''.join('%5s' % classes[test_label[j]] for j in range(4)))
# # show images
# imshow(torchvision.utils.make_grid(val_image))  # 需要首先将测试数据集的数量改为4，简单读取查看


if __name__ == '__main__':
    main()

代码解读


    train_set = torchvision.datasets.CIFAR10(root='./data', train=True,
                                             download=False, transform=transform)

第一次使用时要将download设置为True才会自动去下载数据集，并下载在当前目录的data文件夹下，这个文件夹会自动生成。

transform = transforms.Compose(
        [transforms.ToTensor(),
         transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

transform这个函数的作用是对图像进行预处理

这个代码的意思是通过Compose方法将中括号内的

transforms.ToTensor(),

transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))

这两个预处理方法打包成一个整体。

两个方法的作用如下：

在这行代码中，(0.5, 0.5, 0.5)表示将每个通道的像素值都减去0.5，从而使其均值为0；(0.5, 0.5, 0.5)表示将每个通道的像素值都除以0.5，从而使其标准差为1。因此，这行代码的作用是对输入图像的每个通道进行归一化，使其像素值在[-1,1]之间。

需要注意的是，在进行归一化操作时，需要保证输入图像的像素值为浮点数类型，且范围在[0,1]之间。

为什么说0.5是RGB颜色通道的中间值

RGB颜色空间的范围是[0, 255]，其中0表示最暗的颜色（黑色），255表示最亮的颜色（白色），因此颜色通道的中间值应该是(0+255)/2=127.5。在将像素值归一化到[-1,1]之前，如果将像素值除以255，得到的像素值范围就会变成[0,1]，此时中间值为0.5。因此，0.5是将像素值归一化到[0,1]范围内时的中间值。

 train_loader = torch.utils.data.DataLoader(train_set, batch_size=36,
                                               shuffle=True, num_workers=0)

这个函数的作用是将前面的训练集导入进来，将它分成一个批次一个批次的形式，这里的batchz_size就是之前的batch.

这里的batch_size=36就是说每一批拿出36张图片进行训练

shuffle=True表示要将数据打乱后再抽取

num_workers=0 表示载入数据的线程数，windows 系统下必须为0，否则报错

下面是chatgpt的回答：

这行代码是针对训练数据集train_set定义了一个数据加载器（Data Loader），用于将训练数据按批次加载到模型中进行训练。具体来说，它的功能有以下几个：

将训练数据集train_set按照batch_size分成若干个小批次，每个小批次包含batch_size个样本；

在每个epoch开始时，将训练数据集打乱（shuffle=True），从而使得每个小批次的样本都是随机选择的；

使用num_workers参数指定加载数据所需的进程数，以加快数据加载速度。

在这行代码中，train_set是训练数据集，batch_size是每个小批次的样本数量，shuffle=True表示每个epoch开始时打乱训练数据集，num_workers是数据加载所需的进程数（这里设置为0，表示不使用多进程）。

值得注意的是，数据加载器中的每个小批次的样本数量通常会影响模型的训练效果。如果batch_size设置过小，每个小批次的样本数量太少，可能会导致模型欠拟合；如果batch_size设置过大，每个小批次的样本数量太多，可能会导致模型过拟合。因此，在进行模型训练时，需要根据实际情况适当调整batch_size的大小。

 val_data_iter = iter(val_loader)
 val_image, val_label = next(val_data_iter)

这些代码是用于从验证数据集val_loader中获取一个小批次的数据用于模型验证的。具体来说，它的功能有以下几个：

使用iter()函数将val_loader转换为一个可迭代的对象val_data_iter；

使用next()函数从val_data_iter中获取下一个小批次的数据；

将获取到的小批次的图像数据val_image和标签数据val_label分别存储到变量中。

在这些代码中，val_loader是验证数据集，它通常由torch.utils.data.DataLoader()函数生成，用于将验证数据集按批次加载到模型中进行验证。val_data_iter是val_loader的一个可迭代对象，它可以通过调用next()函数来逐个获取小批次的数据。val_image是获取到的小批次的图像数据，val_label是获取到的小批次的标签数据。

需要注意的是，在进行模型验证时，通常需要将验证数据集的全部样本都输入到模型中进行验证，并计算模型在验证集上的性能指标。因此，上述代码通常会放在一个循环中，以逐个获取验证数据集中的所有小批次数据，进行模型验证和性能指标计算。

optimizer = optim.Adam(net.parameters(), lr=0.001)

这行代码是用于定义优化器（Optimizer）的，用于优化神经网络模型的参数。具体来说，它的功能如下：

使用optim.Adam()函数创建一个Adam优化器对象optimizer；

将神经网络模型net的参数net.parameters()传递给优化器对象optimizer，用于优化模型的参数；

设置优化器的学习率（learning rate）为0.001，即在每次迭代中更新参数时的步长大小。

Adam优化器的工作原理如下：

初始化模型参数的梯度值为0；

从训练数据集中随机取出一个batch size的数据，将这些数据输入到神经网络模型中，并计算出模型在这些数据上的输出值；

计算输出值与真实标签之间的误差（即损失函数），并计算出损失函数对模型参数的梯度；

根据梯度和学习率（learning rate）计算出每个参数的更新量，并更新参数值；

重复以上步骤，直至训练集上的损失函数收敛或达到最大迭代次数。

在这些代码中，net是神经网络模型，它通常由torch.nn.Module()类定义。Adam优化器是一种基于梯度的优化器，通常用于神经网络的训练。在每次迭代中，Adam优化器使用当前的梯度信息来更新神经网络模型的参数，使得损失函数值最小化。学习率是优化器中的一个重要参数，它决定了每次参数更新的步长大小。通常需要根据实际情况适当调整学习率的大小，以获得最佳的模型训练效果。

    for epoch in range(5):  # loop over the dataset multiple times

        running_loss = 0.0
        for step, data in enumerate(train_loader, start=0):
            # get the inputs; data is a list of [inputs, labels]
            inputs, labels = data

            # zero the parameter gradients
            optimizer.zero_grad()

            # forward + backward + optimize
            outputs = net(inputs)
            loss = loss_function(outputs, labels)
            loss.backward() 
            optimizer.step()

            # print statistics
            running_loss += loss.item()
            if step % 500 == 499:  # print every 500 mini-batches
                with torch.no_grad():  
                    outputs = net(val_image)  # [batch, 10]
                    predict_y = torch.max(outputs, dim=1)[1]  
                    accuracy = torch.eq(predict_y, val_label).sum().item() / val_label.size(0)  

                    print('[%d, %5d] train_loss: %.3f  test_accuracy: %.3f' %
                          (epoch + 1, step + 1, running_loss / 500, accuracy))  
                    running_loss = 0.0

这些代码是用于训练和验证神经网络模型的。具体来说，它的功能有以下几个：

使用一个外层循环来控制训练的epoch数，即将整个训练集遍历多次；

在每个epoch开始时，初始化训练损失running_loss为0；

使用for循环遍历训练数据集train_loader，每次获取一个小批次的数据inputs和标签labels；

将优化器optimizer中的参数梯度清零optimizer.zero_grad()，避免上一次迭代的残余梯度对本次迭代造成影响；

将小批次数据inputs输入到神经网络模型net中，得到模型在小批次数据上的输出outputs；

使用损失函数loss_function计算模型在小批次数据上的损失loss；

使用反向传播算法计算损失关于模型参数的梯度loss.backward()，并使用优化器optimizer更新模型参数optimizer.step()；

计算训练损失running_loss，用于后续的训练过程可视化；

在每个epoch的末尾，对验证集进行评估，计算模型在验证集上的准确率accuracy，并打印出当前epoch和训练过程中的训练损失与测试准确度。

在这些代码中，epoch是训练的轮数，train_loader是训练数据集的数据加载器，val_image和val_label是验证集的图像数据和标签数据。running_loss是训练过程中的训练损失，step是当前小批次的编号。accuracy是模型在验证集上的准确率，val_label.size(0)表示验证集的样本数量。

这里面的 loss.backward() 的作用

在神经网络模型的训练过程中，需要通过反向传播算法计算损失函数对模型参数的梯度，从而使用优化器来更新模型参数。这就是loss.backward()函数的作用所在。具体来说，它的功能有以下几个：

计算当前小批次数据上的损失函数loss关于神经网络模型中每个可训练参数（如权重和偏置）的梯度；

将计算得到的梯度存储在各个参数的.grad属性中；

计算完成后，可以使用优化器的step()函数来更新模型中的参数。

需要注意的是，反向传播算法是一个基于链式法则的求导过程，它将当前计算节点的梯度向前传递直至输入节点，从而计算出各个参数的梯度。在PyTorch中，可以通过调用loss.backward()函数来自动计算梯度，避免手动计算梯度的繁琐过程。

loss.backward()

optimizer.step()

这两行代码的作用机理就是，前者算出当前损失下的梯度，后者根据前者算出的梯度更新得到一个新的参数，然后根据这两个参数对应的loss值来决定怎么更新参数，即取当前的权重还是取更新后的权重。

 running_loss += loss.item()

这行代码是用于计算训练过程中的训练损失的。具体来说，它的功能有以下几个：

将当前小批次数据上的损失loss使用loss.item()函数转换为一个标量值，存储在变量loss_value中；

将loss_value加到训练损失running_loss中；

在训练过程中，running_loss记录了所有小批次数据的损失之和，用于后续的训练过程可视化。

在这些代码中，loss是神经网络模型在当前小批次数据上的损失函数值，它通常由损失函数（如交叉熵损失函数）计算得到。loss.item()函数将损失值转换为一个标量值，可以方便地进行后续的计算和处理。running_loss是一个累计变量，它记录了训练过程中所有小批次数据的损失之和，用于评估模型的训练效果。

with torch.no_grad():  
    outputs = net(val_image)  # [batch, 10]
    predict_y = torch.max(outputs, dim=1)[1]  
    accuracy = torch.eq(predict_y, val_label).sum().item() / val_label.size(0)  

    print('[%d, %5d] train_loss: %.3f  test_accuracy: %.3f' %
          (epoch + 1, step + 1, running_loss / 500, accuracy))  
    running_loss = 0.0

dim=1指定沿着第1个维度（即列维度）进行最大值的查找，这样就可以得到每个输出向量中的最大值和对应的类别索引；

[1]表示取得每个最大值对应的类别索引，即输出矩阵outputs中每行最大值所在的列索引，得到一个一维张量predict_y。

这些代码是用于在模型训练过程中对模型在验证集上的性能进行评估的。具体来说，它的功能有以下几个：

使用torch.no_grad()语句创建一个上下文管理器，该上下文管理器可以禁用PyTorch自动求导机制，从而避免在评估模型时浪费内存和计算资源；因为这里的测试集数据一般都会非常大，这里的batch sieze 是5000：

如果不用with torch.no_grad():

那么就会自动取求这些数据的梯度，要知道我们训练集每个batch size是36.

将验证集的图像数据val_image输入到神经网络模型net中，得到模型在验证集上的输出outputs（每个输出都是一个10维向量，表示对应样本属于10个类别的概率）；

使用torch.max()函数计算每个输出向量中的最大值以及对应的类别索引，得到模型对验证集上每个样本的预测值predict_y；

使用torch.eq()函数计算预测值predict_y与验证集标签val_label之间的匹配情况，得到正确预测的样本数量；

将正确预测的样本数量除以验证集的样本数量val_label.size(0)，得到模型在验证集上的准确率accuracy。

在这些代码中，val_image是验证集的图像数据，val_label是验证集的标签数据。net是神经网络模型，outputs是模型在验证集上的输出，predict_y是模型对验证集上每个样本的预测值，accuracy是模型在验证集上的准确率。通过对模型在验证集上的性能进行评估，可以及时发现模型的过拟合和欠拟合等问题，从而调整模型的超参数和结构，提高模型的泛化能力。

predict.py

import torch
import torchvision.transforms as transforms
from PIL import Image

from model import LeNet


def main():
    transform = transforms.Compose(
        [transforms.Resize((32, 32)),
         transforms.ToTensor(),
         transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

    classes = ('plane', 'car', 'bird', 'cat',
               'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

    net = LeNet()
    net.load_state_dict(torch.load('Lenet.pth'))

    im = Image.open('1.jpg')
    im = transform(im)  # [C, H, W]
    im = torch.unsqueeze(im, dim=0)  # [N, C, H, W]

    with torch.no_grad():
        outputs = net(im)
        predict = torch.max(outputs, dim=1)[1].numpy()
    print(classes[int(predict)])


if __name__ == '__main__':
    main()

代码解读

import torch: 导入PyTorch库，一个用于深度学习的开源库。

import torchvision.transforms as transforms: 从torchvision库中导入transforms模块，用于对图像进行预处理。

from PIL import Image: 从PIL库中导入Image类，用于处理图像。

from model import LeNet: 从model模块中导入LeNet类，这是一个预先定义好的LeNet模型。

def main():: 定义主函数main。

transform = transforms.Compose([...]): 定义一个图像预处理的组合操作，包括：调整图像大小为32x32，将图像转换为张量，对图像进行归一化处理。

classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck'): 定义一个元组，包含10个类别的名称。

net = LeNet(): 创建一个LeNet模型实例。

net.load_state_dict(torch.load('Lenet.pth')): 加载预训练的模型权重。

im = Image.open('1.jpg'): 使用PIL库打开一张名为'1.jpg'的图像。但通过PIL打开的图片其格式一般是[ H, W ,C ]

im = transform(im): 对图像进行预处理。即把[ H, W ,C ]转换成[C, H, W]格式。

im = torch.unsqueeze(im, dim=0): 在图像张量的第0维（批量维度）上增加一个维度，就是转换成标准的pytorch tensor的格式，以便将其作为一个批量输入到模型中。

with torch.no_grad():: 使用torch.no_grad()上下文管理器，表示在接下来的代码块中，不需要计算梯度。

outputs = net(im): 将预处理后的图像输入到LeNet模型中，得到输出结果。

predict = torch.max(outputs, dim=1)[1].numpy(): 找到输出结果中概率最大的类别索引。

print(classes[int(predict)]): 根据索引在classes元组中找到对应的类别名称，并打印出来。

net.load_state_dict(torch.load('Lenet.pth'))

torch.load('Lenet.pth'): 使用PyTorch的torch.load()函数从文件Lenet.pth中加载预训练的模型权重。这个文件通常是通过torch.save()函数保存的，包含了模型的参数（权重和偏置等）。Lenet.pth文件应该位于当前工作目录或者指定的文件路径下。

net.load_state_dict(...): 调用LeNet模型实例（net）的load_state_dict()方法，将加载到的预训练模型权重应用到当前模型实例上。load_state_dict()方法接受一个字典作为参数，该字典包含了模型的各个层的参数（权重和偏置等）。

im = Image.open('1.jpg')
im = transform(im)  # [C, H, W]
im = torch.unsqueeze(im, dim=0)  # [N, C, H, W]

im = Image.open('1.jpg'): 使用PIL库的Image.open()函数打开名为'1.jpg'的图像文件，并将其赋值给变量im。这里，im是一个PIL图像对象。

im = transform(im): 对图像im进行预处理。transform是一个由torchvision.transforms.Compose()创建的预处理操作组合，包括调整图像大小为32x32，将图像转换为张量，以及对图像进行归一化处理。这些预处理操作是为了将图像转换为LeNet模型所期望的输入格式。经过预处理后，im变为一个形状为[C, H, W]的PyTorch张量，其中C表示通道数（颜色通道），H表示图像高度，W表示图像宽度。

im = torch.unsqueeze(im, dim=0): 使用PyTorch的torch.unsqueeze()函数在图像张量的第0维（批量维度）上增加一个维度。这是因为LeNet模型期望输入的张量形状为[N, C, H, W]，其中N表示批量大小。通过在第0维上增加一个维度，我们将单张图像转换为一个包含1张图像的批量，以便将其输入到模型中。

这三行代码的工作原理是：首先打开一张图像，然后对其进行预处理，将其转换为LeNet模型所期望的输入格式，最后将单张图像转换为一个批量，以便将其输入到模型中进行分类。

pytorch tensor的通道排序

N：批量大小（Batch size），表示一批次中包含的样本数量。

C：通道数（Channel），表示图像的颜色通道（例如，对于彩色图像，通常有3个通道：红、绿、蓝）。

H：图像高度（Height），表示图像在垂直方向上的像素数量。

W：图像宽度（Width），表示图像在水平方向上的像素数量。

例如，一个形状为(64, 3, 32, 32)的张量表示一批次包含64张3通道（RGB）的32x32像素大小的图像。

一些小技巧

按住Ctrl键再左键函数名，

进入函数定义：

参数定义：

复制函数名到去官方查看官方文档

你可能感兴趣的:(深度学习-图像分类,深度学习,神经网络,计算机视觉)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
目前主流图像分类模型的详细对比分析 @comefly 闲聊 linux 运维服务器
以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失，支持超深网络（如ResNet-152）76.1%25.6中等通用分类、目标检测ViTTransformer将图像分割为patches，用标准Transforme
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio