在路上的工程师

使用Pytorch识别字符验证码

使用`Pytorch`识别字符验证码

之前已经学习过利用Keras搭建神经网络模型来识别字符验证码，相关的文章：
字符验证码识别之数据预处理
涉及图像预处理和标签处理等操作

字符验证码识别之模型构建
涉及模型构建以及训练过程。

近期又学习了pytorch实现卷积神经网络相关的技术，正好遇到一个验证码识别的需求，所以尝试使用pytorch来实现。

数据预处理

要训练的验证码如下所示:

其为中文汉字的简单运算，实际上仅包括零壹贰叁肆伍陆柒捌玖加减乘等于，这15个汉字，等于可以不识别（其实识别也完全没问题，只不过问题能简化就尽量简化嘛），那最后也就是总共要识别13个汉字，分类数就是13。

另外我们可以用’0123456789±x’来代替汉字，避免文件名称无法使用汉字（windows下open-cv不能读取带有中文路径或文件名称）的问题。

下载并标注了1000张验证码，观察其字体颜色和干扰线、点均多变，无法根据特定规则将其区分；另外，尝试中值模糊、均值模糊和高斯模糊，均得不到较好的效果（肉眼观察）。只有灰度化和二值化后，感觉稍微变得清晰了一些。

另外，针对数据集我还统计了一下各个类别的数量是否均衡（主要怕有的文字训练样本太少，训练效果差）。

{'捌': 206, '减': 346, '肆': 220, '柒': 205, '零': 200, '伍': 214, '加': 358, 
'玖': 189, '壹': 195, '叁': 191, '陆': 206, '乘': 297, '贰': 176}

数据集的分布情况如上数据，总体还算均衡，那就表示可以开始处理数据和进行训练了。

在进一步处理数据之前，先划分数据集，800个训练集、验证集和测试集分别100，划分完数据集后，我也是统计了下各个数据集下的分类数量是否均衡（毕竟以前犯过划分数据集有问题的错误）。

以上都是一些简单的操作，下面仅展示后续将图片和标签转换成numpy矩阵的代码：

import os
import cv2
import numpy as np
import random
from os import remove
import math


class ImageProcess:
    channel = 1
    height = 40
    width = 90
    num_classes = 13  # 共13个汉字
    labels_len = 3  # 每个标签包含3个汉字
    words = '0123456789+-x'  # 用字符来代替汉字

    images_path_train = 'D:/captcha/shanghai/train/'
    images_path_val = 'D:/captcha/shanghai/val/'
    images_path_test = 'D:/captcha/shanghai/test/'
    images_train = os.listdir(images_path_train)
    images_val = os.listdir(images_path_val)
    images_test = os.listdir(images_path_test)

    def __init__(self):
        self.x_data_train = None
        self.y_data_train = None
        self.x_data_val = None
        self.y_data_val = None
        self.x_data_test = None
        self.y_data_test = None

        print('预处理图像...')
        self.process_image("train")
        self.process_image("test")
        self.process_image("val")

        print('预处理标签')
        self.process_label("train")
        self.process_label("test")
        self.process_label("val")

        print('处理完成')

    def process_label(self, which):
        """
        处理标签
        如果每个样本是单类别，每个类别就一个值，处理成一个长度为batch的列表就可以
        如果每个样本是多类别(假设为n, n>=2)，处理成[batch, n]的二维数组
        :param: which 处理哪个数据集
        :return:
        """
        labels_list = []
        if which == "train":
            images = self.images_train
        elif which == "test":
            images = self.images_test
        else:
            images = self.images_val
        for image in images:
            labels = image.split("_")[1].replace('.jpg', '')
            """
            这部分是ont-hot编码的处理逻辑，在pytorch种实际不需要这样处理，
            这主要取决于 nn.CrossEntropyLoss()的输入参数格式
            参数只需要标签即可, 不需要传one-hot向量
            """
            # 初始化一个 3x13 的矩阵，初始值为0.0
            # result = np.zeros((self.labels_len, self.num_classes), dtype='float32')
            # for i, c in enumerate(labels):
            #     result[i][self.words.index(c)] = 1

            """
            直接处理为 [batch, n]的二维数组 即可
            """
            result = []
            for label in labels:
                result.append(self.words.index(label))
            labels_list.append(result)
        if which == "train":
            self.y_data_train = np.array(labels_list, dtype='int32')
        elif which == "test":
            self.y_data_test = np.array(labels_list, dtype='int32')
        else:
            self.y_data_val = np.array(labels_list, dtype='int32')

    def process_image(self, which):
        """
        处理图片 处理目标 (batch, channel, height, width)
        :return:
        """
        images_list = []
        if which == "train":
            images = self.images_train
            images_path = self.images_path_train
        elif which == "test":
            images = self.images_test
            images_path = self.images_path_test
        else:
            images = self.images_val
            images_path = self.images_path_val
        for image in images:
            path = f'{images_path}{image}'
            img = cv2.imread(path)

            # 中值模糊
            # img = cv2.medianBlur(img, 3)
            # 均值模糊
            # img = cv2.blur(img, (2, 2))
            # 高斯模糊
            # img = cv2.GaussianBlur(img, (5, 5), 1)

            # 灰度化
            img = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
            # 二值化
            ret, img = cv2.threshold(img, 0, 255, cv2.THRESH_OTSU)

            # cv2.namedWindow('captcha', cv2.WINDOW_NORMAL | cv2.WINDOW_KEEPRATIO)
            # cv2.resizeWindow('captcha', 180, 80)
            # cv2.imshow('captcha', img)
            # cv2.waitKey(0)

            img = np.array(img, dtype='float32')
            # 归一化
            img /= 255
            images_list.append(np.reshape(img, (1, self.height, self.width)))

        if which == "train":
            self.x_data_train = np.array(images_list, dtype='float32')
        elif which == "test":
            self.x_data_test = np.array(images_list, dtype='float32')
        else:
            self.x_data_val = np.array(images_list, dtype='float32')

    def train_loader(self, batch_size=16):
        """
        按批次，将训练数据和标签 迭代返回
        :param batch_size:
        :return:
        """
        batch_nums = math.ceil(len(self.x_data_train)/batch_size)
        for i in range(batch_nums):
            x_train = self.x_data_train[i*batch_size:(i+1)*batch_size]
            y_train = self.y_data_train[i*batch_size:(i+1)*batch_size]
            yield x_train, y_train

    def test_loader(self, batch_size=16):
        """
        按批次，将测试数据和标签 迭代返回
        :param batch_size:
        :return:
        """
        batch_nums = math.ceil(len(self.x_data_test)/batch_size)
        for i in range(batch_nums):
            x_test = self.x_data_test[i*batch_size:(i+1)*batch_size]
            y_test = self.y_data_test[i*batch_size:(i+1)*batch_size]
            yield x_test, y_test

    def val_loader(self, batch_size=16):
        """
        按批次，将验证数据和标签 迭代返回
        :param batch_size:
        :return:
        """
        batch_nums = math.ceil(len(self.x_data_val)/batch_size)
        for i in range(batch_nums):
            x_val = self.x_data_val[i*batch_size:(i+1)*batch_size]
            y_val = self.y_data_val[i*batch_size:(i+1)*batch_size]
            yield x_val, y_val

关于代码核心的地方，在代码中都有注释。

另外需要注意的一点是，如果输入到神经网络中的图片为三维，则

images_list.append(np.reshape(rr_img, (1, self.height, self.width)))

要替换为

images_list.append(np.transpose(img, (2, 0, 1)))

否则reshape会导致整个数据错乱。

搭建模型

之前使用Keras做字符验证码识别的时候，得到的经验就是针对这种比较简单的字符验证码，无需过于复杂的模型，几层CNN就够了。

import torch
from torch import nn
from torch import optim

import os


class NeuralNetWork(nn.Module):
    def __init__(self, channel, num_classes):
        """
        :param channel: 输入图片的channel
        :param num_classes: 分类数量
        """
        super(NeuralNetWork, self).__init__()
        self.convin = nn.Sequential(
            nn.Conv2d(channel, 64, kernel_size=(3, 3), padding=1, bias=False),
            nn.ReLU(),
            nn.Conv2d(64, 64, kernel_size=(3, 3), padding=1, bias=False),
            nn.ReLU(),
            nn.MaxPool2d(2, 2),
            nn.Dropout(0.25)
        )
        self.convall = nn.Sequential(
            nn.Conv2d(64, 64, kernel_size=(3, 3), padding=1, bias=False),
            nn.ReLU(),
            nn.Conv2d(64, 64, kernel_size=(3, 3), padding=1, bias=False),
            nn.ReLU(),
            nn.MaxPool2d(2, 2),
            nn.Dropout(0.25)
        )
        # 承接卷积层和fc层
        self.fc1 = nn.Sequential(
            nn.Linear(64*5*11, 1024),  # 这个输入值需要计算，根据输入图像的尺寸决定（本次输入图像尺寸为40*90）
            nn.ReLU(),
            nn.Dropout(0.5)
        )
        self.dense1 = nn.Sequential(
            nn.Linear(1024, 512),
            nn.ReLU(),
            nn.Linear(512, num_classes),
            # nn.LogSoftmax()
        )
        self.dense2 = nn.Sequential(
            nn.Linear(1024, 512),
            nn.ReLU(),
            nn.Linear(512, num_classes),
            # nn.LogSoftmax()
        )
        self.dense3 = nn.Sequential(
            nn.Linear(1024, 512),
            nn.ReLU(),
            nn.Linear(512, num_classes),
            # nn.LogSoftmax()
        )
       
    
   def forward(self, n_input):
        # 进行卷积、激活和池化操作
        feature = self.convin(n_input)
        feature = self.convall(feature)
        feature = self.convall(feature)

        # 对特征层(Tensor类型)进行维度变换，变成两维
        feature = feature.view(n_input.size(0), -1)  # size(0)是批次大小

        # 进行全连接操作
        feature = self.fc1(feature)
        out_put1 = self.dense1(feature)
        out_put2 = self.dense2(feature)
        out_put3 = self.dense3(feature)
        # 每个样本有三个输出值
        return [out_put1, out_put2, out_put3]

关于模型代码，有以下几点说明：

使用几层卷积、卷积核的数量、池化操作和dropout等并不是固定的，这要根据你的训练情况逐步调整；
全连接层的地方的输入值是需要计算的，是由输入到全连接层的输出通道数量x你的图片经过你的卷积和池化层后得到的尺寸，比如这里输出通道数量为64，原始输入图片尺寸为40x90，经过padding=1的卷积层尺寸不变，经过三次(2, 2)的池化层，变为5x11。

40x90 --> 20x45 --> 10x22 --> 5x11

并且在全连接层之前要把feature转换为(batch, )形状的二维tensor。
如何控制每个样本有3个输出值，这里是我遇到的难题，因为之前学习都是每个样本一个类型。

这里经过咨询有经验的同事得知，实际上就是利用相同的线性层计算得到三个值，同时返回。

不过需要注意的是，即使这三个输出值是经过了相同的线性层，就像这里的
```
nn.Sequential(
    nn.Linear(1024, 512),
    nn.ReLU(),
    nn.Linear(512, num_classes),
)
```
但是一定是三个独立定义的层（层名称无所谓），如果均使用同一个层，那么输出的这三个值永远都是一样的（亲身踩坑）

编写训练代码

from image_process import ImageProcess


if __name__ == "__main__":

    net = NeuralNetWork(1, 13)  # channel=1，classes=13

    epochs = 100  # 设置训练轮次
    batch_size = 16

    # 训练部分代码
    criterion = nn.CrossEntropyLoss()  # 交叉熵损失函数
    # 随机梯度下降优化
    # optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
    optimizer = optim.Adam(net.parameters(), lr=0.001, weight_decay=1e-6)

    ip = ImageProcess()

    val_loss_min = 0  # 保存训练过程中的最小损失（验证）
    for epoch in range(epochs):

        net.train()  # 训练与测试，BN和Dropout有区别
        # 如果没有BN和Dropout,或者只训练不验证，可以不执行该方法
        train_loss = 0.0  # 实时打印当前损失变化情况
        for batch_idx, data in enumerate(ip.train_loader(batch_size=batch_size)):
            inputs, labels = data
            inputs = torch.from_numpy(inputs)  # 从numpy array转成tensor
            labels = torch.from_numpy(labels).long()  # 输入损失函数要求type为long
            optimizer.zero_grad()  # 先将梯度设置为0

            out_puts = net(inputs)  # 前向传播
            # out_puts的shape(n, batch_size, num_classes) 3x16x13 n表示每个样本包含的分类数量
            # 这里因为输出多个值，所以计算损失把多个损失加在一起
            # labels的shape(batch_size, n) 16x3
            loss = (
                    criterion(out_puts[0], labels[:, 0]) +
                    criterion(out_puts[1], labels[:, 1]) +
                    criterion(out_puts[2], labels[:, 2])
            )

            loss.backward()  # 反向传播
            optimizer.step()

            # 查看网络训练状态(损失是计算几批数据的平均损失)
            train_loss += loss.item()

            # 800个训练样本，batch_size=16, 800/16 = 50（一共50批次）
            # 每10批，打印一次损失
            if (batch_idx+1) % 10 == 0:
                print(f'epoch: {epoch+1}, batch_inx: {batch_idx+1} train loss: {train_loss/160}')
                train_loss = 0.0

        state = {
            'net': net.state_dict(),
            'epoch': epoch+1
        }
        if not os.path.isdir('checkpoint'):
            os.mkdir('checkpoint')
        if (epoch+1) % 10 == 0:   # 每10轮保存一次权重
            print(f'saving epoch {epoch+1} mode ...')
            torch.save(state, f'./checkpoint/shanghai_epoch_{epoch+1}.pth')  # pth 与 ckpt

        # 验证部分
        net.eval()
        val_loss = 0.0
        for batch_idx, val_data in enumerate(ip.val_loader(16)):
            inputs, labels = val_data
            inputs = torch.from_numpy(inputs)  # 从numpy array转成tensor
            labels = torch.from_numpy(labels).long()  # 输入损失函数要求type为long
            out_puts = net(inputs)

            loss = (
                    criterion(out_puts[0], labels[:, 0]) +
                    criterion(out_puts[1], labels[:, 1]) +
                    criterion(out_puts[2], labels[:, 2])
            )

            val_loss += loss.item()

            # 100个训练样本，batch_size=16, 100/16 = 6（一共7批次）
            # 一轮计算一次平均损失
            if (batch_idx+1) % 7 == 0:
                print(f'epoch: {epoch+1}, batch_inx: {batch_idx+1} val loss: {val_loss/100}')
                if not val_loss_min:
                    val_loss_min = val_loss
                # 正常是每10轮保存一次权重，当发现这一轮验证损失更小时，也会保存一次权重
                elif val_loss_min >= val_loss:
                    val_loss_min = val_loss
                    print(f'saving epoch {epoch+1} mode ...')
                    torch.save(state, f'./checkpoint/shanghai_epoch_{epoch+1}.pth')
            val_loss = 0.0

    print('training task finished')

关于训练代码，有以下几点说明：

这里批量加载训练集和验证集是我在前面数据预处理部分特别开发好的，我觉得还是蛮巧妙地；
pytorch中都是使用tensor，所以需要将加载的数据(numpy矩阵)转换成tensor：

torch.from_numpy(inputs)
最重要的一点是三个输出的情况下，如何计算损失，这是我开发过程中遇到的另一个难题。

经过咨询有经验的同事得知，实际上就是将三个输出的损失加在一起，但是你要根据神经网络的数据输出格式和你自己的标签格式，将正确的数据输入到损失函数中进行计算，且要注意CrossEntropyLoss的输入参数格式。

关于CrossEntropyLoss使用方式的介绍：
```
import torch
from torch import nn

x = torch.tensor([[0.2, 0.3, 0.5, 0.1], [0.3, 0.01, 0.02, 0.4]])
y = torch.tensor([2, 3])
criterion = nn.CrossEntropyLoss()
loss = criterion(x, y)
print(loss)
```
其y参数只需要标签即可, 不需要传one-hot向量，这也就是前面数据预处理时没有采用one-hot编码来处理标签的原因。另外out_puts的输出shape我在代码中也有注释。

记录一些训练过程中遇到的情况

训练到第30轮，训练损失才开始明显下降，一度让我以为程序哪里有问题，经过上网查资料发现：损失函数(loss)在最初的几个epochs时没有下降，可能的原因是学习率设置的太低、正则参数太高和陷入局部最小值。

我当时设置的学习率lr=0.0001，确实比较小，我尝试调整为lr=0.001再训练，发现在第20轮时损失就开始下降了，果然是学习率设置的太低。

另外我觉得dropout的太多有可能也是导致损失延迟降低的原因，所以我尝试将dropout的值缩小，也能提前几轮损失开始下降，但是最后的训练效果却不如dropout较大的时候。
在较前面的轮次，val_loss远小于train_loss，一开始我总结的原因是在网络中添加了dropout层，而dropout仅在训练时生效，测试时是不会dropout的。所以val_loss会小于train_loss，因为我这里是远小于，后经排查是计算的时候写了bug。
```
net.train()  # 训练与测试，BN和Dropout有区别

net.eval() # 验证部分
```
也就是这两行代码的作用，执行后告诉神经网络接下来将进入训练模式还是测试模型；另外BN层也是仅在训练时生效，在测试时不使用。
关于如何设计出较好的模型，目前是我能力欠缺的一个地方，上面代码使用的模型架构（经过80轮的训练准确率能达到80%，经过250轮的训练准确率能达到90%），是参考大佬的模型，而我自己设计的模型准确率最高仅能达到70%，并且我也经过多次调整和训练，效果也并没有显著提升。

测试

import torch

from train import NeuralNetWork
from image_process import ImageProcess


if __name__ == "__main__":
    # 测试
    net = NeuralNetWork(1, 13)
    # 如果有dropout和BN操作，这里一定执行该方法，表示网络接下来进行测试操作
    net.eval() 
    check_point = torch.load('./checkpoint/shanghai_epoch_27.pth')
    # check_point = torch.load('shanghai_epoch_80.pth')
    net.load_state_dict(check_point['net'])
    batch_size = 16

    ip = ImageProcess()
    total_image = 0  # 总的图片数量
    correct_image = 0

    total_label = 0  # 总的标签数量
    correct_label = 0
    for data in ip.test_loader(batch_size):
        images, labels = data
        images = torch.from_numpy(images)
        out_puts = net(images)
        # batch_result = []
        _, predicted1 = torch.max(out_puts[0], 1)
        _, predicted2 = torch.max(out_puts[1], 1)
        _, predicted3 = torch.max(out_puts[2], 1)
        # batch_result.append(temp_result)
        for i in range(labels.shape[0]):
            total_image += 1
            total_label += 3
            print(f'true label: {labels[i]}')
            true_label = labels[i]
            print(f'predicted label: {predicted1[i]}  {predicted2[i]}  {predicted3[i]}')
            predicted_label = [int(predicted1[i]), int(predicted2[i]), int(predicted3[i])]
            if list(true_label) == predicted_label:
                correct_image += 1
            if true_label[0] == predicted_label[0]:
                correct_label += 1
            if true_label[1] == predicted_label[1]:
                correct_label += 1
            if true_label[2] == predicted_label[2]:
                correct_label += 1

    print(f'correct_image / total_image: {correct_image}/{total_image}')
    print(f'correct_label / total_label: {correct_label}/{total_label}')

这里的测试是批量测试，与实际的预测方法还有区别，但是大同小异，只不过在预测的方法中要注意针对单张图片再增加一个维度表示批次，否则传入神经网络的数据格式会出问题。

尝试进一步优化

添加BN层
```
self.convin = nn.Sequential(
    nn.Conv2d(channel, 64, kernel_size=(3, 3), padding=1, bias=False),
    nn.BatchNorm2d(64),
    nn.ReLU(),
    nn.Conv2d(64, 64, kernel_size=(3, 3), padding=1, bias=False),
    nn.BatchNorm2d(64),
    nn.ReLU(),
    nn.MaxPool2d(2, 2),
    nn.Dropout(0.25)
)
```
添加批规范化层后，训练得到的模型效果并没有不添加之前好，不过训练损失则在第2~3轮就开始明显下降了，不使用BN层的话，要训练15~20轮，训练损失才开始明显下降。

考虑到BN层的目标就是防止梯度消失或爆炸、加快训练速度，所以损失下降比较快就体现了BN层的用处，但是针对我这个项目，整体效果却并没有提升。
旋转图片

因为观察验证码会稍微有些倾斜，倾斜幅度很小，所以想着能不能利用数据增强（旋转一个很小的角度）来进一步提升准确率。

为了进行数据增强，我是直接在process_image方法中，对每一张图片进行旋转，然后生成一张新的直接添加到训练集中，另外标签也要添加两遍，这样我的训练集就变成了1600张，这种方法有个缺点就是一张图片和他的旋转图是挨着的两个样本，在训练时如果可以彻底打乱比较好，而且不知道是不是这个原因，再次训练时，损失吃吃降不下来了（到60轮没有下降，我就停了），但是添加BN层后快速下降（但最终效果没有提升）。

这里记录下旋转用到的技术：

  from torchvision.transforms import transforms
      
  # 随机旋转图像
  def random_rotation(image):
      image = Image.fromarray(image)  # 传入的image为CV2对象，转换为PIL.Image格式
      # image.show()
      rr = transforms.RandomRotation(degrees=(5, 10))
      rr_image = rr(image)
      # rr_image.show()
      return rr_image  # 返回的依然是PIL.Image格式，但是同样可以直接转为np.array

后来我觉得进行数据增强实际上可以对训练集操作然后直接生成相应的图片保存下来，然后在读取的时候打乱数据集比较方便，感兴趣的可以自己尝试。

我的gtihub博客地址：https://forchenxi.github.io/

另外，如果对投资理财感兴趣的同学，可以关注我的微信公众号：运气与实力。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
Pyorch中 nn.Conv1d 与 nn.Linear 的区别迪三 #NN_Layer 神经网络
即一维卷积层和全联接层的区别nn.Conv1d和nn.Linear都是PyTorch中的层，它们用于不同的目的，主要区别在于它们处理输入数据的方式和执行的操作类型。nn.Conv1d通过应用滑动过滤器来捕捉序列数据中的局部模式，适用于处理具有时间或序列结构的数据。nn.Linear通过将每个输入与每个输出相连接，捕捉全局关系，适用于将输入数据作为整体处理的任务。1.维度与输入nn.Conv1d（一
图片中的上采样，下采样和通道融合(up-sample, down-sample, channel confusion) 迪三 #图像处理_PyTorch 计算机视觉深度学习人工智能
前言以conv2d为例（即图片），Pytorch中输入的数据格式为tensor，格式为:[N,C,W,H,W]第一维N.代表图片个数，类似一个batch里面有N张图片第二维C.代表通道数，在模型中输入如果为彩色，常用RGB三色图，那么就是3维，即C=3。如果是黑白的，即灰度图，那么只有一个通道，即C=1第三维H.代表图片的高度，H的数量是图片像素的列数第四维W.代表图片的宽度，W的数量是图片像素的
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
深度学习-13-小语言模型之SmolLM的使用皮皮冰燃深度学习深度学习
文章附录1SmolLM概述1.1SmolLM简介1.2下载模型2运行2.1在CPU/GPU/多GPU上运行模型2.2使用torch.bfloat162.3通过位和字节的量化版本3应用示例4问题及解决4.1attention_mask和pad_token_id报错4.2max_new_tokens=205参考附录1SmolLM概述1.1SmolLM简介SmolLM是一系列尖端小型语言模型，提供三种规
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的农作物病害检测 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。1.农作物病害检测的挑战病害种类繁多：农作物病害的类型多样，不同病害在同一作物上的表现差异很大，同时同一种病害在不同生长阶段的症状也可能不同。环境影响：天气、光照、湿度等外部环境因素会影响农作物的表现，使得病害检
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
深度学习--对抗生成网络（GAN, Generative Adversarial Network） Ambition_LAO 深度学习生成对抗网络
对抗生成网络（GAN,GenerativeAdversarialNetwork）是一种深度学习模型，由IanGoodfellow等人在2014年提出。GAN主要用于生成数据，通过两个神经网络相互对抗，来生成以假乱真的新数据。以下是对GAN的详细阐述，包括其概念、作用、核心要点、实现过程、代码实现和适用场景。1.概念GAN由两个神经网络组成：生成器（Generator）和判别器（Discrimina
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

使用Pytorch识别字符验证码

使用Pytorch识别字符验证码

数据预处理

搭建模型

编写训练代码

记录一些训练过程中遇到的情况

测试

尝试进一步优化

你可能感兴趣的:(深度学习,验证码识别,pytorch,深度学习,神经网络)

使用`Pytorch`识别字符验证码