@Dwyanelittle64c

【paddle初体验】基于GoogLeNet实现中草药分类

零

最近突发奇想打算完整的从零开始做一个完整的深度学习任务，于是从飞桨实践库里随便找了一个简单的VGG网络实现中草药分类的问题。

一、介绍（数据集，paddle，GoogLeNet，流程）

1.数据集

本案例数据集均来源于互联网，分为5个类别共901张图片，其中百合179张图片，枸杞185张图片，金银花180张图片，槐花167张图片，党参190张图片。具体如下图：

数据集仅含若干张图片，每张图片放置于以对应标签类别命名的文件夹内，如下图所示：

2.paddlepaddle

与主流的pytorch和TensorFlow类似，paddlepaddle是也是一套深度学习框架，只不过paddlepaddle是由百度公司制作的。

3.GoogLeNet

GoogLeNet是2014年ImageNet比赛的冠军，它的主要特点是网络不仅有深度，还在横向上具有“宽度”。由于图像信息在空间尺寸上的巨大差异，如何选择合适的卷积核来提取特征就显得比较困难了。空间分布范围更广的图像信息适合用较大的卷积核来提取其特征；而空间分布范围较小的图像信息则适合用较小的卷积核来提取其特征。为了解决这个问题，GoogLeNet提出了一种被称为Inception模块的方案。

左图是Inception模块的设计思想，使用3个不同大小的卷积核对输入图片进行卷积操作，并附加最大池化，将这4个操作的输出沿着通道这一维度进行拼接，构成的输出特征图将会包含经过不同大小的卷积核提取出来的特征，从而达到捕捉不同尺度信息的效果。

Inception模块采用多通路(multi-path)的设计形式，每个支路使用不同大小的卷积核，最终输出特征图的通道数是每个支路输出通道数的总和，这将会导致输出通道数变得很大，尤其是使用多个Inception模块串联操作的时候，模型参数量会变得非常大。为了减小参数量，Inception模块使用了右图中的设计方式，在每个3x3和5x5的卷积层之前，增加1x1的卷积层来控制输出通道数；在最大池化层后面增加1x1卷积层减小输出通道数。基于这一设计思想，形成了右图中所示的结构。

GoogLeNet网络则是将若干个Inception模块串联起来，形成更深的网络结构，如下图所示。

（说明：在原作者的论文中添加了softmax1和softmax2两个辅助分类器，训练时将三个分类器的损失函数进行加权求和，以缓解梯度消失现象。这里的程序作了简化，没有加入辅助分类器）

4.流程

本案例主要是熟悉深度学习的整个流程。分类任务大致有如下几个流程：处理数据集（数据集增强、扩充，划分训练集测试集）、读取数据，制作数据读取器、搭建神经网络、编写训练代码、评估模型、进行模型推理

二、开始

1.数据集处理——数据增强

使用飞桨提供的api接口paddle.vision.transforms，对图像的亮度，对比度，饱和度进行随机调整，并对尺寸进行随机裁剪。

核心代码如下：

def get_transformed_img(img_path):
    srcimg = PIL.Image.open(img_path)       # 读取原图像
    img_w=np.array(srcimg).shape[1]         # 获取图像宽
    img_h=np.array(srcimg).shape[0]         # 获取图像高
    # print(img_w,img_h)
    transform0 = RandomResizedCrop(min(img_w, img_h))   # 随机裁剪图像
    transform1 = BrightnessTransform(0.2)               # 调整亮度
    transform2 = ContrastTransform(0.2)                 # 调整对比度
    transform3 = SaturationTransform(0.2)               # 调整饱和度

    # 调用声明好的API实现随机剪切
    img_res=transform0(srcimg)
    img_res = transform1(img_res)
    img_res = transform2(img_res)
    img_res = transform3(img_res)

    print(img_path, 'done')
    return img_res

将原数据集中所有图片都进行上述操作，并另存到新的文件夹，新文件夹格式和原文件夹格式相同，如下图所示：

2.划分训练集和测试集，制作图片路径和标签的txt文件

这一步的任务是得到train.txt和eval.txt，为下一步制作数据集读取器做准备。

train.txt中的内容是：训练集中每一张图片的路径、以及对应的标签。

代码如下：

def make_data_list():
    data_path1='data/Chinese Medicine'          # 原数据集文件夹
    data_path2='data/Chinese Medicine expand'   # 增强数据集文件夹
    data_label = os.listdir(data_path1)         # ['baihe', 'dangshen', 'gouqi', 'huaihua', 'jinyinhua']
    print(data_label)

    eval_list = []
    train_list = []

    for dir_id, dir in enumerate(data_label):   # 对每个类别
        # 处理原数据集文件夹
        class_dir = os.path.join(data_path1, dir)       # 获取每个分类的文件夹路径
        for img_id,img_dir in enumerate(os.listdir(class_dir)):
            data = str(os.path.join(class_dir, img_dir)) + '\t' + str(dir_id) + '\n'    # 将图片路径和标签制作为字符串
            if img_id % 8==0:                           # 训练集和测试集为8:1
                eval_list.append(data)
            else:
                train_list.append(data)
        # 处理增强数据集文件夹，操作与上面类似
        class_dir = os.path.join(data_path2, dir)
        for img_id, img_dir in enumerate(os.listdir(class_dir)):
            data = str(os.path.join(class_dir, img_dir)) + '\t' + str(dir_id) + '\n'
            if img_id % 8 == 0:
                eval_list.append(data)
            else:
                train_list.append(data)

    # 对两个list进行洗牌
    random.seed(233)
    random.shuffle(eval_list)
    random.shuffle(train_list)

    eval_num = len(eval_list)
    train_num = len(train_list)
    print("共{}张图片，其中训练集{}张，测试集{}张".format(train_num+eval_num, train_num, eval_num))

    # 写入eval.txt和train.txt
    eval_list_path = 'data/eval.txt'
    with open(eval_list_path, 'w') as f:
        for image in eval_list:
            f.write(image)

    train_list_path = 'data/train.txt'
    with open(train_list_path, 'w') as f:
        for image in train_list:
            f.write(image)
    print('txt文件写入完成')

3.定义数据集读取器

定义数据集读取器一般是以类的形式封装，需要继承paddle.io.Dataset类

定义数据集读取器之后，能够非常方便地获取训练集数据和测试集数据

# 定义数据读取器
class dataset(Dataset):
    def __init__(self, data_path, mode='train'):
        """
        数据读取器
        :param data_path: 数据集所在路径
        :param mode: train or eval
        """
        super().__init__()
        self.data_path = data_path
        self.img_paths = []
        self.labels = []

        if mode == 'train':
            # 读取TXT文件，获得图片路径及对应标签，放入各自的list中
            with open(os.path.join(self.data_path, "train.txt"), "r", encoding="utf-8") as f:
                self.info = f.readlines()
            for img_info in self.info:
                img_path, label = img_info.strip().split('\t')
                self.img_paths.append(img_path)
                self.labels.append(int(label))

        else:
            with open(os.path.join(self.data_path, "eval.txt"), "r", encoding="utf-8") as f:
                self.info = f.readlines()
            for img_info in self.info:
                img_path, label = img_info.strip().split('\t')
                self.img_paths.append(img_path)
                self.labels.append(int(label))
        # print(self.img_paths)
        # print(self.labels)

    def __getitem__(self, index):
        """
        获取一组数据
        :param index: 文件索引号
        :return:
        """
        img_path = self.img_paths[index]
        img = cv2.imread(img_path)
        img = np.array(img).astype('float32')
        img = img[:, :, [2, 1, 0]]  # 转RGB
        img = cv2.resize(img, (224, 224))   # 调整尺寸
        img = img.transpose((2, 0, 1)) / 255   # 从[w,c,h]转换为[c,w,h]，并映射到0-1
        
        label = self.labels[index]
        label = np.array([label], dtype="int64")
        
        return img, label

    def __len__(self):
        return len(self.img_paths)

当然，还可以对数据集使用paddle.io.DataLoader进行进一步封装，以获取打包成batch的数据样本。代码如下：

train_dataset = dataset('data', mode='train')
img, label = train_dataset[0]
print(img.shape, label.shape)  # (3, 224, 224) (1,)

train_loader = paddle.io.DataLoader(train_dataset, batch_size=8, shuffle=True)
for data in train_loader:
    img, label = data
    print(img.shape, label.shape)  # [8, 3, 224, 224] [8, 1]
    break

4.搭建网络

GoogLeNet的核心是Inception模块，inception模块的实现代码如下：

# Inception块
class Inception(paddle.nn.Layer):
    def __init__(self, c0, c1, c2, c3, c4):
        '''
        Inception模块，
        c1,图(b)中第一条支路1x1卷积的输出通道数，数据类型是整数
        c2,图(b)中第二条支路卷积的输出通道数，数据类型是tuple或list,
               其中c2[0]是1x1卷积的输出通道数，c2[1]是3x3
        c3,图(b)中第三条支路卷积的输出通道数，数据类型是tuple或list,
               其中c3[0]是1x1卷积的输出通道数，c3[1]是3x3
        c4,图(b)中第一条支路1x1卷积的输出通道数，数据类型是整数
        '''
        super(Inception, self).__init__()
        # 依次创建Inception块每条支路上使用到的操作
        self.p1_1 = Conv2D(in_channels=c0, out_channels=c1, kernel_size=1, stride=1)
        self.p2_1 = Conv2D(in_channels=c0, out_channels=c2[0], kernel_size=1, stride=1)
        self.p2_2 = Conv2D(in_channels=c2[0], out_channels=c2[1], kernel_size=3, padding=1, stride=1)
        self.p3_1 = Conv2D(in_channels=c0, out_channels=c3[0], kernel_size=1, stride=1)
        self.p3_2 = Conv2D(in_channels=c3[0], out_channels=c3[1], kernel_size=5, padding=2, stride=1)
        self.p4_1 = MaxPool2D(kernel_size=3, stride=1, padding=1)
        self.p4_2 = Conv2D(in_channels=c0, out_channels=c4, kernel_size=1, stride=1)

    def forward(self, x):
        # 支路1只包含一个1x1卷积
        p1 = F.relu(self.p1_1(x))
        # 支路2包含 1x1卷积 + 3x3卷积
        p2 = F.relu(self.p2_2(F.relu(self.p2_1(x))))
        # 支路3包含 1x1卷积 + 5x5卷积
        p3 = F.relu(self.p3_2(F.relu(self.p3_1(x))))
        # 支路4包含 最大池化和1x1卷积
        p4 = F.relu(self.p4_2(self.p4_1(x)))
        # 将每个支路的输出特征图拼接在一起作为最终的输出结果
        return paddle.concat([p1, p2, p3, p4], axis=1)

上述代码建议结合inception模块图看便于理解

有了inception模块，就可以以其为基础，构建GoogLeNet网络，代码如下：

# GoogLeNet
class GoogLeNet(paddle.nn.Layer):
    def __init__(self):
        super(GoogLeNet, self).__init__()
        # GoogLeNet包含五个模块，每个模块后面紧跟一个池化层
        # 第一个模块包含1个卷积层
        self.conv1 = Conv2D(in_channels=3, out_channels=64, kernel_size=7, padding=3, stride=1)
        # 3x3最大池化
        self.pool1 = MaxPool2D(kernel_size=3, stride=2, padding=1)
        # 第二个模块包含2个卷积层
        self.conv2_1 = Conv2D(in_channels=64, out_channels=64, kernel_size=1, stride=1)
        self.conv2_2 = Conv2D(in_channels=64, out_channels=192, kernel_size=3, padding=1, stride=1)
        # 3x3最大池化
        self.pool2 = MaxPool2D(kernel_size=3, stride=2, padding=1)
        # 第三个模块包含2个Inception块
        self.block3_1 = Inception(192, 64, (96, 128), (16, 32), 32)
        self.block3_2 = Inception(256, 128, (128, 192), (32, 96), 64)
        # 3x3最大池化
        self.pool3 = MaxPool2D(kernel_size=3, stride=2, padding=1)
        # 第四个模块包含5个Inception块
        self.block4_1 = Inception(480, 192, (96, 208), (16, 48), 64)
        self.block4_2 = Inception(512, 160, (112, 224), (24, 64), 64)
        self.block4_3 = Inception(512, 128, (128, 256), (24, 64), 64)
        self.block4_4 = Inception(512, 112, (144, 288), (32, 64), 64)
        self.block4_5 = Inception(528, 256, (160, 320), (32, 128), 128)
        # 3x3最大池化
        self.pool4 = MaxPool2D(kernel_size=3, stride=2, padding=1)
        # 第五个模块包含2个Inception块
        self.block5_1 = Inception(832, 256, (160, 320), (32, 128), 128)
        self.block5_2 = Inception(832, 384, (192, 384), (48, 128), 128)
        # 全局池化，用的是global_pooling，不需要设置pool_stride
        self.pool5 = AdaptiveAvgPool2D(output_size=1) # 自适应全局池化，自动选取池化核使得输出尺寸为1
        self.fc = Linear(in_features=1024, out_features=5)

    def forward(self, x):
        x = self.pool1(F.relu(self.conv1(x)))
        x = self.pool2(F.relu(self.conv2_2(F.relu(self.conv2_1(x)))))
        x = self.pool3(self.block3_2(self.block3_1(x)))
        x = self.block4_3(self.block4_2(self.block4_1(x)))
        x = self.pool4(self.block4_5(self.block4_4(x)))
        x = self.pool5(self.block5_2(self.block5_1(x)))
        x = paddle.reshape(x, [x.shape[0], -1])
        x = self.fc(x)
        return x

结合模块图便于理解

5.编写训练代码

常见的训练函数一般是如下结构：

当然除此之外，还有可视化训练结果，计算准确率，保存模型等操作。代码如下：

# 训练函数
def train(model, epoch):
    # 存放训练集损失和测试集损失的list
    train_loss_list = []
    eval_loss_list = []
    # 定义优化器，使用Adam优化器，初始学习率为0.0001
    opt = paddle.optimizer.Adam(learning_rate=0.0001, parameters=model.parameters())
    # 使用GPU训练
    paddle.device.set_device('gpu:0')

    for e in range(epoch):  # 对于每一个epoch
        # 训练数据加载
        train_dataset = dataset('data', mode='train')
        train_loader = paddle.io.DataLoader(train_dataset, batch_size=8, shuffle=True)
        model.train()  # 模型设置为训练模式
        for batch_id, data in enumerate(train_loader()):  # 对于每一个batch
            imgs, labels = data  # 拿到数据和标签
            preds = model(imgs)  # 正向传播
            loss = F.cross_entropy(preds, labels)  # 计算损失
            # avg_loss = paddle.mean(loss)
            avg_loss = loss
            if batch_id % 80 == 0:
                # 每隔80个batch输出一下loss
                print("epoch:{}, batch:{}, train_loss:{:.2f}".format(e, batch_id, avg_loss.numpy()[0]))
                # 将loss添加到list中
                train_loss_list.append(avg_loss.numpy()[0])
            # 计算梯度
            avg_loss.backward()
            # 更新参数
            opt.step()
            # 清空梯度变量
            opt.clear_grad()

        """
        这部分是对模型进行评估
        """
        # 计算测试集上的loss
        model.eval()  # 模型设置为推理模式
        # 评估数据加载
        eval_dataset = dataset('data', mode='eval')
        eval_loader = paddle.io.DataLoader(eval_dataset, batch_size=8, shuffle=True)
        for batch_id, batch in enumerate(eval_loader):
            imgs, labels = batch
            preds = model(imgs)
            loss = F.cross_entropy(preds, labels)
            avg_loss = paddle.mean(loss)
            if batch_id % 10 == 0:
                print("epoch:{}, batch:{}, eval_loss:{:.2f}".format(e, batch_id, avg_loss.numpy()[0]))
                eval_loss_list.append(avg_loss.numpy()[0])

        # 每个epoch结束后，覆盖绘制loss下降曲线
        plt.plot(list(range(len(train_loss_list))), train_loss_list)
        plt.plot(list(range(len(eval_loss_list))), eval_loss_list)
        plt.savefig('log/loss_now.jpg')

        # 每个epoch结束后，计算在测试集上的准确率
        eval_loader = paddle.io.DataLoader(eval_dataset, batch_size=1, shuffle=True)
        all = 0
        correct = 0
        for id, data in enumerate(eval_loader):
            img, lab = data
            pred = model(img)
            pred = np.argmax(pred.numpy()[0])  # 取输出中概率最大的作为输出标签
            if pred == lab.numpy()[0][0]:
                correct += 1
            all += 1
        print("epoch {} is done, acc:{:.2f}".format(e, correct / all))

        # 每个epoch结束后，保存一次模型参数
        paddle.save(model.state_dict(), 'log/' +
                    'Epoch ' + str(e) +
                    ' train_loss ' + str(train_loss_list[len(train_loss_list) - 1]) +
                    ' eval_loss ' + str(eval_loss_list[len(eval_loss_list) - 1]) +
                    ' googleNet.pdparams')

6.对训练结果进行总结

下图是训练程度和loss的曲线图（蓝色是测试集loss，黄色是训练集loss）

观察曲线有如下发现：

1.整体曲线有下降趋势，说明模型正在被训练

2.曲线的震荡十分明显，猜测是因为batch_size设的不大（batch_size=8）

3.训练末期训练集loss趋于0，而测试集loss逐渐不稳定，说明模型逐渐开始过拟合

综上，我们取横轴为80-100，也就是大约26-32个epoch时的模型为最佳。

7.进行推理

推理的流程就十分简单了，读入图片后，对其进行预处理，包括通道变换，归一化，以及维度扩张，然后送入模型得到输出，匹配对应类别即可。

代码如下：

def predict(img_path):
    label=['baihe','dangshen','gouqi','huaihua','jinyinhua']
    try:
        img=PIL.Image.open(img_path)
    except:
        print("open error!")
        return
    PIL.Image.Image.show(img)
    img=img.resize((224,224))
    img=np.array(img).astype('float32')
    img = img.transpose((2, 0, 1)) / 255  # 从[w,c,h]转换为[c,w,h]，并映射到0-1
    img=paddle.to_tensor(img)
    img=paddle.reshape(img,[1,3,224,224])

    model=GoogLeNet()
    model.eval()
    myPdparams_path = 'log/Epoch 30 train_loss 0.07772641 eval_loss 0.2556547 googleNet.pdparams'
    model_state_dict = paddle.load(myPdparams_path)
    model.load_dict(model_state_dict)

    output=model(img)
    output=F.softmax(output)        # 套一个softmax以将输出转换为概率
    index = np.argmax(output.numpy()[0])    # 获取最大概率的index
    confidence=output.numpy()[0][index]     # 获取该最大概率
    result=label[index]                     # 获取最大概率对应的标签
    print("this picture is: {}, confidence is: {:.2f}".format(result,confidence))

二、总结

这是up第一次完整写一个深度学习案例，虽然内容很简单，但对于第一次写来说，还是有许多没有接触到的新知识，尤其是在自己定义数据读取器，自己构建模型，自己做训练的过程中。

大致有如下需要注意的地方：

1.在数据读取器部分，通常读取数据的流程为：制作样本路径以及标签的txt文件，写一个类继承paddle.io.Dataset类，并重写其def __getitem__(self, index): 和 def __len__(self): 方法。在getitem中，利用之前准备的txt文件，按照其中的路径读取对应的图片，并进行一些预处理，最后返回图片以及对应的标签。

2.在数据读取器的预处理时，通常会用到图像库进行图片读取操作如PIL，cv2等，需要注意的是：PIL等库读取图片默认得到的是RGB的通道排列，而cv2读取图片默认的是BGR的排列，千万不可两者混用，若一定要用cv2可以将其通道排布转换过来再使用

img = img[:, :, [2, 1, 0]]  # BGR转RGB

3.在数据读取器的预处理时，通常还会遇到需要将图片的shape从[w,c,h]转换为[c,w,h]的情况，因为paddle的二维图像处理api如卷积等操作都是需要[N,C,W,H]的shape。在shape转换的过程中，可能会有两种方法：

img = img.reshape((3, 224, 224)) / 255  # 使用np的reshape转换
img = img.transpose((2, 0, 1)) / 255    # 使用np的transpose转换

up刚开始一直用的前者reshape()进行转换的，但准确率一直上不去，在60%以内波动。后来逐行检查，最后发现可能是这里的问题。我的理解是：reshape()虽然也能将shape进行转换，但它的原理其实是将先矩阵拉伸成一条向量，然后再按照给定的shape进行重新排布，这样一来，虽然shape确实转换了，但得到的结果已经没有空间信息了，也就是类似雪花屏一样的乱码，进行可视化展示的话如下图所示：

这样处理后得到的图像，再来经过卷积，已经提取不到什么有用信息了...

应该使用transpose，transpose作用是改变序列。

4.在训练过程中还发生过一些有意思的事情，如下几张loss曲线图：

这张图我认为是最典型的过拟合，在横轴大于100之后，训练集loss出现显著降低，而测试集loss不断飙升，符合“模型对训练集过度学习，学完之后只认识训练集，不认识测试集”的特征。

这张图表示训练遇到了瓶颈，也就是局部最小值。仔细观察最后loss趋近于1.6，而因为我们损失函数使用的是交叉熵，在5分类问题中，若模型的输出恒定，那么交叉熵loss的值就是-lg(1/5)也就是1.6，所以这次训练陷入了局部最优。

本文到这里就结束了，up小白在学习过程中还有许多错误指出还请读者批评指正！

参考资料：

飞桨PaddlePaddle-源于产业实践的开源深度学习平台

模型训练时loss不收敛、不下降原因和解决办法_ytusdc的博客-CSDN博客_模型不收敛

【python error】cannot import name ‘TorchDispatchMode‘ from ‘torch.utils._python_dispatch‘ Eternal-Student Jetson Orin NX Python python 开发语言
报错：cannotimportname‘TorchDispatchMode’from‘torch.utils._python_dispatch’(/home/nvidia/.conda/envs/pytorch/lib/python3.8/site-packages/torch/utils/_python_dispatch.py)File“/media/nvidia/Ubuntu/xxxxx/ev
全自动量化交易软件是否真的可靠？使用过程中有哪些潜在风险需要注意财云量化 python炒股自动化量化交易程序化交易全自动量化交易软件可靠性潜在风险数据准确性股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
【测试语言篇四】Python进阶篇之json模块 m0_37135615 编程语言 python php 开发语言
一、json模块介绍JSON（JavaScript对象表示法）是一种轻量级数据格式，用于数据交换。在Python中具有用于编码和解码JSON数据的内置json模块。只需导入它，就可以使用JSON数据了：importjsonJSON的一些优点：JSON作为“字节序列”存在，在我们需要通过网络传输（流）数据的情况下非常有用。与XML相比，JSON小得多，可转化为更快的数据传输和更好的体验。JSON非常
嵌入式AI必备技能2-模型的压缩与加速奥德彪123 嵌入式AI 人工智能嵌入式
嵌入式AI必备技能2-模型的压缩与加速引言随着嵌入式AI设备的广泛应用，模型的计算效率和存储需求成为核心挑战。由于嵌入式系统通常资源受限，传统的深度学习模型往往难以直接部署。因此，模型压缩和加速技术应运而生，旨在减少计算量、降低存储需求，同时尽可能保持模型的准确性。本文介绍几种常见的模型压缩与加速方法，包括剪枝、低秩分解、量化、权值共享、知识蒸馏等，并探讨如何综合应用这些技术来优化AI模型。1.常
DeepSeek API 客户端使用文档老大白菜 python 人工智能数据库
1.简介deep.py是一个用于与DeepSeekAPI交互的Python客户端封装。它提供了简单易用的接口，支持对话历史管理、日志记录等功能，使得与DeepSeekAPI的交互更加便捷和可靠。2.功能特点简单的接口设计自动管理对话历史完整的日志记录灵活的配置选项异常处理机制3.安装依赖pipinstallopenai4.配置环境在项目根目录创建.env文件：#WindowssetDEEPSEEK
信息检索系统评估指标的层级分析：从单点精确度到整体性能度量人工智能深度学习llm检索系统
在构建搜索引擎系统时，有效的评估机制是保证系统质量的关键环节。当用户输入查询词如"machinelearningtutorialspython"，系统返回结果列表后，如何客观评估这些结果的相关性和有效性？这正是信息检索评估指标的核心价值所在。分析用户与搜索引擎的交互模式，我们可以观察到以下行为特征：用户主要关注结果列表的前几项对顶部结果的关注度显著高于底部结果用户基于多次搜索体验形成对搜索系统整体
python系列【仅供参考】：python tornado 集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案坦笑&&life #python python tornado redis
pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案封装redis异步类pythontornado集成redis消息订阅的异步任务之后tornado主程序无法启动，解决方案封装redis异步类sys_redis_helper.pyimportredis
Python通过SSH隧道访问数据库 Java菜鸟在北京 python sshtunnel paramiko SSH隧道访问数据库
本文介绍通过sshtunnel类库建立SSH隧道，使用paramiko通过SSH来访问数据库。实现了两种建立SSH方式：公私钥验证、密码验证。公私钥可读本地，也可读取AwsS3上的私钥文件。本质上就是在本机建立SSH隧道，然后将访问DB转发到本地SSH内去访问数据库。简单易懂，上代码：fromsshtunnelimportSSHTunnelForwarderfromsqlalchemyimport
用Python写一个天气预报小程序穿梭的编织者 Python脚本 python 小程序
一、界面效果二、完整代码importtkinterastkfromtkinterimportttkimportrequestsimportjsonfromdatetimeimportdatetimefromPILimportImage,ImageTkimportiofromttkbootstrapimportStyleclassWeatherApp:def__init__(self,root):s
Python写一个脚本——30行代码——1秒实现PDF任意页码拆分穿梭的编织者 Python精选 pdf python
一、引入库importosfromPyPDF2importPdfReader,PdfWriter二、定义拆分方法defsplit_pdf(input_path,output_dir,ranges):ifnotos.path.exists(output_dir):os.makedirs(output_dir)withopen(input_path,'rb')asfile:pdf=PdfReader(
python手写kmeans算法菜鸟懿机器学习聚类算法 python
kmean聚类是最基础和常见的算法，工程上使用比较常见，spark,sklearn都有实现，本文手写实现kmeans#!/usr/bin/pythonimportsysimportrandomimportmathdefcreate_rand_points(max_x,max_y,count):"""Createcountpoints(0-x),(0-y)."""points=[]foriinran
Python 科学计算与机器学习入门：NumPy + Scikit-Learn 实战指南吴师兄大模型 python numpy scikit-learn 人工智能开发语言机器学习编程
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
python start函数_Python中10个常用的内置函数半残大叔霁天 python start函数
大家好，我是小张在3.8版本中，Python解释器有近69个内置函数可供使用，有了它们能极大地提高编码效率，数量虽然不少，但在日常搬砖中只用到其中一部分，根据使用频率和用法，这里列出来几个本人认为不错的内置函数，结合一些例子介绍给大家complex()返回一个形如a+bj的复数，传入参数分为三种情况：参数为空时，返回0j参数为字符串时，将字符串表达式解释为复数形式并返回参数为两个整数(a,b)时，
cv君独家视角 | AI内幕系列七：EfficientViT模型：基于多尺度线性注意力模块，实现高效的高分辨率密集预测 cv君 cv君独家视角 AI内幕系列原创项目级实战项目深度学习与计算机视觉精品 1024程序员节 EfficientViT 高分辨率密集预测任务高分辨率视觉模型 Transformer 人工智能计算机视觉
专题概况cv君独家视角|AI内幕系列是一个专注于人工智能领域的深度专题，旨在为读者揭开AI所有领域技术的神秘面纱，展示其背后的科学原理和实际应用。通过一系列精心策划的文章，我们将带您深入了解AI的各个领域，从计算机视觉到文本语音等多模态领域，从基础理论到前沿技术，从行业应用到未来趋势。无论您是AI领域的工程师或者专家，还是对这一领域充满好奇的读者，这个系列都将为您提供高价值的见解和启发，为您带来横
一个完整的python webSockets游戏服务器，每100ms接收并广播玩家位置小宝哥Code Python基础及AI开发 python 游戏服务器
PythonWebSockets游戏服务器下面是一个完整的PythonWebSockets游戏服务器实现，它每100ms接收并广播玩家位置信息。这个服务器使用websockets和asyncio库来处理WebSocket连接和异步操作。完整代码#!/usr/bin/envpython3"""实时游戏位置广播服务器每100ms接收玩家位置并广播给所有连接的客户端"""importasyncioimp
32路模拟采集PCI总线带DIO用什么采集卡阿尔泰1999 数据分析嵌入式硬件科技
北京阿尔泰科技PCI5659是一-款多功能数据采集卡，具有32路12位100K采集频率，AD带16K字FIFO缓存，保证数据的连续性，并带16路可设方向的DIO功能。产品支持阿尔泰科技最新的ART-DAQ数据管理软件，提供QT、PYTHON、LABVIEW、VC、VB、VB.NET、C#等例子程序。模拟量输入通道数32路精度12位*大采样频率100KsPs多通道采样速度各通道*大采样频率/设置的采
Python 爬虫实战：艺术品市场趋势分析与交易平台数据抓取西攻城狮北 python 爬虫开发语言
一、引言在当今数字化时代，艺术品市场正经历着前所未有的变革。随着互联网技术的飞速发展，越来越多的艺术品交易转移到了线上平台，这为我们提供了海量的数据资源。通过Python爬虫技术，我们可以抓取艺术品交易平台上的数据，进而分析艺术品市场的趋势，为投资者、收藏家以及艺术爱好者提供有价值的参考。本文将带领读者深入探索Python爬虫在艺术品市场的应用。从爬虫的基本原理到实际代码实现，再到数据的清洗、分析
【2025年饿了么春招-3月14日-第二题（200分）- 小红的排列构造】（题目+思路+Java&C++&Python解析+在线测试) 塔子哥学算法 java c++python 算法数据结构饿了么
题目内容小红希望你构造一个长度为nnn的排列，满足∑i=1n∗i\sum_{i
贪心算法在背包问题上的运用（Python） MATLAB卡尔曼智能算法的MATLAB实现贪心算法 python 算法
背包问题有n个物品，它们有各自的体积和价值，现有给定容量的背包，如何让背包里装入的物品具有最大的价值总和？这就是典型的背包问题(又称为0-1背包问题)，也是具体的、没有经过任何延伸的背包问题模型。背包问题的传统求解方法较为复杂，现定义有一个可以载重为8kg的背包，另外还有4个物品，物品的价值和质量数据如下表，不考虑背包的容量。4个物品的总质量大于8kg，所以要想在有限载重的背包携带更多质量的物品，
NVIDIA显卡型号有哪些？怎么知道自己电脑的型号？可靠的豆包蟹同志杂烩积累经验分享
NVIDIA显卡型号显卡分N卡和A卡，这个N卡指的是英伟达（NVIDIA），A卡之前是ATI（后来被AMD收购），现在的A卡指的就是AMD显卡。如果是为了玩游戏或者是学深度学习，选显卡肯定是要选N卡，因为A卡对于游戏优化的没有N卡好。（1）图中的GTX表示是英伟达的一个系列名称，全称叫GeForceGTX，GTX定位高端显卡系列，从低到高排名：GS/GT/GTS/GTX/RTX/Ultra，从20
英伟达系列显卡大解析B100、H200、L40S、A100 2301_78234743 java
家里有了变故。。。快手数分秋招一面面经我发现算法岗也不很难进啊(深度学习)算法想转数开…Java零基础校招学习路线突击版（吐血整理）等的花都谢了的华子最后给开了22k，武汉，应该是14a。不过在这几个月里我坚定了搞几年快钱回家和np朋友因骂了hr，boos被封了哈哈哈在央企想被开除需要做什么？2024小米分布式存储研发急招华为2012被毁意向我发现算法岗也不很难进啊(深度学习)在央企想被开除需要做
阿里巴巴发布 R1-Omni：首个基于 RLVR 的全模态大语言模型，用于情感识别新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/情感识别一直是AI领域的难题，尤其是视觉与音频信号的融合。单独依赖视觉或音频的模型，往往
接口测试中加密参数如何处理？海姐软件测试接口测试 python 开发语言测试工具职场和发展
1.加密类型及应对策略①对称加密（AES/DES）特点：加密解密使用同一密钥。处理方法：向开发获取密钥和加密算法（如AES-CBC、AES-ECB）。使用代码或工具解密响应数据：python复制fromCrypto.CipherimportAESimportbase64defdecrypt_aes(key,encrypted_data):cipher=AES.new(key.encode(),AE
用Python玩转Hyperledger：构建企业级区块链解决方案 Echo_Wish Python！实战！perl python opencv 人工智能
用Python玩转Hyperledger：构建企业级区块链解决方案大家好，我是Echo_Wish。在区块链技术的炙手可热中，“企业级区块链”俨然成为了下一个重磅关键词。相比于公有区块链，企业级区块链更注重隐私性、灵活性和高效性。而在这片“蓝海”中，Hyperledger项目无疑是企业级区块链解决方案的标杆。如果再搭配上Python这种“高效工具”，简直让人事半功倍！那么，如何将Python与Hyp
eBest AI Hub全场景接入Deepseek eBest数字化转型方案人工智能
一、技术赋能，智创未来Deepseek的强大基因将为eBest产品注入新的活力即时智能响应：融合海量行业智慧与互联网搜索精华，提供秒级智能建议；多模态理解能力：突破界限，无缝融合文本、代码与图像理解，精准解析用户的需求；进化式深度学习：不断学习，持续进化，为用户提供日益完善、超越期待的服务体验。二、全场景赋能，体验再次跃升1.智能报表-数据洞察，指尖掌控升级后的智能报表功能，能够根据查询和检
Android自动化测试工具海棠如醉 web技术自动化运维
细解自动化测试工具Airtest-CSDN博客以下是几种常见的Android应用自动化测试工具：Appium：支持多种编程语言，如Java、Python、Ruby、JavaScript等。可以用于Web应用程序和原生应用程序的自动化测试，并支持iOS和Android平台。Espresso：由Google开发的AndroidUI测试框架，可用于测试应用程序的用户界面和与用户的交互。Espresso支
Python说明一一代码 python
Python的主要特点：1.**易读易写**：Python的语法简洁明了，代码可读性高。2.**跨平台**：Python可以在多种操作系统上运行，如Windows、macOS、Linux等。3.**丰富的库**：Python拥有庞大的标准库和第三方库，涵盖了从Web开发到数据科学的多个领域。4.**动态类型**：Python是动态类型语言，变量不需要显式声明类型。5.**解释型语言**：Pytho
使用 Excel 实现绩效看板的自动化 chenchihwen 自动化运维
引言在日常工作中，团队的绩效监控和管理是确保项目顺利进行的重要环节。然而，面临着以下问题：数据分散：系统中的数据难以汇总，缺乏一个宏观的团队执行情况视图。看板缺失：系统本身可能无法提供合适的Dashboard，导致数据分析困难。手动操作繁琐：数据采集、汇总和分析过程繁琐且耗时。本文将介绍如何利用免费的软件和工具（如Python、MySQL、Excel等）实现绩效看板的自动化。通过邮件自动推送和接收
Python真经：代码修仙录 zzzzjflzdvkk python 开发语言青少年编程 python真经
第一章：Python真经的起源在八十年代末，九十年代初，荷兰国境之内，有一位名为GuidovanRossum的修士，于国家数学与计算机科学研究所中，悟出了一门无上真经——Python。此真经融合了诸多上古大能的智慧结晶，如ABC、Modula-3、C、C++、Algol-68、SmallTalk、Unixshell等，终成一体，化为Python真经。Python真经自诞生之日起，便遵循GPL（GN
python提示unmatched_Python自动化学习--异常提示 weixin_39933356
举例：打开一个不存在的文件时：>>open("abc.txt","r")会提示错误Traceback(mostrecentcalllast):File"D:/project1/test.py",line11,inopen("abc.txt","r")FileNotFoundError:[Errno2]Nosuchfileordirectory:'abc.txt'这时可以用try....except
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理