武汉测绘科技大学

在武测学习（二）：卷积神经网络CNN——《Python深度学习》学习笔记

卷积神经网络

1 卷积神经网络简介

1.1 卷积运算

1.2 最大池化运算

2.2 实例——dogs-vs-cats

2.1 数据准备

2.2 数据生成器及数据增强

2.3 预训练的模型

2 Pytorch实现CNN

1 卷积神经网络简介

卷积神经网络（convnet，CNN）是计算机视觉应用中最常见的深度学习模型，对于图像问题具有很好的性能。

和密集连接层相比，卷积层能够学习到特征空间中的局部模式，这得益于卷积运算的特性。

卷积神经网络具有两个重要性质：

平移不变性。当CNN在图像中学习到某个局部模式，那么这个模式出现在任何一个其它地方，CNN都能够识别。而对于密集连接层，它会将其视作不同的模式，导致从头学习。而视觉世界从根本上具有平移不变性。
能够学到模式的空间层次结构。神经网络可以有效地学习越来越复杂、越来越抽象的视觉概念。而视觉世界从根本上具有空间层次结构。

CNN所处理的图像，包含两个空间轴（高度和宽度）和一个深度轴。

1.1 卷积运算

CNN利用卷积运算，改变图像的深度，从而生成特征图。特征图的每一层具有的含义不再和原始图像相同。卷积运算的通常为3×3或5×5的区域，由于边界效应，图的宽度和高度会缩小。另外，卷积运算还有步幅的概念，即相邻的两个卷积核之间的距离。步幅和边界效应以及是否对原图进行填充，将决定输出图像的尺寸。

1.2 最大池化运算

当模型中只有卷积层时，模型很难学习到图像的空间层级结构（所学习到的窗口会越来越小）。而且所包含的元素会越来越多，导致模型的过拟合。因此引入了下采样的概念。

通过将图像以某种方式缩小大小，则卷积窗口在原始图像中的大小会越来越大，并且特征图的元素个数不会过大。可以通过在卷积层中添加步幅来实现，也可以通过最大池化层。

2.1.3 CNN的基本结构

_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 conv2d (Conv2D)             (None, 26, 26, 32)        320       
                                                                 
 max_pooling2d (MaxPooling2D  (None, 13, 13, 32)       0         
 )                                                               
                                                                 
 conv2d_1 (Conv2D)           (None, 11, 11, 64)        18496     
                                                                 
 max_pooling2d_1 (MaxPooling  (None, 5, 5, 64)         0         
 2D)                                                             
                                                                 
 conv2d_2 (Conv2D)           (None, 3, 3, 64)          36928     
                                                                 
 flatten (Flatten)           (None, 576)               0         
                                                                 
 dense (Dense)               (None, 64)                36928     
                                                                 
 dense_1 (Dense)             (None, 10)                650       
                                                                 
=================================================================
Total params: 93,322
Trainable params: 93,322
Non-trainable params: 0
_________________________________________________________________

可以看到，这个示例中的CNN由两部分组成：

①卷积层和最大池化层的堆叠

②Dense层堆叠得到的分类器

两者之间还有一个flattern层，用于将多维数据展平成一维向量，可供密集连接层处理。

2.2 实例——dogs-vs-cats

2.1 数据准备

图像数据处理的步骤较为繁琐，主要有以下几步（keras）：

划分训练集和测试集，为每张图像贴上标签（生成标签向量）
将图像编码为width×height×para的三维张量，并标准化到0-1之间
利用数据生成器进行训练。当训练数据较少时，可以使用数据增强

首先是数据准备。书作者的方法比较便于查看，将数据根据文件名划分到不同文件夹里，train和test，其内分别包含cat和dog两个文件夹。这样在后续读取的时候很方便去贴标签，也容易检查数据个数是否正确。

original_dataset_dir = 'D:/DeepLearning/kaggle_original_data/train'

# 生成存放新数据的文件夹
base_dir = 'D:/DeepLearning/cats_and_dogs_small'
os.mkdir(base_dir)

# 生成子文件夹（训练集，验证集，测试集）
train_dir = os.path.join(base_dir, 'train')
os.mkdir(train_dir)
validation_dir = os.path.join(base_dir, 'validation')
os.mkdir(validation_dir)
test_dir = os.path.join(base_dir, 'test')
os.mkdir(test_dir)

# 训练集子文件夹（训练集猫，训练集狗）
train_cats_dir = os.path.join(train_dir, 'cats')
os.mkdir(train_cats_dir)

# Directory with our training dog pictures
train_dogs_dir = os.path.join(train_dir, 'dogs')
os.mkdir(train_dogs_dir)

# 生成验证级 猫，狗文件夹
validation_cats_dir = os.path.join(validation_dir, 'cats')
os.mkdir(validation_cats_dir)

validation_dogs_dir = os.path.join(validation_dir, 'dogs')
os.mkdir(validation_dogs_dir)

# 生成测试集 猫，狗文件夹
test_cats_dir = os.path.join(test_dir, 'cats')
os.mkdir(test_cats_dir)

test_dogs_dir = os.path.join(test_dir, 'dogs')
os.mkdir(test_dogs_dir)

# 利用名字来检索1000只猫
fnames = ['cat.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_cats_dir, fname)
    #将图像从路径src复制到dst
    shutil.copyfile(src, dst)

# 将之后的500只猫复制到验证集下的猫文件夹
fnames = ['cat.{}.jpg'.format(i) for i in range(1000, 1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_cats_dir, fname)
    shutil.copyfile(src, dst)
    
# 将最后的500只猫复制到训练集下的狗文件夹
fnames = ['cat.{}.jpg'.format(i) for i in range(1500, 2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_cats_dir, fname)
    shutil.copyfile(src, dst)
    
# 重复上述操作，把猫改成狗
fnames = ['dog.{}.jpg'.format(i) for i in range(1000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_dogs_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['dog.{}.jpg'.format(i) for i in range(1000, 1500)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_dogs_dir, fname)
    shutil.copyfile(src, dst)    

fnames = ['dog.{}.jpg'.format(i) for i in range(1500, 2000)]
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_dogs_dir, fname)
    shutil.copyfile(src, dst)

2.2 数据生成器及数据增强

数据生成器的概念类似于pytorch中的dataloader。可以在数据生成器中加入旋转、平移、缩放等操作，增加训练数据量，也就是数据增强（data augment）。

keras中的imageDataGenarator能够定义生成器，flow_from_directory则从文件进行读取和分类

需要注意的是，batch_size和steps_per_epoch应当乘积为数据总量，或者可以不定义其中一个，模型会自动计算另外一个。

from keras.preprocessing.image import ImageDataGenerator

# 利用imageDataGenerator创建生成器，读取图像的同时进行数据的缩放
train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
        # 从目标路径读取数据，根据子文件夹来分类
        train_dir,
        # All images will be resized to 150x150
        target_size=(150, 150),
        batch_size=20,
        # 使用二进制标签
        class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=20,
        class_mode='binary')

# 利用生成器进行训练和验证
history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,#一次抽取20个，总共2000个，因此抽取100次
      epochs=30, #迭代30次
      validation_data=validation_generator,
      validation_steps=50)

绘制得到精度曲线图：

模型出现了典型的过拟合。

下面给出利用数据增强来训练的实例：

#训练模型生成器（包括数据增强）
train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True,)

# 测试数据生成器（没有数据增强）                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          
test_datagen = ImageDataGenerator(rescale=1./255)

#训练数据生成器实例化
train_generator = train_datagen.flow_from_directory(
        train_dir,
        target_size=(150, 150),
        batch_size=32,
        class_mode='binary')

#测试数据生成器实例化
validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=32,
        class_mode='binary')

#利用生成器拟合
history = model.fit_generator(
      train_generator,
      # steps_per_epoch=63,
      epochs=100,
      validation_data=validation_generator,
      # validation_steps=32
      )

这里虽然使用了数据增强，但输入的steps_per_epoch参数和原来一样。也就是说数据增强的过程在这其中已经加入了。

得到精度图像

模型不再过拟合，数据增强起到了作用。

2.3 预训练的模型

前面说过，卷积层能够学习到局部特征，并且具有平移不变性，因此其学习的特征比密集连接层要更通用，也就更适合重复使用。

有许多在ImageNet上已经训练好的模型，如VGG16，VGG19，Xception，Inception V3，ResNet50，MobileNet等。书中介绍了利用预训练网络来提取图像特征，再输入到密集连接分类器中学习的方法。主要包括以下几种：

①利用VGG网络predict训练数据，得到输出特征图，再输入到密集分类器。

首先初始化基础模型，用于生成特征图

from keras.applications import VGG16

# 初始化一个VGG16模型
conv_base = VGG16(weights='imagenet',
                  include_top=False,
                  input_shape=(150, 150, 3))

import os
import numpy as np
from keras.preprocessing.image import ImageDataGenerator

base_dir = 'D:/DeepLearning/cats_and_dogs_small'

train_dir = os.path.join(base_dir, 'train')
validation_dir = os.path.join(base_dir, 'validation')
test_dir = os.path.join(base_dir, 'test')

然后定义函数，来用于处理数据得到特征图数据

#定义数据生成器
datagen = ImageDataGenerator(rescale=1./255)
batch_size = 20

#定义函数，用于生成特征图，并规定数量上限sample_count
def extract_features(directory, sample_count):
    #初始化特征图和标签（全为0）
    features = np.zeros(shape=(sample_count, 4, 4, 512))
    labels = np.zeros(shape=(sample_count))
    generator = datagen.flow_from_directory(
        directory,
        target_size=(150, 150),
        batch_size=batch_size,
        class_mode='binary')

    i = 0
    #循环输出
    for inputs_batch, labels_batch in generator:
        #predict生成特征批量
        features_batch = conv_base.predict(inputs_batch)
        #给特征图的第i个批量赋值，label无需处理
        features[i * batch_size : (i + 1) * batch_size] = features_batch
        labels[i * batch_size : (i + 1) * batch_size] = labels_batch
        i += 1
        #当读取的数据大于样本数时退出
        if i * batch_size >= sample_count:
            break
    return features, labels

#生成训练数据和验证数据和测试数据

train_features, train_labels = extract_features(train_dir, 2000)
validation_features, validation_labels = extract_features(validation_dir, 1000)
test_features, test_labels = extract_features(test_dir, 1000)

剩下的就是将数据展平然后训练和验证，不再赘述。

这种计算方法的代价很低，因为只对一个密集连接层做训练。它的缺点在于无法使用数据增强，因为数据增强需要在每轮拟合输入不同的随机增强的样本，而在这个方法中每轮必定是一样的样本，否则便需要不断运行卷积基，导致巨大的计算代价。也因此导致模型迅速过拟合，效果不够理想。

②在VGG之后添加一个密集连接分类器

这种方法直接在预训练模型的后面增加分类器，这会导致计算代价非常大，但好处在于可以使用数据增强来降低过拟合。

不仅如此，训练模型的时候可以选择将预训练模型冻结，从而实现只对密集连接分类器的权重进行训练。

③微调预训练模型

微调模型将预训练模型部分解冻，来对预训练模型的权重进行更新，使其更适合具体的问题。但需要注意的是，在微调之前必须先将分类器的权重训练好，而不是随机初始化，否则会将解冻的几层严重破坏。

其中，通常解冻的是卷积基的底部几层。因为卷积基中更靠顶部的层编码的是更专业化的特征，而靠近底部的是更普通使用的特征。同时训练过多层会导致参数过多，过拟合的风险增加。

三种方法思路很清晰，以下附上书本的代码和自己添加的注释。

from keras import models
from keras import layers
from keras.preprocessing.image import ImageDataGenerator

# 在卷积基后面添加密集连接分类器
model = models.Sequential()
model.add(conv_base)
model.add(layers.Flatten())
model.add(layers.Dense(256, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

# 冻结卷积基
conv_base.trainable = False

# 对训练数据进行数据增强
train_datagen = ImageDataGenerator(
      rescale=1./255,
      rotation_range=40,
      width_shift_range=0.2,
      height_shift_range=0.2,
      shear_range=0.2,
      zoom_range=0.2,
      horizontal_flip=True,
      fill_mode='nearest')

# 验证数据不能被数据增强
test_datagen = ImageDataGenerator(rescale=1./255)

# 通过文件夹定义数据生成器
train_generator = train_datagen.flow_from_directory(
        train_dir,
        target_size=(150, 150),
        batch_size=20,
        class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=20,
        class_mode='binary')

# 编译模型
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=2e-5),
              metrics=['acc'])

# 训练模型
history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,
      epochs=30,
      validation_data=validation_generator,
      validation_steps=50,
      verbose=2)

conv_base.trainable = True
# 循环遍历模型中的层，定义冻结层
set_trainable = False
for layer in conv_base.layers:
    # 微调的层很少，直接用if语句判断
    if layer.name == 'block5_conv1':
        set_trainable = True
    if set_trainable:
        layer.trainable = True
    else:
        layer.trainable = False

# 编译模型
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-5),
              metrics=['acc'])

# 训练模型（模型是之前保存了的，意味着密集连接分类器的参数已经训练过）
history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,
      epochs=100,
      validation_data=validation_generator,
      validation_steps=50)

书中提到一个有意思的现象：在这两张图中，验证损失一直上升，而验证精度却保持在一个水平，这打破了之前我以为的“验证损失就是验证精度的反面”的观念。实际上验证损失是损失值的平均值，而验证精度和损失的分布有关，两者并不能互相替代。

也正因此，即使平均损失增大，模型也可能在进步。换言之，精度才是模型好坏的标准。损失值只能用于调整权重。

2 Pytorch实现CNN

class CNNnet(torch.nn.Module):
    def __init__(self):
        super(CNNnet,self).__init__()
        self.conv1 = torch.nn.Sequential(
            torch.nn.Conv2d(in_channels=1,
                            out_channels=16,
                            kernel_size=3,
                            stride=1,
                            padding=1),
            torch.nn.ReLU()
            nn.MaxPool2d(kernel_size=2)
        )
        self.conv2 = torch.nn.Sequential(
            torch.nn.Conv2d(in_channels=16,
                            out_channels=32,
                            kernel_size=3,
                            stride=1,
                            padding=1),
            torch.nn.ReLU()
            nn.MaxPool2d(kernel_size=2)       
        )
        self.mlp1 = torch.nn.Sequential(
                    torch.nn.Linear(2*2*64,100)
                    torch.nn.ReLU()
                    )
        self.mlp2 = torch.nn.Sequential(
                    torch.nn.Linear(100,10)
                    torch.nn.ReLU()
                    )
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = self.mlp1(x)
        x = self.mlp2(x)
        return x

这里的代码仅作模型构建示意，结构也很简单。pytorch实际上也只是多了一个Relu需要单独写出来，并且反向传播等过程需要一步步写，其它方面并没有显著区别。

kafka学习笔记4-TLS加密 —— 筑梦之路筑梦之路 Java技术 linux系统运维学习笔记
1.准备证书文件mkdir/opt/kafka/pkicd!$#生成CA证书opensslreq-x509-nodes-days3650-newkeyrsa:4096-keyoutca.key-outca.crt-subj"/CN=Kafka-CA"#生成私钥opensslgenrsa-outkafka.key4096#生成证书签名请求(CSR)opensslreq-new-keykafka.ke
kafka学习笔记6 ACL权限 —— 筑梦之路筑梦之路 Java技术 linux系统运维 kafka 学习笔记
在Kafka中，ACL（AccessControlList）是用来控制谁可以访问Kafka资源（如主题、消费者组等）的权限机制。ACL配置基于Kafka的kafka-acls.sh工具，能够管理对资源的读取、写入等操作权限。ACL介绍Kafka的ACL是基于以下几个方面的：资源类型（ResourceType）:Kafka支持多种资源类型，包括主题（Topic）、消费者组（ConsumerGroup
C语言学习：函数、整型数组作为函数参数与一二维字符型数组作为函数参数 wsy0903@@@ Linux编程嵌入式学习日记 c语言学习开发语言
函数的基本构成每个C语言函数都包含三个主要部分：返回值类型：指定函数执行完毕后返回什么类型的结果函数名：表明函数的功能，需符合标识符命名规则参数列表：接收传递给函数的数据基本语法格式如下：返回值类型函数名(形式参数){//函数体声明部分语句部分}函数的工作流程函数的工作流程可以概括为：输入->处理->输出。这个过程中：输入通过参数实现处理在函数体中完成输出通过return语句返回函数参数深入理解形
2025美赛数学建模-备战2025数学建模美赛——神经网络预测模型详解 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模算法 2025年数学建模美赛 2025年 2025年美赛神经网络人工智能
（全部都是公开资料，不代写论文，请勿盲目订阅）2025年数学建模美赛期间，会发布思路和代码，赛前半价，赛前会发布往年美赛的经典案例，赛题会结合最新款的chatgpto1pro分析，会根据赛题难度，选择合适的题目着重分析，没有代写论文服务，只会发布思路和代码，因为赛制要求，不会回复私信。内容可能达不到大家预期，请不要盲目订阅。已开通200美元/月的chatgptpro会员，会充分利用chatgpto
[Foc学习记录00]导览 GivemeAK 学习
电机理论基础电磁基础【电机学复习笔记】第一章磁路_电机学csdn-CSDN博客电路基础磁滞现象：一讲就懂，很nb【经典】深刻阐述磁性材料的磁滞现象_哔哩哔哩_bilibili《现代永磁同步电机控制原理及Matlab仿真》学习第一章、三相永磁同步电机的数学建模006永磁电机永磁体的类型：何为凸极性、隐极性，表贴式、内置式，傻瓜式讲解，专为零基础编写。_表贴式和内置式的区别-CSDN博客根据学习进度，
1.21学习总结 2401_89561082 学习
今天不知道点到什么把codeblock给玩死了，试图抢救，但是抢救无效，只好删了重下，终于让他变成了记忆中的模样。在博客上看了背包问题详解，不是很理解，题目也没能做出来。P1387：最大正方形b[i][j]表示以节点i,j为右下角，可构成的最大正方形的边长。只有a[i][j]==1时，节点i,j才能作为正方形的右下角；对于一个已经确定的b[i][j]=x，它表明包括节点i，j在内向上x个节点，向左
Java 学习路线全解析：从基础到实战，全面掌握 Java 编程 ZIM学编程知识分享 java 学习开发语言
在当今数字化时代，Java作为一种广泛应用且极具影响力的编程语言，为众多开发者开启了通往技术世界的大门。无论是大型企业级应用开发，还是互联网后端服务构建，Java都展现出了强大的适应性和稳定性。以下是一条系统全面的Java学习路线，帮助你逐步攀登Java编程的高峰。一、JavaSE基础（20天）JavaSE是整个Java编程的基石，扎实掌握这部分内容至关重要。通过学习诸如变量、数据类型、控制语句、
java微服务中消息队列处理中间件基础语法学习，零基础学习慧香一格学习消息队列 java java 中间件消息队列处理
在Java微服务中，消息队列处理中间件可以帮助实现服务之间的异步通信、解耦和负载均衡。常用的Java消息队列工具包括RabbitMQ、ApacheKafka和ActiveMQ。下面我将详细介绍这些消息队列工具在Java中的基础语法和使用方法。1.RabbitMQRabbitMQ是一个广泛使用的开源消息代理软件，支持多种协议（AMQP、MQTT、STOMP等）。我们可以使用SpringAMQP来简化
宇宙规律对可转移量子强化学习架构的启示 AI天才研究院计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章引言：宇宙规律与量子强化学习架构1.1问题背景宇宙规律是指宇宙中普遍存在的自然规律，如物理学中的万有引力定律、量子力学中的不确定性原理等。这些规律对宇宙的运行和演化起着决定性的作用。随着科技的发展，人们开始意识到这些宇宙规律可能对人工智能领域，尤其是量子强化学习架构的设计和优化有着深远的启示。量子强化学习是一种结合了量子计算和强化学习的新型机器学习方法。它利用量子计算机的优势，在训练和优化模
C# 与 Python 代码互相调用的实践一只小灿灿 net Python c#python
一、引言在当今的软件开发领域，不同的编程语言都有其独特的优势和适用场景。C#是一种功能强大、面向对象的编程语言，主要应用于Windows平台开发、企业级应用开发以及游戏开发（借助Unity引擎等）等领域；而Python则以其简洁的语法、丰富的库以及在数据科学、机器学习、自动化脚本等众多方面的出色表现备受青睐。在实际的项目开发中，有时候我们希望能够结合这两种语言的优势，实现C#与Python代码的互
【MYSQL学习】MySQL内置函数：窗口函数的5大绝招你GET到了吗？墨瑾轩 MySql入门~精通 mysql 学习 android
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣MySQL内置函数：窗口函数的5大绝招你GET到了吗？引言❓在数据分析和报表生成中，窗口函数是一个非常强大的工具，它可以让你在同一个查询中进行复杂的聚合和排序操作。但你真的了解窗口函数吗？今天，我们就来一场深入浅出的探索之旅，带你了解窗口函数的5大绝招，让你在
【AI大模型】Prompt 提示词工程使用详解小码农叔叔 AI大模型实战与应用 Prompt 提示词工程使用 Prompt提示词工程 Prompt 提示词 Prompt使用详解 Prompt prompt使用总结 Prompt使用总结
目录一、前言二、Prompt提示词工程介绍2.1Prompt提示词工程是什么2.1.1Prompt构成要素2.2Prompt提示词工程有什么作用2.2.1Prompt提示词工程使用场景2.3为什么要学习Prompt提示词工程三、Prompt提示词工程元素构成与操作实践3.1前置准备3.2Prompt基本结构介绍与使用3.2.1明确指令3.2.2提供必要的原始内容3.2.3提供背景参考四、Promp
时间序列预测综述 Super_Whw 时序预测
文章目录非周期时间序列预测1.转化为监督学习数据集，使用xgboot/LSTM模型/时间卷积网络/seq2seq(attention_based_model)2.Facebook-prophet，类似于STL分解思路3.深度学习网络，结合CNN+RNN+Attention，作用各不相同互相配合参考：非周期时间序列预测1.转化为监督学习数据集，使用xgboot/LSTM模型/时间卷积网络/seq2s
自强学堂django学习笔记人菜就要多透虚
视图与网址进阶这里学到了正则表达式的解释url(r'^add/(\d+)/(\d+)/$',calc_views.add2,name='add2'),用括号括起来的意思是保存为一个子组，每一个子组将作为一个参数，被views.py中的对应视图函数接收。模板模板是可以继承的：以一个HTML文件为基础，拓展出其他的HTML模板模板进阶模板HTML上接收到一个参数是这么表示的{{string}}用两层花
清华和哈工大把大模型量化做到了1比特，把世界顶尖多模态大模型开源大模型量化个人电脑运行！机器人领域首个开源视觉-语言操作大模型，激发开源VLMs更大潜能，视 Mamba速度提升2.8倍，内存能省87% 代码讲故事机器人智慧之心 Mamba 机器人量化大模型开源视觉 VLMs
清华和哈工大把大模型量化做到了1比特，把世界顶尖多模态大模型开源大模型量化个人电脑运行！机器人领域首个开源视觉-语言操作大模型，激发开源VLMs更大潜能，视Mamba速度提升2.8倍，内存能省87%。清华和哈工大把大模型量化做到了1比特。在追求更高效的机器学习模型部署时，模型量化技术应运而生，它通过降低权重矩阵的位宽来显著减少大型语言模型的存储和计算需求。我们一般的双精度浮点型double是64位
Django学习笔记 Atmanlee python SQL Django
Django跟着“自强学堂”学习django。。。。。感谢学堂！！！https://code.ziqiangxuetang.com/django/django-tutorial.html（自强学堂）Django使用python开发的免费开源的web框架，用于快速搭建网站。特点之一就是拥有强大的数据库操作接口(QuerySetAPI),如果需要也可以执行原生SQLDjango概览urls.py网址入
3d高斯泼溅学习便携与感知组，研ing 3d
椭球集就是一堆3d高斯椭球集之位置与形状：协方差矩阵(包括旋转矩阵和缩放矩阵)，要大多数都能表达实体的位置，实体的位置和形状要落在大概率范围内椭球集之球谐函数：代表球面上不同位置的值基函数，拟合颜色和形状1.球谐函数在形状上的拟合，阶数越高就越能描述原来的真实形状(用多项式(基函数)和傅立叶变换拟合)3d高斯Splatting里面用的是4阶的，参数量有16个拟合的函数r＝f(θ，φ)2.球谐函数在
IGModel——提高基于 GNN与Attention 机制的方法在药物发现中的实用性 Jackie_AI 计算机视觉 stable diffusion 自然语言处理语言模型 Imagen
IGModel——提高基于GNN与Attention机制的方法在药物发现中的实用性导言深度学习在药物发现（发现治疗药物）领域的应用以及传统方法面临的挑战。药物（尤其是我们将在本文中讨论的被称为抑制剂的药物）通过与在人体中发挥不良功能的蛋白质结合并改变这些蛋白质的功能来发挥治疗效果。因此，在设计药物时，必须优化这些结合的亲和力和药理特性，并准确预测蛋白质与药物之间的相互作用。近年来，人们尤其提倡使用
Golang学习笔记_26——通道 LuckyLay Golang学习笔记 golang 学习笔记通道 channel
Golang学习笔记_23——error补充Golang学习笔记_24——泛型Golang学习笔记_25——协程Golang学习笔记_25——协程文章目录通道1.创建通道2.发送和接收数据3.带缓冲的通道4.Demo源码通道在Go中，协程是通过go关键字来创建的。当你使用go关键字调用一个函数时，该函数会在一个新的协程中执行。协程的调度由Go运行时（runtime）管理，开发者不需要关心具体的调度
Spring学习笔记_41——@RequestBody LuckyLay Spring学习笔记 spring 消息转换器 RequestBody SpringMVC SpringBoot
Spring学习笔记_38——@RequestParamSpring学习笔记_39——@PathVariableSpring学习笔记_40——@RequestHeader@RequestBody1.介绍@RequestBody是Spring框架中用于处理HTTP请求的一个非常关键的注解。它主要用于将客户端发送的HTTP请求体中的JSON、XML或其他格式的数据转换到Java方法参数上，这个转换过程
【机器学习】多模态AI——融合多种数据源的智能系统 2的n次方_ 人工智能
随着人工智能的快速发展，单一模态（如文本、图像或语音）已经不能满足复杂任务的需求。多模态AI（MultimodalAI）通过结合多种数据源（如文本、图像、音频等）来提升模型的智能和表现，适用于多样化的应用场景，如自动驾驶、医疗诊断、跨语言翻译等。一、多模态AI简介多模态AI是一种将不同形式的数据（如文本、图像、音频等）融合在一起的技术，旨在让模型从多个维度感知和理解信息。这种融合使得AI系统能够从
DETRs with Collaborative Hybrid Assignments Training论文阅读与代码分享总结快乐论文阅读
关键词：协作混合分配训练【目标检测】Co-DETR：ATSS+FasterRCNN+DETR协作的先进检测器（ICCV2023）-CSDN博客摘要：在这篇论文中，作者观察到在DETR中将过少的Query分配为正样本，采用一对一的集合匹配，会导致对编码器输出的监督稀疏，严重损害编码器的区分特征学习，反之亦然，也会影响解码器中的注意力学习。为了缓解这个问题，作者提出了一种新颖的协同混合分配训练方案，名
Golang学习笔记_28——工厂方法模式 LuckyLay Golang学习笔记 golang 学习笔记设计模式工厂方法模式
Golang学习笔记_25——协程Golang学习笔记_26——通道Golang学习笔记_27——单例模式文章目录工厂方法模式1.介绍2.优点3.类图4.实现源码工厂方法模式1.介绍工厂方法模式（FactoryMethod）是一种创建型设计模式，它提供了一种创建对象的接口，但由子类决定要实例化的类是哪一个。工厂方法模式让类的实例化推迟到子类中进行2.优点解耦：将对象的创建与使用分离，客户端不需要知
Python3.13来了！编程爱好者必看 Python之栈人工智能 python 开发语言
Python3.13于近期发布，其中包含大量重要更新。Python作为机器学习、数据科学和人工智能领域使用最广泛的编程语言，一直在不断发展，以满足这些领域日益增长的需求。最新发布的Python3.13提供了多项具有影响力的改进，旨在提高性能和生产力，对于从事ML和AI项目的开发人员来说是一个重要的里程碑。Python在ML和AI领域的主导地位主要归功于它的简单性、广泛的库支持和庞大的社区。然而，随
ubuntu安装Redis详细教程开机重启大熊苏尔 ubuntu redis linux 运维服务器
我整理的一些关于【Ubuntu】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/f2PFnNUbuntu安装Redis详细教程（开机自动重启）在这篇文章中，我将带你通过一个详细的过程，帮你在Ubuntu系统上安装Redis，并设置为开机自动启动。下面我们将通过一个表格概述整个流程，然后深入每一步的具体操作。整体流程步骤操作1更新系统包2安装Redis3
vue2和vue3组件传值——父传子 MvemiZ javascript vue.js 前端经验分享笔记
****近期学习vue3的组件传值，发现和之前的vue2版本并没有什么区别，实现的思路都是一样的，文章底部我会用大白话叙述一下vue组件传值的思路过程。下面就一起学习vue的组件传值吧，不足之处大家多批评指正！**vue2-父传子//父组件中通过v-bind绑定了list这个自定义的属性，并赋了一个值dateimportSonViewfrom'@/components/SonView.vue';e
卷积调制空间自注意力SPATIALatt模型详解及代码复现清风AI 深度学习人工智能 python 神经网络 conda
背景与意义SPATIALaTT模型的提出源于对自注意力机制和卷积神经网络（CNN）的深入研究。在计算机视觉领域，CNN长期占据主导地位，而自注意力机制的引入为视觉任务带来了新的思路。SPATIALaTT模型的意义在于融合了这两种强大的特征提取方法，充分发挥了它们的优势。这种融合不仅提高了模型的性能，还为设计更高效的视觉模型提供了新的思路，推动了计算机视觉技术的发展。通过结合自注意力机制和卷积神经网
Python学习：Pandas库使用（二）之读写Excel文件——read_excel()和to_excel()函数及其参数详解爬虫俗手小马达 python 学习 pandas
在Python的Pandas库中，读取和写入Excel文件主要使用read_excel和to_excel函数。以下是详细用法和示例：1.读取Excel文件：pd.read_excel()importpandasaspd#读取Excel文件df=pd.read_excel('文件路径.xlsx',sheet_name='Sheet1',header=0,usecols='A:C',skiprows=
Python学习——装饰器（一）：两个简单例子爬虫俗手小马达 python 学习开发语言
例一计时器#创建一个装饰器，用于计算函数执行时间importtimedeftime_this(func):defwrapper(*args,**kwargs):start_time=time.time()result=func(*args,**kwargs)end_time=time.time()execution_time=end_time-start_timeprint(f"Execution
基于YOLOv5、YOLOv8和YOLOv10的机场安检行李检测：深度学习应用与实现 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言随着全球航空运输业的持续增长，机场的安全性变得越来越重要。机场安检作为航空安全的重要组成部分，主要负责对乘客和行李进行检查，防止危险物品进入机场或飞行器。传统的安检方式多依赖人工检查，效率低下且容易出错。因此，基于深度学习的自动化行李检测系统应运而生，通过计算机视觉技术，自动识别和分类行李中的物品，大大提高了安检的效率与准确性。YOLO（YouOnlyLookOnce）系列算法，由于其高效的目
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

在武测学习（二）：卷积神经网络CNN——《Python深度学习》学习笔记

卷积神经网络

1 卷积神经网络简介

1.1 卷积运算

1.2 最大池化运算

2.2 实例——dogs-vs-cats

2.1 数据准备

2.2 数据生成器及数据增强

2.3 预训练的模型

2 Pytorch实现CNN

你可能感兴趣的:(深度学习,计算机视觉,神经网络,学习)