猎猫骑巨兽

粗读《Python 深度学习》（4）

第五章深度学习用于计算机视觉
- 5.1 卷积神经网络简介
- - 5.1.1 卷积运算
  - 5.1.2 最大池化运算
- 5.2 在小型数据集上从头开始训练一个卷积神经网络
- - 5.2.1 深度学习与小数据问题的相关性
  - 5.2.2 下载数据
  - 5.2.3 构建网络
  - 5.2.4 数据预处理
  - 5.2.5 使用数据增强
- 5.3 使用预训练的卷积神经网络
- - 5.3.1 特诊提取
  - 5.3.2 微调模型
  - 5.3.3 小结
- 5.4 卷积神经网络的可视化
- - 5.4.1 可视化中间激活
  - 5.4.2 可视化卷积神经网络的过滤器
  - 5.4.3 可视化类激活的热力图
小结

第五章深度学习用于计算机视觉

5.1 卷积神经网络简介

简单的卷积神经网络由 Conv2D 层和 MaxPooling2D 层堆叠而成。卷积神经网络接收形状为 (image_height, image_width, image_channels) 的输入张量（不包括批量维度）。

from keras import layers 
from keras import models
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1))) 
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))    # 64 通道，卷积核大小为 3×3
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

输出张量大小为 (3, 3, 64) ，将其展平为 1D 张量，再输入到 Dense 层中进行分类。

model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

查看网络架构：

>>> model.summary()
_________________________________________________________________
Layer (type)                      Output Shape          Param # 
=================================================================
conv2d_1 (Conv2D)                 (None, 26, 26, 32)    320 
_________________________________________________________________
max_pooling2d_1 (MaxPooling2D)    (None, 13, 13, 32)    0 
_________________________________________________________________
conv2d_2 (Conv2D)                 (None, 11, 11, 64)    18496 
_________________________________________________________________
max_pooling2d_2 (MaxPooling2D)    (None, 5, 5, 64)      0 
_________________________________________________________________
conv2d_3 (Conv2D)                 (None, 3, 3, 64)      36928 
_________________________________________________________________
flatten_1 (Flatten)               (None, 576)           0 
_________________________________________________________________
dense_1 (Dense)                   (None, 64)            36928 
_________________________________________________________________
dense_2 (Dense)                   (None, 10)            650 
=================================================================
Total params: 93,322
Trainable params: 93,322
Non-trainable params: 0

以 conv2d_2 层为例，当前层参数量 18496 = (32 × 3 × 3 +1) × 64。指的是，conv2d_2 层将从上一层输出的 32 个特征中组合提取 64 种特征，其中每一种特征通过 3 × 3 × 32 的 过滤器（filter） 扫描 32 层的 特征图（feature map） 输出 32 张 响应图（response map），将其叠加并加上偏置量，生成 输出特征图（output feature map）。

Dense 层类似，以 dense_1 为例， 36928 = (576 + 1) × 64。

5.1.1 卷积运算

密集连接层和卷积层的根本区别在于，Dense 层从输入特征空间中学到的是全局模式，而卷积层学到的是局部模式。对于图像来说，学到的就是在输入图像的二维小窗口中发现的模式。

卷积神经网络具有以下两种突出性质：

1、卷积神经网络学到的模式具有 平移不变性（translation invariant）。卷积神经网络是通过过滤器扫描图像，利用过滤器学习到的模式进行特征识别。这意味着无论特征在图像的什么位置都可以被过滤器识别。

2、卷积神经网络可以学到模式的 空间层次结构（spatial hierarchies of patterns）。第一个卷积层将学习较小的局部模式（比如边缘），第二个卷积层将学习由第一层特征组成的更大的模式（视窗逐渐扩大），以此类推。这使得卷积神经网络可以有效地学习越来越复杂、越来越抽象的视觉概念（因为视觉世界从根本上具有空间层次结构）。随着网络加深，过滤器提取的特征越来越抽象、复杂；过滤器的视窗范围越来越大，提取特征的范围越来越广。

卷积由以下两个关键参数所定义：
1、从输入中提取的图块尺寸：这些图块的大小通常是 3×3 或 5×5；
2、输出特征图的深度：卷积所计算的过滤器的数量。

卷积的工作原理：在 3D 输入特征图上 滑动（slide） 这些 3×3 或 5×5 的窗口，在每个可能的位置停止并提取周围特征的 3D 图块［形状为 (window_height, window_width, input_depth)］。然后每个 3D 图块与学到的同一个权重矩阵［叫作 卷积核（convolution kernel）］（3D 张量）做张量积，转换成形状为 (output_depth,) 的 1D 向量。然后对所有这些向量进行空间重组，使其转换为形状为 (height, width, output_depth) 的 3D 输出特征图。输出特征图中的每个空间位置都对应于输入特征图中的相同位置（比如输出的右下角包含了输入右下角的信息）。

应注意，输出特征图的宽高会因为边界效应和步幅选择而与输入特征图不同。

1、理解边界效应与填充

边界效应指的是，窗口在输入特征图上滑动时，因窗口不能越过边界，而使得输出特征图宽高缩小。以 3×3 的窗口在 5×5 的特征图上滑动为例。

如果想要输出特征图的空间维度与输入相同，那么可以使用 填充（padding）。填充是在输入特征图的每一边添加适当数目的行和列，使得每个输入方块都能作为卷积窗口的中心（窗口为偶数时，需要设置锚点）。

对于 Conv2D 层，可以通过 padding 参数来设置填充，这个参数有两个取值："valid" 表示不使用填充（只使用有效的窗口位置）；"same" 表示“填充后输出的宽度和高度与输入相同”。padding 参数的默认值为 "valid"。

2、理解卷积步幅

两个连续窗口的距离，叫作步幅，默认值为 1。步幅大于 1 的卷积叫做 步进卷积（strided convolution）。

使用步进卷积缩小输出特征图，实现特征图的下采样，但通常使用 最大池化（max-pooling） 运算来下采样。

5.1.2 最大池化运算

最大池化 是从输入特征图中提取窗口，并输出每个通道的最大值。它与卷积运算相似，同样是利用窗口在特征图上滑动，只不过不做卷积运算而是取每个窗口中的最大值。

最大池化运算可以极大地减少模型参数，降低计算机的负担。同时，可以保留特征在原特征图上的位置，起到筛选特征的作用。

除了最大池化还有 平均池化，通过取每个窗口的平均值。但效果没有最大池化好，原因在于特征中往往编码了某种模式或概念在特征图的不同位置是否存在（因此得名特征图），而观察不同特征的最大值而不是平均值能够给出更多的信息。

5.2 在小型数据集上从头开始训练一个卷积神经网络

5.2.1 深度学习与小数据问题的相关性

有时你会听人说，仅在有大量数据可用时，深度学习才有效。这种说法部分正确：深度学习的一个基本特性就是能够独立地在训练数据中找到有趣的特征，无须人为的特征工程，而这只在拥有大量训练样本时才能实现。对于输入样本的维度非常高（比如图像）的问题尤其如此。

但对于初学者来说，所谓 “大量” 样本是相对的，即相对于你所要训练网络的大小和深度而言。只用几十个样本训练卷积神经网络就解决一个复杂问题是不可能的，但如果模型很小，并做了很好的正则化，同时任务非常简单，那么几百个样本可能就足够了。由于卷积神经网络学到的是局部的、平移不变的特征，它对于感知问题可以高效地利用数据。虽然数据相对较少，但在非常小的图像数据集上从头开始训练一个卷积神经网络，仍然可以得到不错的结果，而且无须任何自定义的特征工程。

5.2.2 下载数据

该书从 https://www.kaggle.com/c/dogs-vs-cats/data 下载原始数据集，再将图像复制到训练、验证和测试的目录。

import os, shutil

original_dataset_dir = '/Users/fchollet/Downloads/kaggle_original_data'  # 原始数据集解压目录路径
base_dir = '/Users/fchollet/Downloads/cats_and_dogs_small'   # 较小数据集的目录路径
os.mkdir(base_dir)    # 创建目录

""" 创建训练集、验证集、测试集的目录 """
train_dir = os.path.join(base_dir, 'train')    # 路径拼接
os.mkdir(train_dir)
validation_dir = os.path.join(base_dir, 'validation')
os.mkdir(validation_dir)
test_dir = os.path.join(base_dir, 'test')
os.mkdir(test_dir)

""" 创建猫狗训练、验证、测试集目录 """
train_cats_dir = os.path.join(train_dir, 'cats') 
os.mkdir(train_cats_dir)
train_dogs_dir = os.path.join(train_dir, 'dogs') 
os.mkdir(train_dogs_dir)

validation_cats_dir = os.path.join(validation_dir, 'cats') 
os.mkdir(validation_cats_dir)
validation_dogs_dir = os.path.join(validation_dir, 'dogs') 
os.mkdir(validation_dogs_dir)

test_cats_dir = os.path.join(test_dir, 'cats') 
os.mkdir(test_cats_dir)
test_dogs_dir = os.path.join(test_dir, 'dogs') 
os.mkdir(test_dogs_dir)

""" 将猫的图像复制到对应路径下 """
fnames = ['cat.{}.jpg'.format(i) for i in range(1000)] 
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_cats_dir, fname)
    shutil.copyfile(src, dst)  # 将文件从 src 复制到 dst，dst 必须是完整的目标文件名

fnames = ['cat.{}.jpg'.format(i) for i in range(1000, 1500)] 
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_cats_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['cat.{}.jpg'.format(i) for i in range(1500, 2000)] 
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_cats_dir, fname)
    shutil.copyfile(src, dst)

""" 将狗的图像复制到对应路径下 """
fnames = ['dog.{}.jpg'.format(i) for i in range(1000)] 
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(train_dogs_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['dog.{}.jpg'.format(i) for i in range(1000, 1500)] 
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(validation_dogs_dir, fname)
    shutil.copyfile(src, dst)

fnames = ['dog.{}.jpg'.format(i) for i in range(1500, 2000)] 
for fname in fnames:
    src = os.path.join(original_dataset_dir, fname)
    dst = os.path.join(test_dogs_dir, fname)
    shutil.copyfile(src, dst)

5.2.3 构建网络

1、构建一个更大的卷积神经网络

from keras import layers
from keras import models

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(150, 150, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(128, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))

model.add(layers.Flatten())
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

应注意，网络中特征图的深度在逐渐增大（从 32 增大到 128），而特征图的尺寸在逐渐减小（从150×150 减小到 7×7）。这几乎是所有卷积神经网络的模式。

2、配置模型用于训练

from keras import optimizers

model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-4),   # learning rate = 0.0001
              metrics=['acc'])

5.2.4 数据预处理

图像数据预处理步骤包括：

1、读取图像文件；
2、将 JPEG 文件解码为 RGB 像素网格；
3、将这些像素网格转换为浮点数张量；
4、将像素值（0~255 范围内）缩放到 [0, 1] 区间（正如你所知，神经网络喜欢处理较小的输入值）。

Keras 拥有自动完成这些步骤的工具。Keras 有一个图像处理辅助工具的模块，位于 keras.preprocessing.image。特别地，它包含 ImageDataGenerator 类，可以快速创建 Python 生成器，能够将硬盘上的图像文件自动转换为预处理好的张量批量。

1、使用 ImageDataGenerator 从目录中读取图像

from keras.preprocessing.image import ImageDataGenerator

train_datagen = ImageDataGenerator(rescale=1./255)   # 创建 ImageDataGenerator 类
test_datagen = ImageDataGenerator(rescale=1./255)    # 将图像缩小 1/255，并转换为浮点数

""" 从路径生成数据增强 """
train_generator = train_datagen.flow_from_directory(
        train_dir,                                   # 路径
        target_size=(150, 150),                      # 图像大小调整为 150×150
        batch_size=20,                               # 将数据分批存入内存
        class_mode='binary')                         # 使用二进制标签

validation_generator = test_datagen.flow_from_directory(
        validation_dir,
        target_size=(150, 150),
        batch_size=20,
        class_mode='binary')

Python 生成器（Python generator） 是一个类似于迭代器的对象，一个可以和 for ... in 运算符一起使用的对象。生成器是用 yield 运算符来构造的。

def generator(): 
    i=0
    while True:
        i += 1
        yield i

关于 yield 的理解和使用，可以参考这篇文章。

2、利用批量生成器拟合模型

history = model.fit_generator(
      train_generator,                        # 训练集数据生成器
      steps_per_epoch=100,                    # 100批
      epochs=30,                              # 10轮
      validation_data=validation_generator,   # 验证集数据生成器
      validation_steps=50)                    # 50批

3、保存模型

model.save('cats_and_dogs_small_1.h5')

4、绘制训练过程中的损失曲线和精度曲线

5.2.5 使用数据增强

数据增强 是从现有的训练样本中生成更多的训练数据，其方法是利用多种能够生成可信图像的随机变换来增加（augment）样本。其目标是，模型在训练时不会两次查看完全相同的图像。这让模型能够观察到数据的更多内容，从而具有更好的泛化能力。

1、利用 ImageDataGenerator 来设置数据增强

datagen = ImageDataGenerator(
      rotation_range=40,
      width_shift_range=0.2,
      height_shift_range=0.2,
      shear_range=0.2,
      zoom_range=0.2,
      horizontal_flip=True,
      fill_mode='nearest')

参数含义：
1、rotation_range 是角度值（在 0~180 范围内），表示图像随机旋转的角度范围；
2、width_shift 和 height_shift 是图像在水平或垂直方向上平移的范围（相对于总宽
度或总高度的比例）；
3、shear_range 是随机错切变换的角度；
4、zoom_range 是图像随机缩放的范围；
5、horizontal_flip 是随机将一半图像水平翻转，即镜像；
6、fill_mode 是用于填充新创建像素的方法，这些新像素可能来自于旋转或宽度/高度平移。

2、显示几个随机增强后的训练图像

from keras.preprocessing import image                   # 图像预处理工具模块

fnames = [os.path.join(train_cats_dir, fname) for
     fname in os.listdir(train_cats_dir)]               # 生成图片路径列表
     
img_path = fnames[3]                                    # 选取一张图片
img = image.load_img(img_path, target_size=(150, 150))  # 读取图片并调整大小
x = image.img_to_array(img)                             # 转换为（150，150，3）的 Numpy 数组
x = x.reshape((1,) + x.shape)                           # 升维，（1，150，150，3）

i = 0 
for batch in datagen.flow(x, batch_size=1):             # 将图像传入生成器中
    plt.figure(i)
    imgplot = plt.imshow(image.array_to_img(batch[0]))
    i += 1
    if i % 4 == 0:
        break                                           # 生成器循环是无限的，需要终止指令

plt.show()

3、在原有模型中全连接层前加入 Dropout 层

4、利用数据增强生成器训练卷积神经网络

5、保存模型

6、绘制训练过程中的损失曲线和精度曲线

可见，使用了数据增强和 dropout 之后，模型不再过拟合：训练曲线紧紧跟随着验证曲线。

5.3 使用预训练的卷积神经网络

想要将深度学习应用于小型图像数据集，一种常用且非常高效的方法是使用预训练网络。预训练网络（pretrained network） 是一个保存好的网络，之前已在大型数据集（通常是大规模图像分类任务）上训练好。如果这个原始数据集足够大且足够通用，那么预训练网络学到的特征的空间层次结构可以有效地作为视觉世界的通用模型，因此这些特征可用于各种不同的计算机视觉问题，即使这些新问题涉及的类别和原始任务完全不同。

使用预训练网络有两种方法：特征提取（feature extraction） 和 微调模型（fine-tuning）。

5.3.1 特诊提取

对于卷积神经网络而言，特征提取 就是取出之前训练好的网络的卷积基（convolutional base），在上面运行新数据，然后在输出上面训练一个新的分类器。卷积基指的是一系列卷积层和池化层的部分。

一、将 VGG16 卷积基实例化

from keras.applications import VGG16

conv_base = VGG16(weights='imagenet',
                  include_top=False, 
                  input_shape=(150, 150, 3))

参数含义：
1、weights 指定模型初始化的权重检查点。
2、include_top 指定模型最后是否包含密集连接分类器。
3、input_shape 是输入到网络中的图像张量的形状。这个参数完全是可选的，如果不传
入这个参数，那么网络能够处理任意形状的输入。

之后有两种运行方法：
1、在数据集上运行卷积基，将输出保存成硬盘中的 Numpy 数组，然后用这个数据作为输入，输入到独立的密集连接分类器中。这种方法速度快，计算代价低，但不能使用数据增强。
2、在顶部添加 Dense 层来扩展已有模型（即 conv_base），并在输入数据上端到端地运行整个模型。这样可以使用数据增强，但这种方法的计算代价比第一种要高很多。

二、不使用数据增强的快速特征提取

1、使用预训练的卷积基提取特征

import os
import numpy as np
from keras.preprocessing.image import ImageDataGenerator

""" 训练、验证、测试集路径 """
base_dir = '/Users/fchollet/Downloads/cats_and_dogs_small'
train_dir = os.path.join(base_dir, 'train') 
validation_dir = os.path.join(base_dir, 'validation') 
test_dir = os.path.join(base_dir, 'test')

""" 定义 ImageDataGenerator 实例 """
datagen = ImageDataGenerator(rescale=1./255)   # 图片缩小 1/255，并转换为浮点数
batch_size = 20 

""" 定义特征提取函数：将数据集传输到卷积基，并保留特征结果 """
def extract_features(directory, sample_count):
    features = np.zeros(shape=(sample_count, 4, 4, 512)) 
    labels = np.zeros(shape=(sample_count))
    generator = datagen.flow_from_directory(
        directory, 
        target_size=(150, 150), 
        batch_size=batch_size,                 # 分批存入内存
        class_mode='binary')
    i = 0
    for inputs_batch, labels_batch in generator:
        features_batch = conv_base.predict(inputs_batch)    # 输出特征
        features[i * batch_size : (i + 1) * batch_size] = features_batch 
        labels[i * batch_size : (i + 1) * batch_size] = labels_batch
        i += 1
        if i * batch_size >= sample_count:
            break 
    return features, labels

""" 调用函数，输出特征 """
train_features, train_labels = extract_features(train_dir, 2000) 
validation_features, validation_labels = extract_features(validation_dir, 1000) 
test_features, test_labels = extract_features(test_dir, 1000)

""" 将特征输出展平为 1D 张量 """
train_features = np.reshape(train_features, (2000, 4 * 4 * 512))
validation_features = np.reshape(validation_features, (1000, 4 * 4 * 512))
test_features = np.reshape(test_features, (1000, 4 * 4 * 512))

2、定义并训练密集连接分类器

from keras import models
from keras import layers
from keras import optimizers

model = models.Sequential()
model.add(layers.Dense(256, activation='relu', input_dim=4 * 4 * 512))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(1, activation='sigmoid'))

model.compile(optimizer=optimizers.RMSprop(lr=2e-5),
              loss='binary_crossentropy',
              metrics=['acc'])
              
history = model.fit(train_features, train_labels,
                    epochs=30,
                    batch_size=20,
                    validation_data=(validation_features, validation_labels))

3、绘制结果

虽然 dropout 比率相当大，但模型几乎从一开始就过拟合。这是因为本方法没有使用数据增强，而数据增强对防止小型图像数据集的过拟合非常重要。

三、使用数据增强的特征提取

1、在卷积基上添加一个密集连接分类器

from keras import models
from keras import layers

model = models.Sequential()
model.add(conv_base)
model.add(layers.Flatten())
model.add(layers.Dense(256, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

在编译和训练模型之前，一定要 “冻结” 卷积基。冻结（freeze） 一个或多个层是指在训练过程中保持其权重不变。如果不这么做，那么卷积基之前学到的表示将会在训练过程中被修改。

在 Keras 中，冻结网络的方法是将其 trainable 属性设为 False。

>>> print('This is the number of trainable weights '
         'before freezing the conv base:', len(model.trainable_weights))
This is the number of trainable weights before freezing the conv base: 30
>>> conv_base.trainable = False
>>> print('This is the number of trainable weights '
         'after freezing the conv base:', len(model.trainable_weights))
This is the number of trainable weights after freezing the conv base: 4

应注意，为了让这些修改生效，必须先编译模型。如果在编译之后修改了权重的 trainable 属性，那么应该重新编译模型，否则这些修改将被忽略。

2、利用冻结的卷积基端到端地训练模型

3、绘制结果

略优于前一个结果。

5.3.2 微调模型

微调是指将其深层的几层 “解冻” ，并将这解冻的几层和新增加的部分（全连接分类器）联合训练。之所以叫作微调，是因为它只是略微调整了所复用模型中更加抽象的表示，以便让这些表示与手头的问题更加相关。

上节说过，冻结 VGG16 的卷积基是为了能够在上面训练一个随机初始化的分类器。同理，只有上面的分类器已经训练好了，才能微调卷积基的顶部几层。如果分类器没有训练好，那么训练期间通过网络传播的误差信号会特别大，微调的几层之前学到的表示都会被破坏。因此，微调网络的步骤如下：
(1) 在已经训练好的 基网络（base network） 上添加自定义网络。
(2) 冻结基网络。
(3) 训练所添加的部分。
(4) 解冻基网络的一些层。
(5) 联合训练解冻的这些层和添加的部分。

做特征提取时已经完成了前三个步骤，从第四步继续。

1、冻结直到某一层的所有层

微调模型时，选择层数应该考虑到：
1、卷积基中浅层记忆的是更加通用的可复用特征，而深层记忆的是更专业化的特征。
2、训练的参数越多，过拟合的风险越大。

conv_base.trainable = True

set_trainable = False
for layer in conv_base.layers:
    if layer.name == 'block5_conv1':
        set_trainable = True
    if set_trainable:
        layer.trainable = True
    else:
        layer.trainable = False

2、微调模型

model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-5),    # 选较小的学习率
              metrics=['acc'])

history = model.fit_generator(
      train_generator,
      steps_per_epoch=100,
      epochs=100,
      validation_data=validation_generator,
      validation_steps=50)

5.3.3 小结

1、卷积神经网络是用于计算机视觉任务的最佳机器学习模型。
2、在小型数据集上的主要问题是过拟合。在处理图像数据时，数据增强是一种降低过拟合的强大方法。
3、利用特征提取，可以很容易将现有的卷积神经网络复用于新的数据集。
4、作为特征提取的补充，可以使用微调进一步提高模型性能。

5.4 卷积神经网络的可视化

深度学习模型像一个 “黑盒” ，即模型学到的表示很难用人类可以理解的方式来提取和呈现。但卷积神经网络学到的表示非常适合可视化，很大程度上是因为它们是**视觉概念
的表示。**该书介绍了三种方法：
1、可视化卷积神经网络的中间输出（中间激活）： 有助于理解卷积神经网络连续的层如何对输入进行变换，也有助于初步了解卷积神经网络每个过滤器的含义。
2、可视化卷积神经网络的过滤器： 有助于精确理解卷积神经网络中每个过滤器容易接受的视觉模式或视觉概念。
3、可视化图像中类激活的热力图： 有助于理解图像的哪个部分被识别为属于某个类别，从而可以定位图像中的物体。

5.4.1 可视化中间激活

可视化中间激活，是指对于给定输入，展示网络中各个卷积层和池化层输出的特征图（层的输出通常被称为该层的激活，即激活函数的输出）。

1、加载模型

from keras.models import load_model

model = load_model('cats_and_dogs_small_2.h5')  # 5.2节保存的模型

2、预处理单张图像

img_path = '/Users/fchollet/Downloads/cats_and_dogs_small/test/cats/cat.1700.jpg'

from keras.preprocessing import image 
import numpy as np

img = image.load_img(img_path, target_size=(150, 150)) 
img_tensor = image.img_to_array(img)                   # (150, 150, 3)
img_tensor = np.expand_dims(img_tensor, axis=0)        # 扩展数组 (1, 150, 150, 3)
img_tensor /= 255.                                     # 缩小数据，并化为浮点数

3、模型实例化

创建一个 Model 类的实例，以图像批量作为输入，所有卷积层和池化层的激活为输出。与 Sequential 模型不同，Model 类允许模型有多个输出。

from keras import models

layer_outputs = [layer.output for layer in model.layers[:8]]  # 此前加载的模型的前八层激活
activation_model = models.Model(inputs=model.input, outputs=layer_outputs)  # 创建 Model 实例

4、以预测模式运行模型

activations = activation_model.predict(img_tensor)  # 返回一个由 8个4D张量组成的列表

5、可视化一个通道

import matplotlib.pyplot as plt

first_layer_activation = activations[0]    # 第一层激活
plt.matshow(first_layer_activation[0, :, :, 4], cmap='viridis')  # 2D矩阵可视化，'viridis'为绿色

6、将每个中间激活的所有通道可视化

""" 记录每层的名字 """
layer_names = [] 
for layer in model.layers[:8]:
    layer_names.append(layer.name)

images_per_row = 16   # 一行16张

""" 将每层激活图像平铺 """
for layer_name, layer_activation in zip(layer_names, activations):  # 层名和激活结果相对应，打包为元组
    n_features = layer_activation.shape[-1]    # 该层激活的特征数量
    size = layer_activation.shape[1]           # 特征图形状为（1，size，size，n_feature）
    n_cols = n_features // images_per_row      # 行数
    
    display_grid = np.zeros((size * n_cols, images_per_row * size)) # 摆放激活结果的零矩阵
    for col in range(n_cols): 
        for row in range(images_per_row):
            channel_image = layer_activation[0,
                                             :, :, 
                                             col * images_per_row + row] # 单通道激活图像
            """ 对特征进行后处理 """
            channel_image -= channel_image.mean() 
            channel_image /= channel_image.std()
            channel_image *= 64
            channel_image += 128
            channel_image = np.clip(channel_image, 0, 255).astype('uint8') # 截取数组，使数组在0~255取值
            """ 将图像填入到零矩阵中 """
            display_grid[col * size : (col + 1) * size, 
                         row * size : (row + 1) * size] = channel_image

    scale = 1. / size
    plt.figure(figsize=(scale * display_grid.shape[1],
                        scale * display_grid.shape[0]))      # 英寸，（宽，高）
    plt.title(layer_name)
    plt.grid(False)                                          # 不显示网格
    plt.imshow(display_grid, aspect='auto', cmap='viridis')

可以看出：
1、第一层是各种边缘探测器的集合。在这一阶段，激活几乎保留了原始图像中的所有信息。
2、随着层数的加深，激活变得越来越抽象，并且越来越难以直观地理解。层数越深，其表示中关于图像视觉内容的信息就越少，而关于类别的信息就越多。
3、激活的 稀疏度（sparsity） 随着层数的加深而增大。在第一层里，所有过滤器都被输入图像激活，但在后面的层里，越来越多的过滤器是空白的。也就是说，输入图像中找不到这些过滤器所编码的模式。

深度神经网络可以有效地作为 信息蒸馏管道（information distillation pipeline），输入原始数据（本例中是 RGB 图像），反复对其进行变换，将无关信息过滤掉（比如图像的具体外观），并放大和细化有用的信息（比如图像的类别）。

5.4.2 可视化卷积神经网络的过滤器

想要观察卷积神经网络学到的过滤器，另一种简单的方法是显示每个过滤器所 响应的视觉模式。这可以通过 在输入空间中进行梯度上升 来实现：从空白输入图像开始，将梯度下降应用于卷积神经网络输入图像的值，其目的是让某个过滤器的响应最大化。

1、定义损失张量

from keras.applications import VGG16
from keras import backend as K

model = VGG16(weights='imagenet',
              include_top=False)

layer_name = 'block3_conv1'
filter_index = 0

layer_output = model.get_layer(layer_name).output
loss = K.mean(layer_output[:, :, :, filter_index])   # 以过滤器响应的均值作为损失函数

2、获取损失相对于输入的梯度

grads = K.gradients(loss, model.input)[0]  # 返回梯度张量列表，取第一个元素，4D

K.gradient 的用法可以参照这篇博客。

3、梯度标准化

""" 除以其 L2 范数 """
grads /= (K.sqrt(K.mean(K.square(grads))) + 1e-5)  # 做除法前加上 1e–5，以防不小心除以 0

4、定义迭代函数

iterate = K.function([model.input], [loss, grads])  # 定义函数 iterate，给定输入返回损失和梯度

import numpy as np
loss_value, grads_value = iterate([np.zeros((1, 150, 150, 3))])

5、通过随机梯度下降让损失最大化

input_img_data = np.random.random((1, 150, 150, 3)) * 20 + 128.    # 定义一张灰度图

step = 1. 
for i in range(40):          # 迭代40次
    loss_value, grads_value = iterate([input_img_data]) 
    input_img_data += grads_value * step             # 沿梯度上升方向，使得响应最大化

6、将张量转换为有效图像

def deprocess_image(x):
    """ 标准化，均值为0，标准差为0.1 """
    x -= x.mean() 
    x /= (x.std() + 1e-5)
    x *= 0.1
    """ 裁切x至区间[0, 1] """
    x += 0.5 
    x = np.clip(x, 0, 1)
    """ 将x转换为RGB数值 """
    x *= 255 
    x = np.clip(x, 0, 255).astype('uint8')
    return x

7、整合1~6，创建过滤器可视化函数

def generate_pattern(layer_name, filter_index, size=150):
    layer_output = model.get_layer(layer_name).output 
    loss = K.mean(layer_output[:, :, :, filter_index])
    
    grads = K.gradients(loss, model.input)[0] 
    grads /= (K.sqrt(K.mean(K.square(grads))) + 1e-5) 
    
    iterate = K.function([model.input], [loss, grads]) 
    
    input_img_data = np.random.random((1, size, size, 3)) * 20 + 128. 
    step = 1.
    for i in range(40): 
        loss_value, grads_value = iterate([input_img_data])
        input_img_data += grads_value * step
   
    img = input_img_data[0]          # 降维，3D数组
    return deprocess_image(img)      # 调用RGB数组转换函数

8、生成某一层中所有过滤器响应模式组成的网格

layer_name = 'block1_conv1'
size = 64        # 一格的大小
margin = 5       # 网格宽度

results = np.zeros((8 * size + 7 * margin, 8 * size + 7 * margin, 3))   # RGB零矩阵

""" 遍历该层所有过滤器 """
for i in range(8):       # 遍历行
    for j in range(8):   # 遍历列
        """ 生成过滤器响应图 """
        filter_img = generate_pattern(layer_name, j + (i * 8), size=size)
        
        """ 计算图像在零矩阵的放置坐标 """
        horizontal_start = i * size + i * margin 
        horizontal_end = horizontal_start + size
        vertical_start = j * size + j * margin
        vertical_end = vertical_start + size
        
        """ 放置过滤器响应图 """
        results[horizontal_start: horizontal_end,
                vertical_start: vertical_end, :] = filter_img

plt.figure(figsize=(20, 20)) 
plt.imshow(results)

下图为 block1_conv1 层的过滤器模式：

下图为 block4_conv1 层的过滤器模式：

可以看出：
1、模型第一层（block1_conv1）的过滤器对应简单的方向边缘和颜色（还有一些是彩色边缘）；
2、模型第四层（block4_conv1）的过滤器类似于自然图像中的纹理：羽毛、眼睛、树叶等；
3、随着模型层数的加深，过滤器识别的模式（包括纹理和颜色的组合）更加复杂。

5.4.3 可视化类激活的热力图

最后一种可视化方法叫作：类激活图（CAM，class activation map）可视化，它是指对输入图像生成类激活的 热力图。换个说法就是，一张图片各个部分较于给定种类的相似程度。

该书介绍的方法是论文 “Grad-CAM: visual explanations from deep networks via gradient-based localization” 中描述的方法。具体思路是：给定一张输入图像，对于一个卷积层的输出特征图，用类别相对于通道的梯度对这个特征图中的每个通道进行加权。可以理解为：用 “每个通道对类别的重要程度” 对 “输入图像对不同通道的激活强度” 的空间图进行加权，从而得到了 “输入图像对类别的激活强度” 的空间图（图像各个部分对类别判定的贡献、激活强度）。

1、加载带有预训练权重的 VGG16 网络

from keras.applications.vgg16 import VGG16

model = VGG16(weights='imagenet')       # 带有全连接层的完整VGG16模型

2、预处理一张输入图像

from keras.preprocessing import image
from keras.applications.vgg16 import preprocess_input, decode_predictions
import numpy as np

img_path = '/Users/fchollet/Downloads/creative_commons_elephant.jpg' 

img = image.load_img(img_path, target_size=(224, 224)) 
x = image.img_to_array(img)        # 形状为 (224, 224, 3) 的float32格式的 Numpy数组
x = np.expand_dims(x, axis=0)      # 升维度，形状为 (1，224, 224, 3)
x = preprocess_input(x)            # 对批量进行预处理（按通道进行颜色标准化）

查看预测结果：

>>> preds = model.predict(x)
>>> print('Predicted:', decode_predictions(preds, top=3)[0])
Predicted:', [(u'n02504458', u'African_elephant', 0.92546833),
(u'n01871265', u'tusker', 0.070257246),
(u'n02504013', u'Indian_elephant', 0.0042589349)]

使用 decode_predictions() 对预测向量解码，top=3 表示输出得分前三的预测结果。

获取第一名的索引：

>>> np.argmax(preds[0])
386

3、应用 Grad-CAM 算法

african_elephant_output = model.output[:, 386]     # 预测向量是one-hot编码，为（samples, categories）

last_conv_layer = model.get_layer('block5_conv3') 

""" 获取最后一层输出结果对非洲象判断的影响程度 """
grads = K.gradients(african_elephant_output, last_conv_layer.output)[0]   # （1，size，size，features）

""" 获取最后一层识别的512个特征对非洲象判断的影响程度 """
pooled_grads = K.mean(grads, axis=(0, 1, 2))     # 对 0~2轴压缩，保留 3轴（特征轴）

""" 创建迭代函数 """
iterate = K.function([model.input],
                     [pooled_grads, last_conv_layer.output[0]])  # 输出结果为（1D，3D）

pooled_grads_value, conv_layer_output_value = iterate([x]) 

""" 遍历最后一层输出结果的512个特征 """
for i in range(512): 
    conv_layer_output_value[:, :, i] *= pooled_grads_value[i]

heatmap = np.mean(conv_layer_output_value, axis=-1)    # 沿特征轴压缩，输出2D热力图

4、热力图后处理

heatmap = np.maximum(heatmap, 0)   # 逐位比较，去除负值
heatmap /= np.max(heatmap)         # 标准化，[0, 1]
plt.matshow(heatmap)               # 矩阵可视化

5、将热力图与原始图像叠加

import cv2

img = cv2.imread(img_path)     # 加载图片

heatmap = cv2.resize(heatmap, (img.shape[1], img.shape[0]))  # 按原图调整热力图形状，(宽，高)

heatmap = np.uint8(255 * heatmap)                        # 转换[0, 255]中的整数
heatmap = cv2.applyColorMap(heatmap, cv2.COLORMAP_JET)   # 创建伪色彩，第二个参数为模式
superimposed_img = heatmap * 0.4 + img                   # 0.4是热力图强度因子
cv2.imwrite('/Users/fchollet/Downloads/elephant_cam.jpg', superimposed_img)  # 保存图片

cv2.applyColorMap() 的使用可参照这篇博客。

小结

1、卷积神经网络是解决视觉分类问题的最佳工具；
2、卷积神经网络通过学习 模块化模式 和 概念的层次结构 来表示视觉世界；
3、在小型数据集上从头开始训练一个卷积神经网络，可以使用 数据增强 来防止过拟合；
4、使用 预训练 的卷积神经网络进行 特征提取 与 模型微调，以此提高模型的识别精度；
5、过滤器可视化 和 类激活热力图可视化。

你可能感兴趣的:(#,《Python,深度学习》,卷积神经网络)

批量图片水印添加工具木木黄木木 python
批量图片水印添加工具这是一个可以批量给图片添加水印的Python程序。程序会根据原始图片的分辨率自动调整水印大小，确保水印效果美观。这里写目录标题批量图片水印添加工具功能特点运行说明注意事项下载地址功能特点支持批量处理多个图片自动根据原图尺寸调整水印大小支持PNG格式的透明水印水印位置固定在右下角支持JPG、JPEG、PNG、BMP等格式的图片运行说明准备文件：将需要添加水印的图片放入input文
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 音视频机器学习人工智能深度学习计算机视觉 transformer
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
PythonWeb——Django框架 Error_exception_worn Python基础数据库 Python django
框架介绍1.什么是框架?框架就是程序的骨架，主体结构，也是个半成品。2.框架的优缺点可重用、成熟,稳健、易扩展、易维护3.Python中常见的框架大包大揽Django被官方称之为完美主义者的Web框架。力求精简web.py和Tornado新生代微框架Flask和Bottle4.Web框架中的一些概念MVC（模型-视图-控制器）和MVT（模型-视图-模板）Django框架介绍Django是一个高级的
1.动手学习深度学习课程安排及深度学习数学基础 Unknown To Known 动手学习深度学习深度学习人工智能
视频资源B站：动手学习深度学习——李沐目录目标内容将学到什么1.N维数组样例2.访问2维数组元素3.数据操作4.线性代数5.矩阵计算6.自动求导目标介绍深度学习景点和最新模型LeNetAlexNetVGGResNetLSTMBERT…机器学习基础损失函数，目标函数，过拟合，优化实践使用pytorch实现介绍的知识点在真实数据上体验算法效果内容深度学习基础——线性神经网络，多层感知机卷积神经网络——
【报错】zipfile.BadZipFile: File is not a zip file Jude_lennon 报错 python
pythonpd.read_excel(excel_path,sheet_name='Sheet1',engine='openpyxl',header=None)出现报错zipfile.BadZipFile:Fileisnotazipfile原代码：data_list=[load_graph_data(file)forfileindata_directory.glob("*.xlsx")]经过de
动手学深度学习V2.0(Pytorch)——10.感知机（激活函数）吨吨不打野动手学深度学习pytorch pytorch 深度学习机器学习
文章目录1.感知机2.多层感知机2.1异或问题2.2单隐藏层2.3激活函数2.3.1logistics函数/sigmoid激活函数2.3.2tanh函数2.3.3sigmoid函数和tanh函数的异同/优缺点2.3.4relu2.4多类分类2.5多隐藏层3Q&A3.1神经网络中一层的定义是什么3.2感知机无法解决XOR问题，多层感知机虽然可以解决，但是还是被SVM替代是为什么?3.3不同任务的激活
Python实现链表反转：迭代与递归双解法详解达不溜先生 ୧⍢⃝୨ python 数据结构链表算法 leetcode
目录一、问题描述二、核心代码实现2.1迭代法实现迭代法中的prev初始值是None的原因：关键步骤图解2.2递归法实现递归法中要设置head.next=None的原因递归过程拆解三、方法对比与选择建议一、问题描述链表反转是数据结构中的基础算法问题，常见于面试和算法题库（如LeetCode#206）。要求将单向链表的节点顺序完全倒置二、核心代码实现2.1迭代法实现时间复杂度：O(n)空间复杂度：O(
Python机器学习实战：使用Flask构建机器学习API AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：使用Flask构建机器学习API作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域，模型训练和部署一直是重要的挑战。传统的机器学习项目往往采用独立的脚本或复杂的流程，难以实现模型的自动化、可视化和复现。为了解决这一问题，将机器学习模型封装成可访问的API变得越来越流行。Fla
Django框架的全面指南：从入门到高级步入烟尘 Python超入门指南全册 django sqlite 数据库
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
Sijia_y的个人经历以及计算机行业发展 Sijia_y python
如今互联网发展的速度甚是快，以至于技术都在更新迭代。稍有不注意可能就会被淘汰甚至是替代。作为一名中专生，我的成绩也是很差。因为高中考不上的缘故，来到了江苏上学。计算机行业我了解的并不是很多，当时只是听说工资高，铁饭碗。我是一个很懒的人，也是很贪玩。并没有学习很高的兴趣。我接触编程语言，完全是因为我的朋友。因为他是自学C语言的，后面他参加比赛得奖了。我就觉得非常厉害。我就开始学习Python，学会一
为什么Python使用者远远大于perl perlpython
不认为两者的语法差异是造成如此局面的主要原因.perl的语法虽然比较特立独行,但也不是很难.总结如下原因:library(或者叫package)的使用如果是本语言原生的library,那没有问题.如果是需要调用外部函数/过程的package的话,那么就会有巨大的差异.python是预编译然后从pypi上下载python(pip)将package下载到本地然后解压后将package内容安装到不同的指
AI 问答系统实战：用 Python + Flask + LLM 打造你的智能对话机器人！ Leaton Lee 人工智能 python flask
开篇互动：你是否想拥属于自己的AI问答机器人？“你是否想过拥有一个可以随时为你解答问题、提供建议的AI助手？”随着大语言模型（LLM）的快速发展，打造一个智能问答系统已经成为可能！本文将手把手教你如何利用Python和Flask快速搭建一个属于自己的AI问答系统，并集成强大的语言模型（如OpenAI的GPT-3.5或HuggingFace的LLaMA）。无论是技术小白还是有一定经验的开发者，都能轻
【TVM教程】为 Mobile GPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：LianminZheng,EddieYan针对特定设备的自动调优对于获得最佳性能至关重要。本文介绍如何调优整个卷积网络。TVM中MobileGPU的算子实现是以template形式编写的。该template有许多可调参数（tile因子
入坑 Python 全能实战小白训练营，470 集干货 12.9G 大揭秘！七七知享 Python python 开发语言 pandas numpy matplotlib java php
家人们，我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集，内容超丰富，资源包有12.9G，完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入，会涉及到Python的各种高级特性，比如面向对象编程、模块与包的使用。在讲面向对象编程时，老师通过打造一个小型游戏角色系统，把类、对象、继承、多态这些抽象概念诠释得生动形象，让
深度学习训练中GPU内存管理 @Mr_LiuYang 遇到过的问题内存管理内存溢出 out of memory GPU内存
文章目录概述常见问题1、设备选择和数据迁移2、显存监控函数3、显存释放函数4、自适应batchsize调节5、梯度累积概述在深度学习模型训练中，主流GPU显存通常为8GB~80GB，内存不足会导致训练中断或BatchSize受限，GPU内存管理是优化性能和避免OutOfMemoryError的关键挑战。本博客简介PyTorch中GPU内存管理的核心函数、用法和实战技巧，帮助开发者高效利用显存资源。
深度学习pytorch之简单方法自定义9类卷积即插即用 @Mr_LiuYang 计算机视觉基础卷积类型非对称卷积深度卷积空洞卷积组卷积深度可分离卷积动态卷积
本文详细解析了PyTorch中torch.nn.Conv2d的核心参数，通过代码示例演示了如何利用这一基础函数实现多种卷积操作。涵盖的卷积类型包括：标准卷积、逐点卷积（1x1卷积）、非对称卷积（长宽不等的卷积核）、空洞卷积（扩大感受野）、深度卷积（逐通道滤波）、组卷积（分组独立处理）、深度可分离卷积（深度+逐点组合）、转置卷积（上采样）和动态卷积（动态生成卷积核），帮助读者理解如何通过调整参数灵活
PyCharm 对接 DeepSeek 大模型的详细操作流程程之编 pycharm ide python
以下是使用PyCharm对接DeepSeek大模型的详细操作流程，基于Python开发环境。假设你已具备DeepSeekAPI的访问权限（需提前申请APIKey）：步骤1：PyCharm环境准备创建新项目打开PyCharm→NewProject→选择纯Python项目→指定项目路径→创建虚拟环境（建议选Virtualenv）。安装依赖库打开终端（Terminal）执行以下命令：pipinstall
一学就会的深度学习基础指令及操作步骤（5）使用预训练模型小圆圆666 深度学习人工智能 python 卷积神经网络
文章目录使用预训练模型加载预训练模型图像加载与预处理预测使用预训练模型查看模型库和常用模型加载预训练模型fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16_Weights#VGG16的预训练权重配置#loadtheVGG16network*pre-trained*ontheImageNetd
深度学习PyTorch之数据加载DataLoader @Mr_LiuYang 计算机视觉基础深度学习 pytorch 人工智能
深度学习pytorch之简单方法自定义9类卷积即插即用文章目录数据加载基础架构1、Dataset类详解2、DataLoader核心参数解析3、数据增强数据加载基础架构核心类关系图torch.utils.data├──Dataset(抽象基类)├──DataLoader(数据加载器)├──Sampler(采样策略)├──BatchSampler(批量采样)└──IterableDataset(流式数
量子计算如何颠覆能源优化领域：从理论到实践 Echo_Wish 人工智能前沿技术量子计算能源
量子计算如何颠覆能源优化领域：从理论到实践大家好，我是Echo_Wish，一个热爱探索前沿技术的人工智能与Python领域的技术分享者。今天，我们将深入探讨一个激动人心的话题——量子计算在能源优化中的应用。这不仅是科技领域的全新趋势，也可能为全人类的能源利用效率带来革命性突破。从理论模型到实际应用，量子计算已经在一些能源相关领域崭露头角，例如电网优化、可再生能源分配和物流节能规划。以下，让我们一步
池化的定义与核心思想 code 旭 AI人工智能学习 python numpy 人工智能
一、池化的定义与核心思想定义：池化是卷积神经网络（CNN）中的一种下采样操作，用于降低特征图的空间维度（宽高），保留主要特征。核心目标：减少计算量：缩小特征图尺寸，降低后续层参数规模。增强模型鲁棒性：对微小平移、旋转等变化不敏感。防止过拟合：通过降维减少冗余信息。二、池化的数学公式1.最大池化（MaxPooling）取池化窗口内的最大值：yi,j=max⁡p=0kh−1max⁡q=0kw−1xi⋅
Kibana 单机与集群部署教程闲人编程大数据集群部署教程大数据集群单机部署 Kibana 日志分析数据可视化
目录Kibana单机与集群部署教程第一部分：Kibana概述第二部分：Kibana单机部署教程1.安装Kibana1.1安装依赖项1.2下载和安装Kibana1.3启动Kibana2.单机案例代码实现（Python）3.常见问题及解决方法3.1无法启动Kibana服务3.2Kibana无法连接到Elasticsearch第三部分：Kibana集群部署教程1.配置集群节点1.1配置Elasticse
卷积神经网络（笔记01）天行者@ cnn 人工智能深度学习
视觉处理三大任务：分类、目标检测、图像分割CNN网络主要有三部分构成：卷积层（ConvolutionalLayer）、池化层（PoolingLayer）和激活函数一、解释卷积层中的偏置项是什么，并讨论在神经网络中引入偏置项的好处。在卷积神经网络（CNN）的卷积层里，卷积操作本质上是输入数据与卷积核（滤波器）进行逐元素相乘再求和的过程。偏置项（Bias）是一个额外的可学习参数，对于每个卷积核而言，都
INCA二次开发GUI实例化智海行舟 python 个人开发
【摘要】本文基于ETASINCA二次开发实践，深入探讨如何构建完整的自动化测试GUI系统。通过Python语言结合COM接口技术，实现从软件架构设计到功能模块开发的完整闭环，为汽车电子领域工程师提供可复用的开发范式。一、INCA二次开发技术背景1.1行业应用需求在汽车电子开发领域，ETASINCA作为行业标准标定工具，其自动化测试需求日益增长。传统的手动操作模式存在以下痛点：重复性操作耗时严重（单
如何通过API用Python获取北向资金流向数据？量化问财量化软件 QMT 量化交易 Python 量化炒股 PTrade QMT 量化交易量化软件 deepseek
推荐阅读：《【最全攻略】免费的量化软件有哪些？券商的交易接口怎么获取？》如何通过API用Python获取北向资金流向数据？北向资金指的是通过沪港通和深港通渠道，从香港市场流入A股市场的资金。对于投资者来说，了解北向资金流向对于把握市场趋势和投资决策具有重要意义。本文将介绍如何通过API用Python获取北向资金流向数据。理解北向资金流向数据北向资金流向数据主要包括以下几个方面：资金流入量：指通过沪
go执行java -jar 完成DSA私钥解析并签名 DavidSoCool java jar golang
起因，最近使用go对接百度联盟api需要使用到DSA私钥完成签名过程，在百度提供的代码示例里面没有go代码的支持，示例中仅有php、python2和3、java的代码，网上找了半天发现go中对DSA私钥解析支持不友好，然后决定使用在java中完成签名计算过程，生成可执行jar后由外部传入参数获取签名数据。百度联盟api文档说明：1）权限开通后，登录百度联盟媒体平台（union.baidu.com）
【30天玩转python】项目实战：从零开始开发一个Python项目爱技术的小伙子 30天玩转python linux 运维服务器
项目实战：从零开始开发一个Python项目在学习Python的过程中，开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识，还能提高实际编程能力。本文将带领你从零开始开发一个Python项目，介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例，逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
python递推法_如何使用Python递归函数中的递推？热茶走 python递推法
我们大家都知道，一个函数可能存在多种不同的用法，很少是有函数只针对一个方式，那么基于一种函数，我们肯定要了解多个方式，今日针对递归函数里的递推内容给大家介绍哦~递归是什么？是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解：递归就是在函数内部调用自己的函数被称之为递归。实例：#直接调用自己：deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions) man One python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

粗读《Python 深度学习》（4）