十年一梦实验室

【机器学习】深度学习概论（一）

经典的机器学习算法与深度学习对比

一、机器学习面临的挑战

1.1 机器学习算法用于各种应用问题时所利用的典型特征

1.2 采用人工特征的机器学习算法处理流程

1.3 人工设计特征面临的问题

二、深度学习技术

2.1 采用受限玻尔兹曼机和逐层训练的方法训练深层网络

2.2 自动编码器

2.3 训练有多个隐含层的自动编码器存在困难

2.4 AlexNet 网络

2.5 循环神经网络（Recurrent Neural Network，RNN）

2.6 解决深层神经网络梯度消失和退化以及局部最优解等问题

三、进展和典型应用

深度学习技术在机器视觉领域、语音识别、自然语言处理、数据挖掘、推荐系统、计算机图形学等方向的应用

3.1 计算机视觉

3.2 语音识别

3.3 自然语言处理

3.4 计算机图形学

3.5 推荐系统

3.6 深度强化学习

四、自动编码器（Autoencoder）

4.1 自动编码器简介

示例代码：用TensorFlow实现的一个简单的自动编码器模型，用于对MNIST数据集进行降维和可视化。

# 导入所需的库
import numpy as np # 用于科学计算
import matplotlib.pyplot as plt # 用于绘图
from tensorflow.keras.datasets import mnist # 用于加载MNIST数据集
from tensorflow.keras.models import Model # 用于构建模型
from tensorflow.keras.layers import Input, Dense # 用于定义层


# 加载MNIST数据集，它包含了6万张训练图像和1万张测试图像，每张图像是28*28的灰度图
#x_train是一个形状为(60000, 28, 28)的数组，表示有6万张训练图像，每张图像有28*28个像素值。y_train是一个形状为(60000,)的数组，表示有6万个训练标签，每个标签是一个0到9的整数。x_test和y_test的含义类似，只是它们的数量是1万而已。
(x_train, y_train), (x_test, y_test) = mnist.load_data()
# 将图像数据归一化到[0,1]区间，这样可以加快模型的收敛速度
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0
# 将图像数据展平成一维向量，方便输入到全连接层
#-1表示自动计算该维度的大小，2828表示将每张图像展平成一个784维的向量
x_train = x_train.reshape(-1, 28*28)
x_test = x_test.reshape(-1, 28*28)


# 定义编码器的输入层和输出层，输入层的形状是(28*28,)，输出层的形状是(2,)，表示将784维的数据降维到2维，输出层使用了ReLU激活函数
input_img = Input(shape=(28*28,))
encoded = Dense(2, activation='relu')(input_img)
# 定义解码器的输入层和输出层，输入层的形状是(2,)，输出层的形状是(28*28,)，表示将2维的数据还原到784维，输出层使用了Sigmoid激活函数，使得输出值在[0,1]区间
decoded = Dense(28*28, activation='sigmoid')(encoded)


# 构建自动编码器模型，它由编码器和解码器组成，输入是图像数据，输出是重构后的图像数据
autoencoder = Model(input_img, decoded)
# 构建编码器模型，它只包含编码器部分，输入是图像数据，输出是编码后的数据
encoder = Model(input_img, encoded)
# 构建解码器模型，它只包含解码器部分，输入是编码后的数据，输出是重构后的图像数据
decoder_input = Input(shape=(2,))#解码器的输入层，它的形状是(2,)，表示输入的数据是2维的向量，这是编码器的输出层的形状
decoder_layer = autoencoder.layers[-1] #获取了自动编码器模型的最后一层，它是一个全连接层，它的形状是(28*28,)，表示输出的数据是784维的向量，这是原始图像数据的形状
decoder = Model(decoder_input, decoder_layer(decoder_input)) #构建了解码器模型，它的输入是解码器的输入层，它的输出是自动编码器的最后一层对输入层的计算结果。


# 编译自动编码器模型，使用Adam优化器和二元交叉熵损失函数
autoencoder.compile(optimizer='adam', loss='binary_crossentropy')
# 训练自动编码器模型，使用训练数据作为输入和输出，设置10个周期，每个批次256个样本，打乱数据顺序，使用测试数据作为验证数据
autoencoder.fit(x_train, x_train, epochs=10, batch_size=256, shuffle=True, validation_data=(x_test, x_test))


# 用编码器模型对测试数据进行编码，得到编码后的数据，它的形状是(10000, 2)，表示有1万个样本，每个样本有2个特征
encoded_imgs = encoder.predict(x_test)
# 用解码器模型对编码后的数据进行解码，得到重构后的图像数据，它的形状是(10000, 28*28)，表示有1万个样本，每个样本有784个像素值
decoded_imgs = decoder.predict(encoded_imgs)


# 绘制原始图像和重构图像，比较它们的相似度
n = 10 # 显示的图像数量
plt.figure(figsize=(20, 4))# 大小为20英寸宽，4英寸高
for i in range(n):
    # 显示原始图像，它是28*28的灰度图
    ax = plt.subplot(2, n, i + 1)#第一行第i+1列
    plt.imshow(x_test[i].reshape(28, 28))
    plt.gray()#设置图像的颜色为灰度
    ax.get_xaxis().set_visible(False)#隐藏子图的x轴
    ax.get_yaxis().set_visible(False)


    # 显示重构图像，它是28*28的灰度图
    ax = plt.subplot(2, n, i + 1 + n)# 第二行第i+1列
    plt.imshow(decoded_imgs[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
plt.show()


# 绘制编码后的数据的散点图，用不同的颜色表示不同的类别，观察它们的分布情况
plt.figure(figsize=(8, 8))
#绘制散点图，横坐标是编码后的数据的第一维，纵坐标是编码后的数据的第二维，颜色是测试数据的标签，颜色映射是彩虹色
plt.scatter(encoded_imgs[:, 0], encoded_imgs[:, 1], c=y_test, cmap='rainbow')
plt.colorbar()#添加一个颜色条，显示不同的颜色对应的数字类别
plt.xlabel('Dimension 1')#设置横坐标的标签
plt.ylabel('Dimension 2')
plt.show()

输出结果：

测试集中前10个原始图像和重建图像

4.2 去噪编码器（Denoising Autoencoder）

示例代码：

#去噪自编码器是一种神经网络，它可以从带有噪声的图像中恢复出原始的清晰图像。
# 用带噪声的图像作为输入，用原始的图像作为输出，让网络学习如何去除噪声
# 导入keras的相关模块
import os
from keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D
from keras.models import Model
from keras.callbacks import TensorBoard
from keras.datasets import mnist
# 导入numpy和matplotlib的相关模块
import numpy as np
import matplotlib.pyplot as plt


# 加载mnist数据集，只使用图像数据，不使用标签数据
(x_train, _), (x_test, _) = mnist.load_data()
# 将图像数据转换为浮点型，并归一化到[0,1]区间
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
# 将图像数据调整为四维张量，第一维是样本数，后三维是图像的高、宽、通道数
# 一个四维的numpy数组，存储了训练集的图像数据，每个图像的形状为(28, 28, 1)
x_train = np.reshape(x_train, (len(x_train), 28, 28, 1))
x_test = np.reshape(x_test, (len(x_test), 28, 28, 1))


# 定义噪声因子，用于在图像数据中添加随机噪声
noise_factor = 0.5
# 在训练集和测试集中添加正态分布的随机噪声
# np.random.normal(loc=0.0, scale=1.0, size=x_train.shape)是一个numpy函数，用于生成一个与x_train形状相同的随机数组，每个元素都服从均值为0，标准差为1的正态分布
x_train_noisy = x_train + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_train.shape)
x_test_noisy = x_test + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_test.shape)
# 将噪声数据裁剪到[0,1]区间 添加噪声后，图像的像素值可能会超出 0 到 1 的范围，这会影响网络的性能。
# 所以，我们需要用 np.clip 函数来将像素值限制在 0 到 1 之间，保证输入的合法性。
x_train_noisy = np.clip(x_train_noisy, 0., 1.)
x_test_noisy = np.clip(x_test_noisy, 0., 1.)


# 定义要显示的图像数量
n = 10
# 创建一个大小为(20, 2)的图形窗口
plt.figure(figsize=(20, 2))
# 循环显示测试集中的噪声图像
for i in range(n):
    # 创建一个子图，位置为第一行第i+1列
    ax = plt.subplot(1, n, i + 1)
    # 显示第i个噪声图像，将其调整为28*28的灰度图
    plt.imshow(x_test_noisy[i].reshape(28, 28))
    plt.gray()
    # 隐藏子图的坐标轴
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
# 显示图形窗口
plt.show()


# 定义输入图像的形状，为(28, 28, 1)
input_img = Input(shape=(28, 28, 1))


# 定义编码器部分，使用卷积层和最大池化层实现特征提取和降维
x = Conv2D(32, (3, 3), activation='relu', padding='same')(input_img)    # (28, 28, 32)
x = MaxPooling2D((2, 2), padding='same')(x)                             # (14, 14, 32)
x = Conv2D(32, (3, 3), activation='relu', padding='same')(x)            # (14, 14, 32)
encoded = MaxPooling2D((2, 2), padding='same')(x)                       # (7, 7, 32)


# 定义解码器部分，使用卷积层和上采样层实现特征还原和升维
x = Conv2D(32, (3, 3), activation='relu', padding='same')(encoded)      # (7, 7, 32)
x = UpSampling2D((2, 2))(x)                                             # (14, 14, 32)
x = Conv2D(32, (3, 3), activation='relu', padding='same')(x)            # (14, 14, 32)
x = UpSampling2D((2, 2))(x)                                             # (28, 28, 32)
# 使用卷积层输出重建的图像，激活函数为sigmoid，保证输出值在[0,1]区间
decoded = Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x)


# 定义自动编码器模型，输入为噪声图像，输出为重建图像
autoencoder = Model(input_img, decoded)
# 编译自动编码器模型，优化器为adadelta，损失函数为二元交叉熵
autoencoder.compile(optimizer='adadelta', loss='binary_crossentropy')


logdir = os.path.join(os.getcwd(), 'my_logs')
# 训练自动编码器模型，输入为噪声图像，输出为原始图像
autoencoder.fit(x_train_noisy, x_train,
                epochs=100, # 迭代次数为100
                batch_size=128, # 批次大小为128
                shuffle=True, # 每次迭代前打乱数据
                validation_data=(x_test_noisy, x_test), # 使用测试集作为验证集
                callbacks=[TensorBoard(log_dir=logdir, histogram_freq=0, write_graph=False)]) # 使用TensorBoard回调函数记录训练过程


# 使用自动编码器模型对测试集中的噪声图像进行预测，得到重建图像
decoded_imgs = autoencoder.predict(x_test_noisy)


# 定义要显示的图像数量
n = 10
# 创建一个大小为(20, 4)的图形窗口
plt.figure(figsize=(20, 4))
# 循环显示测试集中的噪声图像和重建图像
for i in range(n):
    # 显示噪声图像，位置为第一行第i+1列
    ax = plt.subplot(2, n, i + 1)
    plt.imshow(x_test_noisy[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)


    # 显示重建图像，位置为第二行第i+1列
    ax = plt.subplot(2, n, i + 1 + n)
    plt.imshow(decoded_imgs[i].reshape(28, 28))
    plt.gray()
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
# 显示图形窗口
plt.show()

测试集中前10个噪声图像

测试集中前10噪声图像和重建图像

4.3 稀疏自动编码器（Sparse Autoencoder）

示例代码（pytorch）：

# 导入 torch 模块，用于构建和训练神经网络
import torch
# 导入 torch.nn 模块，用于定义神经网络的层和损失函数
import torch.nn as nn
# 导入 torch.nn.functional 模块，用于实现一些常用的激活函数和其他函数
import torch.nn.functional
# 导入 torch.optim 模块，用于实现优化算法
import torch.optim as optim
# 导入 torch.utils.data.dataloader 模块，用于加载和处理数据
import torch.utils.data.dataloader as dataloader


# 导入 torchvision 模块，用于处理图像数据
import torchvision
# 导入 torchvision.datasets 模块，用于获取一些常用的数据集
import torchvision.datasets as datasets
# 导入 torchvision.transforms 模块，用于对图像数据进行一些变换
import torchvision.transforms as transforms


# 导入 common.datas 模块，用于获取 MNIST 数据集的加载器
from common.datas import get_mnist_loader


# 导入 os 模块，用于操作系统相关的功能
import os
# 导入 time 模块，用于获取时间相关的信息
import time
# 导入 matplotlib.pyplot 模块，用于绘制图形
import matplotlib.pyplot as plt
# 导入 PIL.Image 模块，用于处理图像
from PIL import Image


# 定义一些超参数
batch_size = 100 # 批次大小，即每次训练的数据量
num_epochs = 50 # 训练的轮数，即所有数据训练的次数
in_dim = 784 # 输入维度，即图像的像素数，28*28=784
hidden_size = 30 # 隐藏层维度，即隐藏层神经元的个数
expect_tho = 0.05 # 期望的平均激活值，用于稀疏性约束




def KL_devergence(p, q):
    """
    计算两个分布的 KL 散度
    :param p: 期望的分布
    :param q: 实际的分布
    :return: KL 散度
    """
    # 编码器激活函数是relu,输出没有限制在0~1
    # 对 q 这个张量进行 softmax 函数的运算，使得 q 的每个元素缩放到 (0, 1) 区间且和为 1
    q = torch.nn.functional.softmax(q, dim=0) # 对 q 进行 softmax 归一化，使其和为 1
    q = torch.sum(q, dim=0)/batch_size  # 对 q 的第一维求和，即将第 j 个神经元在 batch_size 个输入下的所有输出取平均
    s1 = torch.sum(p*torch.log(p/q)) # 计算 p 和 q 的交叉熵
    s2 = torch.sum((1-p)*torch.log((1-p)/(1-q))) # 计算 1-p 和 1-q 的交叉熵
    return s1+s2 # 返回 KL 散度


# 定义一个自编码器类，继承自 nn.Module
class AutoEncoder(nn.Module): 
    def __init__(self, in_dim=784, hidden_size=30, out_dim=784): # 定义类的初始化方法，接受输入维度、隐藏层维度和输出维度作为参数
        super(AutoEncoder, self).__init__() # 调用父类的初始化方法
        self.encoder = nn.Sequential( # 定义编码器，即将输入数据压缩为隐藏层表示的部分
            nn.Linear(in_features=in_dim, out_features=hidden_size), # 定义一个全连接层，将输入维度映射为隐藏层维度
            nn.ReLU() # 定义一个 ReLU 激活函数，增加非线性
        )
        self.decoder = nn.Sequential( # 定义解码器，即将隐藏层表示恢复为输出数据的部分
            nn.Linear(in_features=hidden_size, out_features=out_dim), # 定义一个全连接层，将隐藏层维度映射为输出维度
            nn.Sigmoid() # 定义一个 Sigmoid 激活函数，将输出限制在 0 到 1 之间，因为图像的像素值在 0 到 1 之间
        )


    def forward(self, x): # 定义类的前向传播方法，接受输入数据 x 作为参数
        encoder_out = self.encoder(x) # 调用编码器，得到隐藏层表示
        decoder_out = self.decoder(encoder_out) # 调用解码器，得到输出数据
        return encoder_out, decoder_out # 返回隐藏层表示和输出数据




train_loader, test_loader = get_mnist_loader(batch_size=batch_size, shuffle=True) # 调用 get_mnist_loader 函数，获取 MNIST 数据集的训练集和测试集的加载器
autoEncoder = AutoEncoder(in_dim=in_dim, hidden_size=hidden_size, out_dim=in_dim) # 创建一个自编码器对象，传入输入维度、隐藏层维度和输出维度作为参数
if torch.cuda.is_available(): # 判断是否有 GPU 可用
    autoEncoder.cuda()  # 将模型放到 GPU 上，因此后续传入的数据必须也在 GPU 上


Loss = nn.BCELoss() # 定义损失函数，使用二元交叉熵损失，用于衡量输出数据和输入数据的差异
Optimizer = optim.Adam(autoEncoder.parameters(), lr=0.001) # 定义优化器，使用 Adam 算法，传入自编码器的参数和学习率作为参数


# 定义期望平均激活值和 KL 散度的权重
#用于计算隐藏层神经元的平均激活值和期望的平均激活值之间的 KL 散度，从而增加稀疏性的约束。
# 期望的平均激活值是一个很小的值，比如 0.05，表示我们希望隐藏层神经元的激活值的平均值接近于这个值，
# 这样可以使得隐藏层神经元只有少数的激活，而大多数的抑制，从而提取输入数据的重要特征
tho_tensor = torch.FloatTensor([expect_tho for _ in range(hidden_size)]) # 创建一个张量，存储期望的平均激活值，大小为隐藏层维度
if torch.cuda.is_available(): # 判断是否有 GPU 可用
    tho_tensor = tho_tensor.cuda() # 将张量放到 GPU 上
_beta = 3 # 定义 KL 散度的权重，用于控制稀疏性的程度


# def kl_1(p, q):
#     p = torch.nn.functional.softmax(p, dim=-1)
#     _kl = torch.sum(p*(torch.log_softmax(p,dim=-1)) - torch.nn.functional.log_softmax(q, dim=-1),1)
#     return torch.mean(_kl)


for epoch in range(num_epochs): # 对所有数据进行 num_epochs 轮训练
    time_epoch_start = time.time() # 记录每轮训练的开始时间
    #enumerate 是一个内置函数，它可以将一个可迭代的对象转换为一个枚举对象，即在每个元素前面加上一个计数值，从 0 开始。这样可以方便地获取每个元素的索引和值。
    # MNIST 数据集 train_data 的数据维度应该是 (batch_size, 1, 28, 28)，其中 batch_size 是您设置的每次训练的数据量，1 是图像的通道数，28 是图像的高度和宽度
    for batch_index, (train_data, train_label) in enumerate(train_loader): # 对训练集的每个批次进行迭代，获取批次索引、数据和标签
        if torch.cuda.is_available(): # 判断是否有 GPU 可用
            train_data = train_data.cuda() # 将数据放到 GPU 上
            train_label = train_label.cuda() # 将标签放到 GPU 上
        input_data = train_data.view(train_data.size(0), -1) # 将 train_data 的每个图像数据转换为一个一维的向量，大小为 784 
        # train_data.size(0) 是一个整数，表示 train_data 的第一维的大小，即批次大小，即每次训练的数据量
        # view 是一个 torch 模块提供的函数，用于改变张量的形状，即维度和大小
        # input_data 的形状应该是 (batch_size, 784)，其中 batch_size 是 train_data 的第一维的大小，784 是 train_data 的其他三维的乘积，即 1×28×28
        encoder_out, decoder_out = autoEncoder(input_data) # 调用自编码器的前向传播方法，得到隐藏层表示和输出数据
        loss = Loss(decoder_out, input_data) # 计算损失函数，比较输出数据和输入数据的差异


        # 计算并增加 KL 散度到损失
        _kl = KL_devergence(tho_tensor, encoder_out) # 调用 KL_devergence 函数，计算期望的分布和实际的分布的 KL 散度
        loss += _beta * _kl # 将 KL 散度乘以权重后加到损失上，增加稀疏性的约束


        Optimizer.zero_grad() # 清空优化器的梯度
        loss.backward() # 调用损失的反向传播方法，计算梯度
        Optimizer.step() # 调用优化器的更新

最后几行输出：

Epoch: 50, Loss: 3.8174, Time: 6.95
Epoch: 50, Loss: 3.8174, Time: 6.97
Epoch: 50, Loss: 3.8171, Time: 6.98
Epoch: 50, Loss: 3.8215, Time: 6.99
Epoch: 50, Loss: 3.8229, Time: 7.00

4.4 收缩自动编码器（Contractive Autoencoder ）

示例代码（pytorch）

# 导入所需的库
import os
import argparse
import torch
import torch.utils.data
import torch.nn as nn
import torch.optim as optim
from torch.autograd import Variable
from torchvision import datasets, transforms
# import pdb
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec


# 设置CUDA设备的顺序和可见性
os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"   # see issue #152
os.environ["CUDA_VISIBLE_DEVICES"]="1"


# 打印导入成功的信息
print("Imported all libraries successfully!")


# 创建一个解析器对象，用于处理命令行参数
parser = argparse.ArgumentParser(description='PyTorch MNIST Example for CAE')
# 添加各种参数，包括批量大小，训练轮数，是否使用CUDA，随机种子，日志间隔等
parser.add_argument('--batch-size', type=int, default=128, metavar='N',
                    help='input batch size for training (default: 64)')
parser.add_argument('--epochs', type=int, default=19, metavar='N',
                    help='number of epochs to train (default: 2)')
parser.add_argument('--no-cuda', action='store_true', default=False,
                    help='enables CUDA training')
parser.add_argument('--seed', type=int, default=1, metavar='S',
                    help='random seed (default: 1)')
parser.add_argument('--log-interval', type=int, default=10, metavar='N',
                    help='how many batches to wait before logging training status')
# 解析参数并赋值给args对象
args = parser.parse_args()
# 判断是否使用CUDA
args.cuda = not args.no_cuda and torch.cuda.is_available()


# 设置随机种子
torch.manual_seed(args.seed)
# 如果使用CUDA，设置CUDA的随机种子
if args.cuda:
    torch.cuda.manual_seed(args.seed)


# 设置数据加载器的参数，如果使用CUDA，设置num_workers和pin_memory
kwargs = {'num_workers': 5, 'pin_memory': True} if args.cuda else {}


# 创建训练数据加载器，使用MNIST数据集，将图片转换为张量
train_loader = torch.utils.data.DataLoader(
  datasets.MNIST('data', train=True, download=True,
    transform=transforms.ToTensor()),
  batch_size=args.batch_size, shuffle=True, **kwargs)


# 创建测试数据加载器，使用MNIST数据集，将图片转换为张量
test_loader = torch.utils.data.DataLoader(
    datasets.MNIST('data', train=False, transform=transforms.ToTensor()),
    batch_size=args.batch_size, shuffle=True, **kwargs)


# 设置收缩损失的系数
lam = 1e-4


# 定义一个收缩自编码器（CAE）的类，继承自nn.Module
class CAE(nn.Module):
  def __init__(self):
    super(CAE, self).__init__()


    self.fc1 = nn.Linear(784, 400, bias = False) # 编码器
    self.fc2 = nn.Linear(400, 784, bias = False) # 解码器


    self.relu = nn.ReLU()
    self.sigmoid = nn.Sigmoid()




  def encoder(self, x):
    h1 = self.relu(self.fc1(x.view(-1, 784))) # 将输入图片展平为784维向量，然后通过全连接层和激活函数得到400维的隐层向量
    return h1


  def decoder(self,z):
    h2 = self.sigmoid(self.fc2(z)) # 将隐层向量通过全连接层和激活函数得到784维的重构向量
    return h2


  def forward(self, x):
            h1 = self.encoder(x) # 编码过程
            h2 = self.decoder(h1) # 解码过程
            return h1, h2 # 返回隐层向量和重构向量


        # 将重构的图片按网格排列并保存，用于检查质量和进度
  def samples_write(self, x, epoch):
    _, samples = self.forward(x) # 得到重构向量
    #pdb.set_trace()
    samples = samples.data.cpu().numpy()[:16] # 将重构向量转换为numpy数组，并取前16个
    fig = plt.figure(figsize=(4, 4)) # 创建一个4x4的画布
    gs = gridspec.GridSpec(4, 4) # 创建一个4x4的网格
    gs.update(wspace=0.05, hspace=0.05) # 设置网格间距
    for i, sample in enumerate(samples): # 遍历每个重构向量
      ax = plt.subplot(gs[i]) # 在对应的子图上绘制
      plt.axis('off') # 关闭坐标轴
      ax.set_xticklabels([]) # 设置x轴刻度为空
      ax.set_yticklabels([]) # 设置y轴刻度为空
      ax.set_aspect('equal') # 设置等比例缩放
      plt.imshow(sample.reshape(28, 28), cmap='Greys_r') # 将重构向量还原为28x28的图片，并以灰度显示
    if not os.path.exists('out/'): # 如果输出文件夹不存在，创建一个
      os.makedirs('out/')
    plt.savefig('out/{}.png'.format(str(epoch).zfill(3)), bbox_inches='tight') # 保存图片，文件名为训练轮数，用0补齐
    #self.c += 1
    plt.close(fig) # 关闭画布




# 定义均方误差损失函数，不取平均
mse_loss = nn.BCELoss(size_average = False)


# 定义总损失函数，包括均方误差和收缩损失
def loss_function(W, x, recons_x, h, lam):
    mse = mse_loss(recons_x, x) # 计算重构向量和输入向量的均方误差
    # Since: W is shape of N_hidden x N. So, we do not need to transpose it as
    # opposed to #1
    dh = h * (1 - h) # 计算隐层向量的导数，得到N_batch x N_hidden的矩阵
    # Sum through the input dimension to improve efficiency, as suggested in #1
    w_sum = torch.sum(Variable(W)**2, dim=1) # 计算全连接层的权重矩阵的平方和，得到N_hidden维的向量
    # unsqueeze to avoid issues with torch.mv
    w_sum = w_sum.unsqueeze(1) # 将向量扩展为N_hidden x 1的矩阵
    contractive_loss = torch.sum(torch.mm(dh**2, w_sum), 0) # 计算收缩损失，即隐层向量导数的平方与权重平方和的乘积的和
    return mse + contractive_loss.mul_(lam) # 返回总损失，即均方误差加上收缩损失乘以系数




# 创建一个CAE模型的实例
model = CAE()
# 创建一个优化器，使用Adam算法，学习率为0.0001
optimizer = optim.Adam(model.parameters(), lr = 0.0001)


# 如果使用CUDA，将模型转移到GPU上
if args.cuda:
    model.cuda()


# 定义一个训练函数，接受训练轮数作为参数
def train(epoch):
    model.train() # 将模型设置为训练模式
    train_loss = 0 # 初始化训练损失为0


    # 遍历训练数据加载器，得到每个批次的数据和标签（标签在这里不需要）
    for idx, (data, _) in enumerate(train_loader):
        data = Variable(data) # 将数据转换为变量
        if args.cuda:
            data = data.cuda() # 如果使用CUDA，将数据转移到GPU上


        optimizer.zero_grad() # 清空优化器的梯度缓存


        hidden_representation, recons_x = model(data) # 将数据输入模型，得到隐层向量和重构向量


        # 获取权重矩阵
        # model.state_dict().keys()
        # 根据手动查看的键名修改
        # (将来我会尝试自动化这个过程)
        W = model.state_dict()['fc1.weight'] # 获取编码器的权重矩阵
        loss = loss_function(W, data.view(-1, 784), recons_x,
                             hidden_representation, lam) # 计算总损失函数


        loss.backward() # 反向传播，计算梯度
        train_loss += loss.data[0] # 累加训练损失
        optimizer.step() # 更新参数


        # 如果达到日志间隔，打印训练信息
        if idx % args.log_interval == 0:
            print('Train epoch: {} [{}/{}({:.0f}%)]\t Loss: {:.6f}'.format(
                  epoch, idx*len(data), len(train_loader.dataset),
                  100*idx/len(train_loader),
                  loss.data[0]/len(data)))




    # 打印每轮训练的平均损失
    print('====> Epoch: {} Average loss: {:.4f}'.format(
         epoch, train_loss / len(train_loader.dataset)))
    # 调用模型的方法，将重构的图片保存
    model.samples_write(data,epoch)


# 遍历训练轮数，调用训练函数
for epoch in range(args.epochs):
    train(epoch)

out目录输出：

4.5 卷积自动编码器（Convolutional Autoencoder）

卷积自编码器（Convolutional Autoencoder）是一种利用卷积神经网络（Convolutional Neural Network, CNN）来实现自编码器功能的深度学习模型，它可以对输入的图像数据进行有效的编码和解码，从而实现图像的降维、去噪、重构等任务。卷积自编码器的结构由两部分组成：卷积编码器（Convolutional Encoder）和卷积解码器（Convolutional Decoder）。卷积编码器使用多个卷积层和池化层（Pooling Layer）来逐渐减小图像的尺寸，提取图像的高级特征，并输出一个压缩的隐层表示。卷积解码器使用多个卷积层和上采样层（Upsampling Layer）来逐渐增大图像的尺寸，恢复图像的细节，并输出一个重构的图像。

示例代码(keras)：

# 导入所需的模块和库
from keras.layers import Input, Dense, Conv2D, MaxPooling2D, UpSampling2D # 导入 Keras 中的层模块
from keras.models import Model # 导入 Keras 中的模型模块
from keras.callbacks import TensorBoard # 导入 Keras 中的回调模块，用于可视化训练过程
from keras.datasets import mnist # 导入 Keras 中的数据集模块，用于加载 MNIST 数据集
from keras import backend as K # 导入 Keras 中的后端模块，用于处理张量运算
import numpy as np # 导入 NumPy 库，用于处理数组运算
import matplotlib.pyplot as plt # 导入 Matplotlib 库，用于绘制图像


# 定义输入图像的形状，即 (28, 28, 1)，表示高度为 28，宽度为 28，通道数为 1 的灰度图像
input_img = Input(shape=(28, 28, 1))


# 定义编码器部分，即将输入图像压缩为一个低维的向量
x = Conv2D(16, (3, 3), activation='relu', padding='same')(input_img)    # 使用 16 个 3×3 的卷积核对输入图像进行卷积操作，激活函数为 ReLU，填充方式为 same，保持输出图像的大小不变，即 (28, 28, 16)
x = MaxPooling2D((2, 2), padding='same')(x)                             # 使用 2×2 的池化核对卷积后的图像进行最大池化操作，填充方式为 same，将输出图像的大小减半，即 (14, 14, 16)
x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)             # 使用 8 个 3×3 的卷积核对池化后的图像进行卷积操作，激活函数为 ReLU，填充方式为 same，保持输出图像的大小不变，即 (14, 14, 8)
x = MaxPooling2D((2, 2), padding='same')(x)                             # 使用 2×2 的池化核对卷积后的图像进行最大池化操作，填充方式为 same，将输出图像的大小减半，即 (7, 7, 8)
x = Conv2D(8, (3, 3), activation='relu', padding='same')(x)             # 使用 8 个 3×3 的卷积核对池化后的图像进行卷积操作，激活函数为 ReLU，填充方式为 same，保持输出图像的大小不变，即 (7, 7, 8)
encoded = MaxPooling2D((2, 2), padding='same')(x)                       # 使用 2×2 的池化核对卷积后的图像进行最大池化操作，填充方式为 same，将输出图像的大小减半，即 (4, 4, 8)，这就是编码后的向量，共有 128 个元素


# 在这一点上，表示是 (4, 4, 8)，即 128 维


# 定义解码器部分，即将编码后的向量还原为原始的输入图像
x = Conv2D(8, (3, 3), activation='relu', padding='same')(encoded)       # 使用 8 个 3×3 的卷积核对编码后的向量进行卷积操作，激活函数为 ReLU，填充方式为 same，保持输出图像的大小不变，即 (4, 4, 8)
x = UpSampling2D((2, 2))(x)                                             # 使用 2×2 的上采样核对卷积后的图像进行上采样操作，将输出图像的大小增加一倍，即 (8, 8, 8)
x = Conv2D(16, (3, 3), activation='relu', padding='same')(x)            # 使用 16 个 3×3 的卷积核对上采样后的图像进行卷积操作，激活函数为 ReLU，填充方式为 same，保持输出图像的大小不变，即 (8, 8, 8)
x = UpSampling2D((2, 2))(x)                                             # 使用 2×2 的上采样核对卷积后的图像进行上采样操作，将输出图像的大小增加一倍，即 (16, 16, 8)
x = Conv2D(16, (3, 3), activation='relu')(x)                            # 使用 16 个 3×3 的卷积核对上采样后的图像进行卷积操作，激活函数为 ReLU，填充方式为 valid，将输出图像的大小减少 2，即 (14, 14, 8)
x = UpSampling2D((2, 2))(x)                                             # 使用 2×2 的上采样核对卷积后的图像进行上采样操作，将输出图像的大小增加一倍，即 (28, 28, 8)
decoded = Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x)    # 使用 1 个 3×3 的卷积核对上采样后的图像进行卷积操作，激活函数为 sigmoid，填充方式为 same，保持输出图像的大小不变，即 (28, 28, 1)，这就是解码后的图像，与输入图像的形状相同


# 定义自编码器模型，即将输入图像和解码后的图像连接起来
autoencoder = Model(input_img, decoded)


# 编译自编码器模型，使用 adadelta 优化器和loss='binary_crossentropy' 二元交叉熵损失函数
autoencoder.compile(optimizer='adadelta', loss='binary_crossentropy')


# 定义编码器模型，即将输入图像和编码后的向量连接起来
encoder = Model(input_img, encoded)


# 从 MNIST 数据集中加载训练数据和测试数据，只需要图像数据，不需要标签数据
(x_train, _), (x_test, _) = mnist.load_data()
# 将图像数据转换为浮点类型，并归一化到 [0, 1] 区间
x_train = x_train.astype('float32') / 255.
x_test = x_test.astype('float32') / 255.
# 将图像数据调整为 (28, 28, 1) 的形状，以适应输入图像的形状
x_train = np.reshape(x_train, (len(x_train), 28, 28, 1))
x_test = np.reshape(x_test, (len(x_test), 28, 28, 1))


# 训练自编码器模型，使用训练数据作为输入和输出，设置迭代次数为 50，批次大小为 128，打乱数据顺序，使用测试数据作为验证数据，使用 TensorBoard 回调函数来可视化训练过程，将日志文件保存在 conv_autoencoder 目录下
autoencoder.fit(x_train, x_train,
                epochs=50,
                batch_size=128,
                shuffle=True,
                validation_data=(x_test, x_test),
                callbacks=[TensorBoard(log_dir='./conv_autoencoder')])


# 使用编码器模型对测试数据进行编码，得到编码后的向量
encoded_imgs = encoder.predict(x_test)
# 使用自编码器模型对测试数据进行解码，得到解码后的图像
decoded_imgs = autoencoder.predict(x_test)


# 设置要显示的图像的个数，这里为 10 个
n = 10
# 创建一个新的图形窗口，设置大小为 (20, 4)
plt.figure(figsize=(20, 4))
# 循环遍历每个图像
for i in range(n):
    # 显示原始图像
    # 创建一个子图，位置为第 i + 1 个，共有 2 行 n 列
    ax = plt.subplot(2, n, i + 1)
    # 将测试数据中的第 i 个图像从 (28, 28, 1) 的形状还原为 (28, 28) 的形状，并显示出来
    plt.imshow(x_test[i].reshape(28, 28))
    # 设置为灰度模式
    plt.gray()
    # 隐藏 x 轴和 y 轴的刻度
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)


    # 显示重建图像
    # 创建一个子图，位置为第 i + 1 + n 个，共有 2 行 n 列
    ax = plt.subplot(2, n, i + 1 + n)
    # 将解码数据中的第 i 个图像从 (28, 28, 1) 的形状还原为 (28, 28) 的形状，并显示出来
    plt.imshow(decoded_imgs[i].reshape(28, 28))
    # 设置为灰度模式
    plt.gray()
    # 隐藏 x 轴和 y 轴的刻度
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
# 显示图形窗口
plt.show()


# 创建一个新的图形窗口，设置大小为 (20, 8)
plt.figure(figsize=(20, 8))
# 循环遍历每个图像
for i in range(n):
    # 显示编码向量
    # 创建一个子图，位置为第 i + 1 个，共有 1 行 n 列
    ax = plt.subplot(1, n, i + 1)
    # 将编码数据中的第 i 个向量从 (4, 4, 8) 的形状还原为 (4, 32) 的形状，并转置为 (32, 4) 的形状，然后显示出来
    plt.imshow(encoded_imgs[i].reshape(4, 4 * 8).T)
    # 设置为灰度模式
    plt.gray()
    # 隐藏 x 轴和 y 轴的刻度
    ax.get_xaxis().set_visible(False)
    ax.get_yaxis().set_visible(False)
# 显示图形窗口
plt.show()

输出结果：

4.5 多层编码器-层叠自动编码器（Stacked_AutoEncoder-SAE）

示例代码-SAE 层叠自动编码器（pytorch）

models.py

# 导入所需的库，包括torch，torchvision，time和os
import torch
from torch import nn, optim, functional, utils
import torchvision
from torchvision import datasets, utils


import time, os




# 定义一个自编码器层的类，继承自nn.Module
class AutoEncoderLayer(nn.Module):
    """
    fully-connected linear layers for stacked autoencoders.
    This module can automatically be trained when training each layer is enabled
    Yes, this is much like the simplest auto-encoder
    """


    # 定义初始化方法，接受输入维度，输出维度和是否进行逐层预训练的参数
    def __init__(self, input_dim=None, output_dim=None, SelfTraining=False):
        super(AutoEncoderLayer, self).__init__() # 调用父类的初始化方法
        # if input_dim is None or output_dim is None:
        #     raise ValueError
        self.in_features = input_dim # 保存输入维度
        self.out_features = output_dim # 保存输出维度
        self.is_training_self = SelfTraining  # 指示是否进行逐层预训练,还是训练整个网络
        # 定义编码器，使用全连接层和Sigmoid激活函数
        self.encoder = nn.Sequential(
            nn.Linear(self.in_features, self.out_features, bias=True),
            nn.Sigmoid()  # 统一使用Sigmoid激活
        )
        # 定义解码器，使用全连接层和Sigmoid激活函数
        self.decoder = nn.Sequential(  # 此处decoder不使用encoder的转置, 并使用Sigmoid进行激活.
            nn.Linear(self.out_features, self.in_features, bias=True),
            nn.Sigmoid()
        )


    # 定义前向传播方法，接受输入x
    def forward(self, x):
        out = self.encoder(x) # 将x通过编码器得到隐层向量
        if self.is_training_self: # 如果是逐层预训练，返回解码器的输出
            return self.decoder(out)
        else: # 否则，返回隐层向量
            return out


    # 定义一个方法，锁定该层的梯度，即不更新参数
    def lock_grad(self):
        for param in self.parameters():
            param.requires_grad = False


    # 定义一个方法，解锁该层的梯度，即更新参数
    def acquire_grad(self):
        for param in self.parameters():
            param.requires_grad = True


    # 定义一个属性，返回输入维度
    @property
    def input_dim(self):
        return self.in_features


    # 定义一个属性，返回输出维度
    @property
    def output_dim(self):
        return self.out_features


    # 定义一个属性，返回是否进行逐层预训练的标志
    @property
    def is_training_layer(self):
        return self.is_training_self


    # 定义一个属性的设置方法，接受一个布尔值，设置是否进行逐层预训练的标志
    @is_training_layer.setter
    def is_training_layer(self, other: bool):
        self.is_training_self = other




# 定义一个栈式自编码器的类，继承自nn.Module
class StackedAutoEncoder(nn.Module):
    """
    Construct the whole network with layers_list
    > 栈式自编码器的架构一般是关于中间隐层对称的
    """


    # 定义初始化方法，接受一个自编码器层的列表作为参数
    def __init__(self, layers_list=None):
        super(StackedAutoEncoder, self).__init__() # 调用父类的初始化方法
        self.layers_list = layers_list # 保存自编码器层的列表
        self.initialize() # 调用初始化方法，将所有层的逐层预训练标志设为False
        # 将列表中的四个自编码器层分别命名为encoder_1, encoder_2, encoder_3, encoder_4
        self.encoder_1 = self.layers_list[0]
        self.encoder_2 = self.layers_list[1]
        self.encoder_3 = self.layers_list[2]
        self.encoder_4 = self.layers_list[3]


    # 定义一个初始化方法，将所有层的逐层预训练标志设为False
    def initialize(self):
        for layer in self.layers_list:
            # assert isinstance(layer, AutoEncoderLayer)
            layer.is_training_layer = False
            # for param in layer.parameters():
            #     param.requires_grad = True


    # 定义前向传播方法，接受输入x
    def forward(self, x):
        out = x # 将x赋值给out
        # 遍历自编码器层的列表，将out依次通过每一层
        # for layer in self.layers_list:
        #     out = layer(out)
        # 也可以直接使用命名的四个自编码器层
        out = self.encoder_1(out)
        out = self.encoder_2(out)
        out = self.encoder_3(out)
        out = self.encoder_4(out)
        return out # 返回最终的输出

run.py

# 导入系统库
import sys
# 将上一级目录添加到系统路径中，以便导入其他模块
sys.path.append('../')


# 从common.datas模块中导入get_mnist_loader函数，用于获取MNIST数据集的加载器
#from common.datas import get_mnist_loader
# 从models模块中导入AutoEncoderLayer和StackedAutoEncoder类，分别用于定义自编码器层和栈式自编码器模型
from models import AutoEncoderLayer, StackedAutoEncoder
# 导入torch库，用于构建和训练神经网络
import torch
# 从torch.nn模块中导入BCELoss类，用于计算二元交叉熵损失函数
from torch.nn import BCELoss
# 从torch模块中导入optim子模块，用于优化神经网络的参数
from torch import optim
# 导入torchvision库，用于处理图像数据
import torchvision
# 从torchvision.datasets模块中导入MNIST类，用于获取MNIST数据集
from torchvision.datasets import MNIST




# 定义一些超参数，包括逐层预训练的轮数，整体训练的轮数，批量大小，是否打乱数据等
num_tranin_layer_epochs = 20
num_tranin_whole_epochs = 50
batch_size = 100
shuffle = True




# 定义一个函数，用于获取MNIST数据集的加载器，接受批量大小和是否打乱数据的参数
def get_mnist_loader(batch_size=100, shuffle=True):
    """


    :return: train_loader, test_loader
    """
    # 创建一个训练数据集的对象，指定数据集的根目录，是否为训练集，是否进行图像转换（转换为张量），是否下载数据集
    train_dataset = MNIST(root='../data',
                          train=True,
                          transform=torchvision.transforms.ToTensor(),
                          download=True)
    # 创建一个测试数据集的对象，指定数据集的根目录，是否为训练集，是否进行图像转换（转换为张量），是否下载数据集
    test_dataset = MNIST(root='../data',
                         train=False,
                         transform=torchvision.transforms.ToTensor(),
                         download=True)


    # 创建一个训练数据加载器的对象，指定数据集，批量大小，是否打乱数据
    train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
                                               batch_size=batch_size,
                                               shuffle=shuffle)
    # 创建一个测试数据加载器的对象，指定数据集，批量大小，是否打乱数据
    test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
                                              batch_size=batch_size,
                                              shuffle=shuffle)
    # 返回训练数据加载器和测试数据加载器
    return train_loader, test_loader


# 定义一个函数，用于训练自编码器层，接受自编码器层的列表，要训练的层的索引，训练轮数，是否验证等参数
def train_layers(layers_list=None, layer=None, epoch=None, validate=True):
    # 如果GPU可用，将所有层转移到GPU上
    if torch.cuda.is_available():
        for model in layers_list:
            model.cuda()
    # 调用get_mnist_loader函数，获取训练数据和测试数据的加载器
    train_loader, test_loader = get_mnist_loader(batch_size=batch_size, shuffle=True)
    # 创建一个优化器，使用SGD算法，学习率为0.001，优化要训练的层的参数
    optimizer = optim.SGD(layers_list[layer].parameters(), lr=0.001)
    # 创建一个损失函数，使用二元交叉熵损失函数
    criterion = BCELoss()


    # 训练
    # 遍历训练轮数
    for epoch_index in range(epoch):
        # 初始化总损失为0
        sum_loss = 0.


        # 如果要训练的层不是第0层，将前面的层的梯度锁定，并将逐层预训练的标志设为False
        if layer != 0:
            for index in range(layer):
                layers_list[index].lock_grad()
                layers_list[index].is_training_layer = False 


        # 遍历训练数据加载器，得到每个批次的数据和标签（标签在这里不需要）
        for batch_index, (train_data, _) in enumerate(train_loader):
            # 如果GPU可用，将数据转移到GPU上
            if torch.cuda.is_available():
                train_data = train_data.cuda()
            # 将数据展平为一维向量
            out = train_data.view(train_data.size(0), -1)


            # 如果要训练的层不是第0层，将数据依次通过前面的层，得到该层的输入
            if layer != 0:
                for l in range(layer):
                    out = layers_list[l](out)


            # 训练第layer层，将输入通过该层，得到输出
            pred =  layers_list[layer](out)


            # 清空优化器的梯度缓存
            optimizer.zero_grad()
            # 计算输出和输入的二元交叉熵损失
            loss = criterion(pred, out)
            # 累加总损失
            sum_loss += loss
            # 反向传播，计算梯度
            loss.backward()
            # 更新参数
            optimizer.step()
            # 如果达到日志间隔，打印训练信息
            if (batch_index + 1) % 10 == 0:
                print("Train Layer: {}, Epoch: {}/{}, Iter: {}/{}, Loss: {:.4f}".format(
                    layer, (epoch_index + 1), epoch, (batch_index + 1), len(train_loader), loss
                ))


        # 如果需要验证，执行验证过程
        if validate:
            pass




# 定义一个函数，用于训练整个栈式自编码器模型，接受模型，训练轮数，是否验证等参数
def train_whole(model=None, epoch=50, validate=True):
    # 打印开始训练的信息
    print(">> start training whole model")
    # 如果GPU可用，将模型转移到GPU上
    if torch.cuda.is_available():
        model.cuda()


    # 将模型的所有参数的梯度解锁，即更新参数
    for param in model.parameters():
        param.require_grad = True


    # 调用get_mnist_loader函数，获取训练数据和测试数据的加载器
    train_loader, test_loader = get_mnist_loader(batch_size=batch_size, shuffle=shuffle)
    # 创建一个优化器，使用SGD算法，学习率为0.001，优化模型的所有参数
    optimizer = optim.SGD(model.parameters(), lr=0.001)
    # 创建一个损失函数，使用均方误差损失函数
    # criterion = BCELoss()
    criterion = torch.nn.MSELoss()


    # 从测试数据加载器中获取一批测试数据，并保存为图片
    test_data, _ = next(iter(test_loader))
    torchvision.utils.save_image(test_data, './test_images/real_test_images.png')


    # 训练
    # 遍历训练轮数
    for epoch_index in range(epoch):
        # 初始化总损失为0
        sum_loss = 0.
        # 遍历训练数据加载器，得到每个批次的数据和标签（标签在这里不需要）
        for batch_index, (train_data, _) in enumerate(train_loader):
            # 如果GPU可用，将数据转移到GPU上
            if torch.cuda.is_available():
                train_data = train_data.cuda()
            # 将数据展平为一维向量
            x = train_data.view(train_data.size(0), -1)


            # 将数据输入模型，得到输出
            out = model(x)


            # 清空优化器的梯度缓存
            optimizer.zero_grad()
            # 计算输出和输入的均方误差损失
            loss = criterion(out, x)
            # 累加总损失
            sum_loss += loss
            # 反向传播，计算梯度
            loss.backward()
            # 更新参数
            optimizer.step()


            # 如果达到日志间隔，打印训练信息
            if (batch_index + 1) % 10 == 0:
                print("Train Whole, Epoch: {}/{}, Iter: {}/{}, Loss: {:.4f}".format(
                    (epoch_index + 1), epoch, (batch_index + 1), len(train_loader), loss
                ))
            # 如果是最后一个批次，将输出重构为图片，并保存
            if batch_index == len(train_loader) - 1:
                torchvision.utils.save_image(out.view(100, 1, 28, 28), "./test_images/out_{}_{}.png".format(epoch_index, batch_index))


        # 每个轮数验证一次
        if validate:
            # 如果GPU可用，将测试数据转移到GPU上
            if torch.cuda.is_available():
                test_data = test_data.cuda()
            # 将测试数据展平为一维向量
            x = test_data.view(test_data.size(0), -1)
            # 将测试数据输入模型，得到输出
            out = model(x)
            # 计算输出和输入的均方误差损失
            loss = criterion(out, x)
            # 打印验证信息
            print("Test Epoch: {}/{}, Iter: {}/{}, test Loss: {}".format(
                epoch_index + 1, epoch, (epoch_index + 1), len(test_loader), loss
            ))




# 判断是否为主模块，如果是，则执行以下代码
if __name__ == '__main__':
    # 导入os库，用于操作系统相关的功能
    import os
    # 如果不存在test_images文件夹，就创建一个
    if not os.path.exists('test_images'):
        os.mkdir('test_images')
    # 如果不存在models文件夹，就创建一个
    if not os.path.exists('models'):
        os.mkdir('models')


    # 定义自编码器层数为5
    nun_layers = 5
    # 创建四个自编码器层的对象，分别为encoder_1, encoder_2, decoder_3, decoder_4，设置输入维度，输出维度和逐层预训练的标志
    encoder_1 = AutoEncoderLayer(784, 256, SelfTraining=True)
    encoder_2 = AutoEncoderLayer(256, 64, SelfTraining=True)
    decoder_3 = AutoEncoderLayer(64, 256, SelfTraining=True)
    decoder_4 = AutoEncoderLayer(256, 784, SelfTraining=True)
    # 将四个自编码器层的对象放入一个列表中，命名为layers_list
    layers_list = [encoder_1, encoder_2, decoder_3, decoder_4]


    # 按照顺序对每一层进行预训练
    # 遍历层数，从0到3
    for level in range(nun_layers - 1):
        # 调用train_layers函数，传入自编码器层的列表，要训练的层的索引，训练轮数，是否验证等参数，进行逐层预训练
        train_layers(layers_list=layers_list, layer=level, epoch=num_tranin_layer_epochs, validate=True)


    # 统一训练
    # 创建一个栈式自编码器的对象，传入自编码器层的列表，命名为SAE_model
    SAE_model = StackedAutoEncoder(layers_list=layers_list)
    # 调用train_whole函数，传入栈式自编码器的对象，训练轮数，是否验证等参数，进行整体训练
    train_whole(model=SAE_model, epoch=num_tranin_whole_epochs, validate=True)


    # 保存模型 refer: https://pytorch.org/docs/master/notes/serialization.html
    # 调用torch.save函数，传入栈式自编码器的对象和保存路径，将模型保存为sae_model.pt文件
    torch.save(SAE_model, './models/sae_model.pt')

输出结果：

test_images文件夹

real_test_images.png

你可能感兴趣的:(机器学习,深度学习,人工智能)

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
Ai插件脚本合集安装包，免费教程视频网盘分享全网优惠分享君
随着人工智能技术的不断发展，越来越多的插件脚本涌现出来，为我们的生活和工作带来了便利。然而，如何快速、方便地获取和使用这些插件脚本呢？今天，我将为大家分享一个非常实用的资源——AI插件脚本合集安装包，以及免费教程视频网盘分享。首先，让我们来了解一下这个AI插件脚本合集安装包。它是一个集合了众多AI插件脚本的资源包，涵盖了各种领域，如数据分析、自动化办公、智能客服等等。通过这个安装包，用户可以轻松地
过去一年，这16本好书不容错过 m0_54050778 perl
编者按：2023年在动荡与希望中收尾，2023年注定会被载入史册。疫情寒冬结束，ChatGPT横空出世，带动了人工智能技术的飞速发展；淄博烧烤、天津大爷、尔滨之旅等充满感动与幸福。但与此同时，2023年又是动荡与不安的一年，俄乌冲突的延宕，新一轮的巴以冲突，极端天气频发。在这个大环境下，有一些经典的书籍著作诞生。本文将分享2023年最值得一读的16本书籍，文章来自翻译，希望对你有所启示。关于202
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS liferecords LLM 语言模型人工智能自然语言处理
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接：arXiv关键字：大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型（LLMs）在各种自然语言任务上表现出色。然而，它们在HTML理解方面的能力——即解析网页的原始HTML，对于自动化基于Web的任务、爬取和浏览器辅助检索等应用——尚未被充分探索。我们为HTML理解模型（经过微调
深度学习项目-基于深度学习的股票价格预测研究雅致教育计算机毕业设计深度学习人工智能
概要随着经济的发展，中国股票市场的规模持续扩大，早已成为金融投资的重要部分，掌握股票市场的变化规律无论是对监管者还是投资者都具有极其重要的意义。正因如此，人们不断探索着股票市场的变化规律，其中使用深度学习预测股价是当前国内国际研究与应用的热点。本文首先从有效市场假说和分形市场假说两个角度讨论了中国股票市场的有效性，说明股票市场具有复杂的非线性特征。其次，结合股票市场特征对比了当前的预测方法
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
ChatGPT：AI合作伙伴助你成为论文写作高手 2401_83550420 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达摘要：本文将介绍ChatGPT3.5Turbo（以下简称ChatGPT），一款强大的AI合作伙伴，能够助你成为一名论文写作高手。我们将深入探讨ChatGPT的特点、优势，并提供多个示例，展示ChatGPT在论文写作中的应用。无论是开展研究、撰写论文、还是与ChatGPT进行互动交流，都能够帮助你提升写作效率和质量。引言：随着人工智能的发展，聊天型语言模型在各个领域都
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
零基础机器学习(5)之线性回归模型的性能评估一只特立独行猪机器学习机器学习线性回归人工智能
文章目录线性回归模型的性能评估1.举例1-单一特征2.举例2-多特征线性回归模型的性能评估评估线性回归模型时，首先要建立评估的测试数据集（测试集不能与训练集相同），然后选择合适的评估方法，实现对线性回归模型的评估。回归任务中最常用的评估方法有均方误差、均方根误差和预测准确率（确定系数）。1.举例1-单一特征分别对两个模型进行评估，输入的测试集如表所示。面积/（m2）售价/（万元）面积/（m2）售价
ChatGPT：智能论文写作指南，让您成为写作高手 AI臻蚌 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达写作是学术研究中不可或缺的一环，然而，对于许多人来说，写作往往是一项艰巨而费时的任务。但是，现在有了ChatGPT，您将能够以前所未有的速度和准确性编写高质量的论文。本文将向您介绍如何利用ChatGPT的强大功能成为写作高手，并为您提供一些示例，展示其在不同领域的应用。1.简介ChatGPT是一种基于人工智能的语言模型，它可以理解并生成人类语言。通过训练大量的语料库
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
数字逻辑不可能涌现出智能 dog250 人工智能
先看一系列竖式乘法的步骤：相乘的两个数数位越大，步骤越多。如果不纠结数制，二进制运算也是这回事，把单个步骤用一个晶体管表达(其实一个步骤不止一个晶体管)，数位越大，所需的晶体管越多。先说结论，所有基于n进制的逻辑运算都不可扩展。硅基时序电路可如此巧妙完成精确计算，开启了数字化时代，人们试图将AI构建在这二进制世界。但若二进制运算不可扩展，基于数字逻辑的人工智能就不可能。前面提到过，二进制运算本质上
深度学习如何入门？科学的N次方深度学习
入门深度学习需要系统性的学习和实践经验积累，以下是一份详细的入门指南，包含了关键的学习步骤和资源：预备知识：•编程基础：熟悉Python编程语言，它是深度学习领域最常用的编程语言。确保掌握变量、条件语句、循环、函数等基本概念，并学习如何使用Python处理数据和文件操作。•数学基础：理解线性代数（矩阵运算、向量空间等）、微积分（导数、梯度求解等）、概率论与统计学（期望、方差、概率分布、最大似然估计
深度学习与（复杂系统）事物的属性科学禅道深度学习模型专栏深度学习人工智能
深度学习与复杂系统中事物属性的关系体现在：特征学习与表示:深度学习通过多层神经网络结构，能够自动从原始输入数据中学习和提取出丰富的特征表示。每一层神经网络都可能对应着事物属性的不同抽象层次，底层可能对应简单直观的属性，而随着网络深度的增加，顶层可以学习到更抽象、复杂的属性及其相互关系。非线性关系建模:深度学习特别擅长处理非线性关系，而在复杂系统中，事物属性间的相互作用往往表现为非线性，例如，某些属
让数据说话：人工智能与六西格玛的完美结合张驰课堂人工智能六西格玛
当人工智能与六西格玛结合，企业可以充分利用人工智能技术的数据处理、预测分析和智能决策支持能力，实现数据驱动的决策、质量控制和流程优化，从而提高企业的效率和竞争力。下面张驰咨询给大家具体的介绍：1、数据驱动决策六西格玛侧重于数据分析和决策制定，而人工智能可以提供更强大的数据处理和分析能力。通过人工智能技术，可以自动收集和整理大量的数据，并进行有效的数据挖掘和模式识别。这些数据分析结果可以为六西格玛项
智合同如何助力建筑行业合同智能化管理智合同（小智）合同智能应用 AI技术降本增效提质人工智能自然语言处理知识图谱深度学习大数据
#建筑行业#人工智能#AI#合同智能应用#深度学习#自然语言处理技术#知识图谱智合同-采用深度学习、自然语言处理技术、知识图谱等人工智能技术，为企业提供专业的合同相关的智能服务。其主要服务包含：合同智能审查、合同要素智能提取、合同版本对比、合同智能起草、ICR智能识别、合同履约追踪、文本一致性对比、广告审查、合同范本库等服务。智合同在助力建筑行业合同智能化管理方面具有显著的优势。首先，智合同利用A
神经网络（深度学习，计算机视觉，得分函数，损失函数，前向传播，反向传播，激活函数） MarkHD 深度学习神经网络计算机视觉
神经网络，特别是深度学习，在计算机视觉等领域有着广泛的应用。以下是关于你提到的几个关键概念的详细解释：神经网络：神经网络是一种模拟人脑神经元结构的计算模型，用于处理复杂的数据和模式识别任务。它由多个神经元（或称为节点）组成，这些神经元通过权重和偏置进行连接，并可以学习调整这些参数以优化性能。深度学习：深度学习是神经网络的一个子领域，主要关注于构建和训练深度神经网络（即具有多个隐藏层的神经网络）。通
AI原生安全亚信安全首个“人工智能安全实用手册”开放阅览亚信安全官方账号安全网络 web安全人工智能大数据
不断涌现的AI技术新应用和大模型技术革新，让我们感叹从没有像今天这样，离人工智能的未来如此之近。追逐AI原生？企业组织基于并利用大模型技术探索和开发AI应用的无限可能，迎接生产与业务模式的全面的革新。我们更应关心AI安全原生。实施人工智能是一项复杂又长远的任务，任何希望利用大模型的组织在设计之初，都必须将安全打入地基，安全一定是AI技术发展的核心要素。针对人工智能和大模型面临的威胁与攻击模式，亚信
开发chrome扩展（禁止指定域名使用插件）徐同保 chrome 前端
mainfest.json:{"manifest_version":3,"name":"ChatGPT学习","version":"0.0.2","description":"ChatGPT,GPT-4,Claude3,Midjourney,StableDiffusion,AI,人工智能,AI","icons":{"16":"./images/logo.png","48":"./images/lo
2022-05-14 败者食尘_40a0
本文结构速览：一、SQL题二、机器学习&概率论三、开放性问题01SQL题面试真题：现有一张用户签到表（user_sign_d）,标记用户每日是否签到，表结构如下sign_date:日期user_id:用户IDif_sign:当日是否签到,1表示签到，0表示未签到问题①：请计算截止到当前每个用户已经连续签到的天数（输出表仅包含当天签到的所有用户，计算其连续签到的天数）输出表结构如下：user_id:
Android 实现照片抠出人像。 No Promises﹉ android
谢谢阅览、关注！！一、各平台的实现方式：1.Android实现方式：使用图像处理库（如OpenCV）：集成OpenCV库，利用其图像处理功能进行边缘检测和图像分割；使用机器学习模型（如TensorFlowLite）：集成TensorFlowLite和预训练的人像分割模型；使用第三方API服务：利用如百度AI、腾讯AI等提供的在线API进行图像处理。步骤：集成必要的库或API、加载和处理图像、应用抠
ai智能语音机器人的出现未来电销行业会如何发展？ VO_794632978 WX-794632978 语音机器人人工智能机器人交互语音识别大数据
人工智能和移动互联网技术的发展，对于很多行业都产生了颠覆性的影响。而对于电销这一重复度较高的行业来说，也是产生了巨大的推动作用。对于传统电销人来说，电销机器人可以帮助你提高销售效率，提高影响客户的能力和转化率，将你过去繁琐简单无效的需要个人做的工作，都交给机器，让你的时间和精力，放在重要的客户和有创造性的事情上。我们一起来看看都有哪些发展。自动化程度提高：AI机器人能够不间断地工作，自动拨打电话、
MATLAB 2023a：强化学习算法的实战演练与性能评估 zmjia111 机器学习 matlab matlab 算法开发语言深度学习机器学习 yolo
在深度学习领域，MATLAB2023版深度学习工具箱以其完整的工具链和高效的运行环境，为研究人员和开发者提供了前所未有的便利。这一工具箱不仅集成了建模、训练和部署的全部功能，更以其简洁易用的语法和强大的算法库，为深度学习任务的快速实现铺平了道路。相较于Python等编程语言，MATLAB的语法更为直观，上手更为迅速。无需繁琐的环境配置和库安装，用户只需打开MATLAB界面，即可轻松开始深度学习之旅
Python机器学习笔记：CART算法实战战争热诚
完整代码及其数据，请移步小编的GitHub传送门：请点击我如果点击有误：https://github.com/LeBron-Jian/MachineLearningNote前言在python机器学习笔记：深入学习决策树算法原理一文中我们提到了决策树里的ID3算法，C4.5算法，并且大概的了
动手学习深度学习——2.5 自动微分 X_Imagine 动手学习深度学习深度学习人工智能自动微分
2.5自动微分正如【2.4微积分】所说，微分是深度学习中几乎所有最优化算法的关键步骤。虽然求这些导数的计算过程很简单，只需要一些基本的微积分知识。但对于复杂的模型，手工计算参数的更新可能很痛苦(而且经常容易出错)。深度学习框架通过自动计算导数加快了这一工作，即自动微分（AutomaticDifferentiation）。在实践中，基于我们设计的模型，系统构建了一个计算图，跟踪哪些数据结合哪些操
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息