程序_丸

【深度学习项目】用于图像压缩和去噪的深度 CNN 自动编码器（详细报告+代码详解）

【深度学习项目】用于图像压缩和去噪的深度 CNN 自动编码器（代码详解）

一、简介
二、用于图像压缩的CNN自动编码器
- 1. 导入库
- 2. 加载MNIST数据
- 3. 预处理图像数据
- 4. 探索性数据分析
- 5. 模型创建
- 6. 训练模型
- 7. 可视化结果
三、用于图像降噪的CNN自动编码器
- 1. 导入库
- 2. 加载数据集
- 3. 预处理图像数据
- 4. 为图像添加噪声
- 5. 探索性数据分析
- 6. 模型创建
- 7. 训练模型
- 8. 可视化结果
四、总结

一、简介

自动编码器：
自动编码器（Autoencoder）是一种无监督学习算法，用于数据的降维和特征提取。它由一个编码器和一个解码器组成，可以通过将输入数据压缩成低维表示，然后再将其解压缩回原始数据空间来重构输入数据。
自动编码器的目标是尽可能地减小重构误差，使得解码器能够生成与输入数据相似的输出。为了达到这个目标，编码器将输入数据映射到潜在空间（也称为编码空间）中的低维表示，而解码器则将该低维表示映射回原始数据空间。

自动编码器的训练过程通常使用无监督学习的方法，即仅使用输入数据作为训练样本，而没有对应的标签。训练过程中，编码器和解码器的参数通过最小化重构误差来进行优化。重构误差可以使用均方差（Mean Squared Error）或其他适当的损失函数来度量。
自动编码器可以应用于多种任务，包括数据降维、特征提取、数据去噪、异常检测等。在数据降维任务中，自动编码器可以将高维数据压缩到低维表示，以便可视化或更高效地处理数据。在特征提取任务中，自动编码器可以学习到输入数据的有用特征表示，从而提高后续任务的性能。在数据去噪任务中，自动编码器可以通过学习重构干净数据来过滤掉输入数据中的噪声。在异常检测任务中，自动编码器可以学习正常数据的表示，然后用于检测与正常模式不符的异常数据。

卷积神经网络（CNN）：
卷积神经网络（Convolutional Neural Network，CNN）是一种广泛应用于计算机视觉和图像处理任务的神经网络模型。与传统的全连接神经网络相比，CNN在处理具有网格结构的数据（如图像）时表现出色。
CNN的核心思想是通过卷积层、池化层和全连接层等组件来实现特征提取和分类。下面是CNN的主要组成部分：

卷积层（Convolutional Layer）：卷积层是CNN的核心。它使用一组可学习的滤波器（卷积核）对输入数据进行卷积操作，从而提取输入数据的局部特征。每个滤波器通过滑动窗口的方式在输入数据上进行卷积操作，生成一系列的特征映射（Feature Map）。
激活函数（Activation Function）：在卷积层之后，一般会应用一个非线性的激活函数，如ReLU（Rectified Linear Unit），来引入非线性特性。激活函数的作用是增加网络的表达能力，并且有助于提取非线性特征。
池化层（Pooling Layer）：池化层用于降低特征映射的空间尺寸，减少参数数量，并提取主要特征。常用的池化操作是最大池化（Max Pooling），它从每个局部区域中选择最大值作为池化结果。池化操作还可以提高网络的平移不变性，使得网络对输入的微小位置变化具有鲁棒性。
全连接层（Fully Connected Layer）：在经过多个卷积层和池化层之后，得到的特征映射被拉平成一维向量，并通过一个或多个全连接层进行分类或回归操作。全连接层的每个神经元与上一层的所有神经元相连，参数量较大。

在CNN中，通过堆叠多个卷积层、激活函数、池化层和全连接层，可以逐渐提取出输入数据的高层次特征表示，从而实现对图像内容的理解和识别。

CNN自动编码器：
CNN自动编码器是将卷积神经网络（CNN）与自动编码器（Autoencoder）结合的模型。它可以用于图像降噪、图像去噪、特征提取等任务。

CNN自动编码器的结构与传统的自动编码器类似，但在编码器和解码器中使用了卷积层和反卷积层（也称为转置卷积层）来处理图像数据的空间结构。以下是CNN自动编码器的一般结构：

编码器（Encoder）：编码器由一系列的卷积层、池化层和激活函数组成。卷积层用于提取输入图像的特征，通过逐渐减小空间维度和增加通道数，将输入图像压缩成低维的特征表示。通常在编码器的最后一层添加一个全连接层，将特征映射转换为更低维的表示。
解码器（Decoder）：解码器是编码器的逆过程，由一系列的反卷积层和激活函数组成。反卷积层（转置卷积层）用于将低维的特征表示映射回原始图像的空间维度和通道数。最后一层的激活函数通常使用sigmoid或tanh函数来保证解码器输出的像素值在合适的范围内。
损失函数（Loss Function）：常用的损失函数是均方差（Mean Squared Error），它衡量解码器输出与原始图像之间的重构误差。优化目标是最小化重构误差，使得解码器能够生成与输入图像相似的输出。

通过训练CNN自动编码器，可以学习到输入图像的有用特征表示，并通过解码器重构图像。编码器部分可以作为特征提取器使用，而解码器部分可以用于生成新的图像样本。
CNN自动编码器在图像处理任务中具有广泛的应用，例如图像降噪，它可以学习到图像的清晰结构并去除噪声；图像去噪，它可以学习到干净图像的表示，并通过解码器生成去噪后的图像；特征提取，它可以学习到图像的有用特征表示，可以用于后续的图像分类、目标检测等任务。

二、用于图像压缩的CNN自动编码器

图像压缩是通过减少图像数据的冗余性和信息损失来减小图像文件的大小的过程。CNN（卷积神经网络）自动编码器是一种有效的方法，可用于图像压缩和重建。
CNN自动编码器由编码器和解码器两部分组成。编码器将输入图像逐渐压缩到一个较低维度的表示，而解码器则将该低维度表示恢复到原始图像的尺寸。
⚙️自动编码器的流程：
*️⃣ 输入图像 -> 编码器 -> 压缩表示 -> 解码器 -> 重构输入图像

• 自动编码器需要一个输入数据样本，这里我们考虑的是一个图像，并将其输入到编码器网络中。
• 编码器网络由若干层组成，通常包括卷积层、池化层和全连接层。这些层逐步减少空间维度，从输入数据中提取有意义的特征。
• 编码器网络的最后一层产生输入数据的压缩表示。
• 编码阶段的压缩表示被传递到解码器网络中。
• 解码器网络与编码器网络是对称的，由全连接层、上采样层和有时转置的卷积层组成。它采用压缩的表示方法，并逐渐增加空间维度，以重建原始输入数据。
• 解码器网络的最后一层生成重构的输出，其目的是与原始输入数据密切相似。

▶️ 以下是用于图像压缩的CNN自动编码器的python代码在jupyter notebook中的实现：

1. 导入库

import numpy as np
import matplotlib.pyplot as plt
from keras import Sequential
from keras.layers import Dense, Conv2D, MaxPooling2D, UpSampling2D
from keras.datasets import mnist

代码详解：

import numpy as np: 导入了numpy库，并将其命名为np，这是一个常用的科学计算库，用于处理数组和矩阵等数值运算。
import matplotlib.pyplot as plt: 导入了matplotlib.pyplot模块，并将其命名为plt，它是matplotlib库中的一个子模块，用于绘制图形和可视化数据。
from keras import Sequential: 从keras库中导入了Sequential类，Sequential类是用于构建深度神经网络模型的基本模块。
from keras.layers import Dense, Conv2D, MaxPooling2D, UpSampling2D: 从keras.layers模块中导入了Dense、Conv2D、MaxPooling2D和UpSampling2D等类，这些类用于构建神经网络的各种层。
from keras.datasets import mnist: 从keras.datasets模块导入了mnist模块，mnist模块提供了加载手写数字数据集MNIST的功能。

这段代码导入了所需的库和模块，为后续的代码提供了必要的功能和工具。

2. 加载MNIST数据

(x_train, _), (x_test, _) = mnist.load_data()

代码详解：
这行代码加载了MNIST手写数字数据集，并将数据集分为训练集和测试集：
MNIST数据集是一个经典的机器学习数据集，包含了一系列的手写数字图像。这里使用的mnist.load_data()函数是keras库中的一个功能，用于从网络下载并加载MNIST数据集。
具体来说，这行代码执行的操作如下：

• 从MNIST数据集中加载训练数据集，赋值给x_train。
• 同时从MNIST数据集中加载测试数据集，赋值给x_test。

在这之后，你可以使用x_train和x_test来访问训练集和测试集的图像数据，进行后续的处理和分析。

3. 预处理图像数据

对图像数据进行归一化：

x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

代码详解：
这段代码对图像数据进行了归一化处理。在机器学习和深度学习中，对输入数据进行归一化是一种常见的预处理步骤。归一化可以将数据缩放到一个特定的范围内，通常是[0, 1]或[-1, 1]之间。这有助于提高模型的训练效果和收敛速度。
这段代码执行了以下操作：

x_train = x_train.astype('float32'): 将x_train的数据类型转换为float32，这是为了进行后续的除法运算。
x_test = x_test.astype('float32'): 将x_test的数据类型转换为float32，同样是为了进行后续的除法运算。
/ 255: 将每个像素的数值除以255，将像素值缩放到[0, 1]的范围内。由于MNIST图像的像素值范围是0到255，所以除以255可以实现这一目的。

通过执行这些操作，x_train和x_test中的图像数据被归一化到了[0, 1]的范围内，可以更好地用于神经网络的训练和评估。

重塑输入图像数据：

x_train = x_train.reshape(len(x_train), 28, 28, 1)
x_test = x_test.reshape(len(x_test), 28, 28, 1)
x_test.shape

运行结果：

代码详解：
这段代码对训练集和测试集的图像数据进行了形状重塑操作。在深度学习中，特别是在使用卷积神经网络（CNN）处理图像数据时，通常要求输入数据的形状符合特定的要求。对于MNIST数据集中的图像数据，CNN通常要求其形状为(样本数, 图像高度, 图像宽度, 通道数)。

x_train = x_train.reshape(len(x_train), 28, 28, 1): 将x_train的形状从(样本数, 图像高度, 图像宽度)重塑为(样本数, 28, 28, 1)，其中28是图像的高度和宽度，1表示图像的通道数，这里是灰度图像，所以通道数为1。
x_test = x_test.reshape(len(x_test), 28, 28, 1): 将x_test的形状从(样本数, 图像高度, 图像宽度)重塑为(样本数, 28, 28, 1)，同样的操作，将图像的高度、宽度和通道数设置为28、28和1。

最后，代码通过x_test.shape打印出了x_test的形状。由于前面对x_test进行了形状重塑，所以输出的形状为(样本数, 图像高度, 图像宽度, 通道数)，即(10000, 28, 28, 1)。表示测试集中共有10000个样本，每个样本的图像大小为28x28，通道数为1。

4. 探索性数据分析

查看输入图像的样子：

# 随机选择一个图像的索引
index = np.random.randint(len(x_test))
# 显示图像
plt.imshow(x_test[index].reshape(28,28))
plt.gray()

运行结果：

代码详解：
这段代码的作用是随机选择一张测试集中的图像，并使用灰度图像进行可视化。下面是对代码逐行的解释：

index = np.random.randint(len(x_test)): 使用np.random.randint()函数随机生成一个介于0和测试集长度之间的整数，将其赋值给index变量。这样就可以随机选择一个图像的索引。
plt.imshow(x_test[index].reshape(28,28)): 使用plt.imshow()函数显示被选择的图像。x_test[index]表示从测试集中选择的图像数据，.reshape(28, 28)将图像数据的形状重塑为28x28的二维数组，以适应imshow()函数的要求。
plt.gray(): 使用plt.gray()函数将显示的图像设置为灰度图像。

通过执行这段代码，你可以看到随机选择的图像以灰度形式显示在屏幕上。下面是随机查看的其他的图像：

5. 模型创建

使用Keras构建的自动编码器（autoencoder）模型：

model = Sequential([
                    # 编码器网络
                    Conv2D(32, 3, activation='relu', padding='same', input_shape=(28, 28, 1)),
                    MaxPooling2D(2, padding='same'),
                    Conv2D(16, 3, activation='relu', padding='same'),
                    MaxPooling2D(2, padding='same'),
                    # 解码器网络
                    Conv2D(16, 3, activation='relu', padding='same'),
                    UpSampling2D(2),
                    Conv2D(32, 3, activation='relu', padding='same'),
                    UpSampling2D(2),
                    # 输出层
                    Conv2D(1, 3, activation='sigmoid', padding='same')
])

model.compile(optimizer='adam', loss='binary_crossentropy')
model.summary()

运行结果：

代码详解：
这段代码定义了一个使用Keras构建的自动编码器（autoencoder）模型，并对模型进行了编译和概要（summary）打印。

model = Sequential([...]): 创建一个Sequential模型对象，并用方括号内的列表来定义模型的层结构。在这个自动编码器模型中，包含了编码器网络和解码器网络，它们通过共享权重来实现数据的压缩和重构。编码器网络和解码器网络之间的中间部分就是数据的潜在表示（latent representation）。
Conv2D(32, 3, activation='relu', padding='same', input_shape=(28, 28, 1)): 添加一个卷积层作为编码器网络的第一层。这个卷积层有32个过滤器，每个过滤器的大小为3x3，使用ReLU激活函数，并采用"same"填充方式。input_shape=(28, 28, 1)指定了输入数据的形状为28x28的灰度图像。
MaxPooling2D(2, padding='same'): 添加一个最大池化层，大小为2x2，采用"same"填充方式。最大池化层用于降低特征图的尺寸，并提取主要特征。
Conv2D(16, 3, activation='relu', padding='same'): 添加另一个卷积层作为编码器网络的第二层，具有16个过滤器，大小为3x3，使用ReLU激活函数，并采用"same"填充方式。
MaxPooling2D(2, padding='same'): 添加第二个最大池化层，大小为2x2，采用"same"填充方式。
Conv2D(16, 3, activation='relu', padding='same'): 添加一个卷积层作为解码器网络的第一层，具有16个过滤器，大小为3x3，使用ReLU激活函数，并采用"same"填充方式。
UpSampling2D(2): 添加一个上采样层，将特征图的尺寸扩大两倍。
Conv2D(32, 3, activation='relu', padding='same'): 添加另一个卷积层作为解码器网络的第二层，具有32个过滤器，大小为3x3，使用ReLU激活函数，并采用"same"填充方式。
UpSampling2D(2): 添加第二个上采样层，将特征图的尺寸再次扩大两倍。
Conv2D(1, 3, activation='sigmoid', padding='same'): 添加输出层，这是解码器网络的最后一层。它具有1个过滤器，大小为3x3，使用Sigmoid激活函数，并采用"same"填充方式。输出层的目标是重构输入图像。
model.compile(optimizer='adam', loss='binary_crossentropy'): 编译模型，指定优化器为Adam，损失函数为二元交叉熵（binary_crossentropy）。自动编码器的目标是通过最小化重构误差来学习数据的有效表示。
model.summary(): 打印模型的概要信息，包括每一层的名称、输出形状和参数数量等。概要信息提供了对模型结构的整体概览。

综上这段代码定义了一个基本的自动编码器模型，并将其编译为可训练的模型。通过打印模型概要，你可以查看模型的层结构和参数数量等重要信息。

6. 训练模型

model.fit(x_train, x_train, epochs=20, batch_size=256, validation_data=(x_test, x_test))

运行结果：

代码详解：
这段代码用于训练自动编码器模型。

model.fit(x_train, x_train, epochs=20, batch_size=256, validation_data=(x_test, x_test)): 使用fit()函数进行模型的训练。参数解释如下：
x_train: 训练集的输入数据，这里是图像数据。
x_train: 训练集的目标数据，这里与输入数据相同，即重构输入图像。
epochs=20: 迭代次数，指定模型训练的轮数，每轮遍历整个训练集。
batch_size=256: 批处理大小，指定每个批次中的样本数量。在每个批次中，模型会根据输入数据进行前向传播和反向传播，并更新权重。
validation_data=(x_test, x_test): 验证数据，用于在每个训练轮次结束时评估模型的性能。这里使用测试集作为验证数据，同时将测试集作为目标数据进行重构误差的计算。

运行结果显示了每个训练轮次所耗费的时间以及每个训练轮次模型的训练误差（loss）和验证误差（val_loss），这两个重要的指标是用于评估模型的性能和训练的进展情况。下面是对这两个指标的介绍：

loss: 训练误差，表示模型在每个训练批次中的平均损失值。它是模型在训练数据上的表现，用于衡量模型对训练数据的拟合程度。训练误差的目标是尽量减小，使模型能够更好地拟合训练数据。
val_loss: 验证误差，表示模型在每个训练轮次结束时，在验证数据上的平均损失值。它是模型在未参与训练的数据上的表现，用于衡量模型的泛化能力。验证误差的目标是尽量减小，使模型能够在未见过的数据上有良好的表现。

通常情况下，正如运行结果所示，随着训练的进行，训练误差和验证误差都会逐渐减小，这意味着模型在训练数据和验证数据上的性能都在改善。然而，如果出现训练误差持续下降而验证误差开始增大的情况，这可能表明模型出现了过拟合现象，即在训练数据上过度拟合而无法很好地泛化到新数据。
通过执行这段代码，模型将使用训练集进行训练，并在每个训练轮次结束时使用测试集进行性能评估。模型会根据给定的损失函数（二元交叉熵）来计算重构误差，并通过优化器（Adam）来更新模型的权重。训练过程将重复进行指定的轮数（20轮），直到模型收敛或达到指定的训练轮次。通过观察训练误差和验证误差的变化趋势，可以帮助判断模型的训练状态和性能。如运行结果所示，如果训练误差和验证误差都能够持续减小且收敛到一个较小的值，那么模型的训练是成功的，并且在训练数据和验证数据上都有良好的性能。

7. 可视化结果

进行预测：

pred = model.predict(x_test)

运行结果：

代码详解：
这行代码用于使用训练好的自动编码器模型对测试集进行预测。

pred = model.predict(x_test): 使用predict()函数对测试集进行预测。将测试集x_test作为输入，模型将对每个输入图像进行预测，并生成相应的输出图像。预测结果将存储在pred变量中。

通过执行这行代码，模型将使用测试集作为输入，通过自动编码器进行图像重构，并生成预测结果。预测结果pred将包含与输入图像对应的重构图像。可以使用这些重构图像来评估模型在测试集上的性能，或进行其他进一步的分析和可视化。

随机选择原始图像并显示结果：

# 随机选择原始的图像
index = np.random.randint(len(x_test))
# 显示原始图像
plt.imshow(x_test[index].reshape(28,28))
plt.gray()

运行结果：

代码详解：
这段代码用于从测试集中随机选择一张图像，并对其进行可视化。

index = np.random.randint(len(x_test)): 使用np.random.randint()函数生成一个随机整数，范围在0到测试集长度之间（不包括测试集长度本身）。这个整数被赋值给index变量，表示所选择的图像在测试集中的索引位置。
plt.imshow(x_test[index].reshape(28,28)): 使用plt.imshow()函数显示所选择的图像。x_test[index]表示从测试集中选择的图像数据，.reshape(28, 28)将图像数据的形状重塑为28x28的二维数组，以适应imshow()函数的要求。
plt.gray(): 使用plt.gray()函数将显示的图像设置为灰度图像。

通过执行这段代码，你可以看到随机选择的图像以灰度形式显示在屏幕上。每次运行代码，都会随机选择不同的图像进行显示。

可视化可视化经过自动编码器压缩和解压后的图像：

plt.imshow(pred[index].reshape(28,28))
plt.gray()

运行结果：

代码详解：
这段代码用于可视化经过自动编码器压缩和解压后的图像。

plt.imshow(pred[index].reshape(28,28)): 使用plt.imshow()函数显示经过自动编码器预测的图像。pred[index]表示从预测结果中选择的图像数据，.reshape(28, 28)将图像数据的形状重塑为28x28的二维数组，以适应imshow()函数的要求。

通过执行这段代码，你可以看到经过自动编码器压缩和解压后的图像以灰度形式显示在屏幕上。这样可以直观地比较原始图像和自动编码器生成的图像之间的差异。这有助于评估自动编码器的性能和图像重构质量。

创建并排显示原始图像和预测压缩图像的子图：

index = np.random.randint(len(x_test))
plt.figure(figsize=(10, 4))
# 显示原图
ax = plt.subplot(1, 2, 1)
plt.imshow(x_test[index].reshape(28,28))
plt.gray()
ax.get_xaxis().set_visible(False)
ax.get_yaxis().set_visible(False)
# 显示压缩图像
ax = plt.subplot(1, 2, 2)
plt.imshow(pred[index].reshape(28,28))
plt.gray()
ax.get_xaxis().set_visible(False)
ax.get_yaxis().set_visible(False)
plt.show()

运行结果：

代码详解：
这段代码用于同时显示原始图像和经过自动编码器压缩和解压后的图像。

index = np.random.randint(len(x_test)): 使用np.random.randint()函数生成一个随机整数，范围在0到测试集长度之间（不包括测试集长度本身）。这个整数被赋值给index变量，表示所选择的图像在测试集中的索引位置。
plt.figure(figsize=(10, 4)): 使用plt.figure()函数创建一个图像窗口，设置图像窗口的大小为(10, 4)。
ax = plt.subplot(1, 2, 1): 使用plt.subplot()函数创建一个子图，设置子图的位置为(1, 2, 1)，表示将原始图像显示在第一个子图位置。
plt.imshow(x_test[index].reshape(28,28)): 使用plt.imshow()函数显示原始图像。x_test[index]表示从测试集中选择的原始图像数据，.reshape(28, 28)将图像数据的形状重塑为28x28的二维数组，以适应imshow()函数的要求。
plt.gray(): 使用plt.gray()函数将显示的图像设置为灰度图像。
ax.get_xaxis().set_visible(False): 使用ax.get_xaxis().set_visible(False)函数将子图的x轴刻度标签隐藏。
ax.get_yaxis().set_visible(False): 使用ax.get_yaxis().set_visible(False)函数将子图的y轴刻度标签隐藏。
ax = plt.subplot(1, 2, 2): 使用plt.subplot()函数创建第二个子图，设置子图的位置为(1, 2, 2)，表示将压缩后的图像显示在第二个子图位置。
plt.imshow(pred[index].reshape(28,28)): 使用plt.imshow()函数显示压缩后的图像。pred[index]表示从预测结果中选择的图像数据，.reshape(28, 28)将图像数据的形状重塑为28x28的二维数组，以适应imshow()函数的要求。
plt.gray(): 使用plt.gray()函数将显示的图像设置为灰度图像。
ax.get_xaxis().set_visible(False): 使用ax.get_xaxis().set_visible(False)函数将子图的x轴刻度标签隐藏。
ax.get_yaxis().set_visible(False): 使用ax.get_yaxis().set_visible(False)函数将子图的y轴刻度标签隐藏。
plt.show(): 使用plt.show()函数显示图像窗口，同时显示原始图像和压缩后的图像。

通过执行这段代码，你可以看到一个图像窗口，其中包含了两个子图。第一个子图显示原始图像，第二个子图显示经过自动编码器压缩和解压后的图像。这样可以直观地比较两者之间的差异。每次运行代码，都会显示不同的图像，因为index变量是随机选择的。图像窗口的大小为(10, 4)，可以根据需要进行调整。

到目前为止，我们已经了解了自动编码器如何用于图像压缩。接下来我们将看到如何使用自动编码器对图像进行降噪。

三、用于图像降噪的CNN自动编码器

1. 导入库

import numpy as np
import matplotlib.pyplot as plt
from keras import Sequential
from keras.layers import Dense, Conv2D, MaxPooling2D, UpSampling2D
from keras.datasets import mnist

2. 加载数据集

(x_train, _), (x_test, _) = mnist.load_data()

3. 预处理图像数据

对图像数据进行归一化：

x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

重塑输入图像数据：

x_train = x_train.reshape(len(x_train), 28, 28, 1)
x_test = x_test.reshape(len(x_test), 28, 28, 1)
x_test.shape

4. 为图像添加噪声

在训练和测试图像中添加随机噪声：

noise_factor = 0.6
x_train_noisy = x_train + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_train.shape)
x_test_noisy = x_test + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_test.shape)

代码详解：

noise_factor = 0.6: 定义噪声因子，表示噪声的强度。这里设置为0.6，意味着添加的噪声将是原始图像的0.6倍大小。
x_train_noisy = x_train + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_train.shape): 使用np.random.normal()函数生成服从正态分布的随机噪声，并将其加到训练集的图像数据上。loc=0.0表示正态分布的均值为0，scale=1.0表示正态分布的标准差为1，size=x_train.shape表示生成的随机噪声的形状与训练集图像数据的形状相同。然后，将生成的随机噪声乘以噪声因子，并加到训练集图像数据上。
x_test_noisy = x_test + noise_factor * np.random.normal(loc=0.0, scale=1.0, size=x_test.shape): 同样地，使用相同的过程对测试集的图像数据添加噪声。

通过执行这段代码，我们将训练集和测试集的图像数据分别与随机生成的噪声相加，从而添加了噪声。这种噪声添加操作可以用于训练和评估去噪自编码器等模型，以提高模型对噪声图像的处理能力。

对添加了噪声的图像数据进行值范围的裁剪：

x_train_noisy = np.clip(x_train_noisy, 0., 1.)
x_test_noisy = np.clip(x_test_noisy, 0., 1.)

代码详解：
这段代码将添加了噪声的图像数据进行值范围的裁剪，将所有像素值限制在0到1之间。

x_train_noisy = np.clip(x_train_noisy, 0., 1.): 使用np.clip()函数对训练集的噪声图像数据进行裁剪操作。np.clip()函数可以将数组中的值限制在指定的范围内。这里将噪声图像数据的像素值限制在0到1之间。
x_test_noisy = np.clip(x_test_noisy, 0., 1.): 同样地，对测试集的噪声图像数据进行值范围的裁剪操作。

通过执行这段代码，我们将添加了噪声的图像数据的像素值限制在0到1的范围内。这种操作可以确保输入数据的像素值在合理的范围内，以便更好地适应模型的训练和处理要求。

5. 探索性数据分析

查看原始图像：

# 随机选择一个图像作为索引
index = np.random.randint(len(x_test))
# 可视化图像
plt.imshow(x_test[index].reshape(28,28))
plt.gray()

运行结果：

代码详解：
这段代码随机选择一个测试集中的图像，并将其可视化。

index = np.random.randint(len(x_test)): 使用np.random.randint()函数生成一个随机整数作为索引，范围为从0到测试集样本数量减1。这样可以随机选择一个图像作为索引。
plt.imshow(x_test[index].reshape(28,28)): 使用plt.imshow()函数将选择的图像数据以灰度图像的形式进行可视化。x_test[index]表示选择的图像数据，.reshape(28,28)将图像数据的形状重新调整为28x28的二维形状，以便适应imshow函数的要求。
plt.gray(): 将图像显示设置为灰度模式。

通过执行这段代码，你可以随机选择一个测试集中的图像，并将其以灰度图像的形式显示出来。这样可以帮助你观察和了解所选择的图像的内容和特征。

查看带有噪声的相同图像：

# 随机选择一个图像作为索引
index = np.random.randint(len(x_test))
# 可视化图像
plt.imshow(x_test_noisy[index].reshape(28,28))
plt.gray()

运行结果：

代码详解：
这段代码随机选择一个添加了噪声的测试集图像，并将其可视化。

index = np.random.randint(len(x_test)): 使用np.random.randint()函数生成一个随机整数作为索引，范围为从0到测试集样本数量减1。这样可以随机选择一个图像作为索引。
plt.imshow(x_test_noisy[index].reshape(28,28)): 使用plt.imshow()函数将选择的添加了噪声的测试集图像数据以灰度图像的形式进行可视化。x_test_noisy[index]表示选择的图像数据，.reshape(28,28)将图像数据的形状重新调整为28x28的二维形状，以便适应imshow()函数的要求。
plt.gray(): 将图像显示设置为灰度模式。

通过执行这段代码，你可以随机选择一个添加了噪声的测试集图像，并将其以灰度图像的形式显示出来。这样可以帮助你观察和了解所选择的图像在添加噪声后的效果和特征变化。

其他带噪声的图像：

通过查看这些图像发现我们很直接通过带噪声的图像难识别其原始图像。

6. 模型创建

model = Sequential([
                    # 编码器网络
                    Conv2D(32, 3, activation='relu', padding='same', input_shape=(28, 28, 1)),
                    MaxPooling2D(2, padding='same'),
                    Conv2D(16, 3, activation='relu', padding='same'),
                    MaxPooling2D(2, padding='same'),
                    # 解码器网络
                    Conv2D(16, 3, activation='relu', padding='same'),
                    UpSampling2D(2),
                    Conv2D(32, 3, activation='relu', padding='same'),
                    UpSampling2D(2),
                    # 输出层
                    Conv2D(1, 3, activation='sigmoid', padding='same')
])

model.compile(optimizer='adam', loss='binary_crossentropy')
model.summary()

运行结果：

代码详解：
这段代码定义了一个基于卷积神经网络的自编码器模型，并进行了编译和打印模型概述。

model = Sequential([...]): 创建一个Sequential模型对象，用于构建神经网络模型。模型中的每一层都按照顺序添加到模型中。
Conv2D(32, 3, activation='relu', padding='same', input_shape=(28, 28, 1)): 添加一个卷积层，该层具有32个过滤器（即输出通道数为32），过滤器的大小为3x3，使用ReLU激活函数，填充方式为“same”，并指定输入的形状为28x28的灰度图像（通道数为1）。
MaxPooling2D(2, padding='same'): 添加一个最大池化层，该层使用2x2的池化窗口进行下采样，填充方式为“same”。
Conv2D(16, 3, activation='relu', padding='same'): 添加另一个卷积层，该层具有16个过滤器，过滤器的大小为3x3，使用ReLU激活函数，填充方式为“same”。
MaxPooling2D(2, padding='same'): 添加另一个最大池化层，使用2x2的池化窗口进行下采样，填充方式为“same”。
Conv2D(16, 3, activation='relu', padding='same'): 添加一个卷积层，该层具有16个过滤器，过滤器的大小为3x3，使用ReLU激活函数，填充方式为“same”。
UpSampling2D(2): 添加一个上采样层，使用2x2的上采样窗口进行上采样。
Conv2D(32, 3, activation='relu', padding='same'): 添加另一个卷积层，该层具有32个过滤器，过滤器的大小为3x3，使用ReLU激活函数，填充方式为“same”。
UpSampling2D(2): 添加另一个上采样层，使用2x2的上采样窗口进行上采样。
Conv2D(1, 3, activation='sigmoid', padding='same'): 添加输出层，该层具有1个过滤器（输出通道数为1），过滤器的大小为3x3，使用Sigmoid激活函数，填充方式为“same”。
model.compile(optimizer='adam', loss='binary_crossentropy'): 编译模型，使用Adam优化器和二元交叉熵损失函数。
model.summary(): 打印模型的概述信息，包括每一层的名称、输出形状和参数数量等。

通过执行这段代码，我们定义了一个基于卷积神经网络的自编码器模型，并编译和打印了模型的概述信息。这个自编码器模型由编码器网络和解码器网络组成，可以用于图像去噪任务。

7. 训练模型

model.fit(x_train_noisy, x_train, epochs=20, batch_size=256, validation_data=(x_test_noisy, x_test))

运行结果：

代码详解：
这段代码使用带有噪声的训练集数据对模型进行训练，并使用未经过噪声处理的测试集数据进行验证。

model.fit(x_train_noisy, x_train, epochs=20, batch_size=256, validation_data=(x_test_noisy, x_test)): 使用fit()函数对模型进行训练。x_train_noisy是带有噪声的训练集输入，x_train是对应的无噪声的训练集目标。epochs=20表示进行20轮的训练，batch_size=256表示每个批次的样本数量为256。validation_data=(x_test_noisy, x_test)表示使用未经过噪声处理的测试集数据作为验证数据。

通过执行这段代码，模型将使用带有噪声的训练集数据进行训练，目标是通过自编码器模型学习恢复无噪声的原始图像。在训练过程中，将计算训练集和验证集的损失值，并更新模型的权重参数，以提高模型对图像去噪的能力。

8. 可视化结果

使用训练好的模型对带有噪声的测试集数据进行预测，生成恢复的去噪图像:

pred = model.predict(x_test_noisy)

运行结果：

代码详解：

pred = model.predict(x_test_noisy): 使用predict()函数对带有噪声的测试集数据进行预测，得到恢复的图像。x_test_noisy是带有噪声的测试集输入。

通过执行这段代码，模型将对带有噪声的测试集数据进行预测，并生成恢复的去噪图像。预测的结果存储在pred变量中，每个样本对应一个去噪的图像。这样可以通过对比去噪的图像与带噪声的图像，评估模型的去噪效果。

随机选择带噪声图像并显示它:

index = np.random.randint(len(x_test))
plt.imshow(x_test_noisy[index].reshape(28,28))
plt.gray()

运行结果：

代码详解：

index = np.random.randint(len(x_test)): 使用np.random.randint()函数生成一个随机整数作为索引，范围为从0到测试集样本数量减1。这样可以随机选择一个图像作为索引。
plt.imshow(x_test_noisy[index].reshape(28,28)): 使用plt.imshow()函数将选择的带有噪声的测试集图像数据以灰度图像的形式进行可视化。x_test_noisy[index]表示选择的图像数据，.reshape(28,28)将图像数据的形状重新调整为28x28的二维形状，以便适应imshow()函数的要求。
plt.gray(): 将图像显示设置为灰度模式。

通过执行这段代码，随机选择了一个带有噪声的测试集图像，并将其以灰度图像的形式显示出来。这样可以帮助你观察和了解所选择的图像的噪声效果和特征变化。

可视化降噪后的图像:

plt.imshow(pred[index].reshape(28,28))
plt.gray()

运行结果：

代码详解：

plt.imshow(pred[index].reshape(28,28)): 使用plt.imshow()函数将选择的去噪后的图像数据以灰度图像的形式进行可视化。pred[index]表示选择的去噪后的图像数据，.reshape(28,28)将图像数据的形状重新调整为28x28的二维形状，以便适应imshow()函数的要求。
plt.gray(): 将图像显示设置为灰度模式。

通过执行这段代码，将去噪后的图像以灰度图像的形式显示出来。这样可以帮助你观察和了解去噪后的图像的特征和效果。

创建子图，将原始和预测的去噪图像并排显示:

index = np.random.randint(len(x_test))
plt.figure(figsize=(10, 4))
# 可视化带噪声图像
ax = plt.subplot(1, 2, 1)
plt.imshow(x_test_noisy[index].reshape(28,28))
plt.gray()
ax.get_xaxis().set_visible(False)
ax.get_yaxis().set_visible(False)
# 可视化降噪后图像
ax = plt.subplot(1, 2, 2)
plt.imshow(pred[index].reshape(28,28))
plt.gray()
ax.get_xaxis().set_visible(False)
ax.get_yaxis().set_visible(False)
plt.show()

运行结果：

代码详解：
这段代码将原始图像和去噪后的图像进行对比，并以一行两列的形式显示在同一张图中。

index = np.random.randint(len(x_test)): 使用np.random.randint()函数生成一个随机整数作为索引，范围为从0到测试集样本数量减1。这样可以随机选择一个图像作为索引。
plt.figure(figsize=(10, 4)): 创建一个大小为10x4的图像窗口，用于显示原始图像和压缩后的图像。
ax = plt.subplot(1, 2, 1): 创建一个子图，位置为1行2列中的第1个位置。用于显示原始图像。
plt.imshow(x_test_noisy[index].reshape(28,28)): 使用plt.imshow()函数将选择的带有噪声的测试集图像数据以灰度图像的形式显示在子图中。x_test_noisy[index]表示选择的图像数据，.reshape(28,28)将图像数据的形状重新调整为28x28的二维形状，以便适应imshow()函数的要求。
plt.gray(): 将图像显示设置为灰度模式。
ax.get_xaxis().set_visible(False): 隐藏x轴刻度和标签。
ax.get_yaxis().set_visible(False): 隐藏y轴刻度和标签。
ax = plt.subplot(1, 2, 2): 创建一个子图，位置为1行2列中的第2个位置。用于显示压缩后的图像。
plt.imshow(pred[index].reshape(28,28)): 使用plt.imshow()函数将选择的去噪后的图像数据以灰度图像的形式显示在子图中。pred[index]表示选择的去噪后的图像数据，.reshape(28,28)将图像数据的形状重新调整为28x28的二维形状，以便适应imshow()函数的要求。
plt.gray(): 将图像显示设置为灰度模式。
ax.get_xaxis().set_visible(False): 隐藏x轴刻度和标签。
ax.get_yaxis().set_visible(False): 隐藏y轴刻度和标签。
plt.show(): 显示图像窗口。

通过执行这段代码，你将在同一张图中同时显示带噪声的图像和去噪后的图像，以便进行对比和观察它们的区别。图像的大小为10x4，左边的子图显示带噪声的图像，右边的子图显示去噪后的图像。

查看其他组的对比：

四、总结

在这个项目教程中，我们探讨了深度CNN自动编码器如何用于图像压缩和去噪。深度CNN自动编码器结合了CNN的空间特征提取能力和自动编码器的重建能力来学习输入数据的有效表示。它可以用于学习紧凑和有意义的表征是至关重要的各种应用。在这里，我们已经看到了自动编码器在图像压缩和去噪方面的应用。
在图像压缩的自动编码器架构中使用深度CNN的优势在于，它可以捕捉空间依赖性并从输入图像中提取有意义的特征。编码器网络中的卷积层进行局部特征提取，捕捉精细的细节和模式。解码器网络使用转置的卷积层对压缩后的表示进行上采样，并以更好的分辨率重建图像。与传统方法相比，深度CNN架构有助于在压缩过程中保留重要的图像特征并确保更高质量的重建。
与图像压缩类似，自动编码器中的深度CNN架构在图像去噪方面也很有优势，因为它可以捕捉复杂的空间模式并提取层次特征。网络中的卷积层可以识别噪声模式并抑制它们，使解码器网络能够重建一个更干净的图像版本。
总之，深度CNN自动编码器是一种强大的方法，适用于图像压缩和去噪任务。它可以在潜伏空间中学习有效的图像表征，允许在降低内存或带宽要求的情况下进行图像压缩。此外，它还能有效地去除损坏图像中的噪声，使重建的图像更干净、质量更高。

⭐️ 往期机器学习/深度学习项目推荐：
1️⃣【机器学习项目】使用 PyTorch 预测汽车价格（详细报告+代码详解）
2️⃣【机器学习/数据分析大项目】黑色星期五销售预测（详细报告+代码详解）
3️⃣【机器学习项目】使用机器学习算法预测航班价格（详细报告+代码详解）

你可能感兴趣的:(深度学习,深度学习,cnn,计算机视觉,人工智能,神经网络)

PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
使用NVIDIA NeRF将2D图像转换为逼真的3D模型（Python） ByteWhiz 3d python 计算机视觉 Python
使用NVIDIANeRF将2D图像转换为逼真的3D模型（Python）NeuralRadianceFields（NeRF）是一种强大的方法，可以将2D图像转换为逼真的3D模型。它使用神经网络来建模场景的辐射场，并通过渲染多个视角的图像来重建3D模型。在本文中，我们将使用Python和NVIDIANeRF库来实现这一过程。首先，我们需要安装所需的库。我们可以通过以下命令使用pip安装NVIDIANe
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
图神经网络：挖掘关系数据中的宝藏
图神经网络：挖掘关系数据中的宝藏在浩瀚的数据海洋中，蕴藏着一类特殊而强大的资源——关系数据。它们不是孤立的点，而是相互连接、彼此影响的复杂网络：社交平台上朋友的朋友、电商系统中商品与用户的互动、蛋白质分子内原子的结合、城市交通网中的道路连接……这些数据天然以图的形式存在，节点代表实体，边则承载着实体间千丝万缕的关系。传统的数据挖掘工具面对这些盘根错节的结构往往力不从心，而图神经网络（GNN）的崛起
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR