长安er

信号处理专题设计-基于边缘检测的数字图像分类识别

一、实验目的

二、实验要求

三、实验原理

1.卷积神经网络（CNN）模型

2.边缘检测

3.形态学操作

4.鲁棒性

四、实验过程

1.数据预处理

2. 网络的构建

3.模型的训练

4.边缘检测和形态学操作相关代码

5.模型训练结果

6.关键信息的保存

五、实验测试与评估

1.鲁棒性测试

2.可扩展性

（1）网络模型的可扩展性

（2）优化器的可扩展性

（3）边缘检测函数的可扩展性

（4）超参数调节扩展性

3.准确性测试

（1）形态学操作

（2）优化器

4. 优化器的评估

六、实验创新

1.多模态resnet网络的设计

2. 关于多模态resnet网络的思考

3.边缘检测函数

七、实验总结与思考

1.实验结果讨论

2.实验局限性分析

3.改进方向

4.实验思考

八、实验心得

附录

附录1

Adam优化器具体实现代码

附录2

SGD优化器具体实现代码

一、实验目的

本实验旨在设计一个基于深度学习的图像信号处理系统，用于识别和提取图像中的关键信息。具体目标包括：

1.设计一个卷积神经网络（CNN）模型，用于对图像进行分类。

2.利用CNN模型对图像进行边缘检测，以提取图像中的关键信息。

3.在边缘检测的基础上，利用OpenCV库实现膨胀、腐蚀、开运算和闭运算等形态学操作，以进一步提取图像中的关键信息。

4.将提取的关键信息保存到文件中，以便后续使用。

5.对整个系统进行测试和评估，包括准确性、鲁棒性和可扩展性等方面。

二、实验要求

1.实现卷积神经网络模型，包括网络结构的设计、层的配置和参数的设置。可以使用Python语言和深度学习框架如TensorFlow、Keras等。

2.使用合适的数据集对CNN模型进行训练和评估，同时记录准确率、损失函数的变化曲线等指标。

3.利用CNN模型对图像进行边缘检测，提取图像中的关键信息。可以使用OpenCV等计算机视觉库来实现边缘检测。

4.实现形态学操作，包括膨胀、腐蚀、开运算和闭运算等，以进一步提取图像中的关键信息。可以使用OpenCV库来实现这些形态学操作。

5.将提取的关键信息保存到文件中，以便后续使用。可以选择合适的文件格式和保存方式。

6.对整个系统进行测试和评估，包括分类准确性、边缘检测效果以及形态学操作对关键信息提取的影响。可以使用合适的评估指标和示例图像来展示实验结果。

7.在实验报告中清晰地描述实验的步骤、流程和实现细节，并附上所使用的代码和数据集（如果适用）。

8.讨论实验结果，包括对模型和算法的优缺点的分析、改进方法的讨论和图像信号处理系统的应用前景等。

三、实验原理

本部分主要介绍本次实验中使用到的重要模型、指标和算法。

1.卷积神经网络（CNN）模型

CNN是一种广泛应用于图像处理和计算机视觉任务的深度学习模型。

CNN包含多个卷积层、池化层和全连接层，通过对图像进行卷积和池化操作提取特征，并通过全连接层进行分类。

通过反向传播算法，CNN能够自动学习到图像中的特征和模式。

2.边缘检测

边缘是图像中灰度变化显著的区域，边缘检测可以识别出图像中的边缘信息。

常用的边缘检测算法包括Sobel算子、Canny边缘检测等。

边缘检测通常涉及梯度计算、非极大值抑制和阈值处理等步骤。

3.形态学操作

形态学操作是一种图像处理方法，用于对图像进行形状的改变和提取。

膨胀（dilation）可以扩展图像中的亮区域，腐蚀（erosion）可以缩小亮区域。

开运算（opening）是先腐蚀后膨胀，闭运算（closing）是先膨胀后腐蚀，用于平滑边缘和填充空洞。

4.鲁棒性

鲁棒性（Robustness）是指图像信号处理系统在处理各种不同情况下的稳定性和适应性。鲁棒性好的系统能够处理图像的光照变化、尺度变化、噪声等干扰因素，并保持较好的性能。

在设计系统时，需要考虑数据集的多样性和模型的泛化能力，以提高系统的鲁棒性。

四、实验过程

1.数据预处理

在进行网络训练之前，对手写数字图像数据进行了预处理。以下是数据预处理的具体步骤：

加载MNIST手写数字图像数据集，包括60,000张训练图像和10,000张测试图像。

将图像数据转换为合适的格式，通常是将图像像素值归一化到0-1之间，并调整图像大小为一致的尺寸。

对图像进行数据增强操作，以增加样本的多样性和鲁棒性。常见的数据增强操作包括图像旋转、平移、缩放、翻转等。

将图像数据划分为训练集和验证集（或测试集），用于模型训练和性能评估。

可选的降噪操作：根据实验需要，可以应用降噪算法去除图像中的噪声，以提高分类准确度。

这些数据预处理步骤旨在将原始图像数据整理成适合输入网络进行训练的形式。通过数据预处理，可以减少噪声和干扰，增加数据集的多样性，提高模型的学习能力和鲁棒性。

2. 网络的构建

在这个代码中，我们创建了一个新的网络类名为FakeNet，在这个网络类中

可以借由参数的选择来创造网络，但网络的整体结构有限制，只能是卷积层＋全连接层的顺序。

以下是具体的形参介绍

这是一个名为FakeNet的类，它表示一个神经网络模型。以下是对其构造函数__init_的各个形参的介绍：

● input_shape：输入数据的形状。通常是一个元组或列表，表示输入数据的维度。

● affine hidden size list：一个整数列表，表示每个全连接层的隐藏单元数量。列表长度为网络的层数（不包括输入层），每个元素表示对应层的隐藏单元个数

● output_size：输出层的大小，表示神经网络的输出维度。

● use_conv：一个布尔值，指示是否在网络中使用卷积层。如果为True，则使用卷积层；如果为False，则不使用。

● conv_params：一个字典，包含了卷积层的参数设置。具体的参数包括filter_num（滤波器数量）、filter size（滤波器大小）、stride（步长）和 pad（填充大小）等。

● active_func：一个字符串，表示激活函数的类型。常见的激活函数有'ReLU'、'Sigmoid'、'Tanh'等。

● weight_init_std：一个字符串或浮点数，表示权重初始化的标准差。可以使用具体的标准差值，也可以使用预设的值，如'ReLU'表示使用针对ReLU激活函数的初始化标准差。

● weight_decay_lambda：一个浮点数，表示权重衰减（L2正则化）的强度。用于控制模型的复杂度，防止过拟合。· use_dropout：一个布尔值，指示是否在网络中使用Dropout层。如果为True，则使用Dropout；如果为False，则不使用。● dropout_ration：一个浮点数，表示要丢弃的神经元比例。仅当 use_dropout 为True 时才起作用。

●use_batchnom：一个布尔值，指示是否在网络中使用批量归一化层。如果为True，则使用批量归一化；如果为False，则不使用。以上是Fakellet类的构造函数中的各个形参的介绍。根据您的需求，可以根据这些形参来初始化和配置网络模型。

在本次手写数字识别中我们使用了两层卷积层和四层全连接层，如下

3.模型的训练

(1)Trainer训练类——专门用来训练的类，内置模型训练函数

这是一个名为 Trainer 的类，用于进行神经网络的训练。以下是对其构造函数 _init__的各个形参的介绍：

● network：要训练的神经网络模型.

● x_train：训练集输入数据。

● t_train：训练集标签数据。

● x_test：测试集输入数据

● t_test：测试集标签数据。

● epochs：训练的轮数（迭代次数），默认为20。

●mini_batch_size：每次迭代中使用的小批量样本数量，默认为100。

●optimizer：优化器的类型，指定了在训练过程中如何更新网络的权重。常见的优化器有'SGD'、'Adam'等。

●optimizer_param：一个字典，包含了优化器的参数设置。具体的参数根据不同的优化器而有所不同，一般包括学习率 lr 等。●evaluate_sample_num_per_epoch：每个epoch中用于评估的样本数量。如果为None，则使用全部测试集数据进行评估，默认为None。

●verbose：一个布尔值，指示是否打印训练过程中的详细信息。如果为 True，则打印；如果为 False，则不打印，默认为 True。

以上是 Trainen类的构造函数中的各个形参的介绍。通过提供适当的参数，可以初始化和配置训练器，并使用该训练器来训练神经网络模型。

（2）Fake优化器的使用

Trainer中所支持的优化器类型如下

其中Fake优化器是由我们独立编写，代码如下

class Fake:
def __init__(self, lr=0.01, momentum=0.9, beta1=0.9, beta2=0.999):
self.lr = lr
self.momentum = momentum
self.v = None
self.h = None
self.beta1 = beta1
self.beta2 = beta2
def update(self, params, grads):
if self.v == None:
if self.h == None:
self.v = {}
self.h = {}
for key, val in params.items():
self.v[key] = np.zeros_like(val)
self.h[key] = np.zeros_like(val)
for key in params.keys():
self.h[key] += (1-self.beta2)*(grads[key]**2 - self.h[key])
self.v[key] = self.momentum*self.v[key] - self.lr*grads[key]/(np.sqrt(self.h[key])+1e-7)
params[key] += (1-self.beta1)*self.v[key]

跟Adam优化器一样，采用了动量和自适应学习率的概念进行编写，属于一个简化版的Adam。

该优化器的原理如下：

初始化学习率（lr）、动量（momentum）、beta1、beta2以及v和h（用于保存每个参数的动量和历史梯度平方项）等参数。

在更新函数update中，首先检查v和h是否为None。如果是，则进行初始化，为每个参数创建相应的零数组。

对于每个参数，根据以下步骤进行更新：

计算当前参数的历史梯度平方项：self.h[key] += (1-self.beta2) * (grads[key]**2 - self.h[key])

计算当前参数的动量项：self.v[key] = self.momentum * self.v[key] - self.lr * grads[key] / (np.sqrt(self.h[key]) + 1e-7)

更新参数：params[key] += (1-self.beta1) * self.v[key]

这个优化器的功能是根据梯度来更新模型的参数，其中包含动量（momentum）和自适应学习率（根据历史梯度平方项h进行调整）。动量可以帮助加速训练过程，而自适应学习率可以根据参数的不同特性来调整更新幅度，以使得训练更加稳定和高效。

需要注意的是，这个优化器是一个简化版本的Adam，可能并不如原版Adam具有相同的性能。如果想要使用更为成熟和广泛应用的优化器，建议使用PyTorch或TensorFlow等深度学习框架中提供的优化器实现，它们通常包含了更多的优化技巧和改进。

4.边缘检测和形态学操作相关代码

#边缘检测
def edge_detection(images, operator='sobel'):
edge_images = []
for gray in images:
if operator == 'sobel':
# 边缘增强 - Sobel算子
sobel_x = cv2.Sobel(gray, cv2.CV_16S, 1, 0)
sobel_y = cv2.Sobel(gray, cv2.CV_16S, 0, 1)
sobel_absx = cv2.convertScaleAbs(sobel_x)
sobel_absy = cv2.convertScaleAbs(sobel_y)
edges_enhanced = cv2.addWeighted(sobel_absx, 0.5, sobel_absy, 0.5, 0)
elif operator == 'laplacian':
# 边缘增强 - Laplacian算子
gray = cv2.normalize(gray, None, 0, 255, cv2.NORM_MINMAX, dtype=cv2.CV_8U)
laplacian = cv2.Laplacian(gray, cv2.CV_16S)
edges_enhanced = cv2.convertScaleAbs(laplacian)
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
# 形态学操作 - Sobel算子 - 闭运算 0.9677 Adam 0.976
edges_close = cv2.morphologyEx(edges_enhanced, cv2.MORPH_CLOSE, kernel)
edge_images.append(edges_close)
# 开运算 0.83
#edges_open = cv2.morphologyEx(edges_enhanced, cv2.MORPH_OPEN, kernel)
#edge_images.append(edges_open)
# 膨胀 0.9567
#edges_dilate = cv2.dilate(edges_enhanced, kernel, iterations=1)
#edge_images.append(edges_dilate)
# 腐蚀 0.8544
#edges_erode = cv2.erode(edges_enhanced, kernel, iterations=1)
#edge_images.append(edges_erode)
return edge_images

以上函数实现了一种边缘检测的操作，其输入参数为一个包含多张灰度图像的列表（images），输出结果也是一个包含多张图像的列表（edge_images），其中每张图像都是经过边缘检测处理后得到的结果。

该函数提供了两种边缘检测算子：Sobel算子和Laplacian算子。默认使用Sobel算子进行边缘增强。在对每张灰度图像进行边缘检测之前，会先通过Sobel算子或Laplacian算子进行边缘增强操作，提高边缘区域的强度。然后，对增强后的边缘图像进行形态学操作，进一步增加边缘的鲁棒性。具体来说，代码中给出了四种形态学操作：闭运算、开运算、膨胀和腐蚀。用户可以根据自己的需要选择其中任意一种或多种形态学操作进行边缘检测。

最后，该函数将所有处理好的边缘图像都存储在edge_images数组中，并且将其返回作为函数输出。

（2）数据集及可视化结果

I 使用Sobel算子进行边缘检测，并在边缘检测的基础上进行形态学操作

①闭运算

②开运算

③膨胀

④腐蚀

II 使用Laplacian算子进行边缘检测，并在边缘检测的基础上进行形态学操作

①闭运算

②开运算

③膨胀

④腐蚀

5.模型训练结果

以下配置多种优化器进行形态学操作的计算结果（epoch为5）

① Fake优化器＋闭运算

② Adam优化器＋闭运算

③ Fake优化器＋开运算

④ Fake优化器＋膨胀

⑤ Fake优化器＋腐蚀

⑥ SGD优化器＋闭运算

6.关键信息的保存

# 创建保存边缘检测图像的文件夹
save_dir = r"D:\wenjiananzhuang\pytorch-transfer-learning-master\pytorch-transfer-learning-master\dataset\mnist_after"
os.makedirs(save_dir, exist_ok=True)
# 保存训练集边缘检测图像
for i in range(len(x_train)):
# 对灰度图像进行边缘检测...
edge_image = x_train[i][0] # 获取灰度图像数据
# 将边缘图像保存
filename = os.path.join(save_dir, f"x_train_{i}.jpg")
cv2.imwrite(filename, edge_image)
# 保存测试集边缘检测图像
for i in range(len(x_test)):
# 对灰度图像进行边缘检测...
edge_image = x_test[i][0] # 获取灰度图像数据
# 将边缘图像保存
filename = os.path.join(save_dir, f"x_test_{i}.jpg")
cv2.imwrite(filename, edge_image)

通过以上代码，实现了本次实验中关键信息及结果的保存

五、实验测试与评估

1.鲁棒性测试

（1）增添了随机角度和噪声的鲁棒性测试，其中只添加了角度的鲁棒性测试准确度变化不大

① 未增加：

② 增加：

（2）但只要增加了噪声，无论优化器的选择抑或是形态学操作，准确度依然很低，维持在0.1左右，如下所示：

（3）鲁棒性测试相关代码

# 鲁棒性测试
# 角度变化
angle = 30 # 旋转角度 0.9709
x_train = rotate(x_train, angle, axes=(2, 3), reshape=False)
x_test = rotate(x_test, angle, axes=(2, 3), reshape=False)
# 将 x_train 和 x_test 扩展为三维数组
# 引入噪声
noise_var = 0.1 # 噪声方差
x_train = random_noise(x_train, var=noise_var)
#x_test = random_noise(x_test, var=noise_var)
# 绘制 x_train 的前十份图
plt.figure(figsize=(10, 5)) # 设置画布大小

2.可扩展性

（1）网络模型的可扩展性

由于使用了独立编写的FakeNet类，可以根据需要改变网络模型的结构。可以任意增加卷积层和全连接层，只需遵循卷积层在全连接层之前的顺序要求。此外，每层卷积层的参数也可以进行更改。因此，在设计新的网络模型时，可以根据任务的需求自由调整网络结构。

（2）优化器的可扩展性

采用了独立编写的Fake优化器，其功能类似于Adam优化器。可以在其他网络中使用该优化器，而不仅限于手写数字识别任务。如果想要使用更成熟、广泛应用的优化器，建议使用PyTorch或TensorFlow等深度学习框架中提供的优化器实现，这些框架通常包含更多的优化技巧和改进。

（3）边缘检测函数的可扩展性

在边缘检测函数中，可以选择使用Sobel算子和Laplacian算子，以及相应的形态学操作。可以根据具体需求选择合适的算子和操作进行边缘检测。如果需要使用其他算子或者自定义形态学操作，可以对代码进行修改和扩展。

（4）超参数调节扩展性

评估实验中使用的超参数对于不同数据集或任务的适应性。合理选择超参数的范围和初始值，使其能够适应多样的数据特征和任务要求。同时，可以使用自动化调参方法，如网格搜索或贝叶斯优化，来进一步探索最佳超参数组合并提升模型的可扩展性。

3.准确性测试

本部分将从两个方面进行准确度测试方面的评估和对比

（1）形态学操作

①闭运算

②开运算

③膨胀

④腐蚀

以上四种情况均是在Fake优化器的基础上进行的。分析以上结果可知，进行闭运算和膨胀的准确度是最高的。

（2）优化器

① Fake优化器

②Adam优化器

③SGD优化器

以上三种情况均是进行闭运算的结果，易分析出Fake优化器对准确度的提高作用是最大的。

4. 优化器的评估

关于Fake优化器和Adam优化器的比较

Fake和Adam的epoch数为2的时候，Fake比Adam的准确度略高一点

当epoch数为5的时候，Adam比Fake的准确度略高一点

但二者总体在epoch数较小的情况下差距不大

以下是各自在epoch数为2下的准确度对比。

Adam优化器

Fake优化器

在以上网络中，由于自己编写基本的网络类没有使用到torch等库，相对来说比较麻烦，因此我们接下来采用了torch库来编写另一个分类网络，即MultimodalResnet（多模态resnet网络）

六、实验创新

1.多模态resnet网络的设计

（1）关于多模态网络

多模态ResNet网络是一种基于深度学习的神经网络架构，用于处理多种类型的输入数据或不同模态的数据。

在多模态ResNet网络中，它扩展了传统的ResNet结构，以处理多个模态的数据，如图像、文本和音频等。这些不同的模态可能具有不同的特征表示和数据结构，因此多模态ResNet网络被设计用于融合多个模态的特征并进行联合学习。

（2）相关代码

# 定义多模态ResNet-18网络
class MultiModalResnet(nn.Module):
def __init__(self, num_classes=2, base_model=resnet18, pretrained=True):
super(MultiModalResnet, self).__init__()
# 定义有色分支的ResNet-18
self.color_resnet = base_model(pretrained=pretrained)
# 定义灰色分支的ResNet-18
self.gray_resnet = base_model(pretrained=pretrained)
# 修改有色分支第一层卷积层的输入通道数
self.color_resnet.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False)
# 修改灰色分支第一层卷积层的输入通道数
self.gray_resnet.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False)
resnet = base_model(pretrained=pretrained)
# 将原来的全连接层替换为新的全连接层
resnet.fc = nn.Linear(2000, num_classes)
# 将修改后的全连接层赋值给模型的fc属性
self.fc = resnet.fc

2. 关于多模态resnet网络的思考

由于任务的目标是对图像进行边缘检测，我们小组认为原图像浪费有点可惜，就尝试了一个支持多分支输入的网络——多模态网络。

在我们的多模态网络中，我们应用了两种不同的预处理方式来生成两个分支的输入数据。第一个分支使用经过图像增强处理的原始图像，从中学习提取图像的颜色特征。而第二个分支则通过边缘检测和形态学操作生成灰度图像，以便学习图像的边缘轮廓特征。这样做的目的是通过多个分支学习到更丰富的特征表示，进一步提高图像处理任务的性能。

为了组合这些特征表示，我们引入了三个ResNet模型。该模型负责提取前两个分支的特征表示，并通过全连接层将它们合并在一起。这种多模态网络结构允许我们同时考虑颜色特征、边缘轮廓特征以及它们的组合特征，从而获得更全面和准确的图像表示和处理结果。

通过采用多模态网络，我们能够充分利用图像中的多种信息，并从中学习到更丰富和有用的特征表示。这种方法在处理图像任务时具有潜力，可以提高分类、识别或分割等任务的性能，为图像处理领域的研究和应用带来新的可能性。

3.边缘检测函数

（1）测试代码

def apply_edge_detection(image_path, category_name, index, lower_threshold, upper_threshold, laplacian_kernel_size):
# 读取图像
image = cv2.imread(image_path)
# 转换为灰度图像
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
# 边缘增强 - Sobel算子
sobel_x = cv2.Sobel(gray, cv2.CV_16S, 1, 0)
sobel_y = cv2.Sobel(gray, cv2.CV_16S, 0, 1)
sobel_absx = cv2.convertScaleAbs(sobel_x)
sobel_absy = cv2.convertScaleAbs(sobel_y)
edges_enhanced_sobel = cv2.addWeighted(sobel_absx, 0.5, sobel_absy, 0.5, 0)
# 形态学操作 - Sobel算子
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
edges_sobel = cv2.morphologyEx(edges_enhanced_sobel, cv2.MORPH_CLOSE, kernel)
# 边缘增强 - Laplacian算子
edges_enhanced_laplacian = cv2.Laplacian(gray, cv2.CV_16S, ksize=laplacian_kernel_size)
edges_enhanced_laplacian = cv2.convertScaleAbs(edges_enhanced_laplacian)
# 形态学操作 - Laplacian算子
edges_laplacian = cv2.morphologyEx(edges_enhanced_laplacian, cv2.MORPH_CLOSE, kernel)
print(
f"Processing: {category_name}: {index}, Threshold: ({lower_threshold}, {upper_threshold}), Laplacian Kernel Size: {laplacian_kernel_size}")
return edges_sobel, edges_laplacian

（2）实验效果

可以对图像分别进行sobel算子和Laplacian算子的增强,并保存在相应的文件夹中，采用了蜜蜂和蚂蚁的数据集，具体效果如下：

（3）结果评估

经过尝试不同优化器、边缘检测和其他相关参数的调整，准确度最高仅达到约0.7左右，效果依然不太理想，这可能是因为网络本身的设计存在一些不完善或草率的地方。

七、实验总结与思考

1.实验结果讨论

根据实验结果的分析，我们发现在使用不同优化器进行网络训练时，Adam优化器在手写数字图像分类识别任务中表现较好，达到了较高的准确度。相比之下，Fake优化器的效果较差，可能是由于其权重更新的不稳定性导致的。此结果表明，在该任务中选择合适的优化器对于提高分类准确度至关重要。

在边缘检测实验中，我们观察到边缘检测技术在一定程度上提升了分类识别的准确度。通过突出图像中的边缘轮廓，我们能够更好地捕捉到手写数字的特征信息，从而改善分类效果。

然而，本次实验也存在一些局限性：

首先，数据集规模和多样性有限。MNIST手写数字数据集规模较小，并且只包含10个数字的手写样本。在实际应用中，手写数字样本可能更加复杂、多样化，因此需要更大规模且多样性更强的数据集来提高模型的泛化能力。

其次，并未观察到多模态ResNet网络在本实验中带来明显的改进效果。可能是因为我们的网络不算规范的多模态网络，因为多模态网络本应该是多种类型的输入数据，但我们的输入数据类型一致，均是图片，但各个分支不同，一支是经过了图像增强的原始图像，另外一支是经过边缘检测及形态学操作的灰度图像，我们想的是可以学习图像的颜色特征，边缘轮廓特征，还能学习下两者结合的特征。

2.实验局限性分析

本次实验的局限性主要包括数据集规模和多样性不足、多模态网络的效果不理想等方面。由于数据集的限制，我们可能无法充分挖掘出网络模型和优化器的潜力。而多模态网络在本实验中的表现也不尽如人意，需要进一步改进和优化。

此外，在边缘检测实验中，我们仅使用了简单的边缘检测技术，并未尝试更高级的边缘检测算法，可能导致提升效果受到限制。

3.改进方向

针对实验中的局限性，下一步的改进方向可以从以下几个方面展开：

首先，扩大数据集规模并增加多样性。收集更多的手写数字样本，以及包括不同字体、不同书写风格等多样性，在更大规模和更真实的数据集上进行训练和测试，提高模型的泛化能力。

其次，进一步优化多模态网络的结构。根据实验结果的分析，优化多模态网络的设计，考虑更合适的特征融合方式和注意力机制，以提升网络的性能和效果。

另外，尝试其他优化器的使用。除了Adam和Fake优化器，可以尝试RMSprop等其他常用优化器，并调整其参数设置，以找到更适合手写数字图像分类任务的优化方法。

同时，探索更先进的边缘检测技术。尝试应用Canny边缘检测算法、基于深度学习的边缘检测方法等，以提升边缘检测的效果，进一步改善分类准确度。

4.实验思考

本次实验通过构建不同网络模型和优化器，应用边缘检测技术，研究了手写数字图像的分类识别任务。实验结果表明，在选择适当的优化器和引入边缘检测技术的情况下，可以提高分类准确度。

然而，实验也揭示了数据集规模和多样性、多模态网络效果以及边缘检测技术的局限性。

在下一步的改进中，我们将致力于扩大数据集规模和多样性，优化多模态网络的结构，尝试其他优化器的使用，并探索更先进的边缘检测技术。这将有助于提高手写数字图像分类识别任务的准确度和性能，进一步推动相关领域的研究与发展。

八、实验心得

为了完成本次基于深度学习的图像信号处理系统设计，我们小组五人首先集体学习了计算机视觉的相关知识，并完成了python相关库的安装。在协作完成实验思路构建的基础上，两人主要负责代码的编写与调试，三人分别负责数据集的查找、实验报告的撰写和答辩ppt的制作。

总的来说，通过本次合作学习，我们小组每个人都收获颇丰，以下是具体内容：

1.计算机视觉深度学习：通过手写数字图像分类识别任务，我们深入了解了计算机视觉领域的深度学习方法。我们学到了如何构建卷积神经网络（CNN）模型，并掌握了常见的图像处理技术，例如边缘检测和特征提取。这对我们理解和应用计算机视觉算法具有重要意义。

2.模型选择和优化器：我们实验中尝试了不同的网络模型和优化器，并对它们的性能进行了评估。我们了解了不同模型的结构和特点，以及如何根据任务需求选择合适的模型。此外，我们还探索了不同优化器的优缺点，并学习了如何调整超参数以提高模型的性能。

3.数据预处理与增强：在实验中，我们遇到了数据集不平衡和噪声等问题。为了解决这些问题，我们采取了数据预处理和增强的方法，例如平衡采样和图像增强技术。通过这些措施，我们提高了模型的鲁棒性和泛化能力，并有效改善了模型在特定情况下的表现。

4.结果评估和可视化：我们实验中对模型进行了全面的结果评估，并利用各种指标对其性能进行了量化分析。同时，我们还运用可视化技术，如混淆矩阵和学习曲线，直观地展示了模型的表现。这些评估和可视化技术为我们提供了深入理解模型性能的工具，并帮助我们调整和改进模型。

5.团队合作和沟通：本次实验是团队合作完成的，我们通过有效的沟通和协作共同完成了任务。在团队中，我们学会了相互倾听、合理分工和有效协调的重要性。这不仅提高了我们的合作能力，也培养了我们的团队意识和领导力。

这些收获将对我们今后的学习、研究和职业发展产生积极的影响。

附录

附录1

Adam优化器具体实现代码

class Adam:
    """Adam (http://arxiv.org/abs/1412.6980v8)"""
    def __init__(self, lr=0.001, beta1=0.9, beta2=0.999):
        self.lr = lr
        self.beta1 = beta1
        self.beta2 = beta2
        self.iter = 0
        self.m = None
        self.v = None

    def update(self, params, grads):
        if self.m is None:
            self.m, self.v = {}, {}
            for key, val in params.items():
                self.m[key] = np.zeros_like(val)
                self.v[key] = np.zeros_like(val)

        self.iter += 1
        lr_t = self.lr * np.sqrt(1.0 - self.beta2**self.iter) / (1.0 - self.beta1**self.iter)

        for key in params.keys():
                    self.m[key] += (1 - self.beta1) * (grads[key] - self.m[key])
            self.v[key] += (1 - self.beta2) * (grads[key]**2 - self.v[key])

            params[key] -= lr_t * self.m[key] / (np.sqrt(self.v[key]) + 1e-7)

附录2

SGD优化器具体实现代码

class SGD:
    """随机梯度下降法（Stochastic Gradient Descent）"""
    def __init__(self, lr=0.01):
        self.lr = lr
    def update(self, params, grads):
        for key in params.keys():
            params[key] -= self.lr * grads[key]

2024-1-20

你可能感兴趣的:(信号处理,分类,数据挖掘)

番茄西红柿叶子病害分类数据集12882张11类别 futureflsl 数据集分类数据挖掘人工智能
数据集类型：图像分类用，不可用于目标检测无标注文件数据集格式：仅仅包含jpg图片，每个类别文件夹下面存放着对应图片图片数量(jpg文件个数)：12882分类类别数：11类别名称:["Bacterial_Spot_Bacteria","Early_Blight_Fungus","Healthy","Late_Blight_Water_Mold","Leaf_Mold_Fungus","Powdery
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
xilinx vivado PULLMODE 设置思路坚持每天写程序 fpga开发
1.xilinx引脚分类XilinxIO的分类：以XC7A100TFGG484为例，其引脚分类如下：1.UserIO(用户IO)：用户使用的普通IO1.1专用(Dedicated)IO：命名为IO_LXXY_#、IO_XX_#的引脚，有固定的特定用途，多为底层特定功能的直接实现，如差分对信号、关键控制信号等，不能随意变更。1.2多功能(Multi-Function)IO：命名为IO_LXXY_ZZ
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
5分钟说透AppStore审核原理，让你拥有上架新思路！ Q仔本人噢
在AppStore上架是越来越难了!相信非常多公司的技术人员都为此困扰，然而外包团队水平又层次不齐，容易遇坑，实在是内忧外患。是什么原因导致审核机制频繁调整？又是什么原因使得审核变得越发严格？那么接下来听小Q分解，马上给各位带来解答!首先看一下近一年的上下架的情况：近一年上架情况近一年下架情况通过数据我们发现越是马甲包产量权重高的分类里被下架的app数量越多，苹果此举可谓是上有政策，下有对策。通过
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
【自动化测试】UI自动化的分类、如何选择合适的自动化测试工具以及其中appium的设计理念、引擎和引擎如何工作 Lossya ui 自动化测试工具自动化测试 appium
引言UI自动化测试主要针对软件的用户界面进行测试，以确保用户界面元素的交互和功能符合预期文章目录引言一、UI自动化的分类1.1基于代码的自动化测试1.2基于录制/回放的自动化测试1.3基于框架的自动化测试1.4按测试对象分类1.5按测试层次分类1.6按测试执行方式分类1.7按测试目的分类二、如何选择合适的自动化测试工具2.1项目需求分析2.2工具特性评估2.3成本考虑2.4团队技能2.5试用和评估
性格小测试熹大头
有些人非常肯定自己属于外向型，有些人则发现自己是绝对的内向型。然而，多数人却发现他们似乎介于两者之间，是两种性格的结合。现在我们就来看看你在这种分类中处在何种位置。阅读以下问题，从a、b、c中选出最适合自己的选项。你可能会发现三个选项都不合适，或者合适的不止一项，这种情况下，选出相对来说更适合自己的即可。1人们经常会用下列哪个词语描述你：a善于分析b遵守纪律c有创造力2一连几天参与社交活动（比如，
李克富 | 咨询师推荐阅读书目李克富
最重要的书籍不是别人的推荐，而是自己学过的教材，不论当初使用的是哪个版本，它都是我们专业的底层代码，具有不可替代性。前不久，中国心理咨询师筹委会的一位老师邀请我罗列一个推荐书目清单作为咨询师工具包的内容，并要求“说明一下简单的分类或者作三言两语的说明”。斟酌后，我觉得自己推荐的书目大体可以分为普及类书籍、心理学书籍和心理咨询与治疗专业书籍，第三类又分为适合于咨询师新手的和有经验咨询师的。经过严格筛
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
Python实现关联规则推荐这孩子谁懂哈 Python Machine Learning python 关联规则机器学习
1.什么关联规则关联规则（AssociationRules）是反映一个事物与其他事物之间的相互依存性和关联性，如果两个或多个事物之间存在一定的关联关系，那么，其中一个事物就能通过其他事物预测到。关联规则是数据挖掘的一个重要技术，用于从大量数据中挖掘出有价值的数据项之间的相关关系。关联规则挖掘的最经典的例子就是沃尔玛的啤酒与尿布的故事，通过对超市购物篮数据进行分析，即顾客放入购物篮中不同商品之间的关
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
郭生白中药方论之二(破除温凉寒热的框框) 本能学堂a昨年
离病说药茫茫然，对症下药不着边。顺势利导一乘法，排异调节渡法船。无限整合非模糊，模糊病区得清楚。共性之外求个性，亲和不生抗药性。温凉寒热巧方便，君臣佐使筏喻焉。药包大小折中看，毒性有无一念间。导读破除温凉寒热的框框寒热温凉是基于中药共性的传统分类药无寒热人有寒热药无寒热病有寒热抛弃温凉不并用的错误观念寒热温凉是基于中药共性的传统分类寒热温凉是个共性，是说的共性。这个共性，知道什么叫共性吗？所有的药
2022-04-25 L是木子李呢
上门维修APP开发应具备哪些功能随着移动互联网的不断发展，上门维修在我们生活中已经是非常普遍的存在了，为了给用户更方便的找到上门维修的渠道，上门维修APP应运而生，那么上门维修APP开发应具备哪些功能呢？1、维修门店搜索为了更好地方便用户省时省力，上门维修APP会依据用户定位信息搜索线下实体店，促使用户更好的找到线下维修店面，省时又省力。2、维修服务分类包括管道洁具维修、强电弱电维修、木工维修、粉
二十四、k8s 资源管理繁华依在 k8s kubernetes 容器云原生
目录一、资源配置范围管理LimitRange介绍1、LimitRange可以做什么：2、资源限制和请求的约束3、创建LimitsRange对象4、示例：创建一个pod5、测试用例测试1：测试2：测试3：二、资源服务质量管理（RequestsQos）1、Qos级别分类：1.1、Guaranteed：1.2、BestEffort：1.3、Burstable：2、Qos的工作特点3、示例三、资源配额管理
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
教师资格考试中学《教育知识与能力》知识点｜高频考点汇总小山丘
温馨提示：更多汇总详情留言小编哦！！！认知过程之易混知识点剖析社会中心课程论情绪——重要考点皮亚杰教你带孩子斯金纳强化规律你的心理足够强大吗?教育心理学的效应德育有规律常考人物思想之夸美纽斯中学常考教学原则孔子及《论语》中的重要教育思想教育学创立阶段人物之赫尔巴特学习策略分类知识点梳理教师资格证辨析题作答思路综合课程的类型班杜拉的学习理论马斯洛需要层次理论记忆类型的四大分类柏拉图和他的《理想国》感
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
MySQL锁沉着冷静2024 MySQL mysql 数据库
MySQL锁文章目录MySQL锁MySQL中锁的分类创建索引时会锁表吗线上修改表结构会加什么锁Innodb存储引擎的行级锁有哪些Update语句中，不带where条件，加什么锁？MySQL实现乐观锁MySQL死锁MySQL死锁是怎么发生的？检查死锁如何避免死锁MySQL中锁的分类全局锁：主要用于全库逻辑备份表级锁：表锁、元数据锁、意向锁表锁：通过locktables语句对表进行加锁，它不仅限制其他
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
外卖返利宝app下载外卖返利宝(外卖红包返现软件) 氧惠购物达人
外卖返利软件是可以帮助用户进行点外卖省钱以及点外卖之后获得返利的外卖返利软件分类合集，外卖返利软件可以帮助喜欢点外卖的用户省钱以及获得返利实惠，外卖返利软件中每日都有大量优惠券赠送活动，还有霸王餐可以秒杀，获得霸王餐的机会，用户可以直接免单外卖，不用花费一分钱。小编这里推荐了多款外卖返利软件。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。
STM32的寄存器深度解析千千道 STM32 stm32 单片机物联网
目录一、STM32寄存器概述二、寄存器的定义与作用三、寄存器分类1.内核寄存器2.外设寄存器四、重要寄存器详解1.GPIO相关寄存器2.定时器相关寄存器3.中断相关寄存器4.RCC相关寄存器五、寄存器操作方法1.直接操作寄存器2.使用库函数操作寄存器六、总结在嵌入式系统开发中，STM32微控制器以其强大的性能和丰富的功能而备受青睐。而理解和掌握STM32的寄存器是深入学习和开发STM32的关键。本
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
小学数学知识记忆的六大技巧海韵互联
记忆是知识的仓库，学过的知识记得牢，积累的知识就丰富，而丰富知识的积累将为创造型人才的培养奠定坚实的基础。如何才能提高学生记忆数学知识的效果呢？下面为大家介绍六种技巧，具体内容如下：一、归类归类记忆法就是根据识记材料的性质、特征及其内在联系，进行归纳分类，以便帮助学生记忆大量的知识。比如，学完计量单位后，可以把学过的所有内容归纳为五类：长度单位；面积单位；体积和容积单位；重量单位；时间单位。这样归
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文