再见十月的朋友

现代卷积神经网络笔记

深度卷积神经网络(AlexNet)

学习表征

特征本身应该被学习；在合理地复杂性前提下，特征应该由多个共同学习的神经网络层组成，每个层都有学习的参数。在机器视觉中，最底层可能检测边缘、颜色和纹理。

AlexNet

2012年，AlexNet横空出世。首次证明学习到的特征可以超越手工设计的特征。AlexNet使用8层卷积神经网络：5个卷积层、2个全连接隐藏层和1个全连接输出层。AlexNet使用ReLU作为其激活函数。

模型设计

在AlexNet的第一层，卷积窗口的形状是 $11 * 11$ 。由于ImageNet中大多数图像的宽和高比MNIST的多10倍以上，因此需要一个更大的卷积窗口来捕获目标。第二层的卷积窗口形状缩减为 $5 * 5$ ，然后是 $3 * 3$ 。此外，在第一层、第二层和第5层卷积层之后，加入窗口形状为 $3 * 3$ 、步幅为2的最大汇聚层。AlexNet卷积通道数目是LeNet的10倍。

激活函数

AlexNet将ReLU作为激活函数，⼀⽅⾯，ReLU激活函数的计算更简单；另⼀⽅⾯，当使⽤不同的参数初始化⽅法时，ReLU激活函
数使训练模型更加容易。

容量控制和预处理

AlexNet通过暂退法控制全连接层的模型复杂度，而LeNet只使用权重衰减。为了进⼀步扩充数据，AlexNet在训练时增加了⼤量的图像增强数据，如翻转、裁切和变⾊。这使得模型更健壮，更⼤的样本量有效地减少了过拟合。

import torch
from torch import nn
from d2l import torch as d2l

net = nn.Sequential(
	nn.Conv2d(1,96,kernel_size=11, stride=4, padding=1), nn.ReLU(),
	nn.MaxPool2d(kernel_size=3,stride=2),
	nn.Conv2d(96,256,kernel_size=5, padding=2), nn.ReLU(),
	nn.MaxPool2d(kernel_size=3,stride=2),
	nn.Conv2d(256,384,kernel_size=3, padding=1), nn.ReLU(),
	nn.Conv2d(384,384,kernel_size=3, padding=1), nn.ReLU(),
	nn.Conv2d(384,256,kernel_size=3, padding=1), nn.ReLU(),
	nn.MaxPool2d(kernel_size=3,stride=2),
	nn.Flatten(),
	nn.Linear(6400, 4096), nn.ReLU(),
	nn.Dropout(p=0.5),
	nn.Linear(4096, 4096), nn.ReLU(),
	nn.Dropout(p=0.5),
	nn.Linear(4096, 10))

X = torch.randn(1, 1, 224, 224)
for layer in net:
	X=layer(X)
	print(layer.__class__.__name__,'output shape:\t',X.shape)
# Conv2d output shape:	 torch.Size([1, 96, 54, 54])
# ReLU output shape:	 torch.Size([1, 96, 54, 54])
# MaxPool2d output shape:	 torch.Size([1, 96, 26, 26])
# Conv2d output shape:	 torch.Size([1, 256, 26, 26])
# ReLU output shape:	 torch.Size([1, 256, 26, 26])
# MaxPool2d output shape:	 torch.Size([1, 256, 12, 12])
# Conv2d output shape:	 torch.Size([1, 384, 12, 12])
# ReLU output shape:	 torch.Size([1, 384, 12, 12])
# Conv2d output shape:	 torch.Size([1, 384, 12, 12])
# ReLU output shape:	 torch.Size([1, 384, 12, 12])
# Conv2d output shape:	 torch.Size([1, 256, 12, 12])
# ReLU output shape:	 torch.Size([1, 256, 12, 12])
# MaxPool2d output shape:	 torch.Size([1, 256, 5, 5])
# Flatten output shape:	 torch.Size([1, 6400])
# Linear output shape:	 torch.Size([1, 4096])
# ReLU output shape:	 torch.Size([1, 4096])
# Dropout output shape:	 torch.Size([1, 4096])
# Linear output shape:	 torch.Size([1, 4096])
# ReLU output shape:	 torch.Size([1, 4096])
# Dropout output shape:	 torch.Size([1, 4096])
# Linear output shape:	 torch.Size([1, 10])

读取数据集

batch_size = 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)

训练AlexNet

lr, num_epochs = 0.01, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

小结

AlexNet的架构与LeNet相似，但使用更多的卷积层和更多的参数来拟合大规模的ImageNet数据集。

Dropout、ReLU和预处理是提升计算机视觉任务性能的其他关键步骤。

VGG块网络

虽然AlexNet证明深层网络卓有成效，但没有提供一个通用的模板来指导后续的研究人员设计新的网络。牛津大学的视觉几何组(visualgeometry group)首先提出使用块的想法，并应用在VGG网络中。通过使用循环和子程序，可以更容易地在任何现代深度学习框架的代码中实现这些重复的架构。

VGG块

经典卷积神经网络的基本组成部分：

带填充以保持分辨率的卷积层；

非线性激活函数，如ReLU；

汇聚层，如最大汇聚层。

而一个VGG块与之类似，由一系列卷积层组成，后面再加上用于空间下采样的最大汇聚层。

import torch
from torch import nn
from d2l import torch as d2l

def vgg_block(num_convs, in_channels, out_channels):
	layers = []
	for _ in range(num_convs):
		layers.append(nn.Conv2d(in_channels,out_channels,kernel_size=3,padding=1))
		layers.append(nn.ReLU())
		in_channels = out_channels
	layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
	return nn.Sequential(*layers)

VGG网络

VGG⽹络可以分为两部分：第⼀部分主要由卷积层和汇聚层组成，第⼆部分由全连接层组成。

conv_arch = ((1,64),(1,128),(2,256),(2,512),(2,512))
def vgg(conv_arch):
	conv_blks=[]
	in_channels=1
	# 卷积层部分
	for (num_convs, out_channels) in conv_arch:
		conv_blks.append(vgg_block(num_convs, in_channels, out_channels))
		in_channels = out_channels

	return nn.Sequential(*conv_blks, nn.Flatten(),
		# 全连接层
		nn.Linear(out_channels*7*7, 4096), nn.ReLU(), nn.Dropout(0.5),
		nn.Linear(4096, 4096), nn.ReLU(), nn.Dropout(0.5),
		nn.Linear(4096, 10))
net = vgg(conv_arch)

X = torch.randn(size=(1, 1, 224, 224))
for blk in net:
	X = blk(X)
	print(blk.__class__.__name__,'output shape:\t',X.shape)
# Sequential output shape:	 torch.Size([1, 64, 112, 112])
# Sequential output shape:	 torch.Size([1, 128, 56, 56])
# Sequential output shape:	 torch.Size([1, 256, 28, 28])
# Sequential output shape:	 torch.Size([1, 512, 14, 14])
# Sequential output shape:	 torch.Size([1, 512, 7, 7])
# Flatten output shape:	 torch.Size([1, 25088])
# Linear output shape:	 torch.Size([1, 4096])
# ReLU output shape:	 torch.Size([1, 4096])
# Dropout output shape:	 torch.Size([1, 4096])
# Linear output shape:	 torch.Size([1, 4096])
# ReLU output shape:	 torch.Size([1, 4096])
# Dropout output shape:	 torch.Size([1, 4096])
# Linear output shape:	 torch.Size([1, 10])

训练模型

net = vgg(conv_arch)
batch_size = 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)

lr, num_epochs = 0.05, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr,  d2l.try_gpu())

小结

VGG-11使用可复用的卷积块构造网络。不同的VGG模型可通过每个块中卷积层数量和输出通道数量的差异来定义。

块的使用导致网络定义非常简洁。使用块可以有效地设计复杂的网络。

在VGG论文中，Simonyan和Ziserman尝试了各种架构。特别是发现深层且窄的卷积( $3 * 3$ )比浅层且宽的卷积更有效。

网络中的网络(NiN)

LeNet、AlexNet和VGG都有一个共同的设计模式：通过一系列的卷积层与汇聚层来提取空间结构特征；然后通过全连接层对特征的表征进行处理。AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。设想，在这个过程的早期使用全连接层，即便可能会完全放弃表征的空间结构。网络中的网络(NiN)提供了一个非常简单的解决方案：在每个像素的通道上分别使用多层感知机。

NiN块

卷积层的输入和输出由四维张量组成，张量的每个轴分别对应样本、通道、高度和宽度。另外，全连接层的输入和输出通道通常是分别对应于样本和特征的二维张量。NiN的相反是在每个像素位置应用一个全连接层。将权重连接到每个空间位置，可以将其视为 $1 * 1$ 卷积层，或作为在每个像素位置上独立作用的全连接层。从另一个角度看，即将空间维度中的每个像素视为单个样本，将通道维度视为不同特征(feature)。
NiN块以一个普通卷积层开始，后面是两个 $1 * 1$ 的卷积层。这两个 $1 * 1$ 卷积层充当带有ReLU激活函数的逐像素全连接层。第一层的卷积窗口形状通常由用户设置，随后的卷积窗口形状固定为 $1 * 1$ 。

import torch
from torch import nn
from d2l import torch as d2l

def nin_block(in_channels, out_channels,kernel_size,stride, padding):
	return nn.Sequential(nn.Conv2d(in_channels,out_channels,kernel_size,stride,padding), nn.ReLU(),
						 nn.Conv2d(out_channels,out_channels,kernel_size=1),nn.ReLU(),
						 nn.Conv2d(out_channels,out_channels,kernel_size=1),nn.ReLU())

NiN模型

最初的NiN网络是在AlexNet后不久提出的，显然从中得到了一些启示。NiN使用窗口形状为 $11 * 11$ 、 $5 * 5$ 和 $3 * 3$ 的卷积层，输出通道数量与AlexNet中的相同。每个NiN块后有一个最大汇聚层，汇聚窗口形状为 $3 * 3$ ，步幅为2。
NiN和AlexNet之间的一个显著区别是NiN完全取消了全连接层。相反，NiN使用一个NiN块，其输出通道数等与标签类别的数量。最后放一个全局平局汇聚层(global average pooling layer)，生成一个对数几率(logits)。NiN设计的一个优点是，它显著减少了模型所需参数的数量。然而，在实践中，射中设计有时会增加训练模型的实践。

net = nn.Sequential(nin_block(1,96,kernel_size=11,stride=4,padding=0),
					nn.MaxPool2d(3, stride=2),
					nin_block(96,256,kernel_size=5,stride=1,padding=2),
					nn.MaxPool2d(3, stride=2),
					nin_block(256,384,kernel_size=3,stride=1,padding=1),
					nn.MaxPool2d(3, stride=2),
					nn.Dropout(0.5),
					nin_block(384,10,kernel_size=3,stride=1,padding=1),
					nn.AdaptiveAvgPool2d((1, 1)),
					nn.Flatten())

X = torch.rand(size=(1, 1, 224, 224))
for layer in net:
	X = layer(X)
	print(layer.__class__.__name__,'output shape:\t', X.shape)
# Sequential output shape:	 torch.Size([1, 96, 54, 54])
# MaxPool2d output shape:	 torch.Size([1, 96, 26, 26])
# Sequential output shape:	 torch.Size([1, 256, 26, 26])
# MaxPool2d output shape:	 torch.Size([1, 256, 12, 12])
# Sequential output shape:	 torch.Size([1, 384, 12, 12])
# MaxPool2d output shape:	 torch.Size([1, 384, 5, 5])
# Dropout output shape:	 torch.Size([1, 384, 5, 5])
# Sequential output shape:	 torch.Size([1, 10, 5, 5])
# AdaptiveAvgPool2d output shape:	 torch.Size([1, 10, 1, 1])
# Flatten output shape:	 torch.Size([1, 10])

训练模型

lr, num_epochs, batch_size = 0.1, 10, 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

小结

NiN使用由一个卷积层和多个 $1 * 1$ 卷积层组成的块。该块可以在卷积神经网络中使用，以允许更多的每像素非线性。

NiN去除了容易造成过拟合的全连接层，将它们替换为全局平均汇聚层(即在所有位置上进行求和)。该汇聚层通道数为所需的输出数量。

移除全连接层可减少过拟合，同时显著减少NiN参数

NiN的设计影响了许多后续卷积神经网络的设计。

含并行连结的网络(GoogLeNet)

Inception块

在GoogLeNet中，基本的卷积块被称为Inception块。Inception块由四条并行路径组成。前三条路径使用窗口大小分别为 $1 * 1$ 、 $3 * 3$ 和 $5 * 5$ 的卷积层，从不同空间大小中提取信息。中间的两条路径在输入上执行 $1 * 1$ 卷积，以减少通道数，从而降低模型的复杂性。第四条路径使用 $3 * 3$ 最大汇聚层，然后使用 $1 * 1$ 卷积层来改变通道数。这四条路径都使用合适的填充来使输入月输出的高和宽一致，最后将每条线路的输出在通道维度上连结，并构成Inception块的输出。在Inception块中，通常调整的超参数是每层输出通道数。

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

class Inception(nn.Module):
	def __init__(self, in_channels, c1, c2, c3, c4, **kwargs):
		super(Inception, self).__init__(**kwargs)
		self.p1_1 = nn.Conv2d(in_channels, c1, kernel_size=1)
		self.p2_1 = nn.Conv2d(in_channels, c2[0], kernel_size=1)
		self.p2_2 = nn.Conv2d(c2[0],c2[1], kernel_size=3, padding=1)
		self.p3_1 = nn.Conv2d(in_channels, c3[0], kernel_size=1)
		self.p3_2 = nn.Conv2d(c3[0],c3[1], kernel_size=5, padding=1)
		self.p4_1 = nn.MaxPool2d(3,stride=1,padding=1)
		self.p4_2 = nn.Conv2d(in_channels, c4, kernel_size=1)

	def forward(self, x):
		p1 = F.relu(self.p1_1(x))
		p2 = F.relu(self.p2_2(F.relu(self.p2_1(x))))
		p3 = F.relu(self.p3_2(F.relu(self.p3_1(x))))
		p4 = F.relu(self.p4_2(self.p4_1(x)))
		return torch.cat((p1,p2,p3,p4), dim=1)

GoogLeNet模型

GoogLeNet⼀共使⽤9个Inception块和全局平均汇聚层的堆叠来⽣成其估计值。Inception块之间的最⼤汇聚层可降低维度。第⼀个模块类似于AlexNet和LeNet，Inception块的组合从VGG继承，全局平均汇聚层避免了在最后使⽤全连接层。

第一个模块使用64个通道、 $7 * 7$ 卷积层。第二个模块使用两个卷积层：一个卷积层是64个通道、 $1 * 1$ 卷积层；第二个卷积层使用将通道数量增加三倍的 $3 * 3$ 卷积层。这对应于Inception块中的第二条路径。

b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3), nn.ReLU(),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b2 = nn.Sequential(nn.Conv2d(64, 64, kernel_size=1),nn.ReLU(),
                   nn.Conv2d(64, 192, kernel_size=3, padding=1),nn.ReLU(),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b3 = nn.Sequential(Inception(192, 64, (96, 128), (16, 32), 32),
                   Inception(256, 128, (128, 192), (32, 96), 64),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b3 = nn.Sequential(Inception(192, 64, (96, 128), (16, 32), 32),
                   Inception(256, 128, (128, 192), (32, 96), 64),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b4 = nn.Sequential(Inception(480, 192, (96, 208), (16, 48), 64),
                   Inception(512, 160, (112, 224), (24, 64), 64),
                   Inception(512, 128, (128, 256), (24, 64), 64),
                   Inception(512, 112, (144, 288), (32, 64), 64),
                   Inception(528, 256, (160, 320), (32, 128), 128),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b5 = nn.Sequential(Inception(832, 256, (160, 320), (32, 128), 128),
                   Inception(832, 384, (192, 384), (48, 128), 128),
                   nn.AdaptiveAvgPool2d((1,1)),
                   nn.Flatten())
net = nn.Sequential(b1, b2, b3, b4, b5, nn.Linear(1024, 10))

X = torch.rand(size=(1, 1, 96, 96))
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape:\t', X.shape)
# Sequential output shape:	 torch.Size([1, 64, 24, 24])
# Sequential output shape:	 torch.Size([1, 192, 12, 12])
# Sequential output shape:	 torch.Size([1, 480, 6, 6])
# Sequential output shape:	 torch.Size([1, 832, 3, 3])
# Sequential output shape:	 torch.Size([1, 1024])
# Linear output shape:	 torch.Size([1, 10])

训练

lr, num_epochs, batch_size = 0.1, 10, 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

批量规范化

训练深层神经网络是十分困难的，特别是在较短的时间内使它们收敛。在本节中，将介绍批量规范化(batch normalization)，这是一种流行且有效的技术，可持续加速深层网络的收敛速度。

训练深层网络

为什么需要批量规范化层呢？
回归一下训练神经网络时出现的一些实际挑战：

首先，数据预处理的方式通常会对最终结果产生巨大影响。使用真实数据时，第一步是标准化输入特征，使其均值为0，方差为1。直观地说，这种标准化可以很好地与优化器配合使用，因为它可以将参数的量级进行统一。

第二，对于典型的多层感知机或卷积神经网络。训练时，中间层的变量可能具有更广的变化范围：不论是沿着从输入到输出的层，跨同一层中的单元，或是随着时间的推移，模型参数随着训练更新变化莫测。批量规范化的发明者非正式地假设，这些变量分布中的这种偏移可能会阻碍网络的收敛。直观地说，我们可能会猜想，如果一个层的可变值是另一层的100倍，这可能需要对学习率进行补偿调整。

第三，更深层的网络很复杂，容易过拟合。这意味着正则化变得更加重要。

批量规范化应用于单个可选层(也可以应用到所有层)，其原理如下：

在每次训练迭代中，首先规范化输入，即通过减去其均值并除以其标准差，其中两者均基于当前小批量处理。

接下来，应用比例系数和比例偏移。

正是由于这个基础批量统计的标准化，才有了批量规范化的名称。注意，如果使用大小为1的小批量应用批量规范化，我们将无法学到任何东西。这是因为在减去均值之后，每个隐藏单元将为0。所以，只有使用足够多的小批量，批量规范化操作才是有效且稳定的。在应用批量规范化时，批量大小的选择可能比没有批量规范化时更重要。

从形式上来说，用 $\bold x \in \Beta$ 表示一个来自小批量 $\Beta$ 的输入，批量规范化BN根据以下表达式转换 $\bold x$ ： $BN(\bold x)=\gamma \odot \frac{\bold x -\bold {\hat{\mu_{\Beta}}}}{\bold {\hat{\sigma_\Beta}}}$
其中， $\bold{\hat{\mu_{\Beta}}}$ 是小批量 $\bold{\Beta}$ 的样本均值， $\bold{\hat{\sigma_{\Beta}}}$ 是小批量 $\bold{\Beta}$ 的样本标准差。应用标准化后，生成的小批量的平均值为0和单位方差为1。由于单位方差是一个主观的选择，因此通常包含拉伸参数(scale) $\gamma$ 和偏移参数(shift) $\beta$ ，它们的形状与 $\bold x$ 相同。注意， $\gamma$ 和 $\beta$ 是需要与其他模型参数一起学习的参数。由于在训练过程中，中间层的变化幅度不能过于强烈，而批量规范化将每一层主动居中，并将它们重新调整为给定的平均值和大小(通过 $\bold {\hat \mu_{\Beta}}$ 和 $\bold {\hat \sigma_{\Beta}}$ )。

从形式上来说，我们计算出的 $\bold {\hat \mu_{\Beta}}$ 和 $\bold {\hat \sigma_{\Beta}}$ 为如下公式所示：
$\bold {\hat \mu_{\Beta}}=\frac{1}{|{\Beta}|} \sum_{\bold x \in \bold \Beta} \bold x$ $\bold {\hat \sigma_{\Beta}^2} = \frac{1}{|{\Beta}|} \sum_{\bold x \in \bold \Beta} (\bold x - \bold {\hat \mu_{\Beta}})^2 + \epsilon$
注意，在方差估计值中添加一个小的常量 $\epsilon >0$ ，以确保永远不会尝试除以零。估计值 $\bold {\hat \mu_{\Beta}}$ 和 $\bold {\hat \sigma_{\Beta}}$ 通过使用平均值和方差的噪声(noise)估计来抵消缩放问题。你可能会认为这种噪声是一个问题，而事实上它是有益的。
事实证明，这是深度学习中一个反复出现的主题。虽然在理论上尚未明确原因，但优化中的各种噪声源通常会导致更快的训练和较少的过拟合，这种变化似乎是正则化的一种形式。
另外，批量规范化层在"训练模式"(通过小批量统计数据规范化)和“预测模式”（通过数据集统计规范化）中的功能不同。在训练过程中，我们无法得知使用整个数据集来估计平均值和方差，所以智能根据每个小批量的平均值和方差不断训练模型。而在预测模式下，可以根据整个数据集进度计算批量规范化所需的平均值和方差。

批量规划化层

批量规范化和其他层之间的一个关键区别是，由于批量规范化在完整的小批量上运行，因此我们不能忽略批量大小。下面讨论全连接层和卷积层两种情况的批量规范化实现。

全连接层

通常，我们将批量规范化层置于全连接层中的仿射变换和激活函数之间。设全连接层的输入为 $x$ ，权重参数和偏置参数分别是 $\bold w$ 和 $\bold b$ ，激活函数为 $\Phi$ ，批量规范化的运算符为 $BN$ 。那么，使用批量规范化的全连接层的输出计算为： $\bold h = \phi(BN(\bold {Wx + b}))$

卷积层

同样，对于卷积层，可以在卷积层之后和非线性激活函数之前应用批量规范化。当卷积层由多个输出通道时，需要对这些通道的“每个”输出执行批量规范化，每个通道都有自己的拉伸（scale）和偏移（shift）参数，这两个参数都是标量。假设小批量包含m个样本，并且对于每个通道，卷积的输出具有高度p和宽度q。那么对于卷积层，在每个输出通道的mpq个元素上同时执行每个批量规划化。因此，在计算平均值和方差时，会收集所有空间位置的值，然后在给定通道内应用相同的均值和方差，以便在每个空间位置对值进行规范化。

预测过程中的批量规划化

批量规范化在训练模式和预测模式下的行为通常不同。首先，将训练好的模型用于预测时，不再需要样本均值中的噪声以及在小批量上估计每个小批次产生的样本方差。其次，例如，我们可能需要使用我们的模型对逐个样本进行预测。一种常用的方法是通过移动平均估算整个训练数据集的样本均值和方差，并在预测时使用它们得到确定的输出。可见，和暂退法一样，批量规范化层在训练模式和预测模式下的计算结果也是不一样的。

从零实现

import torch
from torch import nn
from d2l import torch as d2l

def batch_norm(X, gamma, beta, moving_mean, moving_var, eps, momentum):
	# 通过is_grad_enabled来判断当前模式是训练模式还是预测模式
	if not torch.is_grad_enabled():
		# 在预测模式下，直接使用传入的均值和方差
		X_hat = (X-moving_mean)/torch.sqrt(moving_var+eps)
	else:
		assert len(X.shape) in (2,4)
		if len(X.shape) == 2:
			# 使用全连接层的情况，计算特征维度上的均值和方差
			mean = X.mean(dim=0)
			var = ((X-mean)**2).mean(dim=0)
		else:
			# 使用卷积层的情况，计算通道维度上的均值和方差
			mean = X.mean(dim=(0, 2, 3), keepdim=True)
			var = ((X - mean) ** 2).mean(dim=(0, 2, 3), keepdim=True)
		# 训练模式下，用当前的均值和方差做标准化
		X_hat = (X - mean) / torch.sqrt(var + eps)
		# 更新移动平均的均值和方差
		moving_mean = momentum * moving_mean + (1.0 - momentum) * mean
		moving_var = momentum * moving_var + (1.0 - momentum) * var
	Y = gamma * X_hat + beta # 缩放和移位
	return Y,moving_mean.data, moving_var.data

撇开算法细节，注意我们实现层的基础设计模式。通常情况下，我们用一个单独的函数定义其数学原理，比如说batch_norm。然后，我们将此功能集成到一个自定义层中，其代码主要处理数据移动到训练设备、分配和初始化任何必需的变量、跟踪移动平均线等问题。为了方便起见，我们并不担心在这里自动推断输入形状，因此我们需要指定整个特征的数量。

class BatchNorm(nn.Module):
	# num_features: 全连接层的输出数量或卷积层的输出通道数
	# num_dims： 2表示完全连接层，4表示卷积层
	def __init__(self, num_features, num_dims):
		super().__init__()
		if num_dims == 2:
			shape = (1, num_features)
		else:
			shape = (1, num_features, 1, 1)
		# 参与求梯度和迭代的拉伸和偏移参数，分别初始化为1.0和0.0
		self.gamma = nn.Parameter(torch.ones(shape))
		self.beta = nn.Parameter(torch.zeros(shape))
		# 非模型参数的变量初始化为0和1
		self.moving_mean = torch.zeros(shape)
		self.moving_var = torch.ones(shape)

	def forward(self, X):
		# 如果X不在内存上，将moving_mean和moving_var复制到X所在显存上
		if self.moving_mean.device != X.device:
			self.moving_mean = self.moving_mean.to(X.device)
			self.moving_var = self.moving_var.to(X.device)
		# 保存更新过的moving_mean和moving_var
		Y, self.moving_mean, self.moving_var = batch_norm(X, self.gamma, self.beta, self.moving_mean, self.moving_var, eps=1e-5, momentum=0.9)
		return Y

使用批量规划范层的LeNet

net = nn.Sequential(
	nn.Conv2d(1,6,kernel_size=5),BatchNorm(6,num_dims=4), nn.Sigmoid(),
	nn.AvgPool2d(kernel_size=2,stride=2),
	nn.Conv2d(6,16,kernel_size=5),BatchNorm(16,num_dims=4), nn.Sigmoid(),
	nn.AvgPool2d(kernel_size=2, stride=2), nn.Flatten(),
	nn.Linear(16*4*4, 120), BatchNorm(120, num_dims=2), nn.Sigmoid(),
	nn.Linear(120, 84), BatchNorm(84, num_dims=2), nn.Sigmoid(),
	nn.Linear(84, 10))

lr, num_epochs, batch_size = 1.0, 10, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

简洁实现

net = nn.Sequential(
	nn.Conv2d(1,6,kernel_size=5),nn.BatchNorm2d(6), nn.Sigmoid(),
	nn.AvgPool2d(kernel_size=2,stride=2),
	nn.Conv2d(6,16,kernel_size=5),nn.BatchNorm2d(16), nn.Sigmoid(),
	nn.AvgPool2d(kernel_size=2, stride=2), nn.Flatten(),
	nn.Linear(16*4*4, 120),  nn.BatchNorm1d(120), nn.Sigmoid(),
	nn.Linear(120, 84),  nn.BatchNorm1d(84), nn.Sigmoid(),
	nn.Linear(84, 10))

小结

在模型训练过程中，批量规划化利用小批量的均值和标准差，不断调整神经网络的中间输出，使真个神经网络各层的中间输出值更加稳定。

批量规范化在全连接层和卷积层的使用略有不同。

批量规范化和暂退层一样，在训练模式和预测模式下计算不同。

批量规范化有许多有益的副作用，主要是正则化。另一方面，“减少内部协变量偏移”的原始动机似乎不是一个有效的解释。

残差网络(resnet)

随着我们设计越来越深的网络，深刻理解“新添加的层如何提升神经网络的性能”变得至关重要。更重要的是设计网络的能力，在这种网络中，添加层会使网络更具表现力，为了取得质的突破，我们需要一些数学基础知识。

函数类

首先，假设有一类特定的神经网络架构 $F$ ，它包括学习速率和其他超参数设置。对于所有 $f\in F$ ，存在一些参数集(例如权重和偏置)，这些参数可以通过在合适的数据集上进行训练而获得。现在假设 $f^*$ 是我们真正想要找到的函数，如果是 $f^*\in F$ ，那么我们可以轻而易举的训练得到它，但通常我们不会那么幸运。相反，我们将尝试找到一个函数 $f^*_F$ ，这是我们在 $F$ 中的最佳选择。例如，给定一个具有 $\bold x$ 和 $\bold y$ 标签的数据集，我们可以尝试通过解决一下优化问题找到它： $f^*_F:= argmin_f L(\bold {X,y,f}) \space subject \space {to} \space f \in F$
那么，怎样得到更近似真正 $f^*$ 的函数呢？唯一合理的可能性是，我们需要设计一个更强大的架构 $F^{'}$ 。换句话说，我们预计 $f{^*}{_{F'}}$ 比 $f{^*}{_{F}}$ “更近似”。然而，如果，果F ̸⊆ F′，则无法保证新的体系更近似。

因此，只有当较复杂的函数类包含较小的函数类时，我们才能确保提高它们的性能。对于深度神经网络，如果我们能将新添加的层训练成恒等映射(identity function) $f(\bold x) = \bold x$ ，新模型和原模型将同样有效。同时，由于新模型可能得出更优的解来拟合训练数据集。因此添加层似乎更容易降低训练误差。
针对这一问题,何恺明等人提出了残差网络(ResNet)。它在2015年的ImageNet图像识别挑战赛夺魁，并深刻影响了后来的深度神经网络的设计。残差网络的核心思想：每个附加层都应该更容易地包含原始函数作为其元素之一。于是，残差块(residual blocks)便诞生了。这个设计对如何建立深层神经网络产生了深远的影响。

残差块

假设我们的原始输入为 $x$ ，而希望学出的理想映射为 $f(\bold x)$ 。左图虚线框部分需要直接拟合出该映射 $f(\bold x)$ ，而右图虚线框部分这需要拟合出残差映射 $f(\bold x) - \bold x$ 。残差映射在现实中往往更容易优化。以本节开头提到的恒等映射作为希望学出的理想映射，只需将右图虚线框内上方的加权运算的权重和偏置参数设置成0，那么 $f(\bold x)$ 即为恒等映射。十几种，当理想映射 $f(\bold x)$ 接近于恒等映射时，残差映射也易于捕捉恒等映射的细微波动。右图是ResNet的基础架构-残差块(residual block)。在残差块中，输入可通过跨层数据线路更快地向前传播。

ResNet沿用了VGG完整的 $3 * 3$ 卷积层设计。残差块里首先有2个相同输出通道数的 $3 * 3$ 卷积层。每个卷积层后接一个批量规范化层和ReLU激活函数。然后通过跨层数据通路，跳过这2个卷积运算，将输入直接加在最后的ReLU激活函数前。这样的设计要求2个卷积层的输出与输入形状一样，从而使它们可以相加。如果想改变通道数，就需要引入一个额外的 $1 * 1$ 卷积层来将输入变换成需要的形状后再做相加运算。残差块的实现如下：

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

class Residual(nn.Module):
	def __init__(self, inputs_channels, num_channels, use_1x1conv=False, strides=1):
		super().__init__()
		self.conv1 = nn.Conv2d(inputs_channels, num_channels, kernel_size=3, padding=1, stride=strides)
		self.conv2 = nn.Conv2d(num_channels,num_channels, kernel_size=3,padding=1)
		if use_1x1conv:
			self.conv3 = nn.Conv2d(inputs_channels,num_channels, kernel_size=1,stride=strides)
		else:
			self.conv3 = None
		self.bn1 = nn.BatchNorm2d(num_channels)
		self.bn2 = nn.BatchNorm2d(num_channels)
	def forward(self, X):
		Y = F.relu(self.bn1(self.conv1(X)))
		Y = self.bn2(self.conv2(Y))
		if self.conv3:
			X = self.conv3(X)
		Y += X
		return F.relu(Y)

此代码生成两种类型的网络：一种是当 $use_1x1conv=False$ 时，应用ReLU非线性函数之前，将输入添加到输出。另一种是当 $use_1x1conv=True$ 时，添加通过 $1 * 1$ 卷积调整通道和分辨率。

示例查看输入和输出形状一致的情况；以及增加输出通道，减半高和宽的情况。

blk = Residual(3,3)
X = torch.rand(4,3,6,6)
Y = blk(X)
Y.shape # torch.Size([4, 3, 6, 6])
blk = Residual(3,6, use_1x1conv=True, strides=2)
blk(X).shape # torch.Size([4, 6, 3, 3])

ResNet模型

ResNet的前两层跟之前介绍的GoogLeNet模型一样：在输出通道为64、步幅为2的 $7 * 7$ 卷积层后，接步幅为2的 $3 * 3$ 的最大池化层。不同之处在于ResNet每个卷积层后增加批量规范化层。

b1 = nn.Sequential(
    nn.Conv2d(1,64,kernel_size=7,stride=2, padding=3),
    nn.BatchNorm2d(64), nn.ReLU(),
    nn.MaxPool2d(kernel_size=3,stride=2,padding=1))

GoogLeNet在后面接了4个由Inception块组成的模块。ResNet则使用4个由残差块组成的模块，每个模块使用若干个同样输出通道数的残差块。第一个模块的通道数同输入通道数一致。由于之前已经使用了步幅为2的最大汇聚层，所以无需减小高和宽。之后的每个模块在第一个残差块里将上一个模块的通道数翻倍，并将高和宽减半。

def resnet_block(input_channels, num_channels, num_residuals, first_block=False):
	blk = []
	for i in range(num_residuals):
		if i == 0 and not first_block:
			blk.append(Residual(input_channels, num_channels,use_1x1conv=True,strides=2))
		else:
			blk.append(Residual(num_channels, num_channels))
	return blk

b2 = nn.Sequential(*resnet(64,64,2,first_block=True))
b3 = nn.Sequential(*resnet(64, 128, 2))
b4 = nn.Sequential(*resnet(128, 256, 2))
b5 = nn.Sequential(*resnet(256, 512, 2))

net = nn.Sequential(b1,b2,b3,b4,b5,nn.AdaptiveAvgPool2d((1,1)),
					nn.Flatten(), nn.Linear(512,10))

X = torch.rand(size=(1, 1, 224, 224))
for layer in net:
    X = layer(X)
    print(layer.__class__.__name__,'output shape:\t', X.shape)
# Sequential output shape:	 torch.Size([1, 64, 56, 56])
# Sequential output shape:	 torch.Size([1, 64, 56, 56])
# Sequential output shape:	 torch.Size([1, 128, 28, 28])
# Sequential output shape:	 torch.Size([1, 256, 14, 14])
# Sequential output shape:	 torch.Size([1, 512, 7, 7])
# AdaptiveAvgPool2d output shape:	 torch.Size([1, 512, 1, 1])
# Flatten output shape:	 torch.Size([1, 512])
# Linear output shape:	 torch.Size([1, 10])

lr, num_epochs, batch_size = 0.05, 10, 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=96)
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

你可能感兴趣的:(动手学深度学习v2)

tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
安装 `privoxy` 将 Socks5 转换为 HTTP 代理 MonkeyKing.sun 网络
(base)shgbitai@shgbitai-C9X299-PGF:~/tools$curl-xhttp://127.0.0.1:1080https://registry-1.docker.io/v2/curl:(56)ProxyCONNECTaborted(base)shgbitai@shgbitai-C9X299-PGF:~/tools$curl-xhttps://127.0.0.1:108
基于高通主板的ARM架构服务器问就是想睡觉 arm开发服务器运维
一、ARM架构服务器的崛起（一）市场需求推动消费市场寒冬，全球消费电子需求下行，服务器成半导体核心动力之一。Arm加速布局服务器领域，如9月推出NeoverseV2。长久以来，x86架构主导服务器市场，现面临挑战。Arm2008年入服务器领域，虽因性能与生态问题未大突破，但近几年重新冲刺。（二）技术创新引领Arm的Neoverse平台不断发展。2018年推出参考架构，2020年衍生出E、N、V系列
安装依赖时报错：npm ERR! code ERESOLVE npm ERR! ERESOLVE could not resolve npm ERR! npm ERR! While resolving 帅气绝非偶然 npm 前端 node.js
这里我在npmivant@latest-v2或者其他依赖包的时候出现以上错误可能是npm版本问题报错解决方法：在安装命令后边加上1|--legacy-peer-deps或者--force如图中的指令：
图片中的上采样，下采样和通道融合(up-sample, down-sample, channel confusion) 迪三 #图像处理_PyTorch 计算机视觉深度学习人工智能
前言以conv2d为例（即图片），Pytorch中输入的数据格式为tensor，格式为:[N,C,W,H,W]第一维N.代表图片个数，类似一个batch里面有N张图片第二维C.代表通道数，在模型中输入如果为彩色，常用RGB三色图，那么就是3维，即C=3。如果是黑白的，即灰度图，那么只有一个通道，即C=1第三维H.代表图片的高度，H的数量是图片像素的列数第四维W.代表图片的宽度，W的数量是图片像素的
MySQL 源码｜55 - 语法解析(V2)：基础查询语句（query_specification）｜V20240915 长行 MySQL源码 mysql 源码语法解析查询
目录文档：MySQL源码｜源码剖析文档目录源码位置（版本=MySQL8.0.37）：sql/sql_yacc.yy前置文档：MySQL源码｜68-语法解析(V2)：LOCKING子句（锁定读取）｜V20240909MySQL源码｜39-语法解析(V2)：ORDERBY子句｜V20240814｜V20240912（第2版）MySQL源码｜40-语法解析(V2)：GROUPBY子句｜V20240814
【docker npm】npm 私库琴韵 docker npm 容器
1.部署环境window11x64DockerDesktop4.34.1(166053)DockerEnginev27.2.01.1.Docker镜像源1.1.1.DockerEngine配置{"builder":{"features":{"buildkit":true},"gc":{"defaultKeepStorage":"32GB","enabled":true}},"experimenta
opencv 学习 1 木木ainiks opencv 计算机视觉 python
opencv学习的第一天#coding:utf-8importcv2ascv#首先读图片src=cv.imread(“img/1.jpg”)#设置图片的名字cv.namedWindow(“1”,cv.WINDOW_AUTOSIZE)#显示图片第一个参数设置图片名，第二个参数图片的地址cv.imshow(“1”,src)cv.waitKey(0)#将图片写入固定位置cv.imwrite(“img/2
python-opencv cv2.findContours()函数 fjswcjswzy opencv python笔记 python opencv
示例代码：image,contours,hierarchy=cv2.findContours(contour,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)输入：contour：带有轮廓信息的图像；cv2.RETR_TREE：提取轮廓后，输出轮廓信息的组织形式，除了cv2.RETR_TREE还有以下几种选项：cv2.RETR_EXTERNAL：输出轮廓中只有外侧轮廓信
【Python】【Opencv】cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数详解和运行示例木彳 Python学习和使用过程积累 python opencv 开发语言人工智能计算机视觉
为帮助大家理解和使用cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数，本文通过对函数内容进行详解，并通过运行示例更直观表述。函数解析cv2.findContours()cv2.drawContours()cv2.contourArea()运行示例运行示例示例详解函数解析cv2.findContours()cv2.findContou
snmp v2 trap搭建监控端小黑要上天 snmp linux 服务器 centos 运维 snmp
1.基础环境配置为了防止防火墙及selinux等的影响，需关闭防火墙及selinux等，具体参考：Linux常规基础配置_linux基础配置-CSDN博客2.安装snmpyum源配置，具体参考：Linux常规基础配置_linux基础配置-CSDN博客snmp安装命令：yuminstall-ynet-snmpnet-snmp-utils[root@kibana~]#yuminstall-ynet-s
深入学习-Gradle-自动化构建技术（五）Gradle-插件架构实现原理剖析- 2401_84002294 2024年程序员学习学习自动化架构
6、AndroidGradlePluginV3.0.0（2017年10月）7、AndroidGradlePluginV2.3.0（2017年2月）三、Gradle构建核心流程解析1、LoadSettings2、Configure3、TaskGraph4、RunTasks5、Finished四、关于Gradle中依赖实现的原理1、通过MethodMissing机制，间接地调用DefaultDepen
开源项目低代码表单FormCreate从Vue2到Vue3升级指南低代码研究员 FormCreate 开源低代码 FormCreate 低代码表单低代码设计器动态表单
开源项目低代码表单FormCreatev3版本基于Vue3.0构建，尽管功能与v2版本大致相同，但有一些重要的变更和不兼容项需要注意。源码地址:Github|GiteeFormCreatev3对比v2版本在一些功能和配置项上做了调整，以更好地支持Vue3的新特性。以下是v2到v3升级过程中需要关注的变化和调整。移除配置项在v3版本中，以下配置项已被移除，因为它们在Vue3中不再适用：attrs：在
玩客云 N1路由各种盒子 s805 s905 s9系列等梦境虽美，却不长笔记
**Amlogic**玩客云s805N1路由s905数码视讯Q7(Q5)s905L中兴b860AV2.1s905L魔百盒HM201s905L百视通R3300-L咪咕盒子MG101s905L新魔百盒M201-Ss905L新魔百盒M201-Ds905L创维900V21Cs905L魔百盒CMC-01-EG2-40FS905F百视通R3300-Ms905mUT斯达康MC8638Ss905L创维E951s9
docker registry提示Layer already exists但blob数据不存在 nangonghen docker docker 容器运维
1概述1.1环境版本信息如下：a、操作系统：centos7.6b、registry版本：v2.7.11.2现象registry的blob目录下的文件被GC之后，再重新dockerpush旧镜像提示Layeralreadyexists，即从服务端响应的数据来看推送镜像是成功的，但在blob目录中写入相应的文件，即实际上推送镜像是失败的。执行dockerpull请求，registry告知manifes
YOLOV8改进-C2f添加Deformable Conv V2 森爱。 YOLOV8改进 YOLO
目录1DeformableConvV2介绍2YOLOV8添加DeformableConvV22.1代码添加到Blocks2.1.1C2f_DCN代码2.1.2加入_all_导入2.1.3加入modules导入2.2添加至运行模块tasks2.2.1导入包2.2.2解析参数添加2.3在_init_中增加名称2.4模型配置文件yaml替换1DeformableConvV2介绍论文地址:https://
Docker Registry Web：一站式私有Docker Registry管理解决方案邹澜鹤Gardener
DockerRegistryWeb：一站式私有DockerRegistry管理解决方案项目介绍docker-registry-web是一个专为私有DockerRegistryv2设计的Web界面和安全服务，它提供了浏览仓库、标签和镜像的能力，并具备基于角色的身份验证和审计功能。通过简单的Docker命令，您可以快速启动并开始管理您的Docker镜像。项目技术分析该项目基于Java开发，利用Dock
opencv 之实战项目识别银行卡上的数字 SEVEN-YEARS opencv 计算机视觉人工智能
OpenCV之实战项目：识别银行卡上的数字引言在日常生活中，银行卡的识别是一个常见的需求，特别是在金融领域。本实战项目旨在使用OpenCV库来识别银行卡上的数字。我们将通过模板匹配的方法，结合图像处理技术，来准确识别银行卡上的数字序列。项目准备本项目需要安装Python和OpenCV库。确保已经安装了必要的库，并准备好银行卡图像和数字模板图像。实验素材定义函数importcv2defsort_co
高佣联盟邀请码填哪个可以升级，高佣联盟app邀请码填写教程小小编007
高佣联盟用户等级分为V1，V2，V3。等级越高返利越高，权益越多。新用户注册是V1等级，邀请码只是用来方便邀请统计的，无论填写高佣联盟的哪个邀请码都不可以升级。需要完成平台的邀请拉新任务，才可以升级。高佣联盟邀请码填写过程也很简单，下载注册即自动提示输入邀请码，百度一下，很多邀请码，填写一个即可。我为什么从高佣联盟转到果冻宝盒呢？当然是因为果冻宝盒返利更高，注册填写邀请码223377即可自动升金牌
TypeError: __init__() got an unexpected keyword argument ‘name‘ PinkAir debug python leetcode
WhenIwroteacustomclassofKeras,Imetthiserror.Solution:changefromthesnippetbelowclasscustconv2d(keras.layers.Layer):def__init__(self):super(custconv2d,self).__init__()self.k=self.add_weight(shape=(1,),i
# 解决Error response from daemon: Get https://registry-1.docker.io/v2/library/hello-world/manifests/ 杀死一只喵
解决Errorresponsefromdaemon:Gethttps://registry-1.docker.io/v2/library/hello-world/manifests/昨天在使用docker时，将image文件从仓库抓取到本地一直报错，经过尝试，终于得以解决。错误信息如下：[root@archlinux~]#dockerimagepulllibrary/hello-worldUsin
番茄免费小说邀请码是多少2024官方版大全一览(番茄小说邀请码)亲测通用凌风导师
2023年番茄免费小说邀请码是【V934425438】。番茄免费小说的邀请码是【V934425438】。这个邀请码非常容易记忆，简约而不失高贵的气息，番茄免费小说邀请码番茄免费小说邀请码V721593338或V934425438或V246956631可完成领取新人红包活动，【番茄免费小说邀请码V934425438】番茄免费小说，番茄免费小说邀请码：V721593338、V934425438或V24
目标检测YOLO系列从入门到精通技术详解100篇-【目标检测】工业相机格图素书数码相机目标检测人工智能
目录知识储备深度相机1TOF2双目视觉3结构光4智能门锁应用5手机应用算法原理相机的成像与标定模型相机标定的实施·标定过程的算法实施相机标定的扩展CCD工业相机、镜头倍率及相关参数计算方法知识储备深度相机1TOF1.1Kinectv2Kinectv2是Microsoft在2014年发售的，如图1-1所示。相比于Kinectv1在硬件和软件上作出了很大的进化，且在深度测量的系统和非系统误差方面表现出
[python] 一个例子初步学习DataFrame _ 修改列名 Jean2257 python python DataFrame
例子:假设有4家公司,他们都在2个省份有自己的业务,用统计量v1,v2进行描述,现在需要对这些数据进行一定的分析.#-*-coding:utf-8-*-importpandasaspdlist1=[1,2,3,4,5,6,7,8]list4=[8,7,6,5,4,3,2,1]list2=['a','a','a','a','b','b','b','b']list3=['c1','c2','c3','
python下报错AttributeError: 'NoneType' object has no attribute 'shape' 无止境x
路径问题：config.TRAIN.hr_img_path=r'D:\SR_datasets\DIV2K\DIV2K_train_HR/'#最后还要加一个/斜杠
界面控件DevExpress中文教程：如何PDF图形对象的可见性？界面开发小八哥 pdf devexpress winform 界面控件 WPF ui
DevExpress拥有.NET开发需要的所有平台控件，包含600多个UI控件、报表平台、DevExpressDashboardeXpressApp框架、适用于VisualStudio的CodeRush等一系列辅助工具。屡获大奖的软件开发平台DevExpress近期重要版本v24.1已正式发布，该版本拥有众多新产品和数十个具有高影响力的功能，可为桌面、Web和移动应用提供直观的解决方案，全面解决各
如何将文本转换为向量？(方法二) DashVector python 开发语言人工智能 embedding 数据挖掘
文本转换为向量有多种方式：方法一：通过模型服务灵积DashScope将文本转换为向量（推荐）方法二：通过ModelScope魔搭社区中的文本向量开源模型将文本转换为向量方法三：通过JinaEmbeddingsv2模型将文本转换为向量方法四：通过百川智能向量化模型将文本转换为向量本文介绍方法二：如何通过ModelScope魔搭社区中的文本向量开源模型将文本转换为向量，并入库至向量检索服务DashVe
python 自动下载ERA5 netCDF4格式数据 INFO Request is queued 水猪1 python
2024-05-2111:18:46,271INFOWelcometotheCDS2024-05-2111:18:46,289INFOSendingrequesttohttps://cds.climate.copernicus.eu/api/v2/resources/reanalysis-era5-pressure-levels2024-05-2111:18:46,512INFORequestis
动手学深度学习（pytorch土堆）-03常见的Transforms #include<菜鸡> 深度学习深度学习 pytorch 人工智能
Composetransforms.Compose是PyTorch中的一个函数，用于将多个图像变换操作组合在一起，形成一个变换流水线。这样可以将一系列的图像处理操作整合为一个步骤，便于对图像进行批量预处理或增强。基本用法transforms.Compose接受一个列表，列表中的每个元素是一个变换操作。这些操作会按照给定的顺序依次作用在输入的图像上。Example:>>>transforms.Com
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓