wyyoowyy

卷积神经网络（convolutional neural networks，CNN）

神经网络架构

平移不变性（translation invariance）：不管检测对象出现在图像中的哪个位置，神经网络的前面几层应该对相同的图像区域具有相似的反应，即为“平移不变性”。
局部性（locality）：神经网络的前面几层应该只探索输入图像中的局部区域，而不过度在意图像中相隔较远区域的关系，这就是“局部性”原则。最终，可以聚合这些局部特征，以在整个图像级别进行预测。

多输入多输出通道的互相关运算（卷积）

当输入*（cinhnw）包含 ci 通道时，需要构造一个与输入数据具有相同输入通道数的卷积核 (cikhkw)* ，以便与输入数据进行互相关运算。
我们可以对每个通道输入的二维张量和卷积核的二维张量进行互相关运算，再对通道求和（将得的结果相加）得到二维张量。（即得到了一个通道的输出）

当输出 (cohw) 包含co通道时，需要co个 (cikhkw) 的卷积核，即卷积核的形状为 （cocikhkw）*

例：输入通道为2，输出通道为1

1*1卷积层：通常用于调整网络层的通道数量和控制模型复杂性

卷积本质

卷积的本质是有效提取相邻像素间的相关特征

填充和步幅

**填充：**在输入图像的边界填充元素（通常填充元素是0）。填充可以增加输出的高度和宽度。这常用来使输出与输入具有相同的高和宽。
**步幅：**每次滑动元素的数量称为步幅（stride）。步幅可以减小输出的高和宽，例如输出的高和宽仅为输入的高和宽的1/n（n是一个大于的整数）。
填充和步幅可用于有效地调整数据的维度。

其中ph表示一共填充的行数，pw表示一共填充的列数
注意：nn.Conv2d中的padding=1时这里的ph=2padding=2, pw=2padding=2
padding=(1,3) ph=21=2,pw=23=6
例：

如图是输入（高宽nh=3,nw=3）,上下左右各填充一行（ph=2,pw=2,padding=1）,与2*2卷积核（高宽kh=2，kw=2），垂直步幅为3（sh=3），水平步幅为2 (sw=2) 的二维互相关运算

输出形状为[ (3-2+2+3)/3 ][ (3-2+2+2)/2] =(22)
故输出形状为2*2

注：

1、在卷积神经网络中，我们组合使用卷积层、非线性激活函数和汇聚层。
2、为了构造高性能的卷积神经网络，我们通常对卷积层进行排列，逐渐降低其表示的空间分辨率，同时增加通道数。

卷积神经网络

这些模型包括：
• LeNet。最早的卷积神经网络之一；
• AlexNet。它是第⼀个在大规模视觉竞赛中击败传统计算机视觉模型的大型神经网络；
• 使用重复块的网络（VGG）。它利用许多重复的神经网络块；
• 网络中的网络（NiN）。它重复使用由卷积层和1 × 1卷积层（用来代替全连接层）来构建深层网络;
• 含并行连结的网络（GoogLeNet）。它使用并行连结的网络，通过不同窗口大小的卷积层和最大汇聚层来并行抽取信息；
• 残差网络（ResNet）。它通过残差块构建跨层的数据通道，是计算机视觉中最流行的体系架构；
• 稠密连接网络（DenseNet）。它的计算成本很高，但给我们带来了更好的效果。

一、LeNet

总体来看，LeNet（LeNet-5）由两个部分组成：
• 卷积编码器：由两个卷积层组成;
• 全连接层密集块：由三个全连接层组成。

import torch
from d2l import torch as d2l
from torchvision import transforms
from torch import nn 
import torchvision
from torch.utils import data

#整合所有组件
#该函数获取和读取Fashion-MNIST数据集，这个函数返回训练集和验证集的数据迭代器
def load_data_fashion_mnist(batch_size,resize=None):#@save
    #下载Fashion-MNIST数据集，然后将其加载到内存中
    trans=[transforms.ToTensor()]
    if resize:
        #trans=[torchvision.transform.Resize(resize),torchvision.transform.ToTensor()]
        trans.insert(0,transforms.Resize(resize))
    trans=transforms.Compose(trans)
    mnist_train=torchvision.datasets.FashionMNIST(root="F:/dataset",train=True,transform=trans,download=True)
    mnist_test=torchvision.datasets.FashionMNIST(root="F:/dataset",train=False,transform=trans,download=True)
    return data.DataLoader(mnist_train,batch_size,shuffle=True,num_workers=d2l.get_dataloader_workers()),data.DataLoader(mnist_test,batch_size,shuffle=False,num_workers=d2l.get_dataloader_workers())

def evaluate_accuracy_gpu(net,data_iter,device=None):#@save
    #使用GPU计算模型在数据集上的精度
    if isinstance(net,nn.Module):
        net.eval()#设置为评估模式
        if not device:
            device=next(iter(net.parameters())).device
    #正确预测的数据，总预测的数量
    metric=d2l.Accumulator(2)
    with torch.no_grad():
        for X,y in data_iter:
            if isinstance(X,list):
                #BERT微调所需要的
                X=[x.to(device) for x in X]
            else:
                X=X.to(device)
            y=y.to(device)
            metric.add(d2l.accuracy(net(X),y),y.numel())
    return metric[0]/metric[1]

#定义LeNet的神经网络
#注意平均池化成的stride=2
net=nn.Sequential(nn.Conv2d(1,6,kernel_size=5,padding=2),nn.ReLU(),nn.AvgPool2d(stride=2,kernel_size=2),
                 nn.Conv2d(6,16,kernel_size=5,padding=0),nn.ReLU(),nn.AvgPool2d(stride=2,kernel_size=2),
                 nn.Flatten(),nn.Linear(16*5*5,120),nn.ReLU(),nn.Linear(120,84),nn.ReLU(),nn.Linear(84,10))

X=torch.rand((1,1,28,28),dtype=torch.float32)
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,"output shape:\t",X.shape)

输出
Conv2d output shape: torch.Size([1, 6, 28, 28])
Sigmoid output shape: torch.Size([1, 6, 28, 28])
AvgPool2d output shape: torch.Size([1, 6, 14, 14])
Conv2d output shape: torch.Size([1, 16, 10, 10])
Sigmoid output shape: torch.Size([1, 16, 10, 10])
AvgPool2d output shape: torch.Size([1, 16, 5, 5])
Flatten output shape: torch.Size([1, 400])
Linear output shape: torch.Size([1, 120])
Sigmoid output shape: torch.Size([1, 120])
Linear output shape: torch.Size([1, 84])
Sigmoid output shape: torch.Size([1, 84])
Linear output shape: torch.Size([1, 10])

batch_size=64
train_iter,test_iter=load_data_fashion_mnist(batch_size=batch_size)
#@save
def train_ch6(net,train_iter,test_iter,num_epochs,lr,device):
    #用GPU训练模型
    def init_weights(m):
        if type(m)==nn.Linear or type(m)==nn.Conv2d:
            nn.init.xavier_uniform_(m.weight)
    net.apply(init_weights)
    print('training on',device)
    net.to(device)
    optimizer=torch.optim.SGD(net.parameters(),lr)
    loss=nn.CrossEntropyLoss()
    animator=d2l.Animator(xlabel='epoch',xlim=[1,num_epochs],legend=['train loss','train acc','test acc'])
    timer,num_batches=d2l.Timer(),len(train_iter)
    for epoch in range(num_epochs):
        #训练损失之和，训练准确率之和，样本数
        metric=d2l.Accumulator(3)
        net.train()
        for i,(X,y) in enumerate(train_iter):
            timer.start()
            optimizer.zero_grad()
            X,y=X.to(device),y.to(device)
            y_hat=net(X)
            l=loss(y_hat,y)
            l.backward()
            optimizer.step()
            with torch.no_grad():
                #X.shape[0]是样本数
                metric.add(l*X.shape[0],d2l.accuracy(y_hat,y),X.shape[0])
            timer.stop()
            train_l=metric[0]/metric[2]
            train_acc=metric[1]/metric[2]
            if(i+1)%(num_batches//5)==0 or i==num_batches-1:
                animator.add(epoch+(i+1)/num_batches,(train_l,train_acc,None))
        test_acc=evaluate_accuracy_gpu(net,test_iter)
        animator.add(epoch+1,(None,None,test_acc))
    print(f"loss{train_l:.3f},train acc{train_acc:.3f},test acc {test_acc:.3f}")
    print(f"{metric[2]*num_epochs/timer.sum():.1f}examples/sec on device{device}")
    
lr,num_epochs=0.01,10
train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())

注意：如果将激活函数从sigmoid换成ReLU时，需要将学习率调小，否则train_loss和train acc变化很小

二、AlexNet

1、组成：五个卷积层，三个最大汇聚层3*3,两个全连接隐藏层，一个全连接输出层
2、使用ReLU激活函数
3、使用了丢弃法，控制全连接层的模型复杂度------而LeNet使用的是权重衰退
4、为了进一步扩充数据，AlexNet在训练的时候增加了大量的图像增强数据，如翻转，裁剪，变色，使模型更强壮，更大的样本量有效的减少了过拟合

import torch
from torch  import nn
from d2l import torch as d2l
net=nn.Sequential(
    #这里我们使用一个11*11的更大窗口来捕捉对象--输入图像（3*224*224）
    #同时步幅为4，以减少输出的高度和宽度
    #输出通道数目远大于LeNet
    nn.Conv2d(1,96,kernel_size=11,stride=4,padding=1),nn.ReLU(),
    nn.MaxPool2d(kernel_size=3,stride=2),
    #减小卷积窗口，使用填充为2来使得输入与输出的高宽一致，且增大输出通道数
    nn.Conv2d(96,256,kernel_size=5,padding=2),nn.ReLU(),
    nn.MaxPool2d(kernel_size=3,stride=2),
    #使用三个连续的卷积层和较小的卷积窗口
    #除以最后的卷积层，输出通道的数量进一步增加
    #在前两个卷积层后，汇聚层不用于减少输入的高度和宽度
    nn.Conv2d(256,384,kernel_size=3,padding=1),nn.ReLU(),
    nn.Conv2d(384,384,kernel_size=3,padding=1),nn.ReLU(),
    nn.Conv2d(384,256,kernel_size=3,padding=1),nn.ReLU(),
    nn.MaxPool2d(kernel_size=3,stride=2),
    nn.Flatten(),
    #这里的全连接层的输出数量是LeNet中的好几倍，使用dropout层来减轻过拟合
    nn.Linear(6400,4096),nn.ReLU(),
    nn.Dropout(p=0.5),
    nn.Linear(4096,4096),nn.ReLU(),
    nn.Dropout(p=0.5),
    #最后是输出层，由于这里使用的饿是Fashion-MNIST,所以类别数为10
    nn.Linear(4096,10))

X=torch.rand(1,1,224,224)
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,'output shape:\t',X.shape)

输出：
Conv2d output shape: torch.Size([1, 96, 54, 54])
ReLU output shape: torch.Size([1, 96, 54, 54])
MaxPool2d output shape: torch.Size([1, 96, 26, 26])
Conv2d output shape: torch.Size([1, 256, 26, 26])
ReLU output shape: torch.Size([1, 256, 26, 26])
MaxPool2d output shape: torch.Size([1, 256, 12, 12])
Conv2d output shape: torch.Size([1, 384, 12, 12])
ReLU output shape: torch.Size([1, 384, 12, 12])
Conv2d output shape: torch.Size([1, 384, 12, 12])
ReLU output shape: torch.Size([1, 384, 12, 12])
Conv2d output shape: torch.Size([1, 256, 12, 12])
ReLU output shape: torch.Size([1, 256, 12, 12])
MaxPool2d output shape: torch.Size([1, 256, 5, 5])
Flatten output shape: torch.Size([1, 6400])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 10])

三、使用块的网络（VGG）

经典卷积神经网络的基本组成部分是下面的这个序列：

带填充以保持分辨率的卷积层；
非线性激活函数，如ReLU；
汇聚层，如最大汇聚层。
VGG网络可以分为两部分：第⼀部分主要由卷积层和汇聚层组成，第⼆部分由全连接层组成。


#vgg_block--实现一个VGG块
#该函数有三个参数,分别对应于卷积层的数量num_conv,输入通道的数量in_channels和输出通道的数量out_channels
import torch 
from torch import nn
from d2l import torch as d2l
def vgg_block(num_convs,in_channels,out_channels):
    layers=[]
    for _ in range(num_convs):
        #经过卷积层图像的高宽不变
        layers.append(nn.Conv2d(in_channels,out_channels,kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels=out_channels
    #经过池化层，高宽减半
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

#原始VGG⽹络有5个卷积块，其中前两个块各有⼀个卷积层，后三个块各包含两个卷积层。第⼀个模块有64个
#输出通道，每个后续模块将输出通道数量翻倍，直到该数字达到512。由于该⽹络使⽤8个卷积层和3个全连接层，因此它通常被称为VGG-11。
#有超参数变量conv_arch。该变量指定了每个VGG块⾥卷积层个数和输出通道数。
conv_arch = ((1, 64), (1, 128), (2, 256), (2, 512), (2, 512))
def vgg(conv_arch):
    conv_blks=[]
    in_channels=1
    #卷积层部分
    for (num_convs,out_channels) in conv_arch:
        conv_blks.append(vgg_block(num_convs,in_channels,out_channels))
        in_channels=out_channels
     
    return nn.Sequential(
    *conv_blks,nn.Flatten(),
    #全连接层部分
    nn.Linear(out_channels*7*7,4096),nn.ReLU(),nn.Dropout(p=0.5),
    nn.Linear(4096,4096),nn.ReLU(),
    nn.Dropout(p=0.5),
    nn.Linear(4096,10))

net=vgg(conv_arch)

X=torch.rand(size=(1,1,224,224))
for blk in net:
    X=blk(X)
    print(blk.__class__.__name__,'output shape:\t',X.shape)

输出：
Sequential output shape: torch.Size([1, 64, 112, 112])
Sequential output shape: torch.Size([1, 128, 56, 56])
Sequential output shape: torch.Size([1, 256, 28, 28])
Sequential output shape: torch.Size([1, 512, 14, 14])
Sequential output shape: torch.Size([1, 512, 7, 7])
Flatten output shape: torch.Size([1, 25088])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 4096])
ReLU output shape: torch.Size([1, 4096])
Dropout output shape: torch.Size([1, 4096])
Linear output shape: torch.Size([1, 10])

ratio=4
#VGG-11计算量大  所以减少通道数来训练Fashion_MNIST
small_conv_arch=[(pair[0],pair[1]//ratio) for pair in conv_arch]  
net=vgg(small_conv_arch)
lr,num_epochs,batch_size=0.05,10,128
#注意这里要resize=224 Fashion_mnist中的原始图片28*28
train_iter,test_iter=load_data_fashion_mnist(batch_size,resize=224)
d2l.train_ch6(net,train_iter,test_iter,num_epochs,lr,d2l.try_gpu())

四、网络中的网络（NiN）

1、卷积层的输入和输出由四维张量组成，张量的每个轴分别对应样本、通道、⾼度和宽度。
全连接层的输⼊和输出通常是分别对应于样本和特征的二维张量。
2、 NiN的想法是在每个像素位置（针对每个⾼度和宽度）应用⼀个全连接层。如果我们将权重连接到每个空间位置，我们可以将其视为1 × 1卷积层，或作为在每个像素位置上独⽴作用的全连接层。从另⼀个角度看，即将空间维度中的每个像素视为单个样本，将通道维度视为不同特征（feature）。
NiN块以⼀个普通卷积层开始，后⾯是两个1 × 1的卷积层。这两个1 × 1卷积层充当带有ReLU激活函数的逐像素全连接层。
第⼀层的卷积窗口形状通常由用户设置。随后的卷积窗口形状固定为1 × 1。
3、 NiN和AlexNet的区别****是 NiN完全取消了全连接层，相反，NiN使用一个NiN块，其输出通道数等于标签类别数量，最后放一个平均汇聚层，生成一个对数几率。
注意：
1、NiN使用由⼀个卷积层和多个1 × 1卷积层组成的块。该块可以在卷积神经⽹络中使用，以允许更多的每像素非线性。
2、 NiN去除了容易造成过拟合的全连接层，将它们替换为全局平均汇聚层（即在所有位置上进行求和）。该汇聚层通道数量为所需的输出数量（例如，Fashion-MNIST的输出为10）。
3、移除全连接层可减少过拟合，同时显著减少NiN的参数。

import torch
from torch import torch as d2l
from torch import nn
def nin_block(in_channels,out_channels,kernel_size,strides,padding):
    return nn.Sequential(
            nn.Conv2d(in_channels,out_channels,kernel_size,strides,padding),
            nn.ReLU(),
            nn.Conv2d(out_channels,out_channels,kernel_size=1),nn.ReLU(),
            nn.Conv2d(out_channels,out_channels,kernel_size=1),nn.ReLU()
    )
net=nn.Sequential(
    #高宽224->54  (224-11+4)/4
    nin_block(1,96,kernel_size=11,strides=4,padding=0),
    #高宽减半52-》26
    nn.MaxPool2d(3,stride=2),
    #26-5+4+1->26 高宽不变 通道增加
    nin_block(96,256,kernel_size=5,strides=1,padding=2),
    #高宽减半 (26-3+2)/2->12
    nn.MaxPool2d(3,stride=2),
    #12-3+2+1=12
    nin_block(256,384,kernel_size=3,strides=1,padding=1),
    #(12-3+2)/2=5
    nn.MaxPool2d(3,stride=2),
    nn.Dropout(0.5),
    #标签类别数是10
    #(5-3+2+1)=5
    nin_block(384,10,kernel_size=3,strides=1,padding=1),
    # nn.AdaptiveAvgPool2d(output_size)
    #全局平均汇聚层（即在所有位置上进行求和）
    nn.AdaptiveAvgPool2d((1,1)),
    #将四维的输出转为二维的输出，其形状为（批量大小，10）
    nn.Flatten())

X=torch.rand(size=(1,1,224,224))
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,"output shape:",X.shape)

输出：
Sequential output shape: torch.Size([1, 96, 54, 54])
MaxPool2d output shape: torch.Size([1, 96, 26, 26])
Sequential output shape: torch.Size([1, 256, 26, 26])
MaxPool2d output shape: torch.Size([1, 256, 12, 12])
Sequential output shape: torch.Size([1, 384, 12, 12])
MaxPool2d output shape: torch.Size([1, 384, 5, 5])
Dropout output shape: torch.Size([1, 384, 5, 5])
Sequential output shape: torch.Size([1, 10, 5, 5])
AdaptiveAvgPool2d output shape: torch.Size([1, 10, 1, 1])
Flatten output shape: torch.Size([1, 10])

五、含并行连结的网络（GoogLeNet）

在GoogLeNet中，基本的卷积块被称为Inception块（Inception block）。

GoogLeNet⼀共使⽤9个Inception块和全局平均汇聚层的堆叠来生成其估计值。Inception块
之间的最大汇聚层可降低维度。第⼀个模块类似于AlexNet和LeNet，Inception块的组合从VGG继承，全局平均汇聚层避免了在最后使用全连接层。

#Inception块由四条并⾏路径组成。前三条路径使⽤窗⼝⼤⼩为1 × 1、3 × 3和5 × 5的卷积层，从不同空间⼤⼩中提取信息。
#中间的两条路径在输⼊上执⾏1 × 1卷积，以减少通道数，从⽽降低模型的复杂性。
#第四条路径使⽤3 × 3最⼤汇聚层，然后使⽤1 × 1卷积层来改变通道数。

#这四条路径都使⽤合适的填充来使输⼊与输出的⾼和宽⼀致，
#最后我们将每条线路的输出在通道维度上连结，并构成Inception块的输出。
#Inception块中，通常调整的超参数是每层输出通道数。
import torch 
from torch import nn
from d2l import torch as d2l 
from torch.nn import functional as F

class Inception(nn.Module):
    #c1-c4是每条路径的输出通道数
    def  __init__(self,in_channels,c1,c2,c3,c4,**kwargs):
        super(Inception,self).__init__(**kwargs)
        #线路一 单1*1卷积层
        self.p1_1=nn.Conv2d(in_channels,c1,kernel_size=1)
        #线路二 1*1卷积层后接3*3卷积层
        self.p2_1=nn.Conv2d(in_channels,c2[0],kernel_size=1)
        self.p2_2=nn.Conv2d(c2[0],c2[1],kernel_size=3,padding=1)
        #线路三 1*1卷积层后接5*5卷积层
        self.p3_1=nn.Conv2d(in_channels,c3[0],kernel_size=1)
        self.p3_2=nn.Conv2d(c3[0],c3[1],kernel_size=5,padding=2)
        #线路四 3*3的最大汇聚层 填充1 1*1的卷积层
        self.p4_1=nn.MaxPool2d(kernel_size=3,padding=1,stride=1)
        self.p4_2=nn.Conv2d(in_channels,c4,kernel_size=1)
    
    def forward(self,x):
        p1=F.relu(self.p1_1(x))
        p2=F.relu(self.p2_2(F.relu(self.p2_1(x))))
        p3=F.relu(self.p3_2(F.relu(self.p3_1(x))))
        p4=F.relu(self.p4_2(self.p4_1(x)))
        #在通道维度上连接输出
        return torch.cat((p1,p2,p3,p4),dim=1)

#GoogLeNet⼀共使⽤9个Inception块和全局平均汇聚层的堆叠来⽣成其估计值。
#Inception块之间的最⼤汇聚层可降低维度
#第⼀个模块类似于AlexNet和LeNet，Inception块的组合从VGG继承，全局平均汇聚层避免了在最后使⽤全连接层。

#第一个模块 使用64个通道，7*7卷积层
#如果输入是96  (96-7+2+6）/2=48  -> (48-3+2+2)/2=24        通道数64，高宽24*24
b1=nn.Sequential(nn.Conv2d(1,64,kernel_size=7,stride=2,padding=3),
               nn.ReLU(),
               nn.MaxPool2d(kernel_size=3,stride=2,padding=1))
#第二个模块使用两个卷积层
#24-》24-》（24-3+2+2）/2=12                           通道数192，高宽12*12
b2=nn.Sequential(nn.Conv2d(64,64,kernel_size=1),nn.ReLU(),
                nn.Conv2d(64,192,kernel_size=3,padding=1),
                nn.ReLU(),
                nn.MaxPool2d(kernel_size=3,stride=2,padding=1))

#第三个模块串联两个完整的Inception块
#第一个Inception块的输出通道数为64+128+32+32=256
#第二个Inception块的输出通道数为128+192+96+64=480   
#（12-3+2+2）/2=6                                       通道数 480  高宽6*6
b3=nn.Sequential(Inception(192,64,(96,128),(16,32),32),
                Inception(256,128,(128,192),(32,96),64),
                nn.MaxPool2d(kernel_size=3,stride=2,padding=1))
#第四个模块串联5个Inception块，其输出通道数分别是是192 + 208 + 48 + 64 = 512、
#160 + 224 +64 + 64 = 512、128 + 256 + 64 + 64 = 512、112 + 288 + 64 + 64 = 528和256 + 320 + 128 + 128 = 832。
#（6-3+2+2）/2=3                                       通道数832   高宽3*3
b4 = nn.Sequential(Inception(480, 192, (96, 208), (16, 48), 64),
                    Inception(512, 160, (112, 224), (24, 64), 64),
                    Inception(512, 128, (128, 256), (24, 64), 64),
                    Inception(512, 112, (144, 288), (32, 64), 64),
                    Inception(528, 256, (160, 320), (32, 128), 128),
                    nn.MaxPool2d(kernel_size=3, stride=2, padding=1))

#第五个模块 含输出通道数为256 + 320 + 128 + 128 = 832和384 + 384 + 128 + 128 = 1024的两个Inception块。
#第五模块的后⾯紧跟输出层，该模块同NiN⼀样使⽤全局平均汇聚层，将每个通道的⾼和宽变成1。最后我们将
#输出变成⼆维数组，再接上⼀个输出个数为标签类别数的全连接层
b5=nn.Sequential(Inception(832, 256, (160, 320), (32, 128), 128),
                Inception(832, 384, (192, 384), (48, 128), 128),
                nn.AdaptiveAvgPool2d((1,1)),
                nn.Flatten())
                 
net=nn.Sequential(b1,b2,b3,b4,b5,nn.Linear(1024,10))
                 
X=torch.rand(size=(1,1,96,96))
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,"output shape:\t",X.shape)

Sequential output shape: torch.Size([1, 64, 24, 24])
Sequential output shape: torch.Size([1, 192, 12, 12])
Sequential output shape: torch.Size([1, 480, 6, 6])
Sequential output shape: torch.Size([1, 832, 3, 3])
Sequential output shape: torch.Size([1, 1024])
Linear output shape: torch.Size([1, 10])

总结：
1、Inception块相当于⼀个有4条路径的子网络。它通过不同窗口形状的卷积层和最大汇聚层来并行抽取信息，并使用1×1卷积层减少每像素级别上的通道维数从而降低模型复杂度。
2、 GoogLeNet将多个设计精细的Inception块与其他层（卷积层、全连接层）串联起来。其中Inception块的通道数分配之比是在ImageNet数据集上通过大量的实验得来的。

六、批量规范化

另外，批量规范化层在”训练模式“（通过⼩批量统计数据规范化）和“预测模式”（通过数据集统计规范化）中的功能不同。在训练过程中，我们无法得知使用整个数据集来估计平均值和方差，所以只能根据每个小批次的平均值和方差不断训练模型。而在预测模式下，可以根据整个数据集精确计算批量规范化所需的平均值和方差。

批量规范化--是在卷积层或全连接层之后，相应的激活函数之前应用的
import torch
from torch import nn
from d2l import torch as d2l

def batch_norm(X,gamma,beta,moving_mean,moving_var,eps,momentum):
    #通过is_grad_enabled来判断当前模式是训练模式还是预测模式
    if not torch.is_grad_enabled():
        #如果是在预测模式下，直接使用传入的移动平均所得的均值和方差
        X_hat=(X-moving_mean)/torch.sqrt(moving_var+eps)
    else:
        assert len(X.shape) in (2,4)
        if len(X.shape) ==2:
            #使用全连接层的情况下，计算特征维上的均值和方差
            #计算小批量样本在不同特征维上的均值和方差
            #（4，5）-》（1，5）
            mean=X.mean(dim=0)
            #方差=（X-均值）的平方求和/小批量样本数+小常量（避免除以0）
            var=((X-mean)**2).mean(dim=0)
        else:
            #使用二维卷积层的情况，计算通道维上（axis=1）的均值和方差
            #这里我们要保持X的形状以便以后做广播运算
            #最后得到通道数个均值和方差
            mean=X.mean(dim=(0,2,3),keepdim=True)
            var=((X_mean)**2).mean(dim=(0,2,3),keepdim=True)
        #训练模式下，用当前的均值和方差做标准化
        X_hat=(X-mean)/torch.sqrt(var+eps)
        #更新移动平均的均值和方差，以便随后在预测期间使用
        #在训练过程中，我们无法得知使用整个数据集来估计平均值和方差，所以只能根据每个⼩批次的平均值和方差不断训练模型。⽽
        moving_mean=momentum*moving_mean+(1.0-momentum)*mean
        moving_var=momentum*moving_var+(1.0-momentum)*var
    #批量规范化还包括  拉伸参数（scale）γ和偏移参数（shift）β  γ*X+β才得到最终批量规范化的结果
    Y=gamma*X_hat+beta#缩放和移位
    return Y,moving_mean.data,moving_var.data
 
class BatchNorm(nn.Module):
    #num_features:完全连接层的输出数量或卷积层的输出通道数
    #num_dims:2表示完全连接层，4表示卷积层
    def __init__(self,num_features,num_dims):
        super.__init__()
        if num_dims==2:
            shape=(1,num_features)
        else:
            shape=(1,num_features,1,1)
        #参与求梯度和迭代的拉伸和偏移参数。分别初始化为1和0
        self.gamma=nn.Parameter(torch.ones(shape))
        self.beta=nn.Parameter(torch.zeros(shape))
        #非模型参数的变量初始化为0和1
        self.moving_mean=torch.zeros(shape)
        self.moving_var=torch.ones(shape)
    
    def forward(self,X):
        #如果X不在内存上，将moving_mean和moving_var复制到X所在显存上
        if self.moving_mean.device!=X.device:
            self.moving_mean=self.moving_mean.to(X.device)
            self.moving_var=self.moving_varr.to(X.device)
        #保存更新过的moving_mean和moving_var
        Y,self.moving_mean,self.moving_var=batch_norm(X,self.gamma,self.beta,self.moving_mean,self.moving_var,eps=1e-5,momentum=0.9)
        return Y

七、ResNet

#ResNet沿⽤了VGG完整的3 × 3卷积层设计。残差块⾥⾸先有2个有相同输出通道数的3 × 3卷积层。
#每个卷积层后接⼀个批量规范化层和ReLU激活函数。
#然后我们通过跨层数据通路，跳过这2个卷积运算，将输⼊直接加在最后的ReLU激活函数前。
#这样的设计要求2个卷积层的输出与输⼊形状⼀样，从⽽使它们可以相加。
#如果想改变通道数，就需要引⼊⼀个额外的1 × 1卷积层来将输⼊变换成需要的形状后再做相加运算。
import torch
from torch import nn
from d2l import torch as d2l
from torch.nn import functional as F

class Residual(nn.Module):#@save
    def __init__(self,input_channels,num_channels,use_1x1conv=False,strides=1):
        super().__init__()
        self.conv1=nn.Conv2d(input_channels,num_channels,kernel_size=3,padding=1,stride=strides)
        self.conv2=nn.Conv2d(num_channels,num_channels,kernel_size=3,padding=1)
        if use_1x1conv:
            #1*1的卷积层是用来改变输入的形状的
            self.conv3=nn.Conv2d(input_channels,num_channels,kernel_size=1,stride=strides)
        else:
            self.conv3=None
        #卷积层num_features=输出通道数
        self.bn1=nn.BatchNorm2d(num_channels)
        self.bn2=nn.BatchNorm2d(num_channels)
    
    def forward(self,X):
        Y=F.relu(self.bn1(self.conv1(X)))
        Y=self.bn2(self.conv2(Y))
        #若输入输出形状一致，X和Y可以直接相加，如果不一致需要先改变X的形状
        if self.conv3:
            X=self.conv3(X)
        Y+=X
        return F.relu(Y)

此代码⽣成两种类型的⽹络：⼀种是当use_1x1conv=False时，应⽤ReLU⾮线性函数之前，将输⼊添加到输出。另⼀种是当use_1x1conv=True时，添加通过1 × 1卷积调整通道和分辨率。

#输入和输出形状一致的情况
blk=Residual(3,3)
X=torch.rand(4,3,6,6)
Y=blk(X)
Y.shape

输出：torch.Size([4, 3, 6, 6])

#增加输出通道数的同时，减半输出的高和宽
blk=Residual(3,6,use_1x1conv=True,strides=2)
blk(X).shape

输出：torch.Size([4, 6, 3, 3])

b1=nn.Sequential(nn.Conv2d(1,64,kernel_size=7,stride=2,padding=3),
                nn.BatchNorm2d(64),nn.ReLU(),
                nn.MaxPool2d(kernel_size=3,stride=2,padding=1))


#对第一个模块做了特别处理
#第⼀个模块的通道数同输⼊通道数⼀致。由于之前已经使⽤了步幅为2的最⼤汇聚层，所以⽆须减⼩⾼和宽
#一共四个resnet_block块，每个块里可以有若干个residual
def resnet_block(input_channels,num_channels,num_residuals,first_block=False):
    blk=[]
    for i in range(num_residuals):
        #如果不是第一个block,但是是第一个residual，那输入通道和输出通道可能不同
        #除了第一个块，其余的块都会在第一个residual经过一次高宽减半
        #如果是第一个block ，且是第一个residual  ->第⼀个模块的通道数同输⼊通道数⼀致
        #如果不是第一个residual ,那么经过第一个residual得到的输出通道数和最终的通道数都是相同的
        if i==0 and not first_block: #是第一个block中的第一个residual
            blk.append(Residual(input_channels,num_channels,use_1x1conv=True,strides=2))
        else:
            blk.append(Residual(num_channels,num_channels))
    return blk

b2 = nn.Sequential(*resnet_block(64, 64, 2, first_block=True))
b3 = nn.Sequential(*resnet_block(64, 128, 2))
b4 = nn.Sequential(*resnet_block(128, 256, 2))
b5 = nn.Sequential(*resnet_block(256, 512, 2))
#加入全局平均汇聚层，将高宽都变成1*1  即 批量大小*512*1*1
net = nn.Sequential(b1,b2,b3,b4,b5,nn.AdaptiveAvgPool2d((1,1)),nn.Flatten(),nn.Linear(512,10))

#在所有的架构中，分辨率降低（高宽减半），通道数增加，直到全局平均汇聚层聚集所有特征
X=torch.rand(size=(1,1,224,224))
for layer in net:
    X=layer(X)
    print(layer.__class__.__name__,"output shape :\t",X.shape)

Sequential output shape : torch.Size([1, 64, 56, 56])
Sequential output shape : torch.Size([1, 64, 56, 56])
Sequential output shape : torch.Size([1, 128, 28, 28])
Sequential output shape : torch.Size([1, 256, 14, 14])
Sequential output shape : torch.Size([1, 512, 7, 7])
AdaptiveAvgPool2d output shape : torch.Size([1, 512, 1, 1])
Flatten output shape : torch.Size([1, 512])
Linear output shape : torch.Size([1, 10])

八、稠密连接⽹络（DenseNet）

ResNet和DenseNet的关键区别在于，DenseNet输出是连接（⽤图中的[, ]表⽰）⽽不是
如ResNet的简单相加。

DenseNet和ResNet
ResNet直接将输入与输出按通道维度相加，所以必须保证输出通道和输入通道一致且高宽一致，所以需要一个1*1的卷积核调整通道数和分辨率（调整分辨率是通过strides）
DenseNet不是简单相加，而是将卷积核的输入和输出在通道维上进行连接。
稠密网络主要由2部分构成：稠密块（dense block）和过渡层（transition layer）。前者定义如何连接输⼊和输出，⽽后者则控制通道数量，使其不会太复杂。

import torch
from torch import nn
from d2l import torch as d2l
def conv_block(input_channels,num_channels):
    return nn.Sequential(
    nn.BatchNorm2d(input_channels),nn.ReLU(),
    nn.Conv2d(input_channels,num_channels,kernel_size=3,padding=1))

#⼀个稠密块由多个卷积块组成，每个卷积块使用相同数量的输出通道。
#然⽽，在前向传播中，我们将每个卷积块的输⼊和输出在通道维上连结。
class DenseBlock(nn.Module):
    def __init__(self,num_convs,input_channels,num_channels):
        super(DenseBlock,self).__init__()
        layer=[]
        for i in range(num_convs):
            #输入通道维为num_channels*i+input_channels，因为每经过一个卷积块都要将输入和输出连接出来
            layer.append(conv_block(num_channels*i+input_channels,num_channels))
            self.net=nn.Sequential(*layer)
    
    def forward(self,X):
        for blk in self.net:
            Y=blk(X)
            #连接通道维度上每个块的输入和输出
            X=torch.cat((X,Y),dim=1)
        return X

blk=DenseBlock(2,3,10)
X=torch.randn(4,3,8,8)
Y=blk(X)
Y.shape

torch.Size([4, 23, 8, 8])

#由于每个稠密块都会带来通道数的增加，使用过多则会过于复杂化模型。⽽过渡层可以⽤来控制模型复杂度。
#它通过1 × 1卷积层来减⼩通道数，并使⽤步幅为2的平均汇聚层减半⾼和宽，从⽽进⼀步降低模型复杂度。
def transition_block(input_channels,num_channels):
    return nn.Sequential(nn.BatchNorm2d(input_channels),nn.ReLU(),
                         #1*1卷积层用来减少通道数，不改变高宽
                         nn.Conv2d(input_channels,num_channels,kernel_size=1),
                         #平均汇聚层不改变通道高，减半高和宽
                         nn.AvgPool2d(kernel_size=2,stride=2))

#DenseNet⾸先使用同ResNet⼀样的单卷积层和最⼤汇聚层。
b1=nn.Sequential(
                nn.Conv2d(1,64,kernel_size=7,stride=2,padding=3),
                nn.BatchNorm2d(64),nn.ReLU(),
                nn.MaxPool2d(kernel_size=3,stride=2,padding=1))


#类似于ResNet使⽤的4个残差块，DenseNet使⽤的是4个稠密块。与ResNet类似，我们可以设置每个稠密块使⽤多少个卷积层。
#这⾥我们设成4，从⽽与 7.6节的ResNet-18保持⼀致。
#稠密块⾥的卷积层通道数（即增⻓率）设为32，所以每个稠密块将增加128个通道。
#在每个模块之间，ResNet通过步幅为2的残差块(Residual块中的第一个卷积层的strides)减⼩⾼和宽
#DenseNet则使用过渡层来减半⾼和宽，并减半通道数。
# num_channels为当前的通道数


#这里的增加率就相当于dense_block中的num_channels
num_channels,growth_rate=64,32
#共有四个dense_block,每个dense_block中都有四个卷积块
num_convs_in_dense_blocks=[4,4,4,4]
blks=[]
for i,num_convs in enumerate(num_convs_in_dense_blocks):
    blks.append(DenseBlock(num_convs,num_channels,growth_rate))
    #上一个稠密块的输出通道数
    num_channels+=growth_rate*num_convs
    #在稠密块之间添加一个转换层，使通道数量减半
    if i!=len(num_convs_in_dense_blocks)-1:
        blks.append(transition_block(num_channels,num_channels//2))
        num_channels=num_channels//2

#与ResNet类似，最后接上全局汇聚层和全连接层来输出结果。
net=nn.Sequential(b1,*blks,
                  nn.BatchNorm2d(num_channels),nn.ReLU(),
                  nn.AdaptiveAvgPool2d((1,1)),
                  nn.Flatten(),
                  nn.Linear(num_channels,10))

输出：
Sequential shape: torch.Size([1, 64, 32, 32])
DenseBlock shape: torch.Size([1, 192, 32, 32])
Sequential shape: torch.Size([1, 96, 16, 16])
DenseBlock shape: torch.Size([1, 224, 16, 16])
Sequential shape: torch.Size([1, 112, 8, 8])
DenseBlock shape: torch.Size([1, 240, 8, 8])
Sequential shape: torch.Size([1, 120, 4, 4])
DenseBlock shape: torch.Size([1, 248, 4, 4])
BatchNorm2d shape: torch.Size([1, 248, 4, 4])
ReLU shape: torch.Size([1, 248, 4, 4])
AdaptiveAvgPool2d shape: torch.Size([1, 248, 1, 1])
Flatten shape: torch.Size([1, 248])
Linear shape: torch.Size([1, 10])

你可能感兴趣的:(笔记,cnn,深度学习)

ReactiveCocoa 学习笔记七（RACCommand）那夜的星空分外清澈 ReactiveCocoa ReactiveCocoa
RACCommandRACCommand关键的两个方法如下，理解了他们便能理解RACCommand的作用。-(instancetype)initWithEnabled:(nullableRACSignal*)enabledSignalsignalBlock:(RACSignal*(^)(InputType_Nullableinput))signalBlock;-(RACSignal*)execut
C语言学习笔记：do..while循环、goto语句女巫和她的乌鸦 C语言 c语言学习
do…while（）循环，do语句的语法：do循环语句；while（表达式）；例：intmain(){inti=1;do{printf("%d",i);i++;}while(i#include#includevoidmenu(){printf("1.play\n");printf("0.exit\n");}voidgame(){//猜数字游戏的实现:先生成随机数-->猜数字。rand函数返回了一个
【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
Kubernetes学习笔记（四）--Pod 状态与生命周期管理 Mr小三 Kubernetes 云原生 kubernetes
文章目录四、Pod状态与生命周期管理1.Pod概念网络存储用法pod的终止2.Init容器init模板用途3.Pause容器4.Pod的生命周期Podphase（阶段）Pod状态5.Pod健康-容器探针(Probe)概念EXEC探针HTTP探针TCPSocket探针四、Pod状态与生命周期管理Pod是kubernetes中最重要的基本概念，在kubernetes中最小的管理元素不是一个个独立的容器
仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
《比昂全集》阅读笔记：漫长的周末 - 战争 4 中若宁Rena
【战争】第4节。如果年轻时候遇到一些优秀的人，这些人可能成为年轻人的榜样。一个人可能希望自己未来成为自己欣赏的老师、教官、或者自己的父母那样的父母。Bion所在的营地很好，纪律严明。那些军官也是应该服从的人。尽管有的教官有有依据的缺点，但是那时候还是容易把对方放到权威的角色里。Bion的生活中，有着：“训练、技术课程、左轮手枪、机关枪、六磅步枪，还有强大的坦克本身……”“不坏的士兵……熄灯……夜晚
什么是java IT界小新学姐
Java属于一种计算机语言，计算机语言的种类非常多，总的来说可以分成机器语言、汇编语言、高级语言三大类。Java是一种高级计算机语言。Java是由SunMicrosystems在1995年首先发布的编程语言和计算平台。有许多应用程序和Web站点只有在安装Java后才能正常工作，而且这样的应用程序和Web站点日益增多。Java快速、安全、可靠。从笔记本电脑到数据中心，从游戏控制台到科学超级计算机，从
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例你喜欢喝可乐吗？ deep learning deploy 深度学习 YOLO 目标检测
深度学习模型开发部署全流程：以YOLOv11目标检测任务为例深度学习模型从开发到部署的完整流程包含需求分析、数据准备、模型训练、模型优化、模型测试和部署运行六大核心环节。YOLOv11作为新一代目标检测模型，不仅延续了YOLO系列的高效实时性能，还在检测精度和泛化能力上取得显著突破，使其成为工业质检、安防监控、自动驾驶等领域的理想选择。本文将详细阐述这一完整流程，并结合YOLOv11的具体实现，提
预测导管原位癌浸润性复发的深度学习：利用组织病理学图像和临床特征浪漫的诗人论文深度学习人工智能
文章目录研究内容目的方法数据集模型开发模型训练与评估外部验证统计分析研究结果模型性能风险分层外部验证特征重要性原文链接原文献：Deeplearningforpredictinginvasiverecurrenceofductalcarcinomainsitu:leveraginghistopathologyimagesandclinicalfeatures研究背景【DCIS与IBC的关联】乳腺导管
《小狗钱钱》学习心得（第三、四、五章） A01琪公子
《小狗钱钱》学习心得（第三、四、五章）最近在跟战友读一本《小狗钱钱》的书，今天把读到的精华与对这本书的感悟分享给正在看文章的你，希望对你有用。一、成功笔记：1.昨天的梦想相册的三个重要梦想开始在我脑海中浮现，我闭眼想到靠自己努力买房并装修好的新房的温馨舒适、爸妈安享晚年的幸福时刻，以及清晨爱人醒来那甜蜜的微笑。2.给客户重新发了合同，不在急急燥燥，而是准备好，只要有机会，就紧紧抓住。3.用心读完了
python分布式爬虫打造搜索引擎--------scrapy实现 weixin_30515513 爬虫 python 开发工具
http://www.cnblogs.com/jinxiao-pu/p/6706319.html最近在网上学习一门关于scrapy爬虫的课程，觉得还不错，以下是目录还在更新中，我觉得有必要好好的做下笔记，研究研究。第1章课程介绍1-1python分布式爬虫打造搜索引擎简介07:23第2章windows下搭建开发环境2-1pycharm的安装和简单使用10:272-2mysql和navicat的安装
创意PPT模板：好水灵的排版，还是熟悉的味道 LJ的学习笔记
大家好，我是爱学习的瞄代表。今天给广大职场人带来一份创意PPT模板（好水灵的排版）。【总览图】：【PPT展示】：【PPT模板特点】：1、创意PPT模板，前所未有的快感；2、几乎所有素材均可编辑，有型更有料；3、扁平设计，时下正流行；4、好水灵的排版，还是熟悉的味道【获取方式】：微信公众号：LJ的读书笔记（ljdushubiji）回复关键词“0505”，即可获取。
深度学习：让 AI 拥有 “思考” 能力的核心技术田园Coder 人工智能科普人工智能科普
1.深度学习：突破传统的AI“进阶版”1.1什么是深度学习？深度学习是机器学习的一个分支，它通过模拟人脑神经网络的多层结构，让AI能够自动学习数据中的复杂特征，从而完成更高级的认知任务。例如，传统机器学习需要人类手动提取“猫有尖耳朵、胡须”等特征，而深度学习能直接从原始图片中，自主学习从像素到轮廓、再到整体形态的多层特征，最终实现更精准的识别。这种“自主提取特征”的能力，让深度学习突破了传统AI的
猴子·成功日记（32） Monkey_858e
2020/3/211、口语打卡2、牙套计时——26副第2天3、小提琴练习2小时4、学习理财+笔记5、备课+文稿6、尤克里里打卡7、上课8、练读《末日焚书》
《How to Take Smart Notes》读书笔记1 LY320
最近在读一本书，题为《HowtoTakeSmartNotes:OneSimpleTechniquetoBoostWriting,LearningandThinking–forStudents,AcademicsandNonfictionBookWriters》1。尚未读完，分享一些读这本书的感想，我的一些心得，和不解。这本书让我觉得最有收获的点是更新了我对记录和整理笔记的认识。通常我们在记录笔记时
左眼跳财右眼跳灾的科学依据是什么？医生告诉你答案高省张导师
俗话说“左眼跳财，右眼跳灾”。许女士对这句俗语深信不疑。从一年前开始，许女士总是左眼皮跳，但每次只要稍作休息就能恢复正常，所以许女士都没放在心上，甚至还心想：说不定能走财运了。大家好，我是高省APP最大团队，【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码520888，注册送2皇冠会员，送万元推广大礼包。给大家推荐一个公主号《张十五笔记》分享引流，思维
为这人间操碎了心-读书笔记-02 Tracy的小书斋
火车有人嫌火车走得慢，又有人嫌火车冒烟脏。人类浪费时间精力做好多好多不该做的事，何必斤斤计较旅途所耗的时间？纵然火车走得像枪弹一般快，车上的人忙的是什么？火车冒烟是脏，可是冒烟的并不只是火车，何况现在火车多不冒烟了。如果老远地看火车冒黑烟或吐白气，那景象却不一定讨厌。送礼礼尚往来，来而不往非礼也。升官图一开始以为这篇文章会是在讲述官场的景象，但是原来升官图只是一个游戏。但是游戏中也蕴含了人间真理：
PyTorch torch.no_grad() 指南（笔记）拉拉拉拉拉拉拉马 pytorch 人工智能 python 笔记深度学习
PyTorchtorch.no_grad()权威在PyTorch深度学习框架中，高效的显存管理对于训练复杂模型和执行大规模推理任务至关重要。显存不足（OutOfMemory,OOM）错误是开发者经常面临的挑战之一。torch.no_grad()作为PyTorch提供的一个核心工具，能够在推理（inference）和验证（validation）阶段显著优化显存使用并提升计算速度。本报告旨在全面、深入
【深度学习基础】PyTorch中model.eval()与with torch.no_grad()以及detach的区别与联系？
目录1.核心功能对比2.使用场景对比3.区别与联系4.典型代码示例(1)模型评估阶段(2)GAN训练中的判别器更新(3)提取中间特征5.关键区别总结6.常见问题与解决方案(1)问题：推理阶段显存爆掉(2)问题：Dropout/BatchNorm行为异常(3)问题：中间张量意外参与梯度计算7.最佳实践8.总结以下是PyTorch中model.eval()、withtorch.no_grad()和.d
读书笔记之瑞达利欧《原则》 niuDavid
桥水创始人瑞·达利欧写的《原则》一书，厚厚的竟达五百多页，我也是花费很长时间读完。《原则》主体架构无非分为三个部分，首先是写自己的历程，夹杂一些自己感悟作为本书的引子，第二部分是讲到归纳的生活原则，最后一部分就讲了工作中的原则。书中归纳点很多，虽然有些是我们早已体察到的，但仍有部分观点新鲜可敬，有些理论是深刻的，有些观点是让人触动不已，有些竟是即相通而又交叉验证的，这些都通过此书系统的给我们展显出
网络爬虫-07 YEGE学AI算法 Python-网络爬虫
网络爬虫-07）**Spider06回顾****scrapy框架****完成scrapy项目完整流程****我们必须记住****爬虫项目启动方式****数据持久化存储****Spider07笔记****分布式爬虫****scrapy_redis详解****腾讯招聘分布式改写****机器视觉与tesseract****补充-滑块缺口验证码案例****豆瓣网登录****Fiddler抓包工具****移
【RK3568 嵌入式linux QT开发笔记】二维码开源库 libqrencode 交叉静态编译和使用
本文参考文章：https://blog.csdn.net/qq_41630102/article/details/108306720参考文章有些地方描述的有疏漏，导致笔者学习过程中，编译的.a文件无法在RK3568平台运行，故写本文做了修正，以下仅是自我学习的笔记，没有写的很详细。一：下载软件包https://download.csdn.net/download/qq_41630102/12781
20200323《学习就是找对方法》笔记1 芯雨诚
走出学习误区，找对学习方法作为老师，经常被问及的问题之一就是，“老师，学习怎么那么难？”“老师，有没有好的学习方法，能够让成绩快速提高呢？”问这个问题的既有学生，也有家长。每每遇到这个问题，我都有一种一言难尽的感觉……其实，学习是一件快乐的事情。我们却总是认为学习是一件“苦差事”，总是觉得学习过程“既枯燥又乏味”，在学校中“厌学”的学生比比皆是……问题到底出在哪里了呢？关键在于我们走进了学习的误区
这也将过去——《大历史：虚无与万物之间》读书笔记毛毛小朋友
图片发自App无论你我的此生有多长，对整个生物的物种而言，都是短暂的；无论我们这个物种生命有多长，对所有的生命而言，都是短暂的；无论所有的生命有多长，对地球而言，都是短暂的；无论地球的寿命有多长，对银河系而言，都是短暂的；我们在短暂的生命中，仰望苍穹，渺小而又卑微的，仰视着时间的河流，那些生命的开端兴盛灭绝与重启。大历史，从星球的形成到未来的遐思，用13章，走完了关于地球的前世今生到未来，那么，阅
恋恋笔记本赫本_abf2
昨晚洗完澡就捧着电脑躲被窝花了两个小时重温了《恋恋笔记本》真心推荐大家看熬对我影响挺大的完全改变了我的爱情观鉴于恋恋笔记本会看哭所以拒绝任何院线的催泪大片（除非自己导/演）睡前会看阿拉斯加独居修行者的纪录片渴望搬去那里远离尘世第一次看这部电影是在高中时候飞往北京的天空中小小的爱情观从那时候开始萌芽电影讲述了一个穷小子爱上富家小姐历尽坎坷白头偕老的故事很难泪目的我也会有情感代入时候毕竟一辈子只爱一个
随笔记龙的心_48aa
新的模式下，人们争先恐后的抢占先机，未来的市场，是适应这种模式，还是淘汰这种模式！静观其变，以不变应万变！
2018-10-24丨微日记027 Jonathanchoi
今天分享一些小碎片：有道云笔记里头有一个扫描文档的功能，可是它只能自动识别，却不能给用户编辑的机会，可谓是“拍得到就是你的，拍不到就拜拜”，而扫描全能王则提供了识别错误后可编辑的功能。开完组会路过包道的时候，发现它提供了顾客到店开柜取餐的功能，为想吃到美食却赶路程赶时间的人们提供了多种选择性。这种饮食界的丰巢快递柜，个人我觉得很实用。捷登都会的洗手间设置让人不太习惯，三层男厕二层是女厕，经常让人白
c语言如何宏定义枚举型结构体,C语言学习笔记--枚举&结构体搁浅的鲎 c语言如何宏定义枚举型结构体
枚举枚举是一种用户定义的数据类型，它用关键字enum以如下语法格式来声明：enum枚举类型名字{名字0，名字1，。。。，名字n}；枚举类型名字通常并不真的使用，要用的是大括号里面的名字，因为它们就是常量符号，它们的类型是int，值则依次从0到n。如：enumcolor{red,yellow,green};就创建了3个常量，red的值是0，yellow的值是1，green的值是2。当需要一些可以排列
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

卷积神经网络 （convolutional neural networks，CNN）