史蒂芬方

完整学习 ResNet 家族 ResNext, SEResNet, SEResNext 代码实现- part1

ResNet一直都是非常卓越的性能级网络从 2015年诞生的原型ResNet一直到最近后续加了squeeze-and-excitation 模块的SEResNet，因为残差机制使得网络层能够不断的加深并且有效的防止性能退化的问题

今天老样子先说原理后上代码和大家一起了解ResNet的理论和实际代码中的架构，之后再说到其他变种

希望不会有小伙伴认为怎么2015年的网络都2019了还有人拿来说，残差结构可谓是经典中的经典，但是有多少人能真正理解其背后含义？
好了，废话不多说入正题

从发现的问题开始着手

ResNet解决传统深度神经网络造成的问题

梯度消失
网络性能退化

待会我们在来说一下梯度为什么会消失， ResNet又是怎么解决的

先说一下网络性能退化吧, 从网络的层数深度来探讨，我们一方面希望层数越多越好，这样一来能够从样本学习到越多的东西，每一层更丰富，但是当网络层不断加深反而会衍生出网络性能退化的问题，有许多层是冗余的，不必要的，关于网络层数过多导致性能退化的问题似乎讨论度比较低，有兴趣推荐以下这篇，建议看原文
Why is it hard to train-deep-neural-networks-degeneracy-not-vanishing-gradient-is-the-key
这边还是稍微提一下，原则上网络性能的下降不代表一定是梯度爆炸或者是消失所导致的，这其实是两个不同层面的问题，但是这边不细说

完整学习 ResNet 家族 ResNext, SEResNet, SEResNext 代码实现- part1_第1张图片

那么我们也不可能每一次都依照不同的任务重新的设计相对应的层数，费时费力不符合成本，于是ResNet问世了

直接来看ResNet的基本结构
这张图一定看过很多次，但从来没好好理解过一次

设输入为 $x$
$F (x)$ 理解为 $x$ 经过各种卷积以及Bn、ReLU的操作

那么右边的 identity 又是什么呢？
我们透过网络退化问题可以了解到较浅层的layer表现的比深层的更好，那么为什么我们不想个办法跳过这些会导致网络退化的层呢？

于是就有了一条自己抄捷径的shortcut，也就是图上的identity
那么整个结构的表达式就可以为

$H (x) = F (x) + x$

H(x) 正是我们网络要学习的output

为了让冗余层（extra layer)能够恒等映射前面的层，就要让F(x)学习为0，

懵了吧我们看下去

我们如果想让某些冗余的层，不要影响网络性能，因此想了个办法可以让该冗余层学习到的参数满足H(x) = x, 什么意思呢？就是输入是x，输出之后还是x，没有变！

我们来仔细看一下表达式 H(x) = F(x) + x，我们如果能让网络学习让F(x) 为0，不就能让H(x) = x，也就是输入等于输出了吗？这比让网络去学习H(x) = x还要简单的多， 因为网络层的权值初始化都会趋近于0, 原来就已经很靠近0了，何必绕一大圈，并且透过ReLU的激活，让负值为0，能够加速让F(x)更接近0，这样当然快速的多，所以让F(x)学习为0来更新冗余层的参数肯定是比较快速的

我们重新将表达式整理成以下

（1） $y_l = h(x_l) + F(x_l, W_l)$
（2） $x_{l+1} = f(y_l)$

$h$ 是恒等映射，也就是右边的shortcut
$F(x_l, W_l)$ 是网络的一系列变化(conv1, bn, relu)
$y_l$ 是输出

$f$ 就是输出之后进行的ReLU function
我们让网络学习F 为0， $h(x_l)$ 和 $f(y_l)$ 都是恒等映射

所以

$h(x_l) = x_l$

如果 $f$ 也是，那么 $x_{l+1} ≡ y$ ，这里≡ 表示恒等于的意思

公式（2）带回原来（1）的式子得到

$x_{l+1} = x_1 + F(x_l, W_l)$

当再次传入到下一个block的时候 $x_{l+2}$

$x_{l+2}=x_{l+1}+F(x_{l+l},W_{l+l}) \\=x_l+F(x_l,W_l)+F(x_{l+1},W_{l+1})$

当从 $x_{l+2}$ 传入到下一个block的时候 $x_{l+3}$

$x_{l+3} = x_{l+2} + F(x{l+2}, W_{l+2}) \\=x_1 + F(x_1, W_1) + F(x_{l+1}, W_{l+1})+F(x_{l+2}, W_{l+2)}$

依照这样循环下去

因此通式可以表达为

$x_L = x_l + \sum^{L-1}_{i=l}F(x_i, Wi)$

所以任意深层的 $X_L$ 的输出，都能表达前面 $L - 1$ 层残差模块的叠加和浅层的输入特征 $x_l$ ,

那么反向传播的式子就会变成如下

Loss对任一层进行更新的话

现在回到我们前面说过梯度消失的问题
还是简单的先了解一下梯度消失的原因

梯度消失容易出现在深层的网络并且用了不合时宜的激励函数例如sigmoid
function，它能将输入的值转换介于0-1之间，我们都知道反向传播是从最后一层向前求导来更新参数，当更新到激活层的地方时， sigmoid的导数会变的非常小趋近于0，如下图可见红色的虚线就是求导后的sigmoid，值最大并不超过0.25，根据Chain rule，每一层的导数相乘之后，梯度将呈现指数形式的下降，网络中每一次的激活层导数相乘越乘越小，也可以总结出越靠后面的层越不容易出现梯度消失的问题，

那么好在ResNet的indentity connection 这条捷径并没有经过任何激活函数（反向式子中的1），而是直接与block的输出相加，所以求导之后的值还是很大，无论权值怎么乘，梯度都还是在正常的值，实现网络层加深的可能

ResNet简单总结

ResNet 结构中的short cut解决了梯度中连乘导致梯度消失的问题
更新冗余层的参数只需要让F(x) 学习0，就能让输入等于输出也就是 H(x) = x

现在你应该对ResNet有更深的了解了吧要是想懂的更透彻
自行推导一下ResNet反向来观察一下 " 1 "的作用

ResNet Pytorch代码实现

那么具体ResNet如何在Pytorch中实现呢？
还是依照几个思路来进行吧，很多教学就是把整个代码一贴，那还不如自己看源码就好

我们来手动实现一下ResNet-18 和ResNet-101吧，光是会调用不值得一提
红框处可见两种不同层数的ResNet
蓝框处可见不同结构的残差block

首先在设计的时候就要先设想好如何用最便利的方式表达这么多种层数的ResNet，我们总不可能101层的真的写一百另一层吧

观察上图就能发现都是block的输出维度有做变化而已，ResNet 网络一共分为5个stage(看最左栏的conv1_x 到· conv5_x), 那么从block的输出通道也从64, 放大到512

我们首先import一下nn这个模块，该模块已经封装了定义ResNet所需要的所有函数，非常之强大，后续也不会import 其他的了

import torch.nn as nn

然后我们发现到残差模块中都有至少一个3x3 的卷积
那么可以先定义一下conv3x3，

def conv3x3(in_channel, out_channel, stride=1):
    return nn.Conv2d(in_channel, out_channel, stride=stride, kernel_size=3, padding=1, bias=False)

return的地方直接返回一个Conv2d的输出，卷积核预设为3， padding值为1
这边注意到bias的部分为False(预设是True)
是因为已经被激活函数前的BatchNorm层的 $\beta$ 给取代了

具体原因请看论文 1502.03167.pdf Section 3.2 有说到

定义好block中3x3的卷积之后，来定义一下整个Basicblock吧

先有几个思路在脑海中

定义一个类继承nn.Module模块
类的初始化中，定义所有会用到的属性(conv, bn, relu)
定义forward function建立数据输入到return的过程

该注意的细节已经在代码旁

class BasicBlock(nn.Module):
    expansion = 1 #主要是定义输出通道的放大倍率， 在bottleneck会用上
    def __init__(self, in_planes, out_planes, stride, downsample=None):
        super(BasicBlock, self).__init__() #记得继承父类
        self.conv1 = conv3x3(in_planes, out_planes, stride=stride)
        self.bn1 = nn.BatchNorm2d(out_planes) #BN通常依据上一层输出的维度做BN
        self.conv2 = conv3x3(in_planes, out_planes, stride=stride)
        self.bn2 = nn.BatchNorm2d(out_planes)
        self.relu = nn.ReLU(inplace=True) #inplace表示对原数据修改， 而非产生新数据， 节省内存
        self.downsample = downsample
        self.stride = stride
        

    def forward(self, x):
        identity = x
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)
        x = self.conv2(x)
        x = self.bn2(x)
        out = self.relu(x)

        if self.downsample is not None:
            x = self.downsample(x)

        out += identity
        out = self.relu(out)
        return out

这边简单说下downsample的作用是为了避免 $y = F(x_i, W_i) + x$ 中 $F(x_i, W_i) + x$ 相加的部分因为维度不同没法相加所进行的一个转换，那么式子会变成 $y = F(x_i, W_i) + W_sx$ ，这个到后面定义网络主架构的时候在提

那么接下来可以定义一下另一种残差模块Bottleneck，加入了conv1x1 减少了参数量，主要给网络层数较深的使用

来说明一下与Basic不同的地方

expansion = 4 ：请看图中的蓝框可以发现bottleneck的最后一层1x1输出的维度是第1(conv1x1), 2(conv3x3)层的四倍, 因此放大倍率为4
主结构变成 1x1, 3x3, 1x1

class Bottleneck(nn.Module):
    expansion = 4 #注意最后一层的out_channel要乘上放大倍率
    def __init__(self, in_planes, out_planes, stride, downsample=None):
        super(Bottleneck, self).__init__()
        self.conv1 = conv1x1(in_planes, out_planes, stride=stride)
        self.bn1 = nn.BatchNorm2d(out_planes) #for conv2
        self.conv2 = conv3x3(in_planes, out_planes, stride=stride)
        self.bn2 = nn.BatchNorm2d(out_planes) #for conv2
        self.conv3 = conv1x1(in_planes, out_planes * self.expansion, stride=stride)
        self.bn3 = nn.BatchNorm2d(out_planes * self.expansion) #for conv3
        self.relu = nn.ReLU(inplace=True)
        self.downsample = downsample
        self.stride = stride

    def forward(self, x):
        identity = x
        x = self.conv1(x)
        x = self.bn(x)
        x = self.relu(x)

        x = self.conv2(x)
        x = self.bn(x)
        x = self.relu(x)

        x = self.conv3(x)
        out = self.bn3(x)

        if self.downsample is not None:
            identity = self.downsample(x)

        out += identity
        out = self.relu(out)

        return out

接下来只要定义ResNet的网络主体就可以了

class ResNet(nn.Module):
    def __init__(self, block, stages, num_classes=1000, zero_init_residual=False):
        super(ResNet, self).__init__()
        self.inplanes = 64 #第一个stage通道数一定是64, 因为先经过(64, 7, 7)的conv1
        self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False)
        self.bn1 = nn.BatchNorm2d(64)
        self.relu = nn.ReLU(inplace=True)
        self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)
        self.layer1 = self._make_layer(block, 64, stages[0], stride=1)
        self.layer2 = self._make_layer(block, 128, stages[1], stride=2)
        self.layer3 = self._make_layer(block, 256, stages[2], stride=2)
        self.layer4 = self._make_layer(block, 512, stages[3], stride=2)

        self.avgpool = nn.AdaptiveAvgPool2d((1, 1)) #算是一种global average pooling
        self.fc = nn.Linear(512*block.expansion, num_classes)
        # 最后一层实现全连接
        #输入就是前一层的输出(512, 1, 1), 输出就是类别数

        for m in self.modules():
            if isinstance(m, nn.Conv2d):#只要是卷积都操作， 都对weight和bias进行kaiming初始化
                nn.init.kaiming_normal_(m.weight, mode='fan_out', nonlinearity='relu')
            elif isinstance(m, nn.BatchNorm2d):#bn层都权重初始化为1， bias=0
                nn.init.constant_(m.weight, 1)
                nn.init.constant_(m.bias, 0)
        '''
        根据以下论文， 在每个block最后的一个BN进行权重0值初始化
        有助于提升精度
        https://arxiv.org/abs/1706.02677
        '''
        if zero_init_residual:
            for m in self.modules():
                if isinstance(m, Bottleneck): #如果是实例bottleneck的话
                    nn.init.constant_(m.bn3.weight, 0)
                elif isinstance(m, BasicBlock):
                    nn.init_constant_(m.bn2.weight, 0)


    def forward(self, x):
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.relu(x)
        x = self.maxpool(x)

        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)

        x = self.avgpool(x) #after pooling shape(N, 1, 1)
        x = x.view(x.size(0), -1)
        out = self.fc(x)

        return out




    def _make_layer(self, block, out_planes, blocks, stride=1):
        downsample = None
        if stride !=1 or self.inplanes != out_planes * block.expansion:
            downsample = nn.Sequential(
                conv1x1(self.inplanes, out_planes* block.expansion, stride),
                nn.BatchNorm2d(out_planes * block.expansion)
            )
        layers = [] #空列表
        layers.append(block(self.inplanes, out_planes, stride, downsample)) #添加进第一个block， 
        self.inplanes = out_planes * block.expansion 
        #确保上一层输出与下一层的输入通道数相同

        for i in range(1, blocks): #blocks(设定每stage多少blocks), 有几个block就添加blocks-1个（前面已经添加第一个block）
            layers.append(block(self.inplanes, out_planes, stride))

        return nn.Sequential(*layers)

这边要特别说一下_make_layer这个函数
我个人认为能想出这样结构来简单的实现各种层数是很牛的
这个函数的功能主要是将ResNet 的 stage 2~5实现，利用for loop将每一个stage需要的block装进去

首先条件式判断
if stride !=1 or self.inplanes != out_planes * block.expansion:
输入通道数不等于输出通道数时定义downsample
这里用到nn的Sequential这个类, 就类似于我们定义的forward一样，能将各种操作封装到一个变量中

downsample = nn.Sequential(
                conv1x1(self.inplanes, out_planes* block.expansion, stride),
                nn.BatchNorm2d(out_planes * block.expansion)
            )

接下来就是依照结构设计将block装进列表

layers =[] #空列表
layers.append(block(self.inplanes, out_planes, stride, downsample)) #添加进第一个block， 
self.inplanes = out_planes * block.expansion 
#确保上一层输出与下一层的输入通道数相同


for i in range(1, blocks): #blocks(设定每stage多少blocks), 有几个block就添加blocks-1个（前面已经添加第一个block）
    layers.append(block(self.inplanes, out_planes, stride))

return nn.Sequential(*layers)

其中self.inplanes = out_planes * block.expansion 的用意如下图
可以确定第一组bottleneck输出为1024，第二组bottleneck的输入也同样为1024，要是少了这组代码输入将全为统一通道数64，不信的可以试试

最终我们主体的两大部分都已经完成了
ResNet主体和block(basic / bottleneck)的部分

在来依照需求组装就行
例如ResNet 18， stage 2 ~ stage5 每个stage都是两组block
那么重新定义函数

def ResNet18(pretrained = False, **kwargs):
    model = ResNet(BasicBlock, [2, 2, 2, 2], **kwargs)
    if pretrained:
        print("Just a test, show download from mode_zoo url")
    return model


def ResNet101(pretrained = False, **kwargs):
    model = ResNet(Bottleneck, [3, 4, 23, 3], **kwargs)
    if pretrained:
        print("Just a test, show download from mode_zoo url")
    return model

pretrained 这个形参依据bool值判别是否进行加载预训练模型，这边只是练习就不写上了，有兴趣可以看torchvision.model里怎么调用的

**kwargs 留下可以添加参数的空间，例如num_classes=1000, zero_init_residual=False

可以看到调用ResNet这个类，并且指定需要传入的block类别，然后利用列表将每一个stage的blocks数目装进

然后就没有然后了，搞定！

Part2准备写一下ResNet的变种 ResNext系列
一样会先说一下网络结构在用代码实现

参考
https://towardsdatascience.com/the-vanishing-gradient-problem-69bf08b15484)
https://towardsdatascience.com/residual-blocks-building-blocks-of-resnet-fd90ca15d6ec

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
开心蒋泳频
从无比抗拒来上课到接受，感动，收获～看着波哥成长，晶晶幸福笑容满面。感觉自己做的事情很有意义，很开心！还有3个感召目标就是还有三个有缘人，哈哈。明天感召去明日计划：8：30-11：00小公益11：00-21点上班，感召图片发自App图片发自App图片发自App
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
2019-12-22-22:30 涓涓1016
今天是冬至，写下我的日更，是因为这两天的学习真的是能量的满满，让我看到了自己，未来另外一种可能性，也让我看到了这两年这几年的过程中我所接受那些痛苦的来源。一切的根源和痛苦都来自于人生，家庭，而你的原生家庭，你的爸爸和妈妈，是因为你这个灵魂在那一刻选择他们作为你的爸爸和妈妈来的，所以你得接受他，你得接纳他，他就是因为他的存在而给你的学习和成长带来这些痛苦，那其实是你必然要经历的这个过程，当你去接纳的
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
人生的每一步路都算数 sheli
如果你想打工，一直靠打工赚钱，那你就会不断的希望自己变得更专业，不断的希望能够获得更好的工作机会，升职加薪。如果你的目标志不在此，而是拥有自己的企业，那你的选择就会出现差别。在认真打工的人眼里，会“不务正业”，会总是选择不同岗位，甚至放弃高薪机会。但是这背后都是有更加长远的规划。成功富人所必需的管理技能包括：1．对现金流的管理。2．对系统的管理。3．对人员的管理。所以，在没有获得这些能力之前，只要
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

完整学习 ResNet 家族 ResNext, SEResNet, SEResNext 代码实现- part1

ResNet解决传统深度神经网络造成的问题

为了让冗余层（extra layer)能够恒等映射前面的层， 就要让F(x)学习为0，

ResNet简单总结

ResNet Pytorch代码实现

可以看到调用ResNet这个类， 并且指定需要传入的block类别， 然后利用列表将每一个stage的blocks数目装进

你可能感兴趣的:(人工智能,目标学习,ResNet,ResNext,学习,Deeplearning,网络结构)

为了让冗余层（extra layer)能够恒等映射前面的层，就要让F(x)学习为0，

可以看到调用ResNet这个类，并且指定需要传入的block类别，然后利用列表将每一个stage的blocks数目装进