Rock_Huang~

rock带你读CornerNet-lite系列源码（二）

文章目录

前言
CorNerNet 结构
CornerNet_saccade结构

attention机制

CornerNet_Squeeze结构
构建Groundtruth

热图
focal loss

pull and push

前言

接上回rock带你读CornerNet-lite系列源码（一）, 前篇文章介绍了项目代码的总体架构，和训练时的调用关系，数据流传递到了 py_utils.py下的model定义部分，本篇主要介绍（一）py_utils.py下的三个文件，模型定义。（二）sample下的三个文件，构建Groundtruth，encode方式。

CorNerNet 结构

阅读源码最好的方式是按照组件解读，这里强烈建议看下：Hourglass网络的理解和代码分析
好的，这里默认看懂了哈，下面看这段代码就比较好理解了。

import torch
import torch.nn as nn

from .py_utils import TopPool, BottomPool, LeftPool, RightPool
#作者定义的C++4个扩展POOL操作
from .py_utils.utils import convolution, residual, corner_pool
from .py_utils.losses import CornerNet_Loss
from .py_utils.modules import hg_module, hg, hg_net

def make_pool_layer(dim):
    return nn.Sequential()

#重复的残差模块，不会改变特征图的大小，但会改变channel的数量，
#即（B，N， W，H）这个操作只会改变N
def make_hg_layer(inp_dim, out_dim, modules):   
    layers  = [residual(inp_dim, out_dim, stride=2)]
    layers += [residual(out_dim, out_dim) for _ in range(1, modules)]
    return nn.Sequential(*layers)

class model(hg_net):
 # 继承hg_net模块，就是把hg_net的所有定义拿过来可以直接调用，
 #这里的model就是CorNerNet model结构的所有
    def _pred_mod(self, dim):  # 用1*1的核升维或者降维到dim个channel
        return nn.Sequential(
            convolution(3, 256, 256, with_bn=False),
            nn.Conv2d(256, dim, (1, 1)) 
        )

    def _merge_mod(self):
        return nn.Sequential(
            nn.Conv2d(256, 256, (1, 1), bias=False), 
            #用1*1的核升维或者降维到256个channel
            nn.BatchNorm2d(256)
        )

    def __init__(self):
        stacks  = 2   #堆叠的沙漏网络，2个沙漏堆一起
        pre     = nn.Sequential(
            convolution(7, 3, 128, stride=2),
            residual(128, 256, stride=2)
        )
 #传入一个（B，N，W，H），B是batch，N是channel，W,H是feature map的维度，
#进入上面的pre模块 “预热”了一下下，让channel的数量变为256，
#这个就是为了下一步好和hg_net 模块好衔接，hg_net 模块从256开始増维到512，
#然后降维256（都是对feature map的channel操作，维度越大，map的size越小，
#维度小，size大，故称沙漏网络） 

        hg_mods = nn.ModuleList([
            hg_module(
                5, [256, 256, 384, 384, 384, 512], [2, 2, 2, 2, 2, 4],
                make_pool_layer=make_pool_layer,
                make_hg_layer=make_hg_layer
            ) for _ in range(stacks)  #2   2次重堆叠沙漏
        ])
        cnvs    = nn.ModuleList([convolution(3, 256, 256) for _ in range(stacks)])
        inters  = nn.ModuleList([residual(256, 256) for _ in range(stacks - 1)])
        cnvs_   = nn.ModuleList([self._merge_mod() for _ in range(stacks - 1)])
        inters_ = nn.ModuleList([self._merge_mod() for _ in range(stacks - 1)])
#  convs ,inters, cnvs_,inters_,这几个都是把一些操作组合成ModuleList执行

        hgs = hg(pre, hg_mods, cnvs, inters, cnvs_, inters_) 
        #沙漏网络的构建，hg_mods里面有2个沙漏网络，强调一下
        tl_modules = nn.ModuleList([corner_pool(256, TopPool, LeftPool) for _ in range(stacks)])
        br_modules = nn.ModuleList([corner_pool(256, BottomPool, RightPool) for _ in range(stacks)])

        tl_heats = nn.ModuleList([self._pred_mod(80) for _ in range(stacks)])
        br_heats = nn.ModuleList([self._pred_mod(80) for _ in range(stacks)])
        #t1_modules, br_moudles,tl_heats,br_heats 层是抽取特征图的信息，构建pred （pred是预测，target或groudtruth是encode之后的标签）
        for tl_heat, br_heat in zip(tl_heats, br_heats):
            torch.nn.init.constant_(tl_heat[-1].bias, -2.19)
            torch.nn.init.constant_(br_heat[-1].bias, -2.19)

        tl_tags = nn.ModuleList([self._pred_mod(1) for _ in range(stacks)])
        br_tags = nn.ModuleList([self._pred_mod(1) for _ in range(stacks)])

        tl_offs = nn.ModuleList([self._pred_mod(2) for _ in range(stacks)])
        br_offs = nn.ModuleList([self._pred_mod(2) for _ in range(stacks)])
        #tl_tags, br_tags, tl_offs, br_offs 同上
        super(model, self).__init__(
            hgs, tl_modules, br_modules, tl_heats, br_heats, 
            tl_tags, br_tags, tl_offs, br_offs
        )
      #super是为了继承父类hg——net的初始化属性
        self.loss = CornerNet_Loss(pull_weight=1e-1, push_weight=1e-1)
       #loss

CornerNet_saccade结构

这个是CornerNet的改进版，改进点是用了三个简化版的沙漏网络，同时还是用了一个attention机制，源代码不做介绍了，和CornetNet差别不大

attention机制

attention机制是将检测物体划分为大目标（96

def create_attention_mask(atts, ratios, sizes, detections):
    for det in detections:
        width  = det[2] - det[0]
        height = det[3] - det[1]

        max_hw = max(width, height)
        for att, ratio, size in zip(atts, ratios, sizes):
        #atts: size [[16, 16], [32, 32], [64, 64]] att_map的大小，这个记不清了，debug下，应该差不多
        #ratio:[16, 8, 4]  这个是中间层map相对输入图的缩小比率
        #sizes:[[96, 256], [32, 96], [0, 32]]  这个是区分标准
        #如果attention大小为16*16
            if max_hw >= size[0] and max_hw <= size[1]:
                x = (det[0] + det[2]) / 2
                y = (det[1] + det[3]) / 2
                x = (x / ratio).astype(np.int32)
                y = (y / ratio).astype(np.int32)
                att[y, x] = 1

这里是将标签 encode成 target形式，网络需要生成pred的attention形式，这个对应定义在 model/CornerNet_Saccade.py的att_mods 模块输出，文章的划分标准是按照特征图层的位置划分的，那个ratio是输入特征图缩小的比例。
这里stack=3， attention= [att_mods1, att_mods2,att_mod3] 3个att_mod模块分别接在3个堆叠的沙漏网络中up层 (每个模块有3个up输出，总共9个map输出)，

        att_mods = nn.ModuleList([
            nn.ModuleList([
                nn.Sequential(
                    convolution(3, 384, 256, with_bn=False),    #接在 512----》384 up的后面
                    nn.Conv2d(256, 1, (1, 1))
                ),
                nn.Sequential(
                    convolution(3, 384, 256, with_bn=False),  # 接在 384----》384  up的后面
                    nn.Conv2d(256, 1, (1, 1))
                ),
                nn.Sequential(
                    convolution(3, 256, 256, with_bn=False),  # 接在  384---》256，  up的后面
                    nn.Conv2d(256, 1, (1, 1))
                )
            ]) for _ in range(stacks)

这句在moudles/moudle.py文件saccade_net类中，意思就是将每个att_mod接在沙漏网络的up位置，

atts       = [[att_mod_(u) for att_mod_, u in zip(att_mods, up)] for att_mods, up in zip(self.att_modules, ups)]

up是什么呢，hg_modules= saccade_module，就是下面返回的atts，这各类调用了 saccade_module类返回的merg，mergs， ups就是mergs=[第一个沙漏最后的所有up层输出，第二个沙漏的所有up层输出，第三个沙漏的所有up层输出]，注：每个沙漏有3个up层，即最高维512----》384， 384----》384， 384—》256，每个有up操作。请再看下attmod的注释。

class saccade(nn.Module):
    def __init__(self, pre, hg_modules, cnvs, inters, cnvs_, inters_):
        super(saccade, self).__init__()

        self.pre  = pre
        self.hgs  = hg_modules
        self.cnvs = cnvs

        self.inters  = inters
        self.inters_ = inters_
        self.cnvs_   = cnvs_

    def forward(self, x):
        inter = self.pre(x)

        cnvs  = []
        atts  = []
        for ind, (hg_, cnv_) in enumerate(zip(self.hgs, self.cnvs)):
            hg, ups = hg_(inter)
            cnv = cnv_(hg)
            cnvs.append(cnv)
            atts.append(ups)

            if ind < len(self.hgs) - 1:
                inter = self.inters_[ind](inter) + self.cnvs_[ind](cnv)
                inter = nn.functional.relu_(inter)
                inter = self.inters[ind](inter)
        return cnvs, atts

CornerNet_Squeeze结构

这个网络是轻量级的，前面2个网络都非常大，训练耗费资源很多，单个GPU基本上训练是不行的，cornerNet_Squeeze网络的改进点在于使用个fire_module 替换了residual模块，这个技术是轻量级网络squeezenet的结构，参考论文:squeezenetV1, suqeezenet-V2
这是一个很巧妙的替换，首先看下residual模块：

class residual(nn.Module):
    def __init__(self, inp_dim, out_dim, k=3, stride=1):
        super(residual, self).__init__()
        p = (k - 1) // 2

        self.conv1 = nn.Conv2d(inp_dim, out_dim, (k, k), padding=(p, p), stride=(stride, stride), bias=False)
        self.bn1   = nn.BatchNorm2d(out_dim)
        self.relu1 = nn.ReLU(inplace=True)

        self.conv2 = nn.Conv2d(out_dim, out_dim, (k, k), padding=(p, p), bias=False)
        self.bn2   = nn.BatchNorm2d(out_dim)
        
        self.skip  = nn.Sequential(
            nn.Conv2d(inp_dim, out_dim, (1, 1), stride=(stride, stride), bias=False),
            nn.BatchNorm2d(out_dim)
        ) if stride != 1 or inp_dim != out_dim else nn.Sequential()
        self.relu  = nn.ReLU(inplace=True)

    def forward(self, x):
        conv1 = self.conv1(x)
        bn1   = self.bn1(conv1)
        relu1 = self.relu1(bn1)

        conv2 = self.conv2(relu1)
        bn2   = self.bn2(conv2)

        skip  = self.skip(x)
        return self.relu(bn2 + skip)

fire_module结构如下：

class fire_module(nn.Module):
    def __init__(self, inp_dim, out_dim, sr=2, stride=1):
        super(fire_module, self).__init__()
        self.conv1    = nn.Conv2d(inp_dim, out_dim // sr, kernel_size=1, stride=1, bias=False)
        self.bn1      = nn.BatchNorm2d(out_dim // sr)
        self.conv_1x1 = nn.Conv2d(out_dim // sr, out_dim // 2, kernel_size=1, stride=stride, bias=False)
        self.conv_3x3 = nn.Conv2d(out_dim // sr, out_dim // 2, kernel_size=3, padding=1, 
                                  stride=stride, groups=out_dim // sr, bias=False)
        self.bn2      = nn.BatchNorm2d(out_dim)
        self.skip     = (stride == 1 and inp_dim == out_dim)
        self.relu     = nn.ReLU(inplace=True)

    def forward(self, x):
        conv1 = self.conv1(x)
        bn1   = self.bn1(conv1)
        conv2 = torch.cat((self.conv_1x1(bn1), self.conv_3x3(bn1)), 1)
        bn2   = self.bn2(conv2)
        if self.skip:
            return self.relu(bn2 + x)
        else:
            return self.relu(bn2)

groups=out_dim // sr 分组卷积，这里sr一定是整除，把channel分成多个组，卷积后相加，这个减少了很多计算量，原来一个卷积和要卷所有的channel，现在只有一半。最后torch.cat把channel叠加成和输入channel一样。

构建Groundtruth

这里是sample下的文件，以cornernet为例：

   #一个batch的图像，这里进行shuffle(打乱)，cropping（随机裁剪），flipping（翻转）
    images      = np.zeros((batch_size, 3, input_size[0], input_size[1]), dtype=np.float32)
    # 左上角的热图
    tl_heatmaps = np.zeros((batch_size, categories, output_size[0], output_size[1]), dtype=np.float32)
    #右下角热图
    br_heatmaps = np.zeros((batch_size, categories, output_size[0], output_size[1]), dtype=np.float32)
    ##左上角坐標偏移，最后特征map输出的 output_size （64,64） 上坐标 和 input_size（511， 511）坐标间的偏移量，都是groundtruth box坐标的损失
    tl_regrs    = np.zeros((batch_size, max_tag_len, 2), dtype=np.float32)
    # 右下角偏移
    br_regrs    = np.zeros((batch_size, max_tag_len, 2), dtype=np.float32)
    # tl_tags[b_ind, tag_ind] = ytl * output_size[1] + xtl， 左上角在output_map(64,64)的位置
    tl_tags     = np.zeros((batch_size, max_tag_len), dtype=np.int64)
    #同上
    br_tags     = np.zeros((batch_size, max_tag_len), dtype=np.int64)
    #tag_masks[b_ind, :tag_len] = 1，  b_ind 是batch中图像索引， tag_len 是图像中的 tl，br 组数量
    tag_masks   = np.zeros((batch_size, max_tag_len), dtype=np.uint8)
    #表示batch中每个图有多少组tl，br
    tag_lens    = np.zeros((batch_size, ), dtype=np.int32)

热图

#radius是根据radius = gaussian_radius((height, width), gaussian_iou)计算
# 生成热图 draw_gaussian(tl_heatmaps[b_ind, category], [xtl, ytl], radius)，
#这里直接使用浅拷贝在tl_heatmap上操作 见 最后三句代码

def gaussian2D(shape, sigma=1):
    m, n = [(ss - 1.) / 2. for ss in shape]
    y, x = np.ogrid[-m:m+1,-n:n+1]

    h = np.exp(-(x * x + y * y) / (2 * sigma * sigma))
    h[h < np.finfo(h.dtype).eps * h.max()] = 0
    return h

def draw_gaussian(heatmap, center, radius, k=1):
    diameter = 2 * radius + 1
    gaussian = gaussian2D((diameter, diameter), sigma=diameter / 6)

    x, y = center

    height, width = heatmap.shape[0:2]
    
    left, right = min(x, radius), min(width - x, radius + 1)
    top, bottom = min(y, radius), min(height - y, radius + 1)

    masked_heatmap  = heatmap[y - top:y + bottom, x - left:x + right] #浅拷贝
    masked_gaussian = gaussian[radius - top:radius + bottom, radius - left:radius + right]
    np.maximum(masked_heatmap, masked_gaussian * k, out=masked_heatmap)
     #输出masked——heatmap，会改变heatmap

focal loss

这是一段经典的代码，这里preds，gt，可以通用，
preds形式如：（N，w）
gt形如（1，W）
focal的函数代码参考 Retinanet

def _focal_loss(preds, gt):
    pos_inds = gt.eq(1)
    neg_inds = gt.lt(1)

    neg_weights = torch.pow(1 - gt[neg_inds], 4)

    loss = 0
    for pred in preds:
        pos_pred = pred[pos_inds]
        neg_pred = pred[neg_inds]

        pos_loss = torch.log(pos_pred) * torch.pow(1 - pos_pred, 2)
        neg_loss = torch.log(1 - neg_pred) * torch.pow(neg_pred, 2) * neg_weights

        num_pos  = pos_inds.float().sum()
        pos_loss = pos_loss.sum()
        neg_loss = neg_loss.sum()

        if pos_pred.nelement() == 0:
            loss = loss - neg_loss
        else:
            loss = loss - (pos_loss + neg_loss) / num_pos
    return loss

pull and push

这段代码用于对齐最后特征图（64,64）生成的tl_tag，和标签 gt_tl_ind的维度

tl_tags   = [_tranpose_and_gather_feat(tl_tag, gt_tl_ind) for tl_tag in tl_tags]
br_tags   = [_tranpose_and_gather_feat(br_tag, gt_br_ind) for br_tag in br_tags]

#对齐函数
def _gather_feat(feat, ind, mask=None):
    dim  = feat.size(2)
    ind  = ind.unsqueeze(2).expand(ind.size(0), ind.size(1), dim)
    feat = feat.gather(1, ind)
    if mask is not None:
        mask = mask.unsqueeze(2).expand_as(feat)
        feat = feat[mask]
        feat = feat.view(-1, dim)
    return feat
def _tranpose_and_gather_feat(feat, ind):
    feat = feat.permute(0, 2, 3, 1).contiguous()
    feat = feat.view(feat.size(0), -1, feat.size(3))
    feat = _gather_feat(feat, ind)
    return feat

无监督学习pull，push，这两个没有标签，比如一张图里面预测了很多个tl，br，到底哪个和哪个匹配呢，遵循原则，越近的尽量近，越远的尽量远，这段代码还是有点抽象，是一篇论文的思想Pixels to graphs by associative embedding. ：

def _ae_loss(tag0, tag1, mask):
    num  = mask.sum(dim=1, keepdim=True).float()
    tag0 = tag0.squeeze()
    tag1 = tag1.squeeze()

    tag_mean = (tag0 + tag1) / 2

    tag0 = torch.pow(tag0 - tag_mean, 2) / (num + 1e-4)
    tag0 = tag0[mask].sum()
    tag1 = torch.pow(tag1 - tag_mean, 2) / (num + 1e-4)
    tag1 = tag1[mask].sum()
    pull = tag0 + tag1

    mask = mask.unsqueeze(1) + mask.unsqueeze(2)
    mask = mask.eq(2)
    num  = num.unsqueeze(2)
    num2 = (num - 1) * num
    dist = tag_mean.unsqueeze(1) - tag_mean.unsqueeze(2)
    dist = 1 - torch.abs(dist)
    dist = nn.functional.relu(dist, inplace=True)
    dist = dist - 1 / (num + 1e-4)
    dist = dist / (num2 + 1e-4)
    dist = dist[mask]
    push = dist.sum()
    return pull, push

========
未完待续。。。。。

【Pytorch学习笔记（三）】张量的运算（2）
一、引言在《张量的运算(1)》中我们已经学习了几种张量中常用的非算数运算如张量的索引与切片，张量的拼接等。本节我们继续学习张量的算术运算。二、张量的算术运算（一）对应元素的加减乘除在PyTorch中，张量的对应元素的算术运算包括加法、减法、乘法、除法等常见的数学运算。这些运算可以对张量进行逐元素操作（element-wise），也可以进行张量之间的广播运算（broadcasting）。1.逐元素操
【Pytorch学习笔记】模型模块09——VGG详解越轨 Pytorch学习笔记 pytorch 学习笔记深度学习人工智能 python
一、VGG核心设计原理小卷积核堆叠用多层3×3卷积替代大卷积核（如5×5/7×7）数学原理：2层3×3卷积感受野等效于5×5：RFout=(RFin−1)×stride+KRF_{out}=(RF_{in}-1)\timesstride+KRFout=(RFin−1)×stride+K参数量对比：3层3×3卷积（3×(32C2)=27C23×(3^2C^2)=27C^23×(32C2)=27C2）
Pytorch学习 day06（torchvision中的datasets、dataloader）丿罗小黑 Pytorch pytorch 学习人工智能
torchvision的datasets使用torchvision提供的数据集API，比较方便，如果在pycharm中下载很慢，可以URL链接到迅雷中进行下载（有些URL链接在源码里）用来告诉程序，数据集存储的位置，共有多少样本等代码如下：importtorchvision#导入torchvision库#使用torchvision的datasets模块，模块中包含CIFAR10、CIFAR100、
Pytorch学习torch.clamp ()用法浅析 Midsummer-逐梦 #torch pytorch 学习人工智能
首先给出官方对此函数的定义网页：torch.clamp—PyTorch2.1documentation一、官方定义torch.clamp(input,min=None,max=None,*,out=None)→Tensor其中：input:输入张量，即需要进行元素限制的张量。min:张量中的元素的最小值。如果元素小于这个值，将被替换为这个最小值。max:张量中的元素的最大值。如果元素大于这个值，将
PyTorch学习笔记 - 损失函数 __星辰大海__ PyTorch pytorch
文章目录1.内置损失函数2.继承nn.Module自定义损失函数3.继承autograd.Function自定义损失函数3.三种不同方式实现MSE实验PyTorch除了内置损失函数，还可以自定义损失函数。我们以均方误差为例来讲解PyTorch中损失函数的使用方法。均方误差(MeanSquaredError,MSE)是预测值x=(x1,x2,...,xn)x=(x_1,x_2,...,x_n)x=(
【Pytorch学习笔记】模型模块05——Module常用函数越轨 Pytorch学习笔记 pytorch 学习笔记人工智能 python
Module常用函数设置训练和评估模式**作用：**在PyTorch中，模型有训练(training)和评估(evaluation)两种模式，它们会影响某些层的行为。主要影响的层：Dropout层：训练时随机丢弃神经元，评估时保持全部神经元BatchNorm层：训练时计算并更新统计量，评估时使用固定统计量LayerNorm层：行为在两种模式下基本一致2.设置方法#设置训练模式model.train
【Pytorch学习笔记】模型模块06——hook函数越轨 Pytorch学习笔记深度学习 pytorch 人工智能学习笔记 python 机器学习
hook函数什么是hook函数hook函数相当于插件，可以实现一些额外的功能，而又不改变主体代码。就像是把额外的功能挂在主体代码上，所有叫hook（钩子）。下面介绍Pytorch中的几种主要hook函数。torch.Tensor.register_hooktorch.Tensor.register_hook()是一个用于注册梯度钩子函数的方法。它主要用于获取和修改张量在反向传播过程中的梯度。语法格
PyTorch学习之：torch.gather是什么？杰瑞学AI AI/AGI NLP/LLMs Computer knowledge pytorch 学习人工智能 python
torch.gather的定义：torch.gather是PyTorch中的一个张量操作函数，其作用是根据指定的维度（dim）和索引张量（index），从输入张量（input）中收集元素，生成一个与索引张量形状相同的输出张量。总体来说，就是维度dim和索引张量index决定一个收集数的规则，然后，基于这个规则从输入张量中获取需要的元素。核心部分：1.输入张量（input）：任意形状的张量。2.索引
小土堆pytorch学习笔记之神经网络基本骨架李小鱼爱喝水 pytorch pytorch 学习笔记
pytorch之神经网络基本骨架[!TIP]首先来补补一些图像处理的基础知识吧！（尊嘟是0基础了）关于图片格式高度（Height）：图像的垂直尺寸，即图像从上到下的像素数量。宽度（Width）：图像的水平尺寸，即图像从左到右的像素数量。通道（Channels）：图像的颜色信息，最常见的是RGB（红、绿、蓝）三通道。每个通道代表图像在特定颜色维度上的强度。批量处理：深度学习模型通常一次处理多个图像，
【Pytorch学习笔记】数据模块05——编写自己的Dataset 越轨 Pytorch学习笔记 pytorch 学习笔记人工智能
编写自己的Dataset通过前面的知识，大家基本了解如何整个数据模块是如何构建的，下面举个完整的例子，要编写自定义的Dataset类，需要遵循以下基本步骤：1.基本结构自定义Dataset类需要继承torch.utils.data.Dataset，并实现以下三个必要方法：init：初始化函数，通常用于加载数据集和进行必要的预处理len：返回数据集的总长度getitem：根据索引返回对应的数据样本和
从零开始认识深度学习工具：TensorFlow vs PyTorch 赛卡青少年AI入门深度学习 tensorflow pytorch matplotlib
从零开始认识深度学习工具：TensorFlowvsPyTorch学习前的知识准备什么是深度学习？深度学习就像教电脑从经验中学习。就像你通过反复练习学会骑自行车一样，计算机会通过大量数据自动发现规律。例如：识别照片中的动物（图像识别）把语音转成文字（语音识别）自动翻译不同语言（自然语言处理）为什么需要工具框架？想象你要搭建乐高城堡，有两种选择：自己烧制每一块积木（相当于从零开始写数学计算代码）使用现
pytorch学习笔记（三） shushu113 pytorch 学习笔记
pytorch学习笔记（三）一、模型保存用pathlib库中的方法来保存模型参数1）保存模型参数frompathlibimportPathMODEL_PATH=Path("models")#Path更好表示路径#parents表示当前路径是否存在多级嵌套，exist_ok表示当前文件夹存在也不影响MODEL_PATH.mkdir(parents=True,exist_ok=True)MODEL_N
零基础学习人工智能—Python—Pytorch学习（十三） kiba518 人工智能 python 学习 pytorch 开发语言
前言最近学习了一新概念，叫科学发现和科技发明，科学发现是高于科技发明的，而这个说法我觉得还是挺有道理的，我们总说中国的科技不如欧美，但我们实际感觉上，不论建筑，硬件还是软件，理论，我们都已经高于欧美了，那为什么还说我们不如欧美呢？科学发现是高于科技发明就很好的解释了这个问题，即，我们的在线支付，建筑行业等等，这些都是科技发明，而不是科学发现，而科学发现是引领科技发明的，而欧美在科学发现上远远领先我
零基础学习人工智能—Python—Pytorch学习（十一） kiba518 人工智能 python 学习 pytorch 开发语言
前言本文主要介绍tensorboard的使用。tensorboard是一个可视化的，支持人工智能学习的一个工具。tensorboard的官方地址：https://www.tensorflow.org/tensorboard本文内容来自视频教程16课，个人感觉对于tensorboard讲的非常好。Tensorboard的使用使用代码如下：importtorchimporttorch.nnasnnim
pytorch学习14之读写文件 wuxuand pytorch+深度学习 pytorch 学习人工智能
将训练的模型保存：用在其他环境中（比如在部署中进行预测）。用于定期保存中间结果，在一个耗时较长的训练过程运行中，以确保在服务器电源被不小心断掉时，损失的计算结果不会过于严重。因此，学习如何加载和存储权重向量和整个模型。1、加载和保存张量一个张量：调用load和save函数分别读写它们。这两个函数都要求我们提供一个名称，save要求将要保存的变量作为输入。load读取已经存好的文件。importto
【pytorch学习笔记，利用Anaconda安装pytorch和paddle深度学习环境+pycharm安装---免额外安装CUDA和cudnn】徳一 pytorch学习深度学习 pytorch 学习
学习的作者链接:link一、安装pytorch环境1.打开打开anaconda的终端后condaenvlist然后创建一个名字叫pytorch，python是3.8版本的环境condacreate-npytorchpython=3.8再次看环境condaenvlist#condaenvironments:#显示如下环境base*D:\anacondapytorchD:\anaconda\envs\
PyTorch学习DAY2transforms各种操作沙鳄鱼 pytorch 机器学习
人民币二分类数据数据收集-->Img，Label数据划分-->trainvalidtest数据读取-->DataLoader(Sampler-->Index，Dataset-->Img，Label)数据预处理-->transformstorch.utils.data.DataLoader功能：构建可迭代的数据装载器dataset：Dataset类，决定数据从哪读取及如何读取batchsize：批大
零基础学习人工智能—Python—Pytorch学习（一） kiba518 人工智能 python 学习 pytorch 开发语言
前言其实学习人工智能不难，就跟学习软件开发一样，只是会的人相对少，而一些会的人写文章，做视频又不好好讲。比如，上来就跟你说要学习张量，或者告诉你张量是向量的多维度等等模式的讲解；目的都是让别人知道他会这个技术，但又不想让你学。对于学习，多年的学习经验，和无数次的回顾学习过程，都证明了一件事，如果一篇文章，一个视频，一个课程，我没学明白，那问题一定不在我，而是上课的主动或被动的不想让我学会，所以，出
PyTorch学习之torch.nn.functional.conv2d函数 Midsummer-逐梦 #torch pytorch 学习人工智能
PyTorch学习之torch.nn.functional.conv2d函数一、简介torch.nn.functional.conv2d是PyTorch中用于进行二维卷积操作的函数。卷积操作是深度学习中卷积神经网络（CNN）的核心部分，用于提取图像特征，常见于图像分类、目标检测和语义分割等任务中。二、基本语法torch.nn.functional.conv2d(input,weight,bias=
PyTorch学习之torch.nn.Conv2d函数 Midsummer-逐梦 #torch pytorch 学习人工智能
PyTorch学习之torch.nn.Conv2d函数一、简介torch.nn.Conv2d是PyTorch中用于实现二维卷积层的类，这个类可以说是对torch.nn.functional.Conv2d的进一步封装，使其使用起来更加的傻瓜式。二、基本语法torch.nn.Conv2d(in_channels,out_channels,kernel_size,stride=1,padding=0,d
Pytorch学习笔记（十六）Image and Video - Transfer Learning for Computer Vision Tutorial nenchoumi3119 pytorch学习笔记 pytorch 学习笔记
这篇博客瞄准的是pytorch官方教程中ImageandVideo章节的TransferLearningforComputerVisionTutorial部分。官网链接：https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html完整网盘链接:https://pan.baidu.com/s/1L9PVZ-KRDGVER
Pytorch学习笔记（十一）Learning PyTorch - What is torch.nn really nenchoumi3119 pytorch学习笔记 pytorch 学习笔记
这篇博客瞄准的是pytorch官方教程中LearningPyTorch章节的Whatistorch.nnreally?部分。主要是教你如何一步一步将最原始的代码进行重构至pytorch标准的代码，如果你已经熟悉了如何使用原始代码以及pytorch标准形式构建模型，可以跳过这一篇。官网链接：https://pytorch.org/tutorials/beginner/nn_tutorial.html
【pytorch】图像数据预处理子根笔记 pytorch python 深度学习
本文是记录一些在深度学习中的预处理的一些语法和函数torchvision.transforms的图像变换[PyTorch学习笔记]2.3二十二种transforms图片数据预处理方法-知乎TORCHVISION.TRANSFORMS的图像预处理_阿巫兮兮的博客-CSDN博客PyTorch09：transforms图像变换、方法操作及自定义方法-YEY的博客|YEYBlog2D、3D中心裁剪：imp
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
PyTorch 深度学习博客 Zoro｜ PyTorch Deep Learning 人工智能
PyTorch深度学习博客欢迎来到我的PyTorch深度学习博客！在这里，我将分享使用PyTorch学习和实践深度学习项目的点滴经验。本博客适用于初学者和有一定基础的开发者，旨在帮助大家快速搭建环境、掌握核心概念，并通过实例了解实际应用。环境配置为了确保项目的稳定性和兼容性，我选择了Python3.9环境，并在conda创建的虚拟环境中运行最新且稳定的PyTorch版本2.6.0。1.创建Pyth
Pytorch学习之路（3） AAAx1anyu Pytorch学习之旅学习人工智能 pytorch 深度学习笔记
一.机器学习任务的整体流程1.数据预处理：数据格式统一、异常数据消除、必要数据转换，划分训练集、验证集、测试集2.选择模型3.设定损失函数、优化方法、对应的超参数4.用模型拟合训练集数据，在验证集/测试集上计算模型表现二.数据读入pytorch数据读入通过Dataset+DataLoader的方式完成，Dataset定义好数据的格式和数据变换形式，DataLoader用iterative的方式不断
Pytorch学习之路（2） AAAx1anyu Pytorch学习之旅 pytorch 学习人工智能
（PS：请先阅读Pytorch学习之路（1）开篇注释）【因为我也是小菜鸟】Pytorch基础知识1.张量（1）简介0维张量——标量（数字）1维张量——向量2维张量——矩阵3维张量——时间序列数据股价文本数据单张彩色图片(RGB)4维张量——图像5维张量——视频张量的核心是一个数据容器（2）创建tensor1).随机初始化矩阵[torch.rand()]importtorchx=torch.rand
Pytorch学习笔记（二）不牌不改【Pytorch学习】pytorch 深度学习 python
后续遇到一些函数等知识，还会进行及时的补充。tensor的创建使用pytorch中的列表创建tensortensor=torch.Tensor([[-1,1],[0,2<
PyTorch学习（13）：PyTorch的张量相乘（torch.matmul）赛先生.AI PyTorch pytorch
PyTorch学习（1）：torch.meshgrid的使用-CSDN博客PyTorch学习（2）：torch.device-CSDN博客PyTorch学习（9）：torch.topk-CSDN博客PyTorch学习（10）：torch.where-CSDN博客PyTorch学习（11）：PyTorch的形状变换(view,reshape)与维度变换(transpose,permute)-CSDN
PyTorch实现CIFAR-10分类代码曹勖之 PyTorch学习之路深度学习 pytorch
这篇是PyTorch学习之路第七篇，用于记录PyTorch实现CIFAR-10分类代码（书上的代码有好多冗余）目录完整代码（还未训练）完整代码（已训练，直接载入模型）下面实例数据集位于：C:\Users\22130\Learning_Pytorch\dataset完整代码（还未训练）importtorchimporttorchvisionimporttorchvision.transformsas
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_