WYXHAHAHA123

focal loss和OHEM(on-line hard example mining)如何应用到faster RCNN中

在物体检测问题中，主要分为两类检测器模型：one stage detector（SSD,YOLO系列，retinanet）和two stage detector（faster RCNN系列及其改进模型），然而无论是一个阶段的检测器还是两个阶段的检测器，都使用到了anchor机制，即在特征图上密集地画anchor boxes，根据先验知识设定的IOU阈值将这些anchor划分为正样本和负样本，再对于正样本anchor boxes进行位置编码，从而得到训练检测器所需要的ground truth label，其中存在很大的问题在于，

（1）前景anchor和背景anchor类别不平衡：在数量巨大的anchor boxes中，仅仅有少部分的anchor boxes是正样本（前景anchor），大量的anchor boxes是负样本，故而进行classification时会存在严重的类别不平衡问题（前景和背景anchor的类别不平衡）。对此，focal loss采用的方法是在各个类别的loss值之前加上权重，而

（2）负样本anchor太多，如何训练？

focal loss是通过在loss前面加上系数实现的，它能够自动地把更多注意力关注到分类错误的前景anchor和背景anchor上去，OHEM是通过对于所有负样本的classification loss值由大到小排序，取出前面loss较大的损失值（即分类错误程度较大的负样本）。

focal loss和OHEM如何解决anchor机制带来的两大问题
anchor机制存在的问题	focal loss	OHEM
前景背景类别不平衡	留下所有的正负样本，在每个类别的loss前加权重系数alpha	设定阈值确定anchor正负样本后，正样本全部保留，按照正负样本1：3比例采样出loss值排序最大的负样本
如何让optimizer更多关注分类错误的样本	在所有正样本前加上权重，权重数值与(1-pt)正相关，即分类错误的概率值越接近ground truth，则权重值越小	只能让optimizer关注更多困难负样本，即对于所有负样本的classification loss值由大到小排序，取出前面loss较大的损失值（即分类错误程度较大的负样本）

一、focal loss原理及代码实现

kaiming大神的focal loss

以二分类的cross entropy为例：loss=-y*log(p)-(1-y)*log(1-p)，当ground truth label=0时，loss=-log(1-p)，最小化loss值即最大化1-p，则希望p接近于0，当ground truth label=1时，loss=-log(p)，最小化loss值即最大化p，则希望p接近于1.

1.focal loss解决class imbalanced问题（alpha）

类别不平衡问题好像现在只能加权重了。代码里面比较好的计算方式是在每个batch size进行训练的时候，自动地统计当前batch size中每个类别的样本数（由于它只想解决正负样本的不平衡，并没有涉及到所有正样本前景类别的不平衡，故而可以动态地统计每个batch size内的正负样本数），并计算每个类别的频率，然后以一定的函数关系式取反比例，得到每个类别的权重（alpha）。

其实很奇怪，focal loss做了很多实验都是设定固定的alpha值来判断效果好，难道不是动态地在每个batch size内的正负样本数，然后再取反比例吗？我之前做过一个multi-class segmentation ，师兄说他是在每个mini-batch内部动态计算频率的，他说动态计算和对于整个数据集事先训练好区别不大，但是总归是要基于数据集本身决定各个类别权值的。作者经过实验观察得到，alpha=0.75时得到的效果最好，也就是（所有类别的）前景正样本anchor classification loss权重为0.75，而负样本的权重为0.25.感觉这莫名地和OHEM中的选择正负样本比例1：3不谋而合了。

2.focal loss解决训练hard example的问题（gamma）

当p_t接近于0的时候，则-log(pt)接近于无穷大，说明当前样本的classification loss很大，应该花更多的注意力在这里，则(1-p_t)接近于1，则分类严重错误，是hard example困难样本，则会给当前的分类损失值赋予较大的权重；当p_t接近于1的时候，则-log(pt)接近于0，说明当前样本的classification loss很小，分类正确，是easy example简单样本，则(1-p_t)接近于0，会给当前的分类损失值赋予较小的权重，因为简单样本很容易分类正确所以不需要关注太多。

由于我的数据集中存在每个前景类别的不平衡，而在每个batch size中又不能保证每个类别的ground truth boxes都出现，所以决定事先统计出每个类别的ground truth boxes在原始数据集中的频率，然后计算出每个类别的权重，最后把所有前景类别的权重值加起来除以3，就得到背景类别的权重。

#coding=gbk
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.autograd import Variable
import numpy as np

def compute_class_weights(histogram):
    classWeights = np.ones(histogram.shape[0], dtype=np.float32)
    # print(classWeights.shape)
    normHist = histogram / np.sum(histogram)
    for i in range(histogram.shape[0]):
        classWeights[i] = 1 / (np.log(1.10 + normHist[i]))
    return classWeights

class FocalLoss(nn.Module):
    def __init__(self):
        super(FocalLoss, self).__init__()
    def forward(self, cls_prob,rois_label):
        '''
        :param cls_prob:经过softmax激活函数作用后的，shape [128,8]  num_class=8
        :param targets:ground truth class类别
        :return:focal loss classification loss
        '''
        proposal_num=cls_prob.shape[0]
        num_class=cls_prob.shape[1]

        class_mask=cls_prob.data.new(proposal_num,num_class)
        class_mask = Variable(class_mask)
        ids=rois_label.view(-1,1)
        class_mask.scatter_(1, ids.data, 1.)
        '''
        class_mask  shape [proposal_num,num_class]
        表示对于ids进行one-hot编码，对应类别的概率值为1
        '''
        #alpha 是用来解决物体检测中类别不平衡问题的

        frequency=torch.zeros(num_class,1)
        for ij in range(torch.max(rois_label)+1):
            frequency[ij]=torch.sum(rois_label==ij)
        frequency=frequency.numpy()
        classWeights=compute_class_weights(frequency)
        alpha=Variable(torch.from_numpy(classWeights).view(-1,1)).cuda()#shape [num_class,]
        alpha_class=alpha[ids.view(-1)]
        gamma = 2

        probs=(cls_prob*class_mask).sum(1).view(-1,1)

        log_p=probs.log()

        batch_loss = -alpha_class * (torch.pow((1 - probs), self.gamma)) * log_p
        loss = batch_loss.mean()
        return loss

二、OHEM原理及代码实现

OHEM(在线困难样本挖掘)，通常是 on line hard negative mining，对于困难的负样本进行在线挖掘，它与focal loss的目标一样，都是为了处理物体检测问题中的类别不均衡问题.这里的类别不均衡，是指由于基于anchor 的检测器都是使用密集检测的策略，如RPN以及所有的one-stage detector，则在数量众多的anchor中有大量的anchor框是负样本——背景框，只有少量的anchor框是正样本，如果不使用任何的策略，直接将所有的anchor直接计算cross entropy的classification loss，则由于很多背景anchor的特征对应到输入图像上的感受野部分就是背景，故而是很容易被分类出来的，这一类很容易被分类正确的负样本被称为简单负样本（对应到代码里面就是那些分类损失值比较小的负样本anchor），在所有的负样本anchor中，简单负样本的数量占据了绝大多数，故而网络最终训练好了，分类损失函数值下降，可能就是由于将大量简单负样本分类正确所导致的分类损失函数值小，但这并不是训练detector的目标，我们的目标是检测器能正确区分正负样本并且能够对于所有的正样本进行多个类别的正确划分，故而需要挖掘出那些困难的负样本（其实困难的负样本可以理解为就是和前景ground truth boxes的IOU数值比较大的，但是又没有超过所设定的正样本阈值的那部分anchor boxes），简单负样本就是那些与前景ground truth boxes的IOU数值较小的，很容易被分类成背景anchor的负样本。所以on line hard example mining是对于负样本进行的，通常的做法是，先对于所有的anchor boxes计算出分类损失值（size_average=False)，也就是计算出每个anchor boxes所对应的classification loss，然后将所有正样本的classification loss值取出，将正样本anchor boxes的数量记作pos_num，再对于剩下的所有负样本anchor boxes的classification loss进行从大到小的排序，最后从排序好的负样本anchor boxes的loss中取出前3*num_pos个classification loss，再与所有的正样本分类损失值相加，最终除以的分母是num_pos。

SSD训练过程中这里引用torchcv中的ssd_loss.py代码进行解释：

from __future__ import print_function

import torch
import torch.nn as nn
import torch.nn.functional as F


class SSDLoss(nn.Module):#损失函数
    def __init__(self, num_classes):
        super(SSDLoss, self).__init__()
        self.num_classes = num_classes#类别总数，对于VOC数据集而言，是21类

    def _hard_negative_mining(self, cls_loss, pos):
        '''Return negative indices that is 3x the number as postive indices.

        Args:
          cls_loss: (tensor) cross entroy loss between cls_preds and cls_targets, sized [N,#anchors].  分类损失值
          pos: (tensor) positive class mask, sized [N,#anchors].

        Return:
          (tensor) negative indices, sized [N,#anchors].
        '''
        cls_loss = cls_loss * (pos.float() - 1)   
        #对于正样本，损失值为0，得到对于负样本计算出的损失值，损失值越大的负样本，cls_loss值越小
        #正样本损失值   0
        #负样本损失值=之前的负样本损失值*（-1）
        #这是因为_hard_negative_mining只返回所有的负样本classification loss
        #从所有的负样本中采样出前（3*num_positive）个负样本的loss
        #这些负样本的classification loss最大，是困难的负样本

        _, idx = cls_loss.sort(1)  # sort by negative losses
        '''
       cls_loss: [N,#anchors]  正样本的损失值为0，对于负样本，损失值越大，cls_loss越小
       tensor.sort方法返回sort之后的按升序排列的tensor和对应的indices
       对每一行，遍历所有的列，则得到的每一行按照升序排列，即对于每个input images，得到其按照升序排列的分类损失idx
       
       idx同样是[N,#anchors].的tensor，其中的每一行的值范围为  [0,1,2,……,8732]    
       表示当前input image 的所有anchors的负样本的分类损失 由大到小的索引排序
       
       '''
        _, rank = idx.sort(1)      # [N,#anchors]

        num_neg = 3*pos.sum(1)  # [N,]
        #num_neg为长度为batch size 的tensor，其中的每个元素表示3*当前input image中的正样本个数

        neg = rank < num_neg[:,None]   # [N,#anchors]  neg中的数值为1或者0  如果是hard  negative examples，则对应位置处的值为1

        '''
        对于当前batch size张图像中的每一张（每一张图像中的正样本不同）
        找到是当前图像中正样本数量3倍的负样本，并且固定数量的负样本是通过在线困难样本挖掘得到的
        这主要是为了解决计算分类损失函数时样本不均衡的问题，因为比如说SSD300这种模型中8732个default boxes
        中的正样本数量很少（与ground  truth 的overlap大于0.5,在box_coder.encode函数中设置）
        为了保证在同一张图像中的正负样本比例在1：3，故而使用在线困难样本挖掘（在线指的是在训练过程中，这意味着
        在每次训练过程中，每次挖掘到的困难负样本可能是不同的，要根据网络模型预测的输出值决定）
        算法如下：
        首先取出所有的负样本，对于当前batch_size*#anchors  ，对于每一行（每张训练图像）的分类损失值进行排序
        按照当前图像中正样本的数量的3倍取出loss值排在前面的负样本）
        负样本的分类损失值计算：np.log(p)  小    p小，就是说对于负样本预测为背景类的概率值小，就是预测为前景的概率值大
        这些是很容易被分类错的负样本，被称为困难负样本，这些样本的loss值很大，对于网络模型的参数更新非常有效
        而那些很容易就能被分类正确的负样本对于最终权值更新效果不大，故而舍弃
        '''
        return neg

    def forward(self, loc_preds, loc_targets, cls_preds, cls_targets):
        '''Compute loss between (loc_preds, loc_targets) and (cls_preds, cls_targets).
        计算分类损失和回归损失

        Args:
          loc_preds: (tensor) predicted locations, sized [N, #anchors, 4].
                      对于当前batch size的图像所预测出来的localization
                      N=batch_size
                      #anchors表示default boxes的数量
          loc_targets: (tensor) encoded target locations, sized [N, #anchors, 4].
          cls_preds: (tensor) predicted class confidences, sized [N, #anchors, #classes].
                      对于当前batch size的图像所预测出来的classification
                      N=batch_size,#anchors表示default boxe数量，
                      #classes表示数据集类别总数
          cls_targets: (tensor) encoded target labels, sized [N, #anchors].
                      batch_size行，#anchors列，
                      第i行第j列的元素表示
                      对于第i个训练样本图像，SSD预测出来的第j个default boxes的GT类别标号（一个int类型整数）

        loss:
          (tensor) loss = SmoothL1Loss(loc_preds, loc_targets) + CrossEntropyLoss(cls_preds, cls_targets).
                              位置回归损失                              交叉熵分类损失
        '''
        pos = cls_targets > 0  # [N,#anchors]  pos中的数值是  0 1
        '''
       cls_targets是经过编码之后的classification ground truth
       表示与ground truth bounding boxes的IOU值最大或者大于一定的阈值的anchor boxes则会被认为是正样本，为1
       负样本为-1 
       
       在encoder阶段，会计算出当前anchor 与当前输入图像中所有ground truth boxes的IOU，并将anchor与所有gt boxes
       最大的IOU值记作当前anchor的overlap值，如果anchor的overlap值大于阈值0.5，则将anchor记作为正样本
       IOU小于0.5为负样本
       '''

        batch_size = pos.size(0)#每个batch 中包含多少张训练图片
        num_pos = pos.sum().item()#对pos 2-Dtensor求和，得到当前batch size的训练图片中共有多少个anchor boxes为正样本
        #当前batch size 数量的输入图像中，positive examples（这里的正样本指的是default boxes而不是一整张图像）的数量

        #===============================================================
        # loc_loss = SmoothL1Loss(pos_loc_preds, pos_loc_targets)
        #===============================================================
        mask = pos.unsqueeze(2).expand_as(loc_preds)       # [N,#anchors,4]
        loc_loss = F.smooth_l1_loss(loc_preds[mask], loc_targets[mask], size_average=False)#只对正样本进行回归损失的计算
        #mask是# [N,#anchors,4]的3-dimension tensor，扩展的第2维度与之前的数值相同，即对于正样例（batch size中的第i幅图片中的第j个anchors）
        #mask[i,j,:]=1,如果为负样本则mask[i,j,:]=0
        #mask作下标则表示其中元素值为1的下标，即所有的正样本所在的下标（4）

        #===============================================================
        # cls_loss = CrossEntropyLoss(cls_preds, cls_targets)
        #===============================================================
        cls_loss = F.cross_entropy(cls_preds.view(-1,self.num_classes), \
                                   cls_targets.view(-1), reduce=False)  # [N*#anchors*num_classes,]
        '''
       cls_preds:[N,#anchors,num_classes]   view    cls_preds:[（N*#anchors）,num_classes]
       cls_targets：[N*#anchors,]
       计算多分类的交叉损失函数是cross_entropy,reduce参数为false，则返回值cls_loss维度为(N*#anchors)
       分别给出了这一个batch size中每张图像所有anchor boxes的分类损失值得
       '''
        cls_loss = cls_loss.view(batch_size, -1)#cls_loss:[N,#anchors]
        cls_loss[cls_targets<0] = 0  # set ignored loss to 0 现将所有负样本的分类损失变成0，这是为了使用hard negative mining算法挑选出困难负样本
        neg = self._hard_negative_mining(cls_loss, pos)  # [N,#anchors]
        cls_loss = cls_loss[pos|neg].sum()
        '''
        正样本具有分类损失和回归损失，SSD中的正样本包括最大的IOU和IOU值大于0.5的region proposal
        一般的负样本没有分类损失，也没有回归损失
        hard negative examples具有分类损失，不具有回归损失
        实际上训练时采用的正负样本是所有的正样本和所有的hard negative examples，   
       '''

        print('loc_loss: %.3f | cls_loss: %.3f' % (loc_loss.item()/num_pos, cls_loss.item()/num_pos), end=' | ')
        loss = (loc_loss+cls_loss)/num_pos
        return loss

三、OHEM应用到faster RCNN

如何将OHEM(on line hard example/negative mining)用到faster RCNN中？

可以在原始的faster RCNN代码实现中加入了OHEM，值得注意的是，OHEM是在计算RPN的classification loss时使用的，在计算RCNN的classification loss使用的是全部的2000个region proposal。原始的faster RCNN代码中并没有加入困难样本挖掘，而是：对于所有的anchor boxes，IOU大于0.7为正样本，IOU小于0.3为负样本，然后随机在一个batch size的输入图像中采样出128个正样本和128个负样本（比例1：1），这里并没有使用困难样本挖掘，因为IOU小于0.3很大概率是简单负样本。

个人感觉OHEM比较适合false positive 很多的情况，这种就是把背景框划分为前景框了，对于背景框的分类不准确，这是由于训练负样本时都是使用的简单负样本的原因，需要加入更多的困难负样本进行训练。

四、focal loss应用到faster RCNN

由于在现在的实验中，RPN部分的classification loss效果比较好，就是说前景背景二分类准确率在95%左右，故而这里我不在加入任何策略（是用最原始的策略，IOU大于0.7正样本，IOU小于0.3是负样本），故而在RCNN部分的classification loss使用了focal loss。

Lombok 在 IntelliJ IDEA 中的使用步骤阿乾之铭 intellij-idea java ide
Lombok是一个非常流行的Java库，它通过注解简化Java类的开发，特别是在处理POJO（PlainOldJavaObjects）类时，如生成getter、setter、toString等常用方法。Lombok在减少样板代码（boilerplatecode）方面非常有用。在IntelliJIDEA中使用Lombok插件，可以极大简化开发过程。1.安装Lombok插件要在IntelliJIDEA
clang和gcc对比三雷科技深入C++编程入门开发语言 c++c clang llvm gcc
clang和gcc对比一、基本概述二、背景与历史三、架构与模块化四、错误提示与静态分析五、性能与编译速度六、兼容性与多平台支持七、调试支持Clang和GCC都是广泛使用的C、C++编译器，它们各自具有独特的优势和特点，适用于不同的使用场景。以下是对两者的详细对比：一、基本概述ClangGCC定义一个C/C++、Objective-C/Objective-C++编程语言的编译器前端，采用底层虚拟机（
GCC支持Objective C的故事？Objective-C?GCC只能编译C语言吗?Objective-C 1.0和2.0有什么区别？程序员小迷编程语言小话ios 编译器 c语言 ios 开发语言 objective-c gcc msvc clang
GCC支持ObjectiveC的故事Objective-C主要由Stepstone公司的BradCox和TomLove在1980年左右发明。乔布斯离开苹果公司后成立了NeXTSTEP公司，买下了Objective-C语言的授权。GCC对Objective-C语言的支持是在1992年加入的，具体是在GCC1.3版本中首次引入的。GCC的后续版本继续改进了对Objective-C的支持，包括对Obje
如何在 PyTorch 分布式训练中使用 TORCH_DISTRIBUTED_DEBUG=INFO 进行调试 weixin_48705841 pytorch 分布式人工智能
如何在PyTorch分布式训练中使用TORCH_DISTRIBUTED_DEBUG=INFO进行调试在使用PyTorch进行分布式训练时，调试分布式训练过程中的问题可能非常棘手。尤其是在多卡、多节点的训练环境中，常常会遇到通信延迟、同步错误等问题。为了帮助调试这些问题，PyTorch提供了一个非常有用的环境变量TORCH_DISTRIBUTED_DEBUG，通过设置它，你可以在控制台输出更多的调试
在 PyTorch 训练中使用 `tqdm` 显示进度条 weixin_48705841 pytorch 人工智能 python
在PyTorch训练中使用tqdm显示进度条在深度学习的训练过程中，实时查看训练进度是非常重要的，它可以帮助我们更好地理解训练的效率，并及时调整模型或优化参数。使用tqdm库来为训练过程添加进度条是一个非常有效的方式，本文将介绍如何在PyTorch中结合tqdm来动态显示训练进度。1.安装tqdm库首先，如果你还没有安装tqdm，可以通过pip命令进行安装：pipinstalltqdmtqdm是一
【在 PyTorch 中使用 tqdm 显示训练进度条，并解决常见错误TypeError: ‘module‘ object is not callable】 weixin_48705841 人工智能
在PyTorch中使用tqdm显示训练进度条，并解决常见错误TypeError:'module'objectisnotcallable在进行深度学习模型训练时，尤其是在处理大规模数据时，实时了解训练过程中的进展是非常重要的。为了实现这一点，我们可以使用tqdm库，它可以非常方便地为你提供进度条显示。1.什么是tqdm？TQDM是一个快速、可扩展的Python进度条库。它可以用来显示迭代的进度，帮助
AttributeError: ‘NoneType‘ object has no attribute ‘xxx‘ Mad Soycat 常见BUG详见数据仓库大数据运维 centos linux
AttributeError:‘NoneType‘objecthasnoattribute‘xxx‘错误分析：AttributeError:'NoneType'objecthasnoattribute'xxx'AttributeError:'NoneType'objecthasnoattribute'xxx'错误通常出现在Python中，表示你尝试访问一个NoneType对象的属性或方法，但Non
昇腾910-PyTorch 实现 GoogleNet图像分类深度学习图像识别
PyTorch实现GoogleNet用于图像分类本实验主要介绍了如何在昇腾上，使用pytorch对经典的GoogleNet模型在公开的CIFAR10数据集进行分类训练的实战讲解。内容包括GoogleNet模型创新点介绍、GoogleNet网络架构剖析与GoogleNet网络模型代码实战分析等等。本实验的目录结构安排如下所示：GoogleNet网络模型创新点介绍GoogleNet的网络架构剖析Goo
深入面向对象 - 2 kdayjj966 python 开发语言
隐藏数据引入classCat(object):def__init__(self,new_name,new_age):self.name=new_nameself.age=new_agedefprint_info(self):print("我叫%s，今年%s了"%(self.name,self.age))#创建猫对象cat=Cat("波斯猫",4)#调用方法cat.print_info()#尝试修改
详解Python迭代器：轻松搞懂工作原理、用法和最佳实践 kdayjj966 python 开发语言
迭代器引入如果开发中有以下需求，如何解决？classStuSystem(object):"""学生管理系统"""def__init__(self):self.stus=[]defadd(self):"""添加一个新的学生:return:"""name=input("请输入新学生的姓名:")tel=input("请输入新学生的手机号:")address=input("请输入新学生的住址:")new_
安全运维：入侵检测与防御实战指南 Echo_Wish 让你快速入坑运维运维探秘安全运维
在当今的互联网时代，网络安全已经成为企业和个人都必须重视的关键问题之一。黑客攻击、恶意软件、数据泄露等威胁不断增加，而入侵检测和防御技术是保障信息系统安全的核心手段。本文将围绕如何通过入侵检测（IntrusionDetectionSystem,IDS）和防御技术来保护网络环境展开，结合实际代码示例，详细讲解实现原理与防御方案。1.什么是入侵检测与防御？入侵检测系统（IDS）是监控计算机网络或系统活
PyQt5页面跳转闪退问题解决丹123 开发语言 python qt5
逻辑描述：点击窗体login中的查询按钮，会出现sele窗体问题描述：点击查询之后，sele窗体闪退，刚出现就退出问题分析：直接在sele窗体中写main函数单独调用，是可以显示的，说明还是在调用过程中出现问题解决办法：在login中实例sele对象时，需要加self出现问题前的代码如下：注意defselect_act中的调用login.pyclassUi_mainWindow(object):d
error: libcublasLt.so.11: cannot open shared object file: No such file or directory/缺少libcublas.so查找鼾声鼾语 linux ubuntu 服务器 python can通讯方法
1,问题：gstnvtracker:Loadinglow-levellibat/opt/nvidia/deepstream/deepstream/lib/libnvds_nvmultiobjecttracker.sogstnvtracker:Failedtoopenlow-levellibat/opt/nvidia/deepstream/deepstream/lib/libnvds_nvmulti
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
深度学习从入门到精通：全面指南 AI天才研究院计算大数据AI人工智能 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《深度学习从入门到精通：全面指南》文章目录《深度学习从入门到精通：全面指南》文章关键词文章摘要引言第一部分：深度学习基础入门第1章：深度学习概述1.1深度学习的基本概念1.2深度学习的发展历程1.3深度学习的基本原理神经网络前向传播反向传播第2章：深度学习框架入门2.1TensorFlow入门TensorFlow环境搭建TensorFlow基本数据结构2.2PyTorch入门PyTorch环境搭建
swift withCheckedContinuation相关使用书弋江山 swift 开发语言 ios
```css```cssclasstest112:NSObject{enumMErr:Error{caseserverError(String)}/*withCheckedContinuation是Swift并发模型中的一个重要工具，它允许你将异步操作转换为一个暂停的函数，直到你手动恢复它。它在将传统的回调式异步代码转换为async/await风格时非常有用确保调用continuation.res
如何在Python中安装GDAL库（gdal）研仔mm python 开发语言
具体安装步骤：1、下载与Python版本相匹配的.whl文件：（如：GDAL-3.4.3-cp38-cp38-win_amd64.whl）cp38代表python3.8版本，win_amd64代表你的电脑是64位的2、安装GDAL：安装到python软件安装目录下的scripts文件夹里：D:\app\Anaconda\envs\pytorch\Scripts（pytorch为我自己创建的虚拟环境
安装CUDA Cudnn Pytorch(GPU版本）步骤学乐乐 pytorch 人工智能 python
一.先看自己的电脑NVIDIA支持CUDA版本是多少？1.打开NVIDIA控制面板2.点击帮助---系统信息--组件我的支持CUDA11.6二.再看支持Pytorch的CUDA版本三.打开CUDA官网下载CUDA11.6下载好后，安装选择自定义然后安装位置（先去F盘建个CUDA-manger文件夹然后在里面建个CUDA11.6文件夹再在里面建立CUDA1CUDA2这两个文件夹前两个位置选到CUDA
【深度学习】Pytorch：在 ResNet 中加入注意力机制 T0uken 深度学习 pytorch 人工智能
在这篇教程中，我们将介绍如何在ResNet网络中加入注意力机制模块。我们将通过对标准ResNet50进行改进，向网络中添加两个自定义的注意力模块，并展示如何实现这一过程。为什么要加入注意力机制注意力机制可以帮助神经网络专注于图像中重要的特征区域，从而提高模型的性能。在卷积神经网络中，加入注意力机制能够有效增强特征提取能力，减少冗余信息的干扰，尤其在处理复杂图像时，能够提升网络的表现。在本教程中，我
为什么使用 char[] 而不是 String 作为密码存储的类型？肉三 Java java 开发语言
在Swing中，密码字段有一个getPassword()(returnschar[])方法，而不是通常的getText()(returnsString)方法。同样，我遇到了一个建议不要使用它String来处理密码。为什么String说密码会有安全隐患呢？感觉用起来很不方便char[]。将密码收集并存储在类型的对象中似乎合乎逻辑java.lang.String。但是，这里有一个警告：Object类型
Pytorch 自学笔记（三）：利用自定义文本数据集构建Dataset和DataLoader JimmyTotoro Pytorch 自学笔记 pytorch 笔记人工智能
Pytorch自学笔记（三）1.Dataset与DataLoader1.1torch.utils.data.Dataset1.2torch.utils.data.DataLoaderPytorch自学笔记系列的第三篇。针对Pytorch的Dataset和DataLoader进行简单的介绍，同时，介绍如何使用自定义文本数据集构建Dataset和DataLoader，以实现数据集的随机采样与batch
Docker部署nnunetv2简洁教程 Tiandaren 模型部署 docker 容器运维 pytorch 人工智能深度学习 python
前言：感觉一些教程没必要说那么多，直接贴出重点的配置文件。如果有不懂的，可以把此文档丢给gpt，配合自己的环境一同服用。首先，在nnunet路径下创建一个Dockerfile。由于我已经完成了nnUNet的训练，所以不需要将相关数据全部上传到容器中，而是只保留源码。#使用适当的基础镜像（如pytorch官方镜像）FROMpytorch/pytorch:latest#更新apt-get并安装必要的工
使用 MySQL 从 JSON 字符串提取数据 m0_74825678 面试学习路线阿里巴巴 mysql json oracle
使用MySQL从JSON字符串提取数据在现代数据库管理中，JSON格式因其灵活性而广泛使用。然而，当数据存储在JSON中时，我们经常需要将其转换为更易于处理的格式。本篇文章将通过一个具体的SQL查询示例，展示如何从存储在MySQL中的JSON字符串提取数据并重新格式化。1.背景知识JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，易于阅读和编写，同时也易于机器
Pytorch: torch.diag()创建对角线张量湫兮之风 pytorch pytorch 人工智能 python
torch.diag()torch.diag是PyTorch中的一个函数，用于从给定的矩阵中提取对角线元素，或者构造一个以给定对角线元素为值的对角矩阵。这个函数对于矩阵分解和转换等操作非常重要。如果输入是一个向量（1D张量），torch.diag会返回一个以该向量为对角线元素的2D方阵。如果输入是一个矩阵（2D张量），则返回一个包含输入矩阵对角线元素的1D张量。torch.diag还允许你指定对角
R语言的面向对象编程 2501_90183952 包罗万象 golang 开发语言后端
R语言的面向对象编程在现代编程中，面向对象编程（Object-OrientedProgramming，OOP）是一种重要的编程范式，它通过将数据和操作数据的函数结合在一起，来提高代码的重用性和可维护性。在R语言中，面向对象编程并不是一开始就被引入的，但随着其发展，R逐渐支持了多种面向对象编程的系统，例如S3、S4以及R6等。本文将深入探讨R语言的面向对象编程，介绍其基本概念、特点以及在实际应用中的
成功解决error while loading shared libraries: libpython2.7.so.1.0: cannot open shared object file: No su 哎呦，帅小伙哦安装
安装了python2.7，第一次执行时报错：errorwhileloadingsharedlibraries:libpython2.7.so.1.0:cannotopensharedobjectfile:Nosuchfileordirectory解决方法如下：1.编辑vi/etc/ld.so.conf如果是非root权限帐号登录，使用sudovi/etc/ld.so.conf添加上python2.
JSONObject解析数据库Date类型报错问题知忆_IS 数据库 java database postgresql
JSONObject解析数据库Date类型报错问题最近项目在写服务器后端查询空间数据的接口时，由于表结构不一致，直接写了一个通用函数用json储存数据库中查询的结果，然而今天前端查询一个表的时候无法查到相应的结果，查了一下代码发现爆了如下错误。报错：Causedby:java.lang.IllegalArgumentExceptionatjava.sql.Date.getHours原因是该表中存在
关于ArcEngine10二次开发，如何在插件窗体内实现如同ArcMap一样的保存数据对话框功能（附源码）装疯迷窍_A c#arcgis
关于ArcEngine10二次开发，如何在插件窗体内实现如上图所示的与ArcMap一样的保存数据对话框功能？首先，Windows窗体工具箱的SaveFileDialog对话框肯定不行，此对话框虽然可以自定义文件保存类型（保存shp文件可以），但是无法保存MDB和GDB数据库文件。其次，在网上找了很久，都未找到问题的解决方案。本着求人不如求己的原则，最后还是通过查询ArcObjectsHelpfor
iOS 网络请求： Alamofire 结合 ObjectMapper 实现自动解析胖虎1 开发经验分享 ios Alamofire ObjectMapper 网络请求自动解析数据自动解析模型
引言在iOS开发中，网络请求是常见且致其重要的功能之一。从获取资料到上传数据，出色的网络请求框架能夠大大提升开发效率。Alamofire是一个极具人气的Swift网络请求框架，提供了便据的API以完成网络请求和响应处理。它支持多种请求类型，如GET和POST，并且给予您便据的带容处理过滤器和返回数据解析的功能。ObjectMapper是一个强大的Swift数据映射工具，使用其提供的Mappable
《CPython Internals》阅读笔记：p285-p328 python
《CPythonInternals》学习第15天，p285-p328总结，总计44页。一、技术总结1.shallowcomparisonp285,InObjectsobject.c,thebaseimplementationoftheobjecttypeiswritteninpureCcode.Therearesomeconcreteimplementationsofbasiclogic,like
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb