Moon00zz

WS-DAN.Pytorch代码理解

WS-DAN.Pytorch

Code Author：GuYuc

train.py

import os
import time
import logging
import warnings
from tqdm import tqdm
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader

import config
from models import WSDAN
from datasets import get_trainval_datasets
from utils import CenterLoss, AverageMeter, TopKAccuracyMetric, ModelCheckpoint, batch_augment

1、GPU设置

# GPU settings
assert torch.cuda.is_available()
os.environ['CUDA_VISIBLE_DEVICES'] = config.GPU
device = torch.device("cuda")
torch.backends.cudnn.benchmark = True

torch.backends.cudnn.benchmark = True:可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法，来达到优化运行效率的问题。

2、Loss function

# General loss functions
cross_entropy_loss = nn.CrossEntropyLoss()
center_loss = CenterLoss()

CrossEntropyLoss交叉熵计算公式
$-log\left ( \frac{exp(x[class])}{\sum_{j}exp(x[j])} \right )$

3、评价指标

# loss and metric
loss_container = AverageMeter(name='loss')
raw_metric = TopKAccuracyMetric(topk=(1, 5))
crop_metric = TopKAccuracyMetric(topk=(1, 5))
drop_metric = TopKAccuracyMetric(topk=(1, 5))

AverageMeter快速计算多个类的平均值。TopKAccuracyMetric：选取概率最大的 k 个标签

class AverageMeter(Metric):
    def __init__(self, name='loss'):
        self.name = name
        self.reset()

    def reset(self):
        self.scores = 0.
        self.total_num = 0.

    def __call__(self, batch_score, sample_num=1):
        self.scores += batch_score
        self.total_num += sample_num
        return self.scores / self.total_num

class TopKAccuracyMetric(Metric):
    def __init__(self, topk=(1,)):
        self.name = 'topk_accuracy'
        self.topk = topk
        self.maxk = max(topk)
        self.reset()

    def reset(self):
        self.corrects = np.zeros(len(self.topk))
        self.num_samples = 0.

    def __call__(self, output, target):
        """Computes the precision@k for the specified values of k"""
        self.num_samples += target.size(0)
        _, pred = output.topk(self.maxk, 1, True, True) #.topk(True, True)返回前k个最大的元素
        pred = pred.t() #.()矩阵转置
        correct = pred.eq(target.view(1, -1).expand_as(pred))

        for i, k in enumerate(self.topk):
            correct_k = correct[:k].view(-1).float().sum(0)
            self.corrects[i] += correct_k.item()

        return self.corrects * 100. / self.num_samples

4、def main()

Initialize and Data load 初始化、数据集加载

    ##################################
    # Initialize saving directory
    ##################################
    if not os.path.exists(config.save_dir):
        os.makedirs(config.save_dir)

    ##################################
    # Logging setting
    ##################################
    logging.basicConfig(
        filename=os.path.join(config.save_dir, config.log_name),
        filemode='w',
        format='%(asctime)s: %(levelname)s: [%(filename)s:%(lineno)d]: %(message)s',
        level=logging.INFO)
    warnings.filterwarnings("ignore")

logging模块是Python内置的标准模块，主要用于输出运行日志，可以设置输出日志的等级、日志保存路径、日志文件回滚等。

日志级别：INFO——确认一切按预期运行

filename: 指定日志文件名

filemode: 和file函数意义相同，指定日志文件的打开模式，‘w’或’a’。

format: 指定输出的格式和内容。%(asctime)s: 打印日志的时间。%(levelname)s: 打印日志级别名称。%(filename)s: 打印当前执行程序名。 %(lineno)d: 打印日志的当前行号。%(message)s: 打印日志信息。

warnings.filterwarnings(“ignore”)：利用过滤器来实现忽略告警

    ##################################
    # Load dataset
    ##################################
    train_dataset, validate_dataset = get_trainval_datasets(config.tag,config.image_size)

    train_loader, validate_loader = DataLoader(train_dataset,
                                               batch_size=config.batch_size,
                                               shuffle=True,
                                               num_workers=config.workers,                                                              pin_memory=True), \
                                    DataLoader(validate_dataset,                                                                        batch_size=config.batch_size * 4,
                                               shuffle=False,
                                               num_workers=config.workers,
                                               pin_memory=True)
    num_classes = train_dataset.num_classes

batch_size调用config.batch_size，shuffle=False不打乱数据顺序，num_workers= 4使用config.workers个子进程。pin_memory=True意味着，生成的Tensor数据最开始是属于内存中的锁页内存，这样将内存的Tensor转义到GPU的显存就会更快一些。

get_trainval_datasets() 调用**_int_.py**，_int_.py中import bird_dataset.py。

_int_.py

from .aircraft_dataset import AircraftDataset
from .bird_dataset import BirdDataset
from .car_dataset import CarDataset
from .dog_dataset import DogDataset

def get_trainval_datasets(tag, resize):
    if tag == 'aircraft':
        return AircraftDataset(phase='train', resize=resize),                 AircraftDataset(phase='val', resize=resize)
    elif tag == 'bird':
        return BirdDataset(phase='train', resize=resize), BirdDataset(phase='val', resize=resize)
    elif tag == 'car':
        return CarDataset(phase='train', resize=resize), CarDataset(phase='val', resize=resize)
    elif tag == 'dog':
        return DogDataset(phase='train', resize=resize), DogDataset(phase='val', resize=resize)
    else:
        raise ValueError('Unsupported Tag {}'.format(tag))

根据tag调用数据集。根据’train’和’val’分别加载训练集和验证集，同时resize图片的大小。

bird_dataset.py：

def __init__(self, phase='train', resize=500):
        assert phase in ['train', 'val', 'test']
        self.phase = phase
        self.resize = resize
        self.image_id = []
        self.num_classes = 200

        # get image path from images.txt
        with open(os.path.join(DATAPATH, 'images.txt')) as f:
            for line in f.readlines():
                id, path = line.strip().split(' ')
                image_path[id] = path

        # get image label from image_class_labels.txt
        with open(os.path.join(DATAPATH, 'image_class_labels.txt')) as f:
            for line in f.readlines():
                id, label = line.strip().split(' ')
                image_label[id] = int(label)

        # get train/test image id from train_test_split.txt
        with open(os.path.join(DATAPATH, 'train_test_split.txt')) as f:
            for line in f.readlines():
                image_id, is_training_image = line.strip().split(' ')
                is_training_image = int(is_training_image)

                if self.phase == 'train' and is_training_image:
                    self.image_id.append(image_id)
                if self.phase in ('val', 'test') and not is_training_image:
                    self.image_id.append(image_id)

        # transform
        self.transform = get_transform(self.resize, self.phase)

    def __getitem__(self, item):
        # get image id
        image_id = self.image_id[item]

        # image
        image = Image.open(os.path.join(DATAPATH, 'images', image_path[image_id])).convert('RGB')  # (C, H, W)
        image = self.transform(image)

        # return image and label
        return image, image_label[image_id] - 1  # count begin from zero

    def __len__(self):
        return len(self.image_id)


if __name__ == '__main__':
    ds = BirdDataset('train')
    print(len(ds))
    for i in range(0, 10):
        image, label = ds[i]
        print(image.shape, label)

CUB-200-2011数据集的划分及设置图片大小，通过读取数据集中的.txt文件，读取图片及label，同时划分为trai、val（test）。

Initialize model 模型初始化

Initialize model，首先初始化参数，to(device)可以把tentor复制一份到指定的device，以后计算在GPU计算。调用class WSDAN（nn.Module），class WSDAN 中调用 BAP(nn.Module)。

    ##################################
    # Initialize model
    ##################################
    logs = {}
    start_epoch = 0
    net = WSDAN(num_classes=num_classes, M=config.num_attentions, net=config.net, pretrained=True)

    # feature_center: size of (#classes, #attention_maps * #channel_features)
    feature_center = torch.zeros(num_classes, config.num_attentions * net.num_features).to(device)

    if config.ckpt:
        # Load ckpt and get state_dict
        checkpoint = torch.load(config.ckpt)

        # Get epoch and some logs
        logs = checkpoint['logs']
        start_epoch = int(logs['epoch'])

        # Load weights
        state_dict = checkpoint['state_dict']
        net.load_state_dict(state_dict)
        logging.info('Network loaded from {}'.format(config.ckpt))

        # load feature center
        if 'feature_center' in checkpoint:
            feature_center = checkpoint['feature_center'].to(device)
            logging.info('feature_center loaded from {}'.format(config.ckpt))

    logging.info('Network weights save to {}'.format(config.save_dir))

WSDAN（nn.Module）

num_classes：分类数目 M=config.num_attentions： attention mps的数量 net=config.net：特征提取网络 pretrained=True 预训练

class WSDAN(nn.Module):
    def __init__(self, num_classes, M=32, net='inception_mixed_6e', pretrained=False):
        super(WSDAN, self).__init__()
        self.num_classes = num_classes
        self.M = M
        self.net = net

        # Network Initialization
        if 'inception' in net:     
            if net == 'inception_mixed_6e':
                self.features = inception_v3(pretrained=pretrained).get_features_mixed_6e()
                self.num_features = 768
            elif net == 'inception_mixed_7c':
                self.features = inception_v3(pretrained=pretrained).get_features_mixed_7c()
                self.num_features = 2048
            else:
                raise ValueError('Unsupported net: %s' % net)
        elif 'vgg' in net:
            self.features = getattr(vgg, net)(pretrained=pretrained).get_features()
            self.num_features = 512
        elif 'resnet' in net:
            self.features = getattr(resnet, net)(pretrained=pretrained).get_features()
            self.num_features = 512 * self.features[-1][-1].expansion
        else:
            raise ValueError('Unsupported net: %s' % net)

        # Attention Maps
        self.attentions = BasicConv2d(self.num_features, self.M, kernel_size=1)

        # Bilinear Attention Pooling
        self.bap = BAP(pool='GAP')

        # Classification Layer
        self.fc = nn.Linear(self.M * self.num_features, self.num_classes, bias=False)

        logging.info('WSDAN: using {} as feature extractor, num_classes: {}, num_attentions: {}'.format(net, self.num_classes, self.M))

#config.py :net = 'inception_mixed_6e'

self.features = inception_v3(pretrained=pretrained).get_features_mixed_6e() 读取并调用inception_v3的预训练模型。使用与训练的mixed_6e层获取特征。

self.attentions = BasicConv2d(self.num_features, self.M, kernel_size=1) BasicConv2d 的效果等效于用一个1*1的卷积核对图像做卷积，同时利用BatchNorm2d 输出batch=self.M的图片。

class BasicConv2d(nn.Module):

    def __init__(self, in_channels, out_channels, **kwargs):
        super(BasicConv2d, self).__init__()
        self.conv = nn.Conv2d(in_channels, out_channels, bias=False, **kwargs)
        self.bn = nn.BatchNorm2d(out_channels, eps=0.001)

    def forward(self, x):
        x = self.conv(x)
        x = self.bn(x)
        return F.relu(x, inplace=True)

Conv2d 二维卷积。（输入通道数，输出通道数，有无偏移）随机取一个数作为卷积子。

BatchNorm2d 在网络中输出的feature map 的尺寸为 B*C*H*W，经过处理后，尺寸变为B*M*H*W。

    def forward(self, x):
        batch_size = x.size(0)

        # Feature Maps, Attention Maps and Feature Matrix
        feature_maps = self.features(x)
        if self.net != 'inception_mixed_7c':
            attention_maps = self.attentions(feature_maps)
        else:
            attention_maps = feature_maps[:, :self.M, ...]
        feature_matrix = self.bap(feature_maps, attention_maps)

        # Classification
        p = self.fc(feature_matrix * 100.)

        # Generate Attention Map
        if self.training:
            # Randomly choose one of attention maps Ak
            attention_map = []
            for i in range(batch_size):
                attention_weights = torch.sqrt(attention_maps[i].sum(dim=(1, 2)).detach() + EPSILON)
                attention_weights = F.normalize(attention_weights, p=1, dim=0)
                k_index = np.random.choice(self.M, 2, p=attention_weights.cpu().numpy())
                attention_map.append(attention_maps[i, k_index, ...])
            attention_map = torch.stack(attention_map)  # (B, 2, H, W) - one for cropping, the other for dropping
        else:
            # Object Localization Am = mean(Ak)
            attention_map = torch.mean(attention_maps, dim=1, keepdim=True)  # (B, 1, H, W)

        # p: (B, self.num_classes)
        # feature_matrix: (B, M * C)
        # attention_map: (B, 2, H, W) in training, (B, 1, H, W) in val/testing
        return p, feature_matrix, attention_map

k_index = np.random.choice(self.M, 2, p=attention_weights.cpu().numpy()) p是概率，通过对图片像素加权的平方得到。 val或test时求均值。

    def load_state_dict(self, state_dict, strict=True):
        model_dict = self.state_dict()
        pretrained_dict = {k: v for k, v in state_dict.items()
                           if k in model_dict and model_dict[k].size() == v.size()}

        if len(pretrained_dict) == len(state_dict):
            logging.info('%s: All params loaded' % type(self).__name__)
        else:
            logging.info('%s: Some params were not loaded:' % type(self).__name__)
            not_loaded_keys = [k for k in state_dict.keys() if k not in pretrained_dict.keys()]
            logging.info(('%s, ' * (len(not_loaded_keys) - 1) + '%s') % tuple(not_loaded_keys))

        model_dict.update(pretrained_dict)
        super(WSDAN, self).load_state_dict(model_dict)

BAP(nn.Module)

self.bap = BAP(pool='GAP')

class BAP(nn.Module):
    def __init__(self, pool='GAP'):
        super(BAP, self).__init__()
        assert pool in ['GAP', 'GMP']
        if pool == 'GAP':
            self.pool = None
        else:
            self.pool = nn.AdaptiveMaxPool2d(1)

    def forward(self, features, attentions):
        B, C, H, W = features.size()
        _, M, AH, AW = attentions.size()

        # match size
        if AH != H or AW != W:
            attentions = F.upsample_bilinear(attentions, size=(H, W))

        # feature_matrix: (B, M, C) -> (B, M * C)
        if self.pool is None:
            feature_matrix = (torch.einsum('imjk,injk->imn', (attentions, features)) / float(H * W)).view(B, -1)
        else:
            feature_matrix = []
            for i in range(M):
                AiF = self.pool(features * attentions[:, i:i + 1, ...]).view(B, -1)
                feature_matrix.append(AiF)
            feature_matrix = torch.cat(feature_matrix, dim=1)

        # sign-sqrt
        feature_matrix = torch.sign(feature_matrix) * torch.sqrt(torch.abs(feature_matrix) + EPSILON)

        # l2 normalization along dimension M and C
        feature_matrix = F.normalize(feature_matrix, dim=-1)
        return feature_matrix

if AH != H or AW != W:

attentions = F.upsample_bilinear(attentions, size=(H, W)) 如果attention maps和feature高和宽不一致，采用双线性插值调整。

1、pool == None：

feature_matrix = (torch.einsum('imjk,injk->imn', (attentions, features)) / float(H * W)).view(B, -1) 把尺寸为i,m,j,k 的attention和尺寸为i,n,j,k的feature，按长宽j,k做内积。得到B*M*C的三维矩阵。除以H*W后，用函数view变为B行，M*C列的二维矩阵。

做完这些变换后得到的feature_matrix，相当于把每个通道的图片展成一维矩阵，然后M个一维矩阵拼接组成一行。feature_matrix的每一行是一张图片的所有特征。

# @zhong
import torch.nn as nn
import torch

m = nn.AdaptiveAvgPool2d(1)
features = torch.randn(2, 3, 3, 3)
attentions = torch.randn(2, 5, 3, 3)
F = torch.einsum('imjk,injk->imn', (attentions, features))
print('einsum', F)
print('after view', F.view(2, -1))

einsum tensor([[[  0.3450,  -3.1217,  -2.0802],
         [ -4.8347,  -2.9586,  -1.6513],
         [  1.8663,   0.3958,  -1.9813],
         [ -0.8181,  -2.9455,  -2.1229],
         [  2.4022,  -2.3604,   4.9093]],

        [[ -7.2237,   2.0915,   4.7289],
         [-12.7117,   0.9476,   4.7803],
         [ -0.4658,   3.7223,   2.7384],
         [ -3.6767,   0.4836,  -0.5864],
         [ -0.1416,   0.4434,  -1.8065]]])
after view tensor([[  0.3450,  -3.1217,  -2.0802,  -4.8347,  -2.9586,  -1.6513,   1.8663,
           0.3958,  -1.9813,  -0.8181,  -2.9455,  -2.1229,   2.4022,  -2.3604,
           4.9093],
        [ -7.2237,   2.0915,   4.7289, -12.7117,   0.9476,   4.7803,  -0.4658,
           3.7223,   2.7384,  -3.6767,   0.4836,  -0.5864,  -0.1416,   0.4434,
          -1.8065]])

2、pool ！= None：

AiF = self.pool(features * attentions[:, i:i + 1, ...]).view(B, -1)

features * attentions[:, i:i + 1, ...]首先，把M张尺寸为B*1*H*W的attention map, 依次和B*C*H*W的feature maps相乘。得到M份B*C*H*W 的part Feature maps。

接着，做自适应池化（AdaptiveAvgPool2d(1)），尺寸变为B*C*1*1。然后用函数view(B, -1) 变为大小为B*C的矩阵。（x.view(batchsize, -1) 中batchsize指转换后有几行，而-1指在不告诉函数有多少列的情况下，根据原tensor数据和batchsize自动分配列数。）

feature_matrix.append(AiF) 循环结束后feature_matrix的大小为M个B*C的矩阵。

feature_matrix = torch.cat(feature_matrix, dim=1) 把feature_mareix 重新排列为B行，C*M列的矩阵。

# @zhong
import torch.nn as nn
import torch

m = nn.AdaptiveAvgPool2d(1)
features = torch.randn(2, 3, 3, 3)
attentions = torch.randn(2, 5, 3, 3)
pool = nn.AdaptiveMaxPool2d(1)

feature_matrix = []
for i in range(5):
    AiF = pool(features * attentions[:, i:i + 1, ...]).view(2, -1)
    feature_matrix.append(AiF)
    print('AiF:\n', AiF)
feature_matrix = torch.cat(feature_matrix, dim=1)
print('feature_matrix:\n', feature_matrix)

AiF:
 tensor([[0.2573, 1.4332, 5.2349],
        [0.3983, 1.6445, 1.8403]])
AiF:
 tensor([[1.1568, 1.7546, 2.5374],
        [3.7578, 0.8067, 1.0593]])
AiF:
 tensor([[1.1870, 2.7297, 1.0319],
        [1.4527, 0.9329, 0.6579]])
AiF:
 tensor([[0.1999, 0.0816, 2.8860],
        [1.6576, 0.8097, 1.1730]])
AiF:
 tensor([[1.5874, 6.1390, 4.3299],
        [1.1993, 2.7865, 0.5152]])
feature_matrix:
 tensor([[0.2573, 1.4332, 5.2349, 1.1568, 1.7546, 2.5374, 1.1870, 2.7297, 1.0319,
         0.1999, 0.0816, 2.8860, 1.5874, 6.1390, 4.3299],
        [0.3983, 1.6445, 1.8403, 3.7578, 0.8067, 1.0593, 1.4527, 0.9329, 0.6579,
         1.6576, 0.8097, 1.1730, 1.1993, 2.7865, 0.5152]])

feature_matrix = torch.sign(feature_matrix) * torch.sqrt(torch.abs(feature_matrix) + EPSILON) 对上面的结果做处理。EPSILON = 1e-12 使根号下不为零。

这个处理是为了得到最显著的特征。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-W641XNqi-1578628118026)(C:\Users\linksure\AppData\Roaming\Typora\typora-user-images\image-20191209194933601.png)]

feature_matrix = F.normalize(feature_matrix, dim=-1) 归一化。

Use cuda 显卡使用

    net.to(device)
    if torch.cuda.device_count() > 1:
        net = nn.DataParallel(net)

把net加载到device中计算，如果CUDA中device的数量大于1，则使用并行计算。

Optimizer, LR Scheduler 优化器

    learning_rate = logs['lr'] if 'lr' in logs else config.learning_rate
    optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate, momentum=0.9, weight_decay=1e-5)

    # scheduler = torch.optim.lr_scheduler.ReduceLROnPlateau(optimizer, factor=0.9, patience=2)
    scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=2, gamma=0.9)

torch.optim.SGD()采用随机梯度下降优化。lr学习速率。momentum冲量。更新量：(当本次梯度下降- dx * lr的方向与上次更新量v的方向相同时，上次的更新量能够对本次的搜索起到一个正向加速的作用。当本次梯度下降- dx * lr的方向与上次更新量v的方向相反时，上次的更新量能够对本次的搜索起到一个减速的作用。)
$v = - d x * l r + v * m o m e m t u m$
weight_decay=1e-5 E（w）= E（w）+λ2w2 使用L2正则化防止过拟合。

torch.optim.lr_scheduler.StepLR() 调整学习速率。每个参数组的学习速率为:
$lr*\lambda^n,n = \frac{epoch}{step\_size}$
step_size(整数类型): 调整学习率的步长,每过step_size次,更新一次学习率。gamma(float 类型):学习率下降的乘数因子。

ModelCheckpoint 模型监控

    callback_monitor = 'val_{}'.format(raw_metric.name)
    callback = ModelCheckpoint(savepath=os.path.join(config.save_dir, config.model_name),
                               monitor=callback_monitor,
                               mode='max')
    if callback_monitor in logs:
        callback.set_best_score(logs[callback_monitor])
    else:
        callback.reset()

监控并保存最好的模型。调用 class ModelCheckpoint(Callback)

class ModelCheckpoint(Callback):
    def __init__(self, savepath, monitor='val_topk_accuracy', mode='max'):
        self.savepath = savepath
        self.monitor = monitor
        self.mode = mode
        self.reset()
        super(ModelCheckpoint, self).__init__()

    def reset(self):
        if self.mode == 'max':
            self.best_score = float('-inf')
        else:
            self.best_score = float('inf')

    def set_best_score(self, score):
        if isinstance(score, np.ndarray):
            self.best_score = score[0]
        else:
            self.best_score = score

    def on_epoch_begin(self):
        pass

    def on_epoch_end(self, logs, net, **kwargs):
        current_score = logs[self.monitor]
        if isinstance(current_score, np.ndarray):
            current_score = current_score[0]

        if (self.mode == 'max' and current_score > self.best_score) or \
            (self.mode == 'min' and current_score < self.best_score):
            self.best_score = current_score

            if isinstance(net, torch.nn.DataParallel):
                state_dict = net.module.state_dict()
            else:
                state_dict = net.state_dict()

            for key in state_dict.keys():
                state_dict[key] = state_dict[key].cpu()

            if 'feature_center' in kwargs:
                feature_center = kwargs['feature_center']
                feature_center = feature_center.cpu()

                torch.save({
                    'logs': logs,
                    'state_dict': state_dict,
                    'feature_center': feature_center}, self.savepath)
            else:
                torch.save({
                    'logs': logs,
                    'state_dict': state_dict}, self.savepath)

Training 训练

    logging.info('Start training: Total epochs: {}, Batch size: {}, Training size: {}, Validation size: {}'.
                 format(config.epochs, config.batch_size, len(train_dataset), len(validate_dataset)))
    logging.info('')

    for epoch in range(start_epoch, config.epochs):
        callback.on_epoch_begin()

        logs['epoch'] = epoch + 1
        logs['lr'] = optimizer.param_groups[0]['lr']

        logging.info('Epoch {:03d}, Learning Rate {:g}'.format(epoch + 1, optimizer.param_groups[0]['lr']))

        pbar = tqdm(total=len(train_loader), unit=' batches')
        pbar.set_description('Epoch {}/{}'.format(epoch + 1, config.epochs))

        train(logs=logs,
              data_loader=train_loader,
              net=net,
              feature_center=feature_center,
              optimizer=optimizer,
              pbar=pbar)
        validate(logs=logs,
                 data_loader=validate_loader,
                 net=net,
                 pbar=pbar)

        if isinstance(scheduler, torch.optim.lr_scheduler.ReduceLROnPlateau):
            scheduler.step(logs['val_loss'])
        else:
            scheduler.step()

        callback.on_epoch_end(logs, net, feature_center=feature_center)
        pbar.close()

logging 输出运行日志。

从起始epoch 到设定的最后一个epoch，callback.on_epoch_begin()是第一个epoch的话就pass。

pbar = tqdm(total=len(train_loader), unit=' batches')加载进度条提示。

调用def train 和 def validate

isinstance() 函数：函数来判断一个对象是否是一个已知的类型（考虑继承关系）。

scheduler.step()对学习速率进行调整。

def train

def train(**kwargs):
    # Retrieve training configuration
    logs = kwargs['logs']
    data_loader = kwargs['data_loader']
    net = kwargs['net']
    feature_center = kwargs['feature_center']
    optimizer = kwargs['optimizer']
    pbar = kwargs['pbar']

**kwargs: **会以键/值对的形式解包一个字典，使其成为独立的关键字参数。

    # metrics initialization
    loss_container.reset()
    raw_metric.reset()
    crop_metric.reset()
    drop_metric.reset()

    # begin training
    start_time = time.time()
    net.train()
    for i, (X, y) in enumerate(data_loader):
        optimizer.zero_grad()

        # obtain data for training
        X = X.to(device)
        y = y.to(device)

参数调用reset（）函数，回到最初设置（全零矩阵）。

def reset(self):
    self.corrects = np.zeros(len(self.topk))
    self.num_samples = 0.

time.time() 返回当前时间。

enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标.

optimizer.zero_grad()将梯度初始化为零。

        ##################################
        # Raw Image
        ##################################
        # raw images forward
        y_pred_raw, feature_matrix, attention_map = net(X)

        # Update Feature Center
        feature_center_batch = F.normalize(feature_center[y], dim=-1)
        feature_center[y] += config.beta * (feature_matrix.detach() - feature_center_batch)

更新feature_center。初始的feature_center是一个全零矩阵。feature_center =zeros(num_classes, config.num_attentions * net.num_features)

detach()返回一个新的Variable，从当前计算图中分离下来的，但是仍指向原变量的存放位置。作差之后，不断叠加变化量到feature_matrix。

        ##################################
        # Attention Cropping
        ##################################
        with torch.no_grad():
            crop_images = batch_augment(X, attention_map[:, :1, :, :], mode='crop', theta=(0.4, 0.6), padding_ratio=0.1)

        # crop images forward
        y_pred_crop, _, _ = net(crop_images)

torch.no_grad()不需要梯度。

调用函数def batch_augument()

def batch_augument()

def batch_augment(images, attention_map, mode='crop', theta=0.5, padding_ratio=0.1):
    batches, _, imgH, imgW = images.size()

    if mode == 'crop':
        crop_images = []
        for batch_index in range(batches):
            atten_map = attention_map[batch_index:batch_index + 1]
            if isinstance(theta, tuple):
                theta_c = random.uniform(*theta) * atten_map.max() 
            else:
                theta_c = theta * atten_map.max()

            crop_mask = F.upsample_bilinear(atten_map, size=(imgH, imgW)) >= theta_c
            nonzero_indices = torch.nonzero(crop_mask[0, 0, ...])
            height_min = max(int(nonzero_indices[:, 0].min().item() - padding_ratio * imgH), 0)
            height_max = min(int(nonzero_indices[:, 0].max().item() + padding_ratio * imgH), imgH)
            width_min = max(int(nonzero_indices[:, 1].min().item() - padding_ratio * imgW), 0)
            width_max = min(int(nonzero_indices[:, 1].max().item() + padding_ratio * imgW), imgW)

            crop_images.append(
                F.upsample_bilinear(images[batch_index:batch_index + 1, :, height_min:height_max, width_min:width_max],
                                    size=(imgH, imgW)))
        crop_images = torch.cat(crop_images, dim=0)
        return crop_images

    elif mode == 'drop':
        drop_masks = []
        for batch_index in range(batches):
            atten_map = attention_map[batch_index:batch_index + 1]
            if isinstance(theta, tuple):
                theta_d = random.uniform(*theta) * atten_map.max()
            else:
                theta_d = theta * atten_map.max()

            drop_masks.append(F.upsample_bilinear(atten_map, size=(imgH, imgW)) < theta_d)
        drop_masks = torch.cat(drop_masks, dim=0)
        drop_images = images * drop_masks.float()
        return drop_images

crop模式：

uniform()方法将随机生成下一个实数。theta为数组时，每次从theta给出的范围中随机生成一个实数。

阈值为theta * atten_map.max()

crop_mask = F.upsample_bilinear(atten_map, size=(imgH, imgW)) >= theta_c 对atten_map（每次循环，从attention maps 取1张图片作为atten_map）做双线性上采样，大于阈值的部分置为true（1），小于阈值的部分置为false（0）。

torch.nonzero(crop_mask[0, 0, ...]) crop_mask的第一个通道，非零值的位置。结果的第一列是图片的行号，第二列是列号。

然后找到第一列的最大值和最小值（向外扩张padding_ratio * imgH）的差值作为高，第二列的最大值与最小值（向外扩张padding_ratio * imgW）的差值作为宽。

crop_images 通过对images（X[:, m:n]，即取所有数据的第m到n-1列数据，含左不含右）按上式获得的边界截取得到。

drop模式：

drop_masks.append(F.upsample_bilinear(atten_map, size=(imgH, imgW)) < theta_d) 做双线性上采样，小于阈值置为0，大于置为1。

drop_masks = torch.cat(drop_masks, dim=0)把drop_mask按列合并，变成B*（M-1）*H*W。

drop_mask与image相乘，得到dropping后的图片。

        ##################################
        # Attention Dropping
        ##################################
        with torch.no_grad():
            drop_images = batch_augment(X, attention_map[:, 1:, :, :], mode='drop', theta=(0.2, 0.5))

        # drop images forward
        y_pred_drop, _, _ = net(drop_images)

crop中输入的attention map是attention_map[:, :1, :, :] attention maps的第一张图片。

drop中输入的attention map是attention_map[:, 1：, :, :] attention maps:除去第一张图片外的所有图片。

（@zhong 想法：同一个batch里的32张attention maps描述的是同一个特征。crop只要得到一个特征的放大图，只需要找到min和max像素的位置，所以一张特征图足够。drop不同，它是把所有小于阈值的像素置0，操作是像素级，用数量多的attention maps可以涵盖尽量大且准确的特征区。）

        # loss
        batch_loss = cross_entropy_loss(y_pred_raw, y) / 3. + \
                     cross_entropy_loss(y_pred_crop, y) / 3. + \
                     cross_entropy_loss(y_pred_drop, y) / 3. + \
                     center_loss(feature_matrix, feature_center_batch)

        # backward
        batch_loss.backward()
        optimizer.step()

        # metrics: loss and top-1,5 error
        with torch.no_grad():
            epoch_loss = loss_container(batch_loss.item())
            epoch_raw_acc = raw_metric(y_pred_raw, y)
            epoch_crop_acc = crop_metric(y_pred_crop, y)
            epoch_drop_acc = drop_metric(y_pred_drop, y)

batch_loss采用交叉熵验证。考虑四个预测部分，结果相加。

backward反向传播，optimizer.step() 根据网络反向传播的梯度来更新网络参数。

metrics ：epoch_loss采用AverageMeter，计算多个类的平均值。epoch_raw，crop，drop采用TopKAccuracyMetric（选取概率最大的 k 个标签）计算平均值。

        # end of this batch
        batch_info = 'Loss {:.4f}, Raw Acc ({:.2f}, {:.2f}), Crop Acc ({:.2f}, {:.2f}), Drop Acc ({:.2f}, {:.2f})'.format(
            epoch_loss, epoch_raw_acc[0], epoch_raw_acc[1],
            epoch_crop_acc[0], epoch_crop_acc[1], epoch_drop_acc[0], epoch_drop_acc[1])
        pbar.update()
        pbar.set_postfix_str(batch_info)

    # end of this epoch
    logs['train_{}'.format(loss_container.name)] = epoch_loss
    logs['train_raw_{}'.format(raw_metric.name)] = epoch_raw_acc
    logs['train_crop_{}'.format(crop_metric.name)] = epoch_crop_acc
    logs['train_drop_{}'.format(drop_metric.name)] = epoch_drop_acc
    logs['train_info'] = batch_info
    end_time = time.time()

    # write log for this epoch
    logging.info('Train: {}, Time {:3.2f}'.format(batch_info, end_time - start_time))

end of this batch：更新进度条。

end of this epoch：把acc写进日志

def validate

    # Retrieve training configuration
    logs = kwargs['logs']
    data_loader = kwargs['data_loader']
    net = kwargs['net']
    pbar = kwargs['pbar']

    # metrics initialization
    loss_container.reset()
    raw_metric.reset()

加载日志。loss_container，raw_metric归零。

    # begin validation
    start_time = time.time()
    net.eval()
    with torch.no_grad():
        for i, (X, y) in enumerate(data_loader):
            # obtain data
            X = X.to(device)
            y = y.to(device)

            ##################################
            # Raw Image
            ##################################
            y_pred_raw, _, attention_map = net(X)

加载数据，获取预测值和attention_map。

            ##################################
            # Object Localization and Refinement
            ##################################
            crop_images = batch_augment(X, attention_map, mode='crop', theta=0.1, padding_ratio=0.05)
            y_pred_crop, _, _ = net(crop_images)

            ##################################
            # Final prediction
            ##################################
            y_pred = (y_pred_raw + y_pred_crop) / 2.

            # loss
            batch_loss = cross_entropy_loss(y_pred, y)
            epoch_loss = loss_container(batch_loss.item())

            # metrics: top-1,5 error
            epoch_acc = raw_metric(y_pred, y)

Object Localization and Refinement：通过crop图片来优化预测。

Final prediction：最后的预测值等于raw image的预测值和crop image的预测值。

计算loss 和 acc。

# end of validation
    logs['val_{}'.format(loss_container.name)] = epoch_loss
    logs['val_{}'.format(raw_metric.name)] = epoch_acc
    end_time = time.time()

    batch_info = 'Val Loss {:.4f}, Val Acc ({:.2f}, {:.2f})'.format(epoch_loss, epoch_acc[0], epoch_acc[1])
    pbar.set_postfix_str('{}, {}'.format(logs['train_info'], batch_info))

    # write log for this epoch
    logging.info('Valid: {}, Time {:3.2f}'.format(batch_info, end_time - start_time))
    logging.info('')


if __name__ == '__main__':
    main()

你可能感兴趣的:(文献阅读)

想提升英文文献阅读速度？有哪些实用方法？ paixiaoxin 科研方法文献工具人工智能科研研究生文献管理文献阅读文献翻译 scholaread
在科研的道路上，筛选文献就像是大海捞针，找对了方法，就能快速锁定那些有价值的信息。尤其是在实验方向尚未确定时，如何从海量文献中筛选出“金子”，就显得尤为重要。关键的第一步：精准筛选当你面对一堆英文文献时，首先得明白，不是每一篇文献都值得你细读。这时候，筛选的技巧就显得至关重要。以下是如何快速而精准地进行筛选：快速阅读技巧：先看摘要和结论：这是最快速了解文章核心的方法。如果这两部分都看不懂或者不感兴
研究生师兄谈SCI论文写作心得华大基因学院
即将毕业的高产博士师兄（博士在读期间累计发表SCI论文11篇，其中第一作者或通讯作者论文10篇），受学院委托介绍一下论文写作经验，希望能对大家更快、更轻松发表学术论文提供些许帮助。一、文献阅读在开展课题前，阅读文献是一个不可或缺的环节，只有充分了解你要做的课题，才能得心应手地设计课题，进而快速的围绕计划开展研究、准备数据，方便后期撰写论文。实际上，很多小伙伴常常花费大量时间看各种文献，但还是往往不
Pytorch学习记录-接近人类水平的GEC（使用混合机器翻译模型）我的昵称违规了
五月第二周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的8.NearHuman-LevelPerformanceinGrammaticalErrorCorrectionwithHybridMachineTranslation昨天一天没看论文，发现我文献阅读速度太
文献阅读（42）——使用深度学习在眼底照中检测糖网并分类（综述）柚子味的羊文献阅读深度学习分类人工智能
使用深度学习在眼底照中检测糖网并分类（综述）Deeplearningfordiabeticretinopathydetectionandclassificationbasedonfundusimages:AreviewIF=6.698/Q1文章目录使用深度学习在眼底照中检测糖网并分类（综述）先验知识/知识拓展文章结构文章结果1.introduction方法1.眼底图像一般的分析pipeline2.
机器学习第二十五周周报 ConvLSTM 沽漓酒江机器学习人工智能
文章目录week25ConvLSTM摘要Abstract一、李宏毅机器学习二、文献阅读1.题目2.abstract3.网络架构3.1降水预报问题的建模3.2ConvolutionalLSTM3.3编码-预测结构4.文献解读4.1Introduction4.2创新点4.3实验过程4.3.1Moving-MNISTDataset4.3.2雷达回波数据集4.4结论三、基于pytorch实现ConvLST
机器学习第二十八周周报 PINNs2 沽漓酒江机器学习人工智能
文章目录week28PINNs2摘要Abstract一、Lipschitz条件二、文献阅读1.题目数据驱动的偏微分方程2.连续时间模型3.离散时间模型4.结论三、CLSTM1.任务要求2.实验结果3.实验代码3.1模型构建3.2训练过程代码小结参考文献week28PINNs2摘要本文主要讨论PINN。本文简要介绍了Lipschitz条件。其次本文展示了题为Physics-informedneura
文献阅读：金鱼端脑细胞类型图谱揭示了空间结构和细胞类型进化的多样性程序员
:::block-1文献介绍文献题目Atelencephaloncelltypeatlasforgoldfishrevealsdiversityintheevolutionofspatialstructureandcelltypes\研究团队AmitZeisel（以色列理工学院）、RonenSegev（本·古里安大学）\发表时间2023-11-01\发表期刊ScienceAdvances\影响因子
文献阅读-nomogram文章（七） cHarden13
题目：DevelopmentandValidationofaRadiomicsNomogramforPreoperativePredictionofLymphNodeMetastasisinColorectalCancerlogistic回归；放射组学；结直肠癌；淋巴结转移ref：医学方：临床医生的逆袭：深入解析临床研究预测类文章思路，带你成为科研“大牛”！一.纳入病人纳入2007.2-2010.
【思维导图认证班】戴兰第四幅思维导图作业-日程规划一为宝贝
我没有选择一日的时间来进行规划，而是以一个市级课题的完成来规划具体的步骤，因为这段时间都在集中做课题，没有安排其他的事情，所以没安排具体的时间。步骤分四部分：准备、撰写、查重和提交。准备又分为文献阅读准备和人员访谈准备；撰写分为结题报告、成果鉴定、成果要报。查重为知网，小于30%。提交分电子版和纸质版。心得：撰写前梳理整个课题的环节，撰写中边阅读文献边记录自己撰写的思路，撰写后按照思维导图傻瓜式准
200320复盘呼噜噜_77b5
上午上课，完成皮肤病学习。下午文献阅读，洗了个澡，然后完成单词，听力，阅读，口语。晚上部分完成老板任务。总得来讲，时间大部分利用了，效率和质量有待提高。
文献阅读：Mamba: Linear-Time Sequence Modeling with Selective State Spaces Espresso Macchiato 文献阅读 Mamba Transformer SSSM S6 SSM
文献阅读：Mamba:Linear-TimeSequenceModelingwithSelectiveStateSpaces1.文章简介2.方法介绍1.StateSpaceModels2.SelectiveStateSpaceModels3.实验考察&结论1.简单问题上的验证2.实际场景效果1.语言模型2.DNA模型3.语音模型3.细节考察1.速度和内存考察2.消融实验4.结论&思考文献链接：ht
2019-7-20晨间日记风雨兼程_007
今天是什么日子起床：0800就寝：2300天气：晴心情：美纪念日：无叫我起床的不是闹钟是梦想年度目标及关键点：结束一年的学校生活，重整行装再出发！本月重要成果：文献阅读报告选对方向今日三只青蛙/番茄钟看望阿姨，学习人家的好习惯看看优秀的人的家庭是怎么样的从中学习，思考人生成功日志-记录三五件有收获的事务给儿子修玩具枪，让其有自豪感陪娃学习，共同见证人家的成长信任感，信赖这东西靠培养财务检视看清楚自
Pytorch学习记录-GEC语法纠错我的昵称违规了
Pytorch学习记录-GEC语法纠错01五月第一周要结束了，接下来的三个月主要是文献阅读，准备8、9月的开题报告，技术类的文献集中在GEC和Textmaching的应用方面，读完之后找demo复现，然后应用。理论方面的论文也都是英文的，国内这块做的真的不行啊……学习计划GEC概念AlibabaatIJCNLP-2017Task1:EmbeddingGrammaticalFeaturesintoL
scanpy 教程 1：预处理和聚类 3k PBMCs Tiger Z 程序人生
「写在前面」学习一个软件最好的方法就是啃它的官方文档。本着自己学习、分享他人的态度，分享官方文档的中文教程。软件可能随时更新，建议配合官方文档一起阅读。推荐先按顺序阅读往期内容：文献篇：1.文献阅读：SCANPY：大规模单细胞基因表达数据分析2.文献阅读：scverse项目为单细胞组学数据分析提供了计算生态系统目录1预处理2主成分分析3计算邻域图4嵌入邻域图5对邻域图进行聚类6寻找标记基因官网教程
文献阅读：金鱼端脑细胞类型图谱揭示了空间结构和细胞类型进化的多样性 Tiger Z 程序人生
文献介绍「文献题目」Atelencephaloncelltypeatlasforgoldfishrevealsdiversityintheevolutionofspatialstructureandcelltypes「研究团队」AmitZeisel（以色列理工学院）、RonenSegev（本·古里安大学）「发表时间」2023-11-01「发表期刊」ScienceAdvances「影响因子」13.6
文献阅读02-2022-12-15 不学无术吗
题目：recentadvancesinRNAstructurome摘要：RNAstructuresareessentialtosupportRNAfunctionsandregulationinvariousbiologicalprocesses.Recently,arangeofnoveltechnologieshavebeendevelopedtodecodegenome-wideRNAstr
2024.2.4周报 Nyctophiliaa 人工智能深度学习
目录摘要一、文献阅读1、题目2、摘要3、模型架构4、文献解读一、Introduction二、实验三、结论二、PINN一、PINN比传统数值方法有哪些优势二、PINN方法三、正问题与反问题总结摘要本周我阅读了一篇题目为DeepResidualLearningforImageRecognition的文献，文章的贡献是作者提出了残差网络的思想，且证明了更深层的残差网络具有比VGG网络更低的复杂度和更高的
一种通过增强的面部边界实现精确面部表示的多级人脸超分辨率 qq_43314576 人工智能机器学习深度学习
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract文献阅读：一种通过增强的面部边界实现精确面部表示的多级人脸超分辨率二、使用步骤1、研究背景2、方法提出3、相关方法3.1、FSR网络结构3.2、多阶段FSR网络结构4、实验工作5、方法比较LSTM代码学习2.1、什么是LSTM2.2、LSTM的处理过程2.3、LSTM代码分析总结摘要本周主要阅读了2020C
基于场景文字知识挖掘的细粒度图像识别算法 qq_43314576 算法深度学习人工智能
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录摘要Abstract文献阅读：基于场景文字知识挖掘的细粒度图像识别算法1、研究背景2、方法提出方法模块3、试验4、文章贡献二、RNN代码学习2.1、什么是RNN2.2、RNN的处理过程2.3、RNN简单代码实现总结摘要本周主要阅读了2022CVPR的文章，基于场景文字知识挖掘的细粒度图像识别算法，该论文提出了一种通过挖掘场景文
2019-05-06文献阅读记录一行白鹭上青天
2019-05-06阅读记录：题目：基于RS和GIS的桓仁县乡村聚落景观格局分析（2005年发表）期刊：测绘与空间地理信息Geomatics&SpatialInformationTechnology作者：于淼；李建东摘要：运用RS和GIS技术以及景观分析方法,以辽东山区桓仁县典型的6个乡镇乡村聚落为研究对象,选取乡村聚落斑块数、斑块面积、斑块密度、平均斑块面积、面积加权平均斑块分维数等5个景观指数
对于CNN的文献阅读和识别手写数字的复现白小李深度学习 cnn 神经网络
摘要一、文献阅读1、题目2、摘要3、引言4、CNN模型结构5、实验过程6、同GS算法的对比二、CNN识别手写数字1、两个性质2、图像卷积总结摘要在论文方面阅读了基于CNN网络对于大气湍流相位的提取，对CNN的结构网络和运行原理进行了学习，对CNN识别手写数字方面展开了编码，采用MINST数据集进行训练模型，并计划通过窗口就行可视化展现。Ireadthepaperonphaseextractiono
每日早晚都读书1000/101-专业文献阅读｜《外国建筑历史图说》刘松茯教授编著通过阅读专业书籍获得多元思维的处世之法李廿
历史发展到今天,古代、近现代和当代,不同的时代反映了不同的建筑观。刘松茯教授作为建筑教育学方面的一名资深中国学者,撰写这本《外国建筑历史图说》,并按照古代、近现代和当代三个不同时期对外国建筑史进行多方位、多角度、多层面的归纳和解读。1，首先,建筑是一种时代气息的表达。建筑与时代的关联十分密切,脱离了时代,建筑的生命力也就枯竭了。农业社会,建筑是手工艺产品:工业社会,建筑是机械化产品:信息社会,建筑
【文献阅读笔记】去噪学生网络：DeSTSeg 迎着黎明那道光文献阅读笔记视觉异常检测笔记异常检测视觉检测深度学习
2023CVPR领域：异常检测目标：图像输入数据文章目录1、模型2、方法3、实验4、引用5、想法1、模型模型分为三个模块，包括教师网络、去噪学生网络和分割网络。分为两个阶段进行训练，第一阶段训练去噪学生网络，第二阶段训练分割网络。2、方法去噪学生网络，主要解决的是异常过度泛化的问题，利用编码器-解码器架构实现去噪。在第一个阶段将合成异常图像输入，训练去噪学生网络输出无异常图像。使用合成异常图像的目
【文献阅读笔记】无监督异常检测遇到噪声数据：STKD 迎着黎明那道光文献阅读笔记视觉异常检测笔记异常检测视觉检测深度学习
2022ICIP领域：异常检测目标：图像输入数据文章目录1、什么是噪声数据2、解决的措施3、模型4、方法5、消融实验6、引用7、想法1、什么是噪声数据在无监督异常检测设置中，用于训练的数据均是正常图片，但由于缺陷可能是细微的，因种种原因可能无法保障用于训练的数据集内均是正常图像，有可能混有异常图像。如果仍然按照原有的假设进行异常检测，将会影响检测性能。2、解决的措施通过迭代执行异常检测步骤和训练步
<文献阅读>用转移熵通过微阵列的时间序列推断基因调控网络(inferring gene regulatory networks from microarray time series data ... 我们一起舔过铁栏杆
这篇文章是2007的时候发表在IEEE杂志上，并没有收录到PubMed里面。是韩国的学者开发出来的方法。具体来说，通过转移熵计算基因对的因果关系(causalrelations),也就是转移熵的值。转移熵不是负数，而且大小代表因果关系的强度。题目：Inferringgeneregulatorynetworksfrommicroarraytimeseriesdatausingtransferentr
生信技能树《GEO数据框挖掘》笔记鹿枫堂
友情提示：一定要有R语言的基础，建议学习生信技能树的《生信人这样这样学R语言》之后（最好再把中级20题做完），再来学习本系列视频！总的来说，理解了R语言中级20题之后，这一块的内容学起来就轻松了很多。1.通读文献阅读及规律这一块儿主要就是在你感兴趣的文章里，找到其测序信息的GSE号，在GEO数据库中直接检索该文件号。2.了解GEO数据库比如我们对GSE42872这个测序结果比较感兴趣，我们现在GE
第二十九周：文献阅读笔记（ResMLP）+ pytorch学习（Resnet代码实现） @默然笔记 pytorch 学习人工智能 python 深度学习机器学习
第二十九周：文献阅读笔记（ResMLP）摘要Abstract1.ResMLP1.1文献摘要1.2文献引言1.3ResMLP方法1.3.1整体流程1.3.2残差多感知机层1.4实验1.4.1数据集1.4.2超参数设置1.4.3主要结果1.4.4监督设置1.4.5自监督设置1.4.5知识蒸馏设置1.5ResMLP的创新点2.pytorch学习（ResNet代码实现）2.1数据集2.2文件结构2.3下载
第二十八周：文献阅读笔记（弱监督学习）+ pytorch学习 @默然笔记学习 pytorch 深度学习人工智能 python
第二十八周：文献阅读笔记（弱监督学习）摘要Abstract1.弱监督学习1.1.文献摘要1.2.引言1.3.不完全监督1.3.1.主动学习与半监督学习1.3.2.通过人工干预1.3.3.无需人工干预1.4.不确切的监督1.5.不准确的监督1.6.弱监督学习的创新点2.pytorch学习2.1.对现有模型进行修改2.2.优化器的使用2.3.完整的模型训练套路总结摘要弱监督学习是一种机器学习方法，其训
第二十七周：文献阅读笔记 @默然笔记
第二十七周：文献阅读笔记摘要AbstractDenseNet网络1.文献摘要2.引言3.ResNets4.DenseBlock5.Poolinglayers6.ImplementationDetails7.Experiments8.FeatureReuse9.代码实现总结摘要DenseNet（密集连接网络）是一种深度学习神经网络架构，由KaimingHe等人在2017年提出。相较于传统的卷积神经网
第二十九周：文献阅读笔记（DenseNet）+ pytorch学习 @默然笔记 pytorch 学习
第二十九周：文献阅读笔记（DenseNet）+pytorch学习摘要Abstract1、DenseNet文献阅读1.1文献摘要1.2文献引言1.3DenseNets网络1.3.1残差网络1.3.2密集连接1.3.3实施细节1.4实验1.4.1数据集1.4.1.1CIFAR1.4.1.2SVHN1.4.2模型训练1.4.3CIFAR和SVHN的分类结果1.4.4ImageNet上的分类结果1.5总结
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。