ZN_daydayup

本周的总结

本周完成的计划

论文阅读

ABSTRACT（摘要）

1 INTRODUCTION（介绍）

2 BACKGROUND（背景）

2.1 MIXMATCH

3 REMIXMATCH

3.1 DISTRIBUTION ALIGNMENT（分布对齐）

3.2 IMPROVED CONSISTENCY REGULARIZATION（改进的一致性正则化）

3.3 PUTTING IT ALL TOGETHER（综合考虑）

4 EXPERIMENTS（实验）

5 CONCLUSION（结论）

Pytorch多GPU训练

多GPU训练介绍

Single Machine Data Parallel（单机数据并行）

Single Machine Model Parallel（单机模型并行）

Distributed Data Parallel（分布式数据并行）

代码实践

使用DataParallel类实现多GPU训练

使用DistributedDataParallel类实现多GPU训练

使用nvidia-msi命令查看GPU的使用情况

本周工作总结

本周完成的计划

读论文《ReMixMatch: Semi-Supervised Learning with Distribution Alignment and Augmentation Anchoring》
学习pytorch框架中如何使用多GPU进行训练
参加计算机网络考试

论文阅读

ReMixMatch: Semi-Supervised Learning with Distribution Alignment and Augmentation Anchoring（具有分布对齐和增广锚定的半监督学习）

ABSTRACT（摘要）

我们改进了最近提出的“MixMatch”半监督学习算法，引入了两种新的技术:分布对齐和增强锚定。分布对齐鼓励对未标记数据的预测的边际分布接近真实标签的边际分布。增强锚定将输入的多个强增强版本输入到模型中，并鼓励每个输出都接近相同输入的弱增强版本的预测。为了产生强增强，我们提出AutoAugment的一个变体，它在模型被训练时学习增强策略。我们的新算法被称为ReMixMatch，它比之前的算法的数据效率要高得多，减少5到16倍的数据才能达到同样的精度。例如，在CIFAR-10中，使用250个标记的样本，我们达到了93.73%的正确率(相比之下，MixMatch对4000个样本的正确率为93.58%)，在每个类只有4个标签的情况下，中值正确率为84.92%。

1 INTRODUCTION（介绍）

半监督学习（SSL）提供了一种在有限的标记数据可用时利用未标记数据来提高模型性能的方法。当标记数据很昂贵或不方便时，可以使用大型、功能强大的模型。对SSL的研究产生了多种方法，包括一致性正则化，鼓励模型在输入扰动时产生相同的预测，以及熵最小化，鼓励模型输出高置信度预测。最近提出的“MixMatch”算法将这些技术结合在一个统一的损失函数中，并在各种图像分类基准上实现了强大的性能。在本文中，我们提出了两个可以很容易地集成到MixMatch框架中的改进。

首先，我们引入“分布对齐”，它鼓励模型聚合类预测的分布与真实类标签的边缘分布相匹配。其次，我们引入了“增广锚定”，它取代了MixMatch的一致性正则化部分。为了产生强增强，我们引入了一种基于控制理论的自动增强变体，我们称之为“CTAugment”。与AutoAugment不同，CTAugment在模型训练的同时学习一个增强策略，这使得它在SSL设置中特别方便。我们将改进算法称为“ReMixMatch”，并在一组标准SSL图像基准上进行了实验验证。ReMixMatch在所有标记的数据量中实现了最先进的精度，例如，在CIFAR-10上使用250个标签时，精度达到93.73%，而以前的最先进水平为88.92%（而使用50000个标签进行完全监督分类时，精度为96.09%）。

2 BACKGROUND（背景）

半监督学习算法的目标是从未标记数据中学习，以提高标记数据的性能。实现这一点的典型方法包括针对未标记数据的“猜测”标签进行训练，或者优化不依赖标签的启发式目标。本节回顾与ReMixMatch相关的半监督学习方法，特别关注我们工作所基于的MixMatch算法的组件。

Consistency Regularization ：许多SSL方法依赖于一致性正则化来强制当输入受到扰动时模型输出保持不变。Entropy Minimization ：认为应该使用未标记的数据来确保类被很好地分离。这可以通过鼓励模型的输出来实现分布对未标记数据具有低熵（即，进行“高置信度”预测）。Standard Regularization ：在SSL设置之外，在过度参数化的情况下，正则化模型通常是有用的。这种正则化通常可以应用于有标记和无标记数据的训练。

Other Approaches ：上述三类SSL技术并未涵盖半监督学习的全部文献。还很很多半监督学习方法，比如基于GAN的，基于图的半监督学习算法。

2.1 MIXMATCH

MixMatch(Berthelot等人，2019年)统一了前面提到的几种SSL技术。该算法的工作原理是为每个未标记的样本生成“猜测标签”，然后使用全监督技术对原始的已标记数据以及未标记数据的猜测标签进行训练。

完整的MixMatch算法流程：

3 REMIXMATCH

在介绍了MixMatch之后，我们现在转向本文提出的两个改进：分布对齐和增广锚定。为了清晰起见，我们描述了如何将它们集成到基本MixMatch算法中。

3.1 DISTRIBUTION ALIGNMENT（分布对齐）

我们的第一个贡献是分布对齐，它强制未标记数据的预测集合与所提供的标记数据的分布相匹配。这个基本思想是在25年前首次提出的（Bridle等人，1992年），但据我们所知，在现代SSL技术中并没有使用。分布对齐的示意图如图1所示。在回顾和扩展了该理论之后，我们描述了如何将其直接包含在ReMixMatch中。

3.1.1 INPUT-OUTPUT MUTUAL INFORMATION（输入-输出互信息）

为了解释这一结果，可以观察eq.(2)中的第二项是熟悉的熵最小化目标，它简单地鼓励每个模型输出具有低熵(表明对一个类标签有很高的信心)。然而，在现代SSL技术中，第一个项并没有得到广泛使用。这个term(粗略地说)鼓励在整个训练集中，该模型平均地以相等的频率预测每一类，Bridle等人(1992)将此模型称为“公平”。

3.1.2 DISTRIBUTION ALIGNMENT IN REMIXMATCH（REMIXMATCH中的分布对齐）

MixMatch已经包含了一种通过“锐化”操作实现的熵最小化的形式，该操作使得未标记数据的猜测标签（合成目标）具有较低的熵。因此，我们也有兴趣在ReMixMatch中加入一种“公平”形式。然而，请注意，目标意味着模型应该以相同的频率预测每个类。如果数据集的边际类分布p(y)不均匀，这不一定是一个有用的目标。此外，虽然原则上可以在每个批次的基础上直接最小化该目标，但我们感兴趣的是以不引入额外损失项或任何敏感超参数的方式将其集成到MixMatch中。

为了解决这些问题，我们引入了一种我们称为“分布对齐”的公平形式，其过程如下:在训练过程中，我们保持模型对未标记数据的预测的运行平均值，我们称之为 $\widetilde{p}(y)$ ，给定模型对一个未标记样本u 的预测q= $p_{model}$ (y|u; $\Theta$ )，我们将q按照 $p(y)/\widetilde{p}(y)$ 的比例缩放，然后将结果重新正规化以形成一个有效的概率分布，然后我们用作为u标签的猜测，并像往常一样进行锐化和其他处理。

3.2 IMPROVED CONSISTENCY REGULARIZATION（改进的一致性正则化）

一致性正则化是大多数SSL方法的基础。对于图像分类任务，通常在同一未标记图像的两个增强版本之间执行一致性。为了实施一种形式的一致性正则化，MixMatch生成每个未标记样本u的K（实际上，K=2）增强，并将它们平均在一起以生成u的“猜测标签”。

最近的研究（Xie et al.，2019）发现，应用更强形式的增强可以显著提高一致性正则化的性能。特别是，对于图像分类任务，使用AutoAugment的变体产生了巨大的收益。由于MixMatch使用一种简单的翻转和裁剪增强策略，我们有兴趣看看用AutoAugment替换MixMatch中的弱增强是否会提高性能，但发现训练不会收敛。为了避免这个问题，我们提出了一种新的方法来实现MixMatch中的一致性正则化，称为“增广锚定”。其基本思想是利用模型对弱增强未标记图像的预测作为同一图像的多个强增强版本的猜测标签。

使用AutoAugment的另一个逻辑问题是，它使用强化学习来学习一个策略，该策略需要许多有监督模型训练的试验。这在SSL设置中提出了一些问题，在SSL设置中，我们通常只有有限的标记数据。为了解决这个问题，我们提出了一种称为“CTAugment”的自动增强变体，它使用控制理论的思想在线调整自己，而不需要任何形式的基于强化学习的训练。我们将在以下两个小节中描述增强锚定和增强。

3.2.1 AUGMENTATION ANCHORING（增强锚固）

我们假设MixMatch和AutoAugment不稳定的原因是MixMatch平均了K个扩增的预测。更强的增强可能导致不同的预测，因此它们的平均值可能不是一个有意义的目标。相反，给定一个未标记的输入，我们首先通过对其应用弱增广来生成一个“锚”。然后，我们使用CTAugment（如下所述）生成相同未标记输入的K个强增强版本。我们使用猜测的标签（在应用分布对齐和锐化之后）作为所有K个强增强版本的图像的目标。该过程如图2所示。

3.3 PUTTING IT ALL TOGETHER（综合考虑）

ReMixMatch处理一批标记和未标记样本的算法如算法1所示。该算法的主要目的是生成集合和，包括应用MixUp的扩展标记和未标记样本。

在和，中的标签和标签猜测被输入到标准的交叉熵损失项与模型的预测。算法1还输出 $\hat{U1}$ ，它包含每个未标记图像的一个单一的高度增强版本，并且猜测它的标签没有应用MixUp。 $\hat{U1}$ 用于两个额外的损失项，提供一个温和的提高性能和改进的稳定性。

ReMixMatch总损失是：

4 EXPERIMENTS（实验）

在CIFAR10和SVHN数据集上ReMixMatch和其它数据集在给定不同标签数量条件下准确率的比较：

ABLATION STUDY（消融研究）

上面消融实验的结果是从CIFAR-10拆分出来的单个250个标签的错误率。

5 CONCLUSION（结论）

过去一年半监督学习的进展颠覆了许多长期以来关于分类的观念，即大量有标签的数据是必要的。通过在MixMatch中引入增强锚定和分布对齐，我们延续了这一趋势:与之前的工作相比，ReMixMatch减少了大量需要的标记数据(例如，在CIFAR-10上击败了4000个标记样本的MixMatch，只有250个;在STL-10上接近于5000个标记样本的MixMatch，只有1000个)。数据高效学习的真正力量将来自于将这些技术应用到实际问题中，在这些问题中获取标签数据是昂贵的或不切实际的。

总结一下这篇论文

主要就是在 MixMatch 的基础上改进了两个部分：

Distribution Alignment
Augmentation Anchoring
CTAugement

ReMixMatch采用弱增强数据的预测结果作为guessing label，还用了更复杂的 Loss Function ，使不同类的 unlabeled data 在空间中能够被分隔的更远。

自己跑了一下GitHub上找的代码，效果如下：

论文中说使用250个标记的样本，我们达到了93.73%的正确率，目前跑到了89%，可能是因为训练次数不够和调参的原因。

Pytorch多GPU训练

多GPU训练介绍

常见的多GPU的使用方法有以下两种：

model parallel，当模型很大，单块GPU的显存不足以放下整个模型时，通常会将模型分成多个部分，每个部分放到不同的GUP设备中，这样就能将原本跑不了的模型利用多块GPU跑起来。但这种情况，一般不能加速模型的训练。
data parallel，当模型不是很大可以放入单块GPU时，可以将模型复制到多块GPU上，进行并行加速训练。这种情况更常见，我也是学习的这种方式的多GPU并行训练。

Single Machine Data Parallel（单机数据并行）

工作过程：

如上图所示，scatter（打散）是将上面batch size=4中的四个sampler，分别放入GPU0、GPU1、GPU2、GPU3中，同样的网络模型m也会被复制4分放入这四个GPU中，然后分别同时进行训练，最后将训练的结果gather（收集）到GPU0（主GPU）中，然后再GPU0上求Loss，再更新模型参数，然后继续重复执行上面操作，直到模型收敛。

Single Machine Model Parallel（单机模型并行）

工作过程：

如上图所示，将模型m分成net1和net2两部分，分别放入GPU0和GPU1中，然后将训练数据线放入GPU0的net1模型中进行训练，将net1得到的结果作为输入，放入GPU1中进行训练，在GPU1上算loss，然后更新模型参数。

Distributed Data Parallel（分布式数据并行）

工作过程：

如上图所示，和Data Parallel数据并行不一样的是，我们不是将模型每次都复制到4个GPU中，并行是在每个GPU中单独算loss,gradient等，然后使用一个在分布式系统经常使用的allreduce操作，意思是最后同步的只是loss，gradient这种，然后更新模型参数。

代码实践

使用DataParallel类实现多GPU训练

import time
import argparse
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from torch.optim.lr_scheduler import StepLR
from torch.nn.parallel import DataParallel

torch.manual_seed(0)
torch.cuda.manual_seed_all(0)


class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, 3, 1)
        self.conv2 = nn.Conv2d(32, 64, 3, 1)
        self.dropout = nn.Dropout(0.5)
        self.fc1 = nn.Linear(9216, 128)
        self.fc2 = nn.Linear(128, 10)

    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)
        x = torch.flatten(x, 1)
        x = self.dropout(x)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = F.log_softmax(x)

        return x


def train(args, model, device, train_loader, optimizer, epoch):
    model.train()
    for idx, (images, targets) in enumerate(train_loader):
        images, targets = images.to(device), targets.to(device)
        pred = model(images)
        loss = F.cross_entropy(pred, targets)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if idx % args.log_interval == 0:
            print("Train Time:{}, epoch: {}, step: {}, loss: {}".format(time.strftime("%Y-%m-%d%H:%M:%S"), epoch + 1, idx, loss.item()))


def test(args, model, device, test_loader):
    model.eval()
    test_loss = 0
    test_acc = 0

    with torch.no_grad():
        for (images, targets) in test_loader:
            images, targets = images.to(device), targets.to(device)
            pred = model(images)
            loss = F.cross_entropy(pred, targets, reduction="sum")
            test_loss += loss.item()
            pred_label = torch.argmax(pred, dim=1, keepdims=True)
            test_acc += pred_label.eq(targets.view_as(pred_label)).sum().item()

    test_loss /= len(test_loader.dataset)
    test_acc /= len(test_loader.dataset)

    print("Test Time:{}, loss: {}, acc: {}".format(time.strftime("%Y-%m-%d%H:%M:%S"), test_loss, test_acc))


def main():
    parser = argparse.ArgumentParser(description="MNIST TRAINING")
    parser.add_argument('--device_ids', type=str, default='0', help="Training Devices, example: '0,1,2'")
    parser.add_argument('--epochs', type=int, default=10, help="Training Epoch")
    parser.add_argument('--log_interval', type=int, default=100, help="Log Interval")

    args = parser.parse_args()

    transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307), (0.3081))])

    dataset_train = datasets.MNIST('../data', train=True, transform=transform)
    dataset_test = datasets.MNIST('../data', train=False, transform=transform)

    train_loader = DataLoader(dataset_train, batch_size=8, shuffle=True, num_workers=8)
    test_loader = DataLoader(dataset_test, batch_size=8, shuffle=False, num_workers=8)

    device_ids = list(map(int, args.device_ids.split(',')))
    device = torch.device('cuda:{}'.format(device_ids[0]))
    model = Net().to(device)
    model = DataParallel(model, device_ids=device_ids, output_device=device)

    optimizer = optim.Adam(model.parameters(), lr=1e-4)
    scheduler = StepLR(optimizer, step_size=1)

    for epoch in range(args.epochs):
        train(args, model, device, train_loader, optimizer, epoch)
        test(args, model, device, test_loader)
        scheduler.step()
        torch.save(model.state_dict(), 'train.pt')

if __name__ == '__main__':
    main()

使用DistributedDataParallel类实现多GPU训练

import time
import argparse
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from torch.optim.lr_scheduler import StepLR
import torch.distributed as dist
from torch.nn.parallel import DistributedDataParallel
from torch.utils.data.distributed import DistributedSampler


torch.manual_seed(0)
torch.cuda.manual_seed_all(0)


class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(1, 32, 3, 1)
        self.conv2 = nn.Conv2d(32, 64, 3, 1)
        self.dropout = nn.Dropout(0.5)
        self.fc1 = nn.Linear(9216, 128)
        self.fc2 = nn.Linear(128, 10)
        self.fc3 = nn.Linear(128, 128)

    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = F.max_pool2d(x, 2)
        x = torch.flatten(x, 1)
        x = self.dropout(x)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        x = F.log_softmax(x)

        return x


def train(args, model, device, train_loader, optimizer, epoch):
    model.train()
    for idx, (images, targets) in enumerate(train_loader):
        images, targets = images.to(device), targets.to(device)
        pred = model(images)
        loss = F.cross_entropy(pred, targets)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if idx % args.log_interval == 0 and args.local_rank == 0:
            print("Train Time:{}, epoch: {}, step: {}, loss: {}".format(time.strftime("%Y-%m-%d%H:%M:%S"), epoch + 1, idx, loss.item()))


def test(args, model, device, test_loader):
    model.eval()
    test_loss = 0
    test_acc = 0

    with torch.no_grad():
        for (images, targets) in test_loader:
            images, targets = images.to(device), targets.to(device)
            pred = model(images)
            loss = F.cross_entropy(pred, targets, reduction="sum")
            test_loss += loss.item()
            pred_label = torch.argmax(pred, dim=1, keepdims=True)
            test_acc += pred_label.eq(targets.view_as(pred_label)).sum().item()

    test_loss /= len(test_loader.dataset)
    test_acc /= len(test_loader.dataset)

    print("Test Time:{}, loss: {}, acc: {}".format(time.strftime("%Y-%m-%d%H:%M:%S"), test_loss, test_acc))


def main():
    parser = argparse.ArgumentParser(description="MNIST TRAINING")
    parser.add_argument('--device_ids', type=str, default='0', help="Training Devices")
    parser.add_argument('--epochs', type=int, default=10, help="Training Epoch")
    parser.add_argument('--log_interval', type=int, default=100, help="Log Interval")
    parser.add_argument('--local_rank', type=int, default=-1, help="DDP parameter, do not modify")

    args = parser.parse_args()

    device_ids = list(map(int, args.device_ids.split(',')))
    dist.init_process_group(backend='nccl')
    device = torch.device('cuda:{}'.format(device_ids[args.local_rank]))
    torch.cuda.set_device(device)
    model = Net().to(device)
    model = DistributedDataParallel(model, device_ids=[device_ids[args.local_rank]], output_device=device_ids[args.local_rank], find_unused_parameters=True)

    transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307), (0.3081))])

    dataset_train = datasets.MNIST('../data', train=True, transform=transform)
    dataset_test = datasets.MNIST('../data', train=False, transform=transform)

    sampler_train = DistributedSampler(dataset_train)

    train_loader = DataLoader(dataset_train, batch_size=8, num_workers=8, sampler=sampler_train)
    test_loader = DataLoader(dataset_test, batch_size=8, shuffle=False, num_workers=8)

    optimizer = optim.Adam(model.parameters(), lr=1e-4)
    scheduler = StepLR(optimizer, step_size=1)

    for epoch in range(args.epochs):
        sampler_train.set_epoch(epoch)
        train(args, model, device, train_loader, optimizer, epoch)
        if args.local_rank == 0:
            test(args, model, device, test_loader)
        scheduler.step()
        if args.local_rank == 0:
            torch.save(model.state_dict(), 'train.pt')

if __name__ == '__main__':
    main()

使用nvidia-msi命令查看GPU的使用情况

本周工作总结

1.学习了半监督论文ReMixmatch，其是对MixMatch的改进，在 MixMatch 的基础上改进了两个部份：Distribution Alignment和Augmentation Anchoring。

2.学习了如何在pytorch框架中使用DaraParallel类和DistributedDataParallel类进行多GPU并行训练。pytorch官方推荐使用DistributedDataParallel类，但是DaraParallel使用起来很方便，只需要加几行代码就能搞定。

2018-1-7 龙儿_a97d
早上六点前起床，晚上八点多从学校回来，周一都快累趴下了。如果有人问我：“你会让你的孩子也当教师吗？”我一定会斩钉截铁的回答：“我有多恨他才这么干啊？不会的。”我估摸99%的教师都会这么回答。这个回答当然有些开玩笑的性质，可绝对是我真实的想法。而且我也的确承认，在中国有一个有趣的现象：好多父母，都不希望子女再干自己的行当。医生不让孩子学医，法律工作者不让孩子学法律，干新闻的不让孩子学传媒……农民当然
早更的自己在你不知道的時間裡愛你很久
其實週日上班我是知道的我怎麼會一點不知就是因為我不想來and教堂我都沒去上班還有那麼重要嗎還好給我打電話了不然我就是不想來乾脆不來雖然家裡準備包餃子其實還時上班多點自由我不願意和奶奶媽媽一起幹活無聊難過且不舒服還不如一個人犯傻我是有點早更對不起我們還是少見面少說話為好我樂意我覺得自己更年期了忍受不了不安靜的早上和很晚安靜下來的夜晚我的自由時間都是從睡眠里扣除的所以有點神經質但凡被剝奪那一點點時間就
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
淘宝优惠卷怎么设置叠加(店铺优惠活动设置流程) 高省爱氧惠
我来给你们揭秘一下淘宝优惠券的设置方法，让你们轻松成为省钱小达人！氧惠APP是与以往完全不同的抖客+淘客app！2024全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（训练营导师每天出单带货几万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大礼包，教你如何1年做到百万团队。古楼导师氧惠邀请码555888，注册送万元推广大礼包，教你如何1年做到百万团队。首先
Unet源码实现（pytorch） wyn20001128 pytorch 人工智能 python
U-Net是一种用于生物医学图像分割的卷积神经网络架构。它通过引入一种新颖的网络结构和训练策略解决了传统方法在数据量不足时面临的挑战。U-Net的主要思想是利用数据增强技术来高效利用有限的标注样本，并通过独特的网络设计来提高分割精度。主要贡献U-Net的主要贡献包括：1、数据增强策略：使用随机弹性变形和其他形式的数据增强来增加训练数据的多样性，从而在有限的数据集上训练出更强大的模型。2、U形网络结
pytorch的学习笔记 wyn20001128 算法
一cuda 2006年，NVIDIA公司发布了CUDA(ComputeUnifiedDeviceArchitecture)，是一种新的操作GPU计算的硬件和软件架构，是建立在NVIDIA的GPUs上的一个通用并行计算平台和编程模型，它提供了GPU编程的简易接口，基于CUDA编程可以构建基于GPU计算的应用程序。 CPU是用于负责逻辑性比较强的计算，GPU专注于执行高度线程化的并行处理任务。所以
2021-03-03 宇娟_ab03
2021.3.3日今天的推荐人培训，很有收获啊！说实话在共好这么长时间，一直没有说刻意的培训过，都是家长们口碑相传。我们几位老师也没有接受过营销相关的培训，所以今天闺蜜分享的陌生人沟通成交和师妹的总结以及现场打电话实操，看似很简单，但其实很有挑战，如果换做是我，我会怎么说呢？要好好总结，向她们学习。今天下午在陌生地方和陌生人话多了，心为物役了，以后多注意。
明天就是38女王节，你准备好“剁手”了吗？简笙
图片发自App不得不说，现在网店的营销水平比实体店的强太多了。无人不知无人不晓的“双十一”，已经成为了大部分人囤货和大抢购的重要日子。据传，去年双十一当日，阿里巴巴的成交额达到了2135亿元。就一个手机大小的屏幕里，可以轻松堆放下不同行业不同产品的广告，各种优惠券，各种明星的代言与推荐，能轻松地搜到自己想要的东西，还不用担心取货地点方不方便......正是因为有这么多的优势加在一起，才使得网上购物
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解
基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解文章目录基于探路者算法优化的正则化极限学习机(RELM)的分类问题求解1.RELM原理2.分类问题求解3.基于探路者算法优化的RELM4.实验结果5.Matlab代码1.RELM原理极限学习机(ELM)具有训练速度快、泛化性能好的优点。极限学习机的结构是一种典型的单隐层前馈神经网络(SLFN)。极限学习机的结构见图RELM算法：若NNN
LangChain 源码剖析（八）：对话记忆的 “智能管家“_RunnableWithMessageHistory ATM006 机器智能人工智能 langchain Agent 大模型
每一篇文章都短小精悍，不啰嗦。一、功能定位：给Runnable装上"对话记忆"在聊天机器人、客服系统等场景中，多轮对话是核心需求——用户不会每次都重复历史信息，系统需要记住之前说过什么。RunnableWithMessageHistory就是为解决这个问题而生的组件：它像一个"智能管家"，给原本只能处理单次输入的Runnable（如大模型调用链）装上"记忆功能"，自动管理对话历史的加载、合并和保存
dos命令for教程，循环语句读取字符串变量文件，bat批处理脚本老盖聊技术
大家好，我是老盖，首先感谢观看本文，本篇文章做的有视频，视频讲述的比较详细，也可以看我发布的视频。今天我们学习dos命令中的for命令，它在bat批处理脚本中用的非常多，可以批量处理一些字符串文本变量等数据。输入命令for/?可以看到这个命令的介绍和参数帮助，for这个命令的参数比较复杂，学起来有点难度，我这里举一些例子和大家讲解一下。@echoofffor%%iin(*.*)doecho%%ip
夸一个人也是一项专业活涂玉霞
昨天看到一篇文章，是脱不花沟通训练的内容，讲怎样赞美一个人的。它把赞美他人变成了一种专业，并提供了实操方法，我觉得挺有意思。摘录部分，大家共品。说到赞美我们会有一个误区，以为赞美就是夸人。夸人还不简单？使劲夸就行了。真的是这样吗？我来问你几个场景，你告诉我怎么夸。在职场上，对方是位老师，岁数比你大好多，你怎么夸？对方是你老板的老板的老板，而且很严肃，你怎么夸？如果你跟对方不熟，不太了解这个人的风格
不用交钱的手机兼职一单一结(直接用手机赚零花方法有这些) 氧惠评测
正规不用交钱的手机挣钱app(直接用手机赚零花方法有这些)。现在能够操作的手机挣钱项目非常多，有大量正规免费项目可做，小编建议大家操作那些正规不用交钱的手机挣钱项目，其实正规靠谱的手机赚钱项目都是不用交钱的。赚钱可以让人快乐翻倍！推荐无门槛零投资一个人创业项目！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少
秦淮河岸，秋意浓北人午泽
记国庆趣事。路上囧事南京，一个拥有深厚文化底蕴的城市，在历史的洪流中，历经种种磨难，最终洗净铅华，千帆过尽，重获新生。新工作不久，喜迎国庆70周年，7天的假期不知何去何从。说走就走的旅行，从未有过。一般来说，没有把握的事情，不去冒险。3号高高兴兴出发去南京，去见大学时代，最真挚的朋友之一。塞翁失马，焉知非福，意外总比惊喜多。人生第一次在火车站丢身份证，幸运的是失而复得。重回身边的感觉跟中奖了一般，
如何进行MySQL配置性能优化 anpeng2025 技术爽文大集合架构师 mysql 性能优化数据库 oracle 华为学习 Oracle ERP
MySQL的性能优化是一个系统工程，涉及配置调整、查询优化、架构设计等多个层面。下面我作为架构师，将重点讲解关键的配置参数优化，这些是提升MySQL性能最常见且效果显著的基础步骤：核心原则：基于硬件和工作负载：没有放之四海而皆准的配置。优化必须考虑你的服务器硬件（内存大小、CPU核数、磁盘类型-SSD还是HDD）以及你的应用负载特点（读多写少？写多读少？事务型还是分析型？）。循序渐进，监控验证：每
日更4 心空守望者
每日更新，坚持到第4天了。其实我开通简述账号，本身就是为了练习的目的而来的。所以每天更新对现在的我来说还是很重要的。养成习惯需要不断的重复，重复一件事情，直到成为习惯。不管每天有多忙，总要抽出几分钟来，完成每天的简单写作任务。慢慢的就会习惯，每天写几百个字儿，而且每天的内容，随着每日生活的不同经历内容变得更加丰富。记录心情，更想写一些简短的故事。不只是充数字走水，是在以后翻出来查看时能够成为有益的
普罗透斯效应：衣服的颜色可以让你更有攻击性？熙桓心理
普罗透斯（Πρωτεύς/Proteus）是希腊神话中的一个早期海神，荷马所称的“海洋老人”之一。他的名字可能有“最初”的含义，因为希腊文表示“最早出世的”。最初并没有提及他的家系，直到后来的神话学者才将他归为奥林匹斯神波塞冬的后代，或者是涅柔斯和多里斯之子，或是俄刻阿诺斯同一个放牧海豹的奈阿得斯所生。他有预知未来的能力，但他经常变化外形使人无法捉到他。后来人们常用“普罗透斯”一词指代“随时准备变
2019.5.3 清汤寡水bh
记录生活、记录想法成了我每天必须完成的一个习惯，没有就总觉得缺点什么。记录以后，好的心情、忧郁的心情总能随风而去，过了似乎就好了，自己也很容易忘却。今天三号了，明天他就要上班了，所以我这两天又很想很想出去兜兜风，但看家里比较忙，想想就没说了。小弟弟逐渐开始会翻身了，但平躺得比较多，感觉还是很软弱，所以这两天开始在训练竖抱的过度，用身体让他靠，他躺得很舒服，老是笑。昨晚一个邻居——婆婆的朋友过来坐会
如果深情被辜负-余生尽予孤独又何妨 b1f93afc76c9
因为有你我开始享受上班只因这成了我唯一可以见到你的理由多想把目光一直停留在你身上可还是选择了偷偷看你如果你没那么优秀我是否还可能拥有喜欢你的勇气以前的自己是那么的不可一世自信满满，为何到了你这里…却有了油然而生的差距感多想把你珍藏起来仅我一人欣赏纵使和你有千般不配却依旧抱有一丝尚存多希望我的直觉是准确的可我却在心里无数次的推翻少有的感觉～你知道吗那种初中时代单纯对异性的喜欢对于我而言…就是苦苦寻觅
压岁钱萍凭简单爱
今天是大年三十，是农历2019年的最后一天，晚上各家都要聚在一起包饺子。今天下午先生陪同婆婆出院回到家中开始准备包饺子的材料，邻居娟姐得知婆婆回来了，提着物品来看望，主动提出来帮忙包饺子。有了娟姐的帮忙我们包饺子快多了，先生顺势多准备了几样菜，两家人一起热热闹闹的集体吃年夜饭。饭后大家聚在一起一边看春晚一边聊天。几个孩子玩的愉快和睦，不忍心分开，时间来到了10点钟，不得不分开了。回到家中轩轩宝贝就
关于学习的一点思考云烟
最近一直在考虑要不要继续做线上理财教育，在理财领域带了三年多的班，给我最大的感触是：大部分人是奔着找标准答案来的。在他们看来报个训练营、报个课，这样就有人手把手教，手把手应该很容易就入门了。但结果往往是开营三天掉队10%，开营一周掉队20%，结营时还剩50%。而这完成课程的50%中，营后能按照课程内容去实践的不超过两位数。这不超两位数中，又不断去学习、实践、调整最终形成一套属于自己体系的更少。不单
光与影村夫_adf2
如果你的心被一个人一点点的占据过，你就知道放下这个人有多难。你曾经多迷恋这道光，便会给你带来多少影。
3D Gaussian Splatting (3DGS) 从入门到精通：安装、训练与常见问题全解析
3DGaussianSplatting(3DGS)从入门：安装、训练与常见问题全解析3DGaussianSplatting(3DGS)作为一种新兴的实时神经渲染技术，以其惊人的渲染速度和高质量的视觉效果迅速获得了社区的关注。然而，从环境配置到数据准备，再到模型训练和结果导出，整个流程中充满了各种可能令人困惑的“坑”。本文旨在为您提供一份全面的3DGS安装与使用指南，汇总了从环境搭建到最终结果产出的
简述表白二元工作室
[你喜不喜欢奶盖?][你喜不喜欢王者荣耀?][你喜不喜欢爱情小说?]微信回复：“你有病呀，问我这么多。”[那么这病也是你招惹的，相思病。]微信回复：“滚。”[别这样，我只是得了喜欢你的这种病。]微信回复：“喜欢我就把天上的月亮摘下来。”[]微信回复：“这也行！”[哈哈，都行，只要能骗到你就行。]微信回复：“那好我给你一次机会。”[算我骗你一次，我愿意为此付出代价。]微信回复：“好吧，算你骗到我了。
自嗨山里娃娃66
图片发自App最近确实很充实，参加遇见训练营，笔墨里的时光写作，一周要保证自己去五次瑜伽房，还得应付工作中不停的杂事和没完没了的各种考核。瑜伽房里，惠医生跟我说，福道全程贯通了，那天下班临时决定，走福道，翻山越岭回家，从洪山桥西客站入口进，至左海隧道口下，等于是翻越整个金牛山，其实早上刚做完训练营打卡，腿脚还是有点酸疼，可是还是有颗很强大的好奇心，贯通后的福道风景到底如何?走完全程要耗时多久呢？傍
迷你世界怎么充值最划算？迷你世界在哪里可以申请福利号？会飞滴鱼儿
今天我告诉大家一个可以申请内部号的平台，直接比返利号牛逼10倍不止，最近几年出现了特别多的手游平台。每个平台的福利的各不相同，但是本质是一样的，就给点礼包，首充什么的。感觉毫无卵用。就在上个月，经一个做游戏行业的朋友介绍，了解到了一个平台“游人特权站”，特别NB。这个平台给的是内部号，什么是内部号？说白了就是托号。进服就会给300-500的充值扶持，v7-v12的vlp等级扶持，另外内部号充值10
构建企业级 AI Agent：不只是 Prompt 工程，更是系统工程
构建企业级AIAgent：不只是Prompt工程，更是系统工程文章目录构建企业级AIAgent：不只是Prompt工程，更是系统工程1.从“玩具”到“产品”：AIAgent的演化路径2.系统工程视角下的AIAgent构建原则2.1.状态外置：构建可恢复、可扩展的会话系统2.2.知识外化：建立结构化记忆机制2.3.模型作为配置项：提升系统的灵活性与可维护性2.4.多入口设计：让Agent更贴近用户场
春节是一段容易断更的日子小尘老师
春节走亲访友，可以写的事情非常多。素材多对坚持日更的人来说是非常不错的。但以我自己的经验，春节期间是最容易断更的。没有跟小伙伴们一起组团日更挑战的时候，我自己的日更挑战就经常断在春节。今天在统计昨天日更挑战打卡文章的时候，我也发现数据的下降。近段时间，准时参与打卡的一般都有90多人，但昨天准时参与打卡的人数只有86人。春节期间因为活动比较多，可写的东西也比较多，按理说日更起来更容易。为何这段时间，
知人不评人，方为人上人！婉琴儿
做人，说话不要太满，三十年河东，三十年河西。做事，要有分寸，花无百日红，人无一世穷；话留三分软，人留几分情。说你做到的，做你说过的，分寸感才是最大的智慧！与人相处，多欣赏别人，宽容大度一点；多去结善缘，人生更加顺风。不要因为一点小事，就忘记别人的好；不要因为一点小错，就忘记包容别人。不要在人背后议论纷纷，不要随意打听别人私事，给别人留空间，给自己留余地。有一种大智若愚，就是知人不评人。当面指出不是
2023-03-31 wgbj
争做敢拼敢为的新时代年轻干部“在其位，谋其政；行其权,尽其责。”年轻党员干部想干事、能干事、多干事、干实事、干大事是义务，是本分，是最起码的要求。要始终把干事创业作为一生无悔的追求，坚持“工作学习化，学习工作化”，保持政治上的清醒、坚定和成熟，不辱使命，不负重托。把勤奋学习常思进取作为干事之基。立身以立学为先，立学以读书为本。读书、立德、修身，不仅是立身之本，更是从政之基。在日常工作学习中要不断培
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

本周的总结

本周完成的计划

论文阅读

ABSTRACT（摘要）

1 INTRODUCTION（介绍）

2 BACKGROUND（背景）

2.1 MIXMATCH

3 REMIXMATCH

3.1 DISTRIBUTION ALIGNMENT（分布对齐）

3.2 IMPROVED CONSISTENCY REGULARIZATION（改进的一致性正则化）

3.3 PUTTING IT ALL TOGETHER（综合考虑）

4 EXPERIMENTS（实验）

5 CONCLUSION（结论）

Pytorch多GPU训练

多GPU训练介绍

Single Machine Data Parallel（单机数据并行）

Single Machine Model Parallel（单机模型并行）

Distributed Data Parallel（分布式数据并行）

代码实践

使用DataParallel类实现多GPU训练

使用DistributedDataParallel类实现多GPU训练

使用nvidia-msi命令查看GPU的使用情况

本周工作总结

你可能感兴趣的:(半监督学习,ReMixMatch,多GPU训练)