longrootchen

PyTorch学习笔记（四）损失函数

Environment

OS: macOS Mojave
Python version: 3.7
PyTorch version: 1.4.0
IDE: PyCharm

文章目录

0. 写在前面
1. L1Loss
2. SmoothL1Loss
3. MSELoss
4. BCELoss
5. BCEWithLogitsLoss
6. CrossEntropyLoss
7. NLLLoss
8. PoisonNLLLoss
9. KLDivLoss
10. MarginRankingLoss
11. HingeEmbeddingLoss
12. MultiLabelMarginLoss
13. SoftMarginLoss
14. MultiLabelSoftMarginLoss
15. CosineEmbeddingLoss
16. MultiMarginLoss
17. TripletMarginLoss
18. CTCLoss

0. 写在前面

损失函数用于描述模型预测与真实值之间的差异。严格意义上来说，损失函数（loss function）是对于单个样本实例而言的，而代价函数（cost function）的对于训练数据集而言的

损失函数 $\text{Loss} = f(\hat{y}, y)$
代价函数 $\text{Cost} = \sum_i^N f(\hat{y}, y)$ 或 $\text{Cost} = \frac{1}{N} \sum_i^N f(\hat{y}, y)$

但实际表述中并不严格区分二者。此外，最终要优化的函数为目标函数为代价函数加上正则项

目标函数 $\text{Obj} = \text{Cost} + \text{Regularization}$

PyTorch 在 torch.nn 模块中提供了 18 种常用的损失函数的类，它们被定义为 torch.nn.Module 的子类，通过重写 forward 方法，在其中调用 torch.nn.functional 中的函数实现。

from torch.nn import Module, CrossEntropyLoss

issubclass(CrossEntropyLoss, Module)  # True

实例化这些类时，都需要传入一个参数 reduction

默认值为 mean，计算 $\text{Cost} = \frac{1}{N} \sum_i^N f(\hat{y}, y)$
若传入 sum，则计算 $\text{Cost} = \sum_i^N f(\hat{y}, y)$
若传入 none，则计算 $\text{Loss} = f(\hat{y}, y)$

from torch.nn import L1Loss

l1_loss = L1Loss(reduction='mean')

这里小小地学习一下这些损失函数的类，有些尚未在应用到，日后方便查询 ✅

1. L1Loss

L1Loss 类，计算 inputs 和 target 之差的绝对值， $|\hat{y} - y|$

import torch
from torch.nn import L1Loss

# create data
inputs = torch.tensor([1, 5, 3, 9, 7], dtype=torch.float)
target = torch.tensor([4, 2, 6, 0, 8], dtype=torch.float)

l1_loss = L1Loss(reduction='none')
print(l1_loss(inputs, target))
# tensor([3., 3., 3., 9., 1.])

2. SmoothL1Loss

SmoothL1Loss 类，平滑 L1 损失函数，计算公式为
$\begin{cases} \frac{1}{2} (\hat{y} - y)^2, \text{ if} |\hat{y} - y| < 1 \\ |\hat{y} - y| - \frac{1}{2}, \text{otherwise} \end{cases}$

import torch
from torch.nn import SmoothL1Loss

# create data
inputs = torch.tensor([1, 5, 3, 9, 7.6], dtype=torch.float)
target = torch.tensor([4, 2, 6, 0, 8], dtype=torch.float)

smooth_l1_loss = SmoothL1Loss(reduction='none')
print(smooth_l1_loss(inputs, target))
# tensor([2.5000, 2.5000, 2.5000, 8.5000, 0.0800])

3. MSELoss

MSELoss 类，计算 inputs 和 target 之差的平方， $(\hat{y} - y)^2$

import torch
from torch.nn import MSELoss

# create data
inputs = torch.tensor([1, 5, 3, 9, 7], dtype=torch.float)
target = torch.tensor([4, 2, 6, 0, 8], dtype=torch.float)

l2_loss = MSELoss(reduction='none')

print(l2_loss(inputs, target))

4. BCELoss

BCELoss 类，计算二分类交叉熵，要求输入 inputs 的值范围在 $[0, 1]$

import torch
from torch.nn import BCELoss

# create data
inputs = torch.tensor([
    [1, 3],
    [4, 2]
], dtype=torch.float)
target = torch.tensor([
    [1, 0],
    [1, 0]
], dtype=torch.float)

binary_crossentropy_loss = BCELoss(
    weight=None,
    reduction='none'
)

# 用 sigmoid 将输入压缩至 0 到 1
print(binary_crossentropy_loss(torch.sigmoid(inputs), target))
# tensor([[0.3133, 3.0486],
#         [0.0181, 2.1269]])

5. BCEWithLogitsLoss

在 BCELoss 类中，要求输入 inputs 的值范围在 $[0, 1]$ ，因此需要额外调用 torch.sigmoid 计算二分类交叉熵。

使用 BCEWithLogitsLoss 类则不用额外调用 torch.sigmoid。计算公式为
$\log{\sigma(\hat{y})} + (1 - y) \log{(1 - \sigma(\hat{y}))})$

import torch
from torch.nn import BCEWithLogitsLoss

# create data
inputs = torch.tensor([
    [1, 3],
    [4, 2]
], dtype=torch.float)
target = torch.tensor([
    [1, 0],
    [1, 0]
], dtype=torch.float)

bce_with_logits_loss = BCEWithLogitsLoss(
    weight=None,
    reduction='none',
    pos_weight=None  # 正样本的权重
)
print(bce_with_logits_loss(inputs, target))
# tensor([[0.3133, 3.0486],
#         [0.0181, 2.1269]])

6. CrossEntropyLoss

CrossEntropyLoss 类，将 LogSoftmax 和 NLLLoss 结合，计算交叉熵损失。可以参考这篇博文 Pytorch详解NLLLoss和CrossEntropyLoss。

import torch
from torch.nn import CrossEntropyLoss

# create data
inputs = torch.tensor([
    [1, 2],
    [1, 3],
    [1, 3]
], dtype=torch.float)
target = torch.tensor([0, 1, 1], dtype=torch.long)

cross_entropy_loss = CrossEntropyLoss(
    weight=None,  # 为各类别的损失设置权重
    ignore_index=-1,  # 忽略某个类别
    reduction='none'
)
print(cross_entropy_loss(inputs, target))
# tensor([1.3133, 0.1269, 0.1269])

传入 weight 参数

import torch
from torch.nn import CrossEntropyLoss

# create data
inputs = torch.tensor([
    [1, 2],
    [1, 3],
    [1, 3]
], dtype=torch.float)
target = torch.tensor([0, 1, 1], dtype=torch.long)

# 设置 weight，如下表示：表示标签为 0 的样本权重为 1，标签为 1 的权重为 2
weight = torch.tensor([1, 2], dtype=torch.float)
cross_entropy_loss = CrossEntropyLoss(weight, reduction='none')
print(cross_entropy_loss(inputs, target))
# tensor([1.3133, 0.2539, 0.2539])

7. NLLLoss

NLLLoss 类，取出真实标签对应的预测分数，并取相反数

import torch
from torch.nn import NLLLoss

# create data
inputs = torch.tensor([
    [1, 2],
    [1, 3],
    [1, 3]
], dtype=torch.float)
target = torch.tensor([0, 1, 1], dtype=torch.long)

nll = NLLLoss(
    weight=None,
    ignore_index=-1,
    reduction='none'
)
print(nll(inputs, target))
# tensor([-1., -3., -3.])

8. PoisonNLLLoss

PoisonNLLLoss 类，对于泊松分布目标的负对数似然损失，计算公式

若参数 log_input 为 True，则 $e^{\hat{y}} - y \times \hat{y}$

若参数 log_input 为 False，则 $\hat{y} - y \times \log{(\hat{y} + eps)}$

import torch
from torch.nn import PoissonNLLLoss

# create data
inputs = torch.tensor([
    [0.3, 0.7],
    [0.6, 0.4]
], dtype=torch.float)
target = torch.tensor([
    [1, 0],
    [1, 0]
], dtype=torch.long)

poison_nll_loss = PoissonNLLLoss(
    log_input=True,  # 指示是否输入的预测值已取了对数
    full=False,  # 计算所有 loss，默认为 False
    eps=1e-8,  # 修正项，避免 log_input=False 时对 0 取对数
    reduction='none'
)

print(poison_nll_loss(inputs, target))
# tensor([[1.0499, 2.0138],
#         [1.2221, 1.4918]])

9. KLDivLoss

KLDivLoss 类，计算 KL 散度（KL Divergence），即相对熵

相对熵的理论公式为
$D_{KL}(P|Q) = E_{x \sim p} [\frac{P(x)}{Q(x)}] = E_{x \sim p} [\log{P(x)} - \log{Q(x)}]$

但 PyTorch 中的计算为
$(\log{y} - \hat{y})$

意味着，在输入 $\hat{y}$ 之前要先计算其 log-probability，可以使用 LogSoftmax 实现

import torch
from torch.nn import KLDivLoss, LogSoftmax

# create data
inputs = torch.tensor([
    [0.5, 0.3, 0.2],
    [0.2, 0.3, 0.5]
])
target = torch.tensor([
    [0.9, 0.05, 0.05],
    [0.1, 0.7, 0.2]
])

# log-probability
inputs = LogSoftmax(dim=1)(inputs)

# reduction 还可以传入 'batchmean'，之后版本的 reduction='mean' 的效果将变为与 reduction='batchmean' 相同
kl_div_loss = KLDivLoss(reduction='none')

print(kl_div_loss(inputs, target))
# tensor([[ 0.7510, -0.0928, -0.0878],
#         [-0.1063,  0.5482, -0.1339]])

10. MarginRankingLoss

MarginRankingLoss 类，描述两个向量之间的相似度，常用于排序任务

计算公式： $max\{0, -y \times (\hat{y_1} - \hat{y_2}) + margin)\}$

import torch
from torch.nn import MarginRankingLoss

# create data
y1 = torch.tensor([
    [1],
    [2],
    [3]
], dtype=torch.float)
y2 = torch.tensor([
    [2],
    [2],
    [2]
], dtype=torch.float)
y_true = torch.tensor([1, 1, -1], dtype=torch.float)

margin_ranking_loss = MarginRankingLoss(
    margin=0.0,  # 边界值，\hat{y_1} 和 \hat{y_2} 之间的差异值
    reduction='none'
)

# 返回一个 n x n 的 loss 矩阵，
# 第一行表示 y1 中的第一个元素和 y2 中的每一个元素计算的结果，
# 第二行表示 y1 中的第二个元素和 y2 中的每一个元素计算的结果，以此类推。
print(margin_ranking_loss(y1, y2, y_true))
# tensor([[1., 1., 0.],
#         [0., 0., 0.],
#         [0., 0., 1.]])

11. HingeEmbeddingLoss

HingeEmbeddingLoss 类，计算预测与真实之间的相似性，常用于非线性 embedding 和半监督学习。

计算公式：
$\begin{cases} \hat{y} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ , if \ \ y = 1 \\ max\{ 0, \Delta - \hat{y} \} \ \ , if \ \ y = -1 \end{cases}$

import torch
from torch.nn import HingeEmbeddingLoss

# create data
# 输入 inputs 应为两个预测之差的绝对值
inputs = torch.tensor([[1., .8, .5]])
target = torch.tensor([[1, 1, -1]])

hinge_embedding_loss = HingeEmbeddingLoss(margin=1.0, reduction='none')
print(hinge_embedding_loss(inputs, target))
# tensor([[1.0000, 0.8000, 0.5000]])

12. MultiLabelMarginLoss

MultiLabelMarginLoss 类，多标签边界损失。计算公式为
$\sum_{ij} \frac{max\{ 0, 1 - (x[y[j]] - x[i]) \}}{\text{x.size}(0)}$
where $i = 0$ to $\text{x.size}(0)-1$ , $j = 0$ to $\text{y.size}(0)-1$ , $\leq y[j] \geq \text{x.size}(0)-1$ , and $\not= y[j]$ for all $i$ and $j$ .

import torch
from torch.nn import MultiLabelMarginLoss

# create data
inputs = torch.tensor([[0.1, 0.2, 0.4, 0.8]])
target = torch.tensor([[0, 3, -1, -1]], dtype=torch.long)

multi_label_margin_loss = MultiLabelMarginLoss(reduction='none')
print(multi_label_margin_loss(inputs, target))
# tensor([0.8500])

手动计算

import torch

# create data
inputs = torch.tensor([[0.1, 0.2, 0.4, 0.8]])
target = torch.tensor([[0, 3, -1, -1]], dtype=torch.long)

input_ = inputs[0]
item1 = (1 - (input_[0] - input_[1])) + (1 - (input_[0] - input_[2]))
item2 = (1 - (input_[3] - input_[1])) + (1 - (input_[3] - input_[2]))

print((item1 + item2) / input_.size(0))
# tensor([0.8500])

13. SoftMarginLoss

SoftMarginLoss 类，二分类 logistic 损失函数，计算公式
$\log{(1 + e^{(-y \times \hat{y})})}$

import torch
from torch.nn import SoftMarginLoss

# create data
inputs = torch.tensor([
    [0.3, 0.7],
    [0.5, 0.5]
])
target = torch.tensor([
    [-1, 1],
    [1, -1]
], dtype=torch.float)

soft_margin_loss = SoftMarginLoss(reduction='none')
print(soft_margin_loss(inputs, target))
# tensor([[0.8544, 0.4032],
#         [0.4741, 0.9741]])

14. MultiLabelSoftMarginLoss

MultiLabelSoftMarginLoss 类，SoftMarginLoss 的多标签版本，计算公式
$-\frac{1}{C} \sum_i \left[ y_i \log{(\frac{1}{1 + e^{-\hat{y_i}}})} + (1 - y_i) \log{(\frac{e^{-\hat{y_i}}}{1 + e^{-\hat{y_i}}})} \right]$
其中， $C$ 为标签数， $y_i$ 表示某一个标签的真实值， $\hat{y_i}$ 表示某一个标签的预测值。

import torch
from torch.nn import MultiLabelSoftMarginLoss

# create data
inputs = torch.tensor([[0.3, 0.7, 0.8]])
target = torch.tensor([[0, 1, 1]], dtype=torch.float)

multi_label_soft_margin_loss = MultiLabelSoftMarginLoss(weight=None, reduction='none')
print(multi_label_soft_margin_loss(inputs, target))
# tensor([0.5429])

手动计算

import torch

# create data
inputs = torch.tensor([[0.3, 0.7, 0.8]])
target = torch.tensor([[0, 1, 1]], dtype=torch.float)

C = 3
i_0 = torch.log(torch.exp(-inputs[0][0]) / (1 + torch.exp(-inputs[0][0])))
i_1 = torch.log(1 / (1 + torch.exp(-inputs[0][1])))
i_2 = torch.log(1 / (1 + torch.exp(-inputs[0][2])))
res = -(1 / C) * (i_0 + i_1 + i_2)
print(res)
# tensor([0.5429])

15. CosineEmbeddingLoss

CosineEmbeddingLoss 类，采用余弦相似度计算两个输入的相似性，常用于非线性 embedding 和半监督学习。计算公式
$\begin{cases} 1 - \cos{(x_1, x_2)} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ , if \ \ y = 1 \\ max\{ 0, \cos{(x_1, x_2)} - margin \} \ \ , if \ \ y = -1 \end{cases}$

import torch
from torch.nn import CosineEmbeddingLoss

# create data
inputs1 = torch.tensor([
    [.3, .5, .7],
    [.3, .5, .7]
])
inputs2 = torch.tensor([
    [.1, .3, .5],
    [.1, .3, .5]
])
target = torch.tensor([1, -1], dtype=torch.float)

cosine_embedding_loss = CosineEmbeddingLoss(
    margin=0.0,  # 边界值，可取值范围为 [-1, 1]，推荐 [0, 0.5]
    reduction='none'
)
print(cosine_embedding_loss(inputs1, inputs2, target))
# tensor([0.0167, 0.9833])

手动计算

import torch
from torch.nn import CosineEmbeddingLoss

# create data
inputs1 = torch.tensor([
    [.3, .5, .7],
    [.3, .5, .7]
])
inputs2 = torch.tensor([
    [.1, .3, .5],
    [.1, .3, .5]
])
target = torch.tensor([1, -1], dtype=torch.float)


def cosine(a, b):
    numerator = a @ b
    denominator = torch.norm(a, 2) * torch.norm(b, 2)
    return numerator / denominator


res_y_pos = 1 - cosine(inputs1[0], inputs2[0])  # y = 1
res_y_neg = max(0, cosine(inputs1[1], inputs2[1]))  # y = -1
print(res_y_pos, res_y_neg)
# tensor(0.0167) tensor(0.9833)

16. MultiMarginLoss

MultiMarginLoss 类，计算多分类任务的合页损失，计算公式
$\frac{1}{C} \sum_i (max\{ 0, margin - x[y] + x[i] \})^p$
其中， $C$ 为多分类的类别数

import torch
from torch.nn import MultiMarginLoss

# create data
inputs = torch.tensor([
    [0.1, 0.2, 0.7],
    [0.2, 0.5, 0.3]
])
target = torch.tensor([1, 2], dtype=torch.long)

multi_margin_loss = MultiMarginLoss(
    p=1,  # 指数部分的值，可传入 1 或 2
    margin=1.0,  # 边界值
    weight=None,  # 各类别损失的权重
    reduction='none'
)
print(multi_margin_loss(inputs, target))
# tensor([0.8000, 0.7000])

手动计算

import torch

# create data
inputs = torch.tensor([
    [0.1, 0.2, 0.7],
    [0.2, 0.5, 0.3]
])
target = torch.tensor([1, 2], dtype=torch.long)

# 对于第一个样本实例
inputs_ = inputs[0]
margin = 1

i_0 = margin - (inputs_[1] - inputs_[0])  # > 0
i_2 = margin - (inputs_[1] - inputs_[2])  # > 0
res = (i_0 + i_2) / inputs_.size(0)
print(res)
# tensor(0.8000)

17. TripletMarginLoss

TripletMarginLoss 类，计算三元组损失，常用于人脸识别。计算公式
$L(a, p, n) = max\{ d(a_i, p_i) - d(a_i, n_i) + margin, 0 \}$
其中， $d(x, y) = ||x - y||_p$

在这里插入代码片import torch
from torch.nn import TripletMarginLoss

# create data
anchor = torch.tensor([[1.]])
pos = torch.tensor([[2.]])
neg = torch.tensor([[0.5]])

triplet_margin_loss = TripletMarginLoss(
    margin=1.0,  # 边界值
    p=2.0,  # 范数的阶，默认为 2
    eps=1e-06,
    swap=False,
    reduction='none'
)
print(triplet_margin_loss(anchor, pos, neg))
# tensor([1.5000])

手动计算

(1. - 2.)**2 - np.sqrt((1. - .5)**2) + 1  # 1.5

18. CTCLoss

计算 CTC (Connectionist Temporal Classificatoin) 损失，用于时序类数据的分类问题。

from torch.nn import CTCLoss

CTCLoss(
    blank=0, # blank label
    reduction='mean',
    zero_infinity=False # 无穷大的值或梯度置零
)

时序建模方面有待进一步了解…

PyTorch学习笔记之基础函数篇（四）熊猫Devin 深度学习之PyTorch pytorch 学习笔记
文章目录2.8torch.logspace函数讲解2.9torch.ones函数2.10torch.rand函数2.11torch.randn函数2.12torch.zeros函数2.8torch.logspace函数讲解torch.logspace函数在PyTorch中用于生成一个在对数尺度上均匀分布的张量（tensor）。这意味着张量中的元素是按照对数间隔排列的，而不是线性间隔。这对于创建在数
pytorch学习笔记（2）--Tensor ToToBe pytorch 笔记 1024程序员节
系列文章pytorch学习笔记（1）–QUICKSTARTpytorch学习笔记（2）–Tensorpytorch学习笔记（3）–数据集与数据导入pytorch学习笔记（4）–创建模型(BuildModel)pytorch学习笔记（5）–Autograd文章目录系列文章Tensor（张量）1.初始化张量2.张量的属性3.张量的操作1.类似numpy的索引和切片2.拼接3.算数操作4.单元素张量5.
PyTorch学习笔记（三）：softmax回归 FriendshipT PyTorch学习笔记 pytorch 回归深度学习 softmax
PyTorch学习笔记（三）：softmax回归softmax回归分类问题softmax回归模型单样本分类的矢量计算表达式小批量样本分类的矢量计算表达式交叉熵损失函数模型预测及评价小结Torchvision获取数据集读取小批量PyTorch从零开始实现softmax获取和读取数据初始化模型参数实现softmax运算定义模型定义损失函数定义优化算法计算分类准确率训练模型预测小结PyTorch模块实现
PyTorch学习笔记1 zt_d918
训练过程importtorch#batch_size,input_dimension,hidden_dimension,output_dimensionN,D_in,H,D_out=64,1000,100,10#模拟一个训练集x=torch.randn(N,D_in)y=torch.randn(N,D_out)#模型定义有多种方式，这里不提model#loss函数定义loss_fn=torch.n
小土堆pytorch学习笔记004 柠檬不萌只是酸i 深度学习 pytorch 学习笔记机器学习深度学习
目录1、神经网络的基本骨架-nn.Module的使用2、卷积操作实例3、神经网络-卷积层4、神经网络-最大池化的使用（1）最大池化画图理解：（2）代码实现：5、神经网络-非线性激活（1）代码实现（调用sigmoid函数）6、神经网络-线性层（1）代码7、网络搭建-小实战（1）完整代码1、神经网络的基本骨架-nn.Module的使用官网地址：pytorch里的nnimporttorchfromtor
小土堆pytorch学习笔记003 | 下载数据集dataset 及报错处理柠檬不萌只是酸i 深度学习人工智能深度学习机器学习 pytorch python
目录1、下载数据集2、展示数据集里面的内容3、DataLoader的使用例子：结果展示：1、下载数据集#数据集importtorchvisiontrain_set=torchvision.datasets.CIFAR10(root="./test10_dataset",train=True,download=True)test_set=torchvision.datasets.CIFAR10(ro
小土堆pytorch学习笔记005 | 完结，✿✿ヽ(°▽°)ノ✿ 柠檬不萌只是酸i 深度学习学习笔记 pytorch 机器学习深度学习
目录1、损失函数与反向传播2、如何在搭建的网络中使用损失函数呢？3、优化器4、现有网络模型的使用及修改例子：5、模型训练保存+读取（1）保存（2）读取6、完整的模型训练：（1）代码【model文件】：【主文件】：（2）运行截图：（3）绘图展示：（4）添加训练正确率的完整代码：（5）总结！！！：（6）使用GPU训练7、完整模型验证（1）代码（2）运行结果1、损失函数与反向传播①计算实际输出和目标之间
小土堆pytorch学习笔记002 柠檬不萌只是酸i 深度学习 pytorch 学习笔记
目录1、TensorBoard的使用（1）显示坐标：（2）显示图片：2、Transform的使用3、常见的Transforms（1）#ToTensor()（2）#Normalize()（3）#Resize()（4）#Compose()4、总结：1、TensorBoard的使用（1）显示坐标：fromtorch.utils.tensorboardimportSummaryWriterimportnu
【pytorch】pytorch学习笔记（续2）小白冲鸭 pytorch 学习笔记
p30：1.均方差（MeanSquaredError,MSE）：（1）注意区分MSE和L2范数：L2范数要开根号，而MSE不需要开根号。用torch.norm函数求MSE的时候不要忘记加上pow(2)。求导：pytorch实现自动求导：第一种方法：torch.autograd.grad()设置w需要求导有两种方法：（1）在创建w之后，用来设置w需要求导。（2）在创建w的时候，用w=torch.te
【pytorch】pytorch学习笔记（续1）小白冲鸭 pytorch 学习笔记
p22：1.加减乘除：（1）add(a,b)：等同于a+b。（2）sub(a,b)：等同于a-b。（3）mul(a,b)：等同于a*b。（4）div(a,b)：等同于a/b。a//b表示整除。2.tensor的矩阵式相乘：matmul注意区分：（1）*：表示相同位置的元素相乘；（2）.matmul：表示矩阵相乘。对于（2）矩阵的相乘，有三种方式：(1)torch.mm:只适用于二维的tensor，
【pytorch】pytorch学习笔记小白冲鸭 pytorch 学习笔记
（实践）p5：线性回归问题中损失函数为什么要使用均方误差？均方误差：即误差的平方和的平均数。p8：1.pytorch不是一个完备的语言库，而是一个对于数据的gpu加速库，所以其没有对string的内键支持，即pytorch的基本类型中不包含string。2.pytorch表示string的方法：（1）onehotencoding问题：1）两个单词之间的相关性并没有在onehot编码中得到体现；2）
【pytorch】pytorch学习笔记（续3）小白冲鸭 pytorch 学习笔记
p41：1.LeakReLU,SELU,softplus2.GPU加速：.to方法p42：不太懂p43：1.visdom，tensorbroadXp44：p45：1.如何检测过拟合？在train上表现很好，而在test上表现不好。test的目的（没有valset的时候）：防止过拟合，选取最优参数。相当于是验证集。一般选取testaccuracy最高的那点停止训练，作为最优参数。p46：1.trai
小土堆pytorch学习笔记001 柠檬不萌只是酸i 深度学习 pytorch 学习笔记
1、Pytorch环境的配置与安装。（1）建议安装：Anaconda（2）检查显卡：GPU（3）管理环境（不同版本的pytorch版本不同）：condacreate-npytorchpython=3.6（4）检测自己的电脑是否可以使用：2、pytorch编辑器的选择（1）pycharm（下载社区版）（2）jupyter（可以交互）启动本地的jupyter:3、为什么torch.cuda.is_av
Pytorch学习笔记(2) Autograd(自动求导) —— PyTorch的核心银色尘埃010
本文是Pytorch快速入门第二部分，主要学习记录，主要翻译PytorchAutograd部分教程原文autograd包是PyTorch中神经网络的核心部分。torch.autograd提供了类和函数,用来对任意标量函数进行求导。要想使用自动求导，只需要对已有的代码进行微小的改变。只需要将所有的tensor包含进Variable对象中即可。一、Tensor(张量)torch.Tensor是程序包的
pytorch学习笔记（十）満湫学习笔记
一、损失函数举个例子比如说根据Loss提供的信息知道，解答题太弱了，需要多训练训练这个模块。Loss作用：1.算实际输出和目标之间的差距2.为我们更新输出提供一定的依据（反向传播）看官方文档每个输入输出相减取平均取绝对值再取平均第一个损失函数：L1Loss（差的绝对值取平均）需要注意输入输出N=batch_size你有多少个数据第一个损失函数：MSELoss（平方差误差，平方取平均）稳妥的写法是先
pytorch学习笔记（八）満湫 pytorch 学习笔记
Sequential看看搭建了这个能不能更容易管理，CIFAR-10数据集进行看一下网络模型CIFAR-10模型123456789输入进过一次卷积，然后经过一次最大池化，尺寸变成16*16了，在经过一次卷积尺寸没变，紧接着进过了一次最大池化，变成了8*8，再经过一次卷积通道数改变32→64，再经过一次池化变成4*4，然后展平，最后输出。（1-2）根据图里面看，32×32经过卷积后的尺寸仍然是32×
pytorch学习笔记（十一）満湫 pytorch 学习笔记
优化器学习把搭建好的模型拿来训练，得到最优的参数。importtorch.optimimporttorchvisionfromtorchimportnnfromtorch.nnimportSequential,Conv2d,MaxPool2d,Flatten,Linearfromtorch.utils.dataimportDataLoaderdataset=torchvision.datasets
pytorch学习笔记（五）満湫学习笔记
关注不同的方法输入是什么类型，输出是什么类型。1.Compose主要关注初始化函数从作用内置call的调用方法两种，第一种,直接使用对象，不用使用点，直接调用的是__call__当要调用的时候直接写个Person()按住ctrl+P看看需要填啥参数。2.Totensor的使用输出结果如下3.Normalize归一化输入必须要tensor的均值，标准差，然后看图片的维度计算4.Resize给定的是一
pytorch学习笔记満湫 pytorch 学习人工智能
torchvision处理图像的pytorch官网上看数据集的包，COCO数据集目标检测、语义分割，cifar物体识别预训练好的模型这个模块是图片的处理root-位置，train-创建的true是个训练集，transform前面是输出图片的数据类型，“3”是targetimporttorchvisionfromtorch.utils.tensorboardimportSummaryWriterda
pytorch学习笔记（七）満湫 pytorch 学习笔记
池化类似压缩最大池化-上采样例如给一个3的话就会生成一个3×3的窗口（生成相同的高和宽），给一个tuple就会给出一个相同的池化核。stride默认值就是核的大小dilation在卷积dialation设置之后每一个会和另外的差一个，空洞卷积ceilfloor模式（天花板、地板）floor就是向下取整。按下面的方法走，走的步数默认为核的大小取9个里面的最大值，走到右一图，这种情况只能覆盖6个，其他
pytorch学习笔记（一）乌拉圭没有壳
1、今天在学习60分钟pytorchtutorial中2、zip就是把2个数组糅在一起x=[1,2,3,4,5]y=[6,7,8,9,10]zip(x,y)[(1,6),(2,7),(3,8),(4,9),(5,10)]还可以方便建立字典。x=['bob','tom','kitty']>>>y=[80,90,95]>>>d=dict(zip(x,y))[('bob',80),('tom',90),
Pytorch学习笔记 | GAN生成对抗网络 | 代码 | 生成mnist手写数字图片惊鸿若梦一书生 Python深度学习 pytorch 学习笔记
文章目录GAN网络简介测试判别器和测试生成器测试判别器测试生成器首次生成图片（效果欠佳）生成图片（比较清晰，但还有差距）生成图片（继续优化，输入扩维）生成图片（继续优化，）GAN网络简介生成对抗网络（GAN，GenerativeAdversarialNetworks）是一种深度学习模型，由IanGoodfellow和他的同事在2014年首次提出。GAN是一种非常强大和独特的神经网络架构，用于生成新
『PyTorch学习笔记』分布式深度学习训练中的数据并行(DP/DDP) VS 模型并行 AI新视界 Pytorch学习笔记 pytorch 数据并行模型并行 Data Parallel
分布式深度学习训练中的数据并行(DP/DDP)VS模型并行文章目录一.介绍二.并行数据加载2.1.加载数据步骤2.2.PyTorch1.0中的数据加载器(Dataloader)三.数据并行3.1.DP(DataParallel)的基本原理3.1.1.从流程上理解3.1.2.从模式角度理解3.1.3.从操作系统角度看3.1.4.低效率3.2.DDP(DistributedDataParallel)的
Pytorch学习笔记——autograd 岳野学习笔记 python 机器学习深度学习
一、神经网络神经网络就是一个”万能的模型+误差修正函数“，每次根据训练得到的结果与预想结果进行误差分析，进而修改权值和阈值，一步一步得到能输出和预想结果一致的模型。机器学习可以看做是数理统计的一个应用，在数理统计中一个常见的任务就是拟合，也就是给定一些样本点，用合适的曲线揭示这些样本点随着自变量的变化关系。深度学习同样也是为了这个目的，只不过此时，样本点不再限定为(x,y)点对，而可以是由向量、矩
PyTorch学习笔记欢桑 pytorch 学习深度学习
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录学习目标学习内容：一pytorch深度学习方法二构建一个简单神经网络三深度学习工作流和pytorch生态系统四基于pytorch构建CNN五RNN以及序列数据处理六生成对抗网络七强化学习八将pytorch用用于生产三种不同的方法总结学习目标4月份到来之前学完《PorTorch深度学习实战》学习内容：一pytorch深度学习方法
Pytorch学习笔记（4）—LSTM序列生成模型 llddycidy Pytorch学习笔记 pytorch 学习笔记
文章目录前言主要内容一、序列生成问题解决方法二、RNN的引入三、LongShortTermMemory(LSTM)4、序列生成音乐本文引用：前言掌握使用PyTorch构建LSTM模型的方法掌握使用LSTM生成MIDI音乐的方法主要内容如何用神经网络做序列生成？RNN与LSTM的工作原理RNN是如何记忆Pattern的？MIDI音乐的原理如何用LSTM作曲一、序列生成问题解决方法将生成问题转化成一个
PyTorch学习笔记（二）——TensorBoard routine1o1oo pytorch
1用途1、训练过程中loss是如何变化的，是否正常或是否按预想的变化，选择什么样的模型2、模型在不同阶段的输出2需要导入的类和常用的方法fromtorch.utils.tensorboardimportSummaryWriterwriter.add_image()writer.add_scalar()查看SummaryWriter的官方文档直接向log_dir文件夹写入事件文件，可以被Tensor
【pytorch学习笔记03】pytorch完整模型训练套路 yierrrrr DL学习笔记 pytorch 学习笔记
B站我是土堆视频学习笔记，链接：https://www.bilibili.com/video/BV1hE411t7RN/?spm_id_from=333.999.0.01.准备数据集train_data=torchvision.datasets.CIFAR10(root='./dataset',train=True,transform=torchvision.transforms.ToTensor
PyTorch学习笔记 Junoxiang pytorch 学习笔记
1.item()→number方法:item()返回一个数只能用于只包含一个元素的张量。对于其他的张量，请查看方法tolist().该操作是不可微分的,即不可求导.(译者注:返回的结果是普通Python数据类型,自然不能调用backward()方法来进行梯度的反向传播)Example:例子:>>>x=torch.tensor([1.0])>>>x.item()1.02.Tensor（张量）中包含d
PyTorch学习笔记（4）--神经网络模型的保存和导入别管我啦就是说 Pytorch学习笔记 python pytorch
1.numpy矩阵的保存importnumpyasnpa=np.array(2)np.save("nm.npy",a)a=np.load("nm.npy")2.模型的保存和导入将训练好的模型和参数保存下来，下一次使用的时候直接导入模型和参数，和一个已经训练好的神经网络模型一样保存模型importtorch#保存整个神经网络的结构和模型参数torch.save(mymodel,'mymodel.pk
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

PyTorch学习笔记（四）损失函数

文章目录

0. 写在前面

1. L1Loss

2. SmoothL1Loss

3. MSELoss

4. BCELoss

5. BCEWithLogitsLoss

6. CrossEntropyLoss

7. NLLLoss

8. PoisonNLLLoss

9. KLDivLoss

10. MarginRankingLoss

11. HingeEmbeddingLoss

12. MultiLabelMarginLoss

13. SoftMarginLoss

14. MultiLabelSoftMarginLoss

15. CosineEmbeddingLoss

16. MultiMarginLoss

17. TripletMarginLoss

18. CTCLoss

你可能感兴趣的:(PyTorch学习笔记)