NeXT_Vision

IDE & Framework之PyTorch使用记录

文章目录

- PyTorch中的常用操作
- - 序号001
  - torchTensor.item()
  - A.numel()=a, B.numel()=b, 已知a>b, 从A中随机采样b个元素赋值给B, 方法是对索引0~a-1随机排序后取前b个, 即:
  - 打印输出 list[5Tensor] 中Tensor的shape
  - torch.nonzero(..., as_tuple=False).squeeze(1)的使用
  - 找出Tensor中的非零元素
  - 找出Tensor中的非重复元素
  - 找出Tensor中的非重复元素的出现次数
  - 从索引集inds_A中随机选出n个索引构成索引集inds_B
  - 利用set()得到获取从pos_inds中去除sampled_inds之后的索引
  - torch.topk()和torch.sort()
  - torch.cat()和torch.stack()
  - torch.contiguous()
  - torch.view(-1)
  - F.interpolate()上采样
  - 计算二维空间中两个点之间的距离
- 初上手PyTorch
- 使用PyTorch时易弄错的地方
- - 张量索引时, 注意tmp_a[:, tmp_b_inds]和tmp_a[torch.arange(len(tmp_b_inds)), tmp_b_inds]之间的不同
  - 张量索引时, 注意核查一下是否会改变原始张量中的元素值
  - 张量索引进行左赋值时, 注意只能使用一层索引
  - 非空张量才可执行torch.max()操作
  - 什么情况下Tensor的shape会是torch.Size([])呢?
  - 报错IndexError: too many indices for tensor of dimension 0
- torch.Tensor的数据类型
- - 值类型(value type)与引用类型(reference type)
  - 单精度(float)与双精度(double)
  - torch.Tensor的数据类型转换
- 搭建子网络
- - A collection of various deep learning architectures, models, and tips
  - PyTorch打印输出网络结构
  - model.trian()与model.eval()
  - 区分理解BatchNorm，LayerNorm， InstanceNorm和GroupNorm
  - BatchNorm2d 的 affine, track_running_stats 参数
  - 激活函数
  - PyTorch中的梯度计算, backward, requires_grad属性, zero_grad(),
  - PyTorch中的计算图, retain_graph
- PyTorch 可视化
- - How to use TensorBoard with PyTorch
  - PyTorch 自带的可视化工具
  - Feature extraction for model inspection
- PyTorch模型训练
- - PyTorch提升数据加载速度
  - PyTorch 创建 data.DataLoader 时, 参数 pin_memory 的理解
  - 梯度下降
  - PyTorch DDP模式单机多卡训练
- the method `tensor.new()` in Pytorch
- `torch.Tensor.scatter_`用法理解
- - incase *value (float)* is not specified, 即利用src张量中的元素来scatter
  - incase *src (Tensor)* is not specified, 即利用value标量来scatter
  - - torch.Tensor.scatter_() 一般可以用来对标签进行**one-hot 编码**，
- torch.gather
- 保持Tensor的索引对齐(或者说索引一致性)
- 在共有的前提条件inds_B_in_A下, 由inds_C_in_B求inds_C_in_A 和由inds_C_in_A求inds_C_in_B
- PyTorch中模型的保存与加载
- PyTorch中tensor和nn.Module的复制 Copy.deepcopy() v.s. clone()
- .clone(), .detach(), new_tensor(), .copy_()
- - 1 .clone()
- 报错问题记录
- - 查看torch所在的虚拟环境信息
  - one of the variables needed for gradient computation has been modified by an inplace operation
  - ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead.
  - PyTorch: cannot import name `container_abc` form torch._six
  - Unable to find a valid cuDNN algorithm to run convolution
  - 待补充
- 二级标题
- 待补充
- - 待补充
- 分割线
- 分割线

PyTorch中的常用操作

序号001

*** Pytorch的Broadcast,合并与分割,数学运算,属性统计以及高阶操作！_布衣小张-CSDN博客 20191213

torch.randn(4, 3)
torch.randint(5, (2, 2))

tmp_b = torch.empty(tmp_a.size(), device=self.device, dtype=torch.float32).shape
tmp_b = torch.zeros(tmp_a.size(), device=self.device, dtype=torch.float32).shape

torch.squeeze()

torch.cat(), torch.stack()操作时, list里的Tensor应都位于cpu或者cuda上;

.reshape(-1) 或 .reshape(1, -1) 将数组横向平铺, -1所在的那个维度会自动计算shape
.reshape(-1, 1) 将数组纵向平铺, -1所在的那个维度会自动计算shape
[numpy或pandas中reshape(-1)等用法 20190708](https://www.jianshu.com/p/0b6bc5ebf24a)

# mmdet/models/dense_heads/anchor_head.py
if not inside_flags.any():  # hc-y_note:如果inside_flags中没有一个元素为True
	return (None, ) * 7

assert ~torch.isnan(tmp_a).any(), 'some elements of tmp_a is NaN'
assert isinstance(scores, (torch.Tensor, np.ndarray))
assert refine_type in [None, 'conv', 'non_local']

temp_a = dict(loss_rpn_cls=1, loss_rpn_bbox=2)
[_temp for _temp in temp_a.keys() if 'loss' in _temp] 

avg_factor = max(torch.sum(label_weights > 0).float().item(), 1.)

# 1. assign -1 by default
assigned_gt_inds = overlaps.new_full((num_bboxes, ),-1,dtype=torch.long)

If you are trying to invert a mask, use the `~` or `logical_not()` operator instead.

tensor矩阵相乘可用@, tensor矩阵逐个元素相乘可用*;
[关于pytorch中@和*的用处 - 回忆瞬间 - 博客园 20200726](https://www.cnblogs.com/peixu/p/13382962.html)

torchTensor.item()

torchTensor.item(): Returns the value of this tensor as a standard Python number. This only works for tensors with one element.
关于pytorch中.item()的用法_千律的博客-CSDN博客 20200918

A.numel()=a, B.numel()=b, 已知a>b, 从A中随机采样b个元素赋值给B, 方法是对索引0~a-1随机排序后取前b个, 即:

A.numel()=a, B.numel()=b, 已知a>b, 从A中随机采样b个元素赋值给B, 方法是对索引0~a-1随机排序后取前b个, 即:
perm = torch.randperm(A.numel(), device=A.device)[:b]
B = A[perm]

打印输出 list[5Tensor] 中Tensor的shape

mlvl_anchors = [torch.zeros(110592, 4), torch.zeros(27648, 4), torch.zeros(6912, 4), torch.zeros(1728, 4), torch.zeros(432, 4)]

print([mlvl_anchors[i].shape for i in range(len(mlvl_anchors))])
[torch.Size([110592, 4]), torch.Size([27648, 4]), torch.Size([6912, 4]), torch.Size([1728, 4]), torch.Size([432, 4])]

print([mlvl_anchors[i].size(0) for i in range(len(mlvl_anchors))])
[110592, 27648, 6912, 1728, 432]

print(sum([mlvl_anchors[i].size(0) for i in range(len(mlvl_anchors))]))
147312

torch.nonzero(…, as_tuple=False).squeeze(1)的使用

通常情况下, 直接使用以下这一句代码就行了, 后面无论len(tmp_d_inds)是否为0, torch.cat([tmp_d1_inds, tmp_d2_inds])均不会报错的;
tmp_inds = torch.nonzero(tmp_a < -2, as_tuple=False).squeeze(1)

tmp_a = torch.rand(6)
tmp_b_inds = torch.nonzero(tmp_a < 0.5, as_tuple=False)
tmp_b_inds.shape  # torch.Size([5, 1])
tmp_b_inds.numel()  # 5
tmp_a[tmp_b_inds].shape  # torch.Size([5, 1])
if tmp_b_inds.numel() != 0:
    tmp_b_inds = tmp_b_inds.squeeze(1)
tmp_a[tmp_b_inds].shape  # torch.Size([5])
tmp_c_inds = torch.nonzero(tmp_a < -2, as_tuple=False)
tmp_c_inds.shape  # torch.Size([0, 1])
tmp_a[tmp_c_inds].shape  # torch.Size([0, 1])
tmp_c_inds.numel()  # 0
if tmp_c_inds.numel() != 0:
    tmp_c_inds = tmp_c_inds.squeeze(1)
tmp_a[tmp_c_inds].shape  # torch.Size([0])

torch.cat([tmp_c_inds.squeeze(1), tmp_b_inds.squeeze(1)])
Out[24]: tensor([1, 2, 3, 4, 5])

torch.cat([tmp_c_inds, tmp_b_inds.squeeze(1)])
Traceback (most recent call last):
  File "D:\OtherProgramFiles\Anaconda3\envs\my_cpu_py3\lib\site-packages\IPython\core\interactiveshell.py", line 3331, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    torch.cat([tmp_c_inds, tmp_b_inds.squeeze(1)])
RuntimeError: Tensors must have same number of dimensions: got 2 and 1

torch.cat([tmp_c_inds, tmp_c_inds.squeeze(1)])
Out[26]: tensor([], size=(0, 1), dtype=torch.int64)

torch.cat([tmp_c_inds, tmp_c_inds])
Out[27]: tensor([], size=(0, 1), dtype=torch.int64)


# 因此通常情况下, 直接使用以下这一句代码就行了, 后面无论
# len(tmp_d_inds)是否为0, torch.cat([tmp_d1_inds, tmp_d2_inds])均不会报错的;
tmp_d_inds = torch.nonzero(tmp_a < -2, as_tuple=False).squeeze(1)

tmp_a = torch.arange(0, 20)
tmp_a
Out[53]: 
tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
        18, 19])

tmp_1_inds = torch.nonzero((tmp_a > 5) & (tmp_a < 9), as_tuple=False).squeeze(1)
tmp_1_inds
Out[77]: tensor([6, 7, 8])
tmp_1_inds.shape
Out[78]: torch.Size([3])

tmp_2_inds = torch.nonzero(tmp_a < -2, as_tuple=False)
if tmp_2_inds.numel() != 0:
    tmp_2_inds = tmp_2_inds.squeeze(1)
tmp_2_inds
Out[79]: tensor([], size=(0, 1), dtype=torch.int64)

torch.cat([tmp_1_inds, tmp_2_inds])
Traceback (most recent call last):
  File "E:\OtherProgramFiles\Anaconda3\envs\my_gpu_py3\lib\site-packages\IPython\core\interactiveshell.py", line 3343, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    torch.cat([tmp_1_inds, tmp_2_inds])
RuntimeError: invalid argument 0: Tensors must have same number of dimensions: got 1 and 2 at C:\Users\builder\AppData\Local\Temp\pip-req-build-e5c8dddg\aten\src\TH/generic/THTensor.cpp:603

tmp_2_inds.shape
Out[81]: torch.Size([0, 1])
tmp_2_inds.numel()
Out[82]: 0
tmp_2_inds.item()
Traceback (most recent call last):
  File "E:\OtherProgramFiles\Anaconda3\envs\my_gpu_py3\lib\site-packages\IPython\core\interactiveshell.py", line 3343, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    tmp_2_inds.item()
ValueError: only one element tensors can be converted to Python scalars

tmp_2_inds.squeeze(1).shape
Out[84]: torch.Size([0])
tmp_2_inds.squeeze(1).numel()
Out[85]: 0
tmp_2_inds.squeeze(1).item()
Traceback (most recent call last):
  File "E:\OtherProgramFiles\Anaconda3\envs\my_gpu_py3\lib\site-packages\IPython\core\interactiveshell.py", line 3343, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    tmp_2_inds.squeeze(1).item()
ValueError: only one element tensors can be converted to Python scalars

找出Tensor中的非零元素

20200919记：

import torch
import time


A = torch.tensor([100, 101, 0, 103, 104, 0, 106, 107])

flag_method = True
# flag_method = False
if flag_method:  # 方法一
	time_start = time.time()
	pos_inds_in_A = torch.nonzero(A > 0, as_tuple=False).squeeze(1)
	print('方法一耗时%10.7f sec' % (time.time() - time_start))  # 方法一耗时 0.0009987 sec
else:
	time_start = time.time()
	pos_inds_in_A = torch.where(A > 0)[0]  # 方法二
	print('方法二耗时%10.7f sec' % (time.time() - time_start))  # 方法二耗时 0.0009885 sec

print('pos_inds_in_A的shape:', pos_inds_in_A.shape)
print('pos_inds_in_A的值:', pos_inds_in_A)

import torch
tmp_a = torch.randint(0, 5, (2, 5))
错误写法:tmp_b = torch.nonzero((0 < tmp_a < 2), as_tuple=False)
错误写法:tmp_b = torch.nonzero((tmp_a > 0 & tmp_a < 2), as_tuple=False)
正确写法:tmp_b = torch.nonzero((tmp_a > 0) & (tmp_a < 2), as_tuple=False)

找出Tensor中的非重复元素

torch.unique()
torch.Tensor.unique()

找出Tensor中的非重复元素的出现次数

torch.unique(*args, **kwargs): Returns the unique elements of the input tensor. 那么, 是否有什么方法可以返回 counts of each unique element 呢?

How to efficiently perform averaging across predefined groups in a tensor - PyTorch Forums 20181012

ptrblck 20181012
You could use scatter_add and a small hack to get the unique counts of your indices:
x = torch.arange(1, 7, dtype=torch.float)
idx = torch.tensor([0, 1, 0, 1, 2, 2])
idx_unique = idx.unique(sorted=True)
idx_unique_count = torch.stack([(idx==idx_u).sum() for idx_u in idx_unique])
res = torch.zeros(len(idx_unique)).scatter_add(0, idx, x)
res /= idx_unique_count.float()
I think it’s time to add a return_counts option to torch.unqiue.

从索引集inds_A中随机选出n个索引构成索引集inds_B

mmdet/core/bbox/samplers/iou_balanced_neg_sampler.py
# 从索引集inds_A中随机选出n个索引构成索引集inds_B
if len(inds_) > n:
	inds_ = self.random_choice(inds_, num_per_gt)


if len(inds_A) > n:
	inds_B = self.random_choice(inds_A, num_per_gt)
else:
	inds_B = inds_A


if inds_A.numel() <= n:
	inds_B = inds_A
else:
	inds_B = self.random_choice(inds_A, num_per_gt)

利用set()得到获取从pos_inds中去除sampled_inds之后的索引

mmdet/core/bbox/samplers/iou_balanced_neg_sampler.py
# 求两个set的交集
floor_neg_inds = list(floor_set & neg_set)

# 利用set()得到获取从pos_inds中去除sampled_inds之后的索引
list(set(pos_inds.cpu().numpy()) - set(sampled_inds.cpu().numpy()))
list(set(pos_inds.cpu()) - set(sampled_inds.cpu()))

tmp_inds = np.array(list(set(np.array(pos_inds.clone().cpu())) & set(np.array(sampled_inds.clone().cpu()))))
tmp_inds = torch.from_numpy(tmp_inds).to(gt_bboxes.device).long()

# 如果某个张量后面在cuda上不需要再次用到, 可以省略.clone()操作
tmp_inds = np.array(list(set(pos_inds.cpu().numpy()) & set(sampled_inds.cpu().numpy())))

torch.topk()和torch.sort()

摘自mmdet/models/dense_heads/v1_rpn_head.py
# sort is faster than topk
# _, topk_inds = scores.topk(cfg.nms_pre)
ranked_scores, rank_inds = scores.sort(descending=True)
topk_inds = rank_inds[:cfg.nms_pre]
scores = ranked_scores[:cfg.nms_pre]

# torch.topk()的使用示例
num_dim0, num_dim1 = (3, 6)
tmp_a = torch.randint(18, (num_dim0, num_dim1))  # torch.Size([num_dim0, num_dim1])
tmp_a
Out[65]: 
tensor([[17, 11, 12,  8, 17,  7],
        [ 0, 10, 14,  6,  8, 10],
        [16,  8, 13, 11,  6,  4]])

topk_values, topk_idxs = tmp_a.topk(2, dim=0, largest=False)  # torch.Size([2, num_dim1]), torch.Size([2, num_dim1])
topk_values
Out[67]: 
tensor([[ 0,  8, 12,  6,  6,  4],
        [16, 10, 13,  8,  8,  7]])
topk_idxs
Out[68]: 
tensor([[1, 2, 0, 1, 2, 2],
        [2, 1, 2, 0, 1, 0]])

tmp_a[topk_idxs[0][0]]  # tensor([17, 11, 12,  8, 17,  7])

tmp_a[topk_idxs, torch.arange(num_dim1)]  # 这种方式取出的才是top2_values, 也即是topk_values
Out[69]: 
tensor([[ 0,  8, 12,  6,  6,  4],
        [16, 10, 13,  8,  8,  7]])
		
tmp_a[topk_idxs, :].shape
Out[71]: torch.Size([2, 6, 6])

torch.cat()和torch.stack()

# 沿着指定的当前dim连接seq中的tensor, 所有的tensor必须有相同的shape或为empty, 其相反的操作为torch.split()和torch.chunk()
torch.cat(seq,dim=0,out=None)

# 沿着新插入的某个指定dim连接seq中的tensor, 所有的tensor必须有相同的shape或为empty
torch.stack(seq, dim=0, out=None)
 
# 注: torch.cat()和torch.stack()的区别在于:
# cat会增加现有维度的值, 可以理解为续接;
# stack会新增加一个维度, 可以理解为叠加;
>>> a=torch.Tensor([1,2,3])
torch.Size([3])
>>> torch.stack((a,a)).size()
torch.Size([2, 3])
>>> torch.cat((a,a)).size()
torch.Size([6])

torch.contiguous()

pytorch .contiguous().view()_qq_35608277的博客-CSDN博客 20190429
Pytorch中的contiguous理解_gdymind的博客-CSDN博客 20180912

torch.view(-1)

注意torch.view(-1)是横向相连的; 对shape为torch.Size([num_dim0, num_dim1])的Tensor执行torch.Tensor.view(-1)操作, 得到的shape是torch.Size([num_dim1*num_dim0]);

# 示例
num_dim0, num_dim1 = (3, 6)
tmp_a = torch.randint(18, (num_dim0, num_dim1))  # torch.Size([num_dim0, num_dim1])
tmp_a
Out[60]: 
tensor([[ 5,  9,  6,  1,  6,  3],
        [15,  9,  7,  7, 14,  2],
        [13, 11, 16,  5,  3, 12]])
tmp_a.view(-1)  # 横向相连的; torch.Size([num_dim1*num_dim0])
Out[59]: tensor([ 5,  9,  6,  1,  6,  3, 15,  9,  7,  7, 14,  2, 13, 11, 16,  5,  3, 12])

tmp_a.view(-1, 1)  # 横向相连的; torch.Size([num_dim1*num_dim0, 1])
Out[59]: 
tensor([[ 5],
        [ 9],
        [ 6],
        [ 1],
        [ 6],
        [ 3],
        [15],
        [ 9],
        [ 7],
        [ 7],
        [14],
        [ 2],
        [13],
        [11],
        [16],
        [ 5],
        [ 3],
        [12]])

tmp_a.view(1, -1)  # 横向相连的; torch.Size([1, num_dim1*num_dim0])
Out[59]: tensor([[ 5,  9,  6,  1,  6,  3, 15,  9,  7,  7, 14,  2, 13, 11, 16,  5,  3, 12]])

tmp_a.transpose(1, 0).contiguous().view(-1)  # 竖向相连的; torch.Size([num_dim0*num_dim1])
Out[58]: tensor([ 5, 15, 13,  9,  9, 11,  6,  7, 16,  1,  7,  5,  6, 14,  3,  3,  2, 12])

tmp_b = tmp_a[0]  # tensor([5, 9, 6, 1, 6, 3])
tmp_b.view(1, -1).expand(num_dim0, num_dim1).contiguous().view(-1)  # torch.Size([num_dim1*num_dim0])
Out[51]: tensor([5, 9, 6, 1, 6, 3, 5, 9, 6, 1, 6, 3, 5, 9, 6, 1, 6, 3])

tmp_a.view(-1).view(num_dim0, -1)
Out[74]: 
tensor([[ 5,  9,  6,  1,  6,  3],
        [15,  9,  7,  7, 14,  2],
        [13, 11, 16,  5,  3, 12]])

在这里插入代码片

在这里插入代码片

F.interpolate()上采样

torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None, recompute_scale_factor=None)

PyTorch学习笔记(10)——上采样和PixelShuffle_g11d111的博客 20180927

计算二维空间中两个点之间的距离

输入: p1_xy with shape (B,m,2), p2_xy with shape (B,n,2);
输出: dist_p with shape (B,m,n);
以下两种方式均可以:
dist_p = torch.pow(p1_xy[..., :, None, :] - p2_xy[..., None, :, :], 2.).sum(dim=-1)
dist_p_ = torch.cdist(p1_xy, p2_xy, p=2.)**2  # ((dist_p_ - dist_p) > 0.0000001).sum()

torch.cdist — PyTorch 1.12 documentation
torch.pow — PyTorch 1.12 documentation
torch.cdist—求解正则项p-norm_繁华落尽，寻一世真情的博客-CSDN博客 20201220

初上手PyTorch

学习PyTorch，感觉官方的 Tutorials 才是最好的教程。
*** Introduction to PyTorch | Learn OpenCV 20190531
Pytorch 教程系列 | 莫烦Python
深度学习之PyTorch实战（1）——基础学习及搭建环境 - 战争热诚 - 博客园 20181024
本篇博客涵盖以下内容：

Tensor的数据类型
Tensor的基本数学运算
搭建一个简易神经网络
自动梯度torch.autograd
*** pytorch入坑一 | Tensor及其基本操作_我是天才很好-CSDN博客 20191205
本篇博客涵盖以下内容：
Tensor的属性
Tensor的创建
- 直接创建
- 从Numpy生成
- 创建指定数值的Tensor
- 创建随机数值的Tensor
Tensor的操作
- 基本操作: indexing, joining, clicing, mutation
- 点对点操作: 三角函数, 加减乘除, 对数运算, 幂函数, 指数函数, 数值截断, 其它
- 降维操作
- 对比操作
- 频谱操作
- 其它操作
其它tips
[干货] 史上最全的 PyTorch 学习资源汇总 import torch as tf - V2EX 20190507

使用PyTorch时易弄错的地方

张量索引时, 注意tmp_a[:, tmp_b_inds]和tmp_a[torch.arange(len(tmp_b_inds)), tmp_b_inds]之间的不同

tmp_a.shape = torch.Size([4, 3])
tmp_b_inds.shape = torch.Size([3])
tmp_a[:, tmp_b_inds]

在使用tmp_b_inds索引tmp_a中的元素值时,

如果tmp_b_inds的dtype=torch.bool, 则tmp_a[:, tmp_b_inds]和tmp_a[tmp_b_inds, :]属于布尔索引;
如果tmp_b_inds的dtype不是torch.bool, 则tmp_a[tmp_b_inds, :]属于常规索引, tmp_a[:, tmp_b_inds]会得不到期望的结果, 应改用tmp_a[torch.arange(4), tmp_b_inds];

张量索引时, 注意核查一下是否会改变原始张量中的元素值

有时候, 对张量A的索引切片进行操作会改变原始张量A中的元素值; 如果需要利用张量A中的元素值, 同时避免对原始张量A中的元素值作修改, 可以预先新建一个张量B, 然后用原始张量A的索引切片给张量B的索引切片赋值;

A[int(), :] 索引

# 案例1
tmp_a = torch.arange(0, 15).reshape(3, 5)
tmp_a
Out[5]: 
tensor([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14]])

# 会改变原始张量中的元素值; 此处相当于给tmp_a中的一部分切片取了个别名, 对tmp_b的操作会改变tmp_a中的元素值;
tmp_b = tmp_a[2, :]
tmp_b
Out[7]: tensor([10, 11, 12, 13, 14])
tmp_b[-3:] = 0

tmp_b
Out[9]: tensor([10, 11,  0,  0,  0])
tmp_a
Out[10]: 
tensor([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11,  0,  0,  0]])

A[torch.arange(1, 3), :] 索引

# 案例2
tmp_a = torch.arange(0, 15).reshape(3, 5)
tmp_a
Out[11]: 
tensor([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14]])

# 不会改变原始张量中的元素值; 此处给tmp_a中的一部分切片创建了个副本, 对tmp_c的操作不会改变tmp_a中的元素值;
tmp_c_inds = torch.arange(1, 3)
tmp_c = tmp_a[:, tmp_c_inds]
tmp_c
Out[14]: 
tensor([[ 1,  2],
        [ 6,  7],
        [11, 12]])
tmp_c[:, 0] = -1

tmp_c
Out[16]: 
tensor([[-1,  2],
        [-1,  7],
        [-1, 12]])
tmp_a
Out[17]: 
tensor([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14]])

A[torch.nonzero(xxx, as_tuple=False).squeeze(1), :] 索引

tmp_a = torch.arange(0, 20)
tmp_a
Out[53]: 
tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
        18, 19])

# 不会改变原始张量中的元素值; 此处给tmp_a中的一部分切片创建了个副本, 对tmp_d的操作不会改变tmp_a中的元素值;
tmp_d_inds = torch.nonzero((tmp_a > 5) & (tmp_a < 9), as_tuple=False).squeeze(1)
tmp_d_inds
Out[54]: tensor([6, 7, 8])
tmp_d = tmp_a[tmp_d_inds]
tmp_d
Out[57]: tensor([6, 7, 8])

tmp_d[:] = 0
tmp_d
Out[59]: tensor([0, 0, 0])

tmp_a
Out[60]: 
tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
        18, 19])

# 如果需要利用张量tmp_a中的元素值, 同时避免对原始张量tmp_a中的元素值作修改, 可以预先新建一个张量tmp_b, 然后用原始张量tmp_a的索引切片给张量tmp_b的索引切片赋值;
tmp_a = torch.arange(0, 15).reshape(3, 5)
tmp_a
Out[5]: 
tensor([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14]])

tmp_b = tmp_a.new_zeros(tmp_a.shape)
# tmp_c = tmp_a.new_full(tmp_a.shape, -1, dtype=torch.long)

tmp_b[2, :] = tmp_a[2, :]
tmp_b
Out[63]: 
tensor([[ 0,  0,  0,  0,  0],
        [ 0,  0,  0,  0,  0],
        [10, 11, 12, 13, 14]])

张量索引进行左赋值时, 注意只能使用一层索引

20211217记:
在索引张量进行左赋值时, 切记只能使用一层索引, 使用多层索引不改变张量的值; 例如,

tmp_a[sub_splice1][ssub_splice2] = 0.  # 此时tmp_a的值不会发生改变
tmp_a[sub_splice3[ssub_splice4]] = 1.  # 此时tmp_a的值会发生改变

非空张量才可执行torch.max()操作

在执行torch.Tensor.max()操作之前得先判断一下该tensor是否为空, 否则会报错;

tmp_a = torch.tensor([])
max_tmp_a, argmax_tmp_a = tmp_a.max(dim=0)
RuntimeError: cannot perform reduction function max on tensor with no elements because the operation does not have an identity

# 判断Tensor是否为空
if tmp_a.numel():  # max(tmp_a.size()) != 0
	print("this tensor is not empty")
else:
	print("this tensor is empty")

什么情况下Tensor的shape会是torch.Size([])呢?

Zero-dimensional tensor concatenation problem · Issue #69
当某个Tensor只有1个维度时，该张量的单个切片值的shape是torch.Size([])；示例，如下：

tmp_a = torch.randint(0, 10, (5,))
tmp_b = tmp_a[3]

>>> tmp_b.shape
Out[7]: torch.Size([])

>>> tmp_b
Out[13]: tensor(2)

>>> torch.tensor([2]).shape
Out[14]: torch.Size([1])

>>> (2.).shape
Traceback (most recent call last):
  File "/lib/python3.8/site-packages/IPython/core/interactiveshell.py", line 3343, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    (2.).shape
AttributeError: 'float' object has no attribute 'shape'

当某个Tensor的shape是torch.Size([])时, 它是不能与其它Tensor被concatenate到一起的；示例，如下：

torch.cat((tmp_a, tmp_a, tmp_b))
Traceback (most recent call last):
  File "/lib/python3.8/site-packages/IPython/core/interactiveshell.py", line 3343, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    torch.cat((tmp_a, tmp_a, tmp_b))
RuntimeError: zero-dimensional tensor (at position 2) cannot be concatenated

报错IndexError: too many indices for tensor of dimension 0

20201207记：
导致IndexError: too many indices for tensor of dimension 0错误的情形有：

对于tmp_sub_a_1[mask_sub_a_2]，当tmp_sub_a_1.shape为torch.Size([]), 而mask_sub_a_2.shape为torch.Size([1])时，就会报该错误；为此，一种解决途径是：

tmp_a = torch.randint(0, 10, (5,))
mask_a = tmp_a > threshold_1
inds_a = mask_a.nonzero().squeeze()
tmp_sub_a_1 = tmp_a[0]
mask_sub_a_2 = tmp_a[mask_a] > threshold_2
if tmp_sub_a_1.shape == torch.Size([]):  # 一种很少见的报错
	tmp_sub_a_1= torch.tensor([tmp_sub_a_1])

tmp_b = tmp_sub_a_1[mask_sub_a_2]

tmp_a = torch.randint(0, 10, (5,))
mask_a = tmp_a == tmp_a[0]
inds_a = mask_a.nonzero().squeeze()
tmp_sub_a_1 = tmp_a[0]

tmp_sub_a_1.shape
Out[1]: torch.Size([])

# 特别注意一下：mask_sub_a_2值 与 mask_sub_a_1, mask_sub_a_3值 的不同
mask_sub_a_1 = tmp_sub_a_1 == tmp_a[0]
# 建议使用tmp_a[inds_a] > thr 而不是tmp_a[mask_a] > thr, 以免报错IndexError: too many indices for tensor of dimension 0
mask_sub_a_2 = tmp_a[mask_a] == tmp_a[0]  # 可见mask_sub_a_2.shape始终不会为torch.Size([])的
mask_sub_a_3 = tmp_a[inds_a] == tmp_a[0]

mask_sub_a_1.shape
Out[2]: torch.Size([])
mask_sub_a_2.shape
Out[3]: torch.Size([1])
mask_sub_a_3.shape
Out[4]: torch.Size([])

mask_sub_a_1
Out[5]: tensor(True)
mask_sub_a_2
Out[6]: tensor([True])
mask_sub_a_3
Out[7]: tensor(True)


tmp_sub_a_1[mask_sub_a_1]  # 可索引出期望值
Out[8]: tensor([5])
tmp_sub_a_1[mask_sub_a_2]
Traceback (most recent call last):
  File "/python3.8/site-packages/IPython/core/interactiveshell.py", line 3343, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    tmp_b[tmp_d]
IndexError: too many indices for tensor of dimension 0
tmp_sub_a_1[mask_sub_a_3]  # 可索引出期望值
Out[9]: tensor([5])

torch.tensor([tmp_sub_a_1])[mask_sub_a_1]
Out[10]: tensor([[5]])
torch.tensor([tmp_sub_a_1])[mask_sub_a_2]  # 可索引出期望值
Out[11]: tensor([5])
torch.tensor([tmp_sub_a_1])[mask_sub_a_3]
Out[10]: tensor([[5]])

torch.Tensor的数据类型

torch.Tensor — PyTorch 1.6.0 documentation

值类型(value type)与引用类型(reference type)

C#语言中，通用类型系统(CTS)定义了如何在运行库中声明、使用和管理类型；可划分为两大类：

值类型(value type):
- 简单类型(simple type)
- 枚举类型(enum type)
- 结构类型(struct type)
- 值为null的类型(nullable type)
引用类型(reference type)
- 类类型(class type)
- 接口类型(interface type)
- 数组类型(array type)
- 委托类型(delegate type)

值类型(value type)的变量在堆栈(stack)中直接包含其数据，每个变量都有自己的数据副本(除ref和out参数变量外)，因此对一个变量的操作不影响另一个变量；
C#的值类型分为简单类型(simple type)、枚举类型(enum type)、结构类型(struct type)、值为null的类型(nullable type)；

引用类型(reference type)的变量在堆栈(stack)中存储对数据(对象)的引用(地址)，数据(对象)存储在托管运行环境管理的堆(Heap)中。对于引用类型，两个变量可能引用同一个对象，因此对一个变量的操作可能影响另一个变量所引用的对象；
C#的引用类型分为类类型(class type)、接口类型(interface type)、数组类型(array type)、委托类型(delegate type)；

20200826值类型与引用类型的分类.jpg

20200826值类型与引用类型的区别示例.jpg

20200826值类型与引用类型的区别.jpg

第2章_数据类型变量与常量共37页文档 20191110

单精度(float)与双精度(double)

浮点型数据类型简介
浮点型简单来说就是表示带有小数的数据类型，而恰恰小数点可以在相应的二进制的不同位置浮动，可能是这样就被定义成浮点型了。浮点型主要有：单精度float、双精度double；
单精度与双精度之间的区别
在IEEE754标准中，单精度(float)在32位机器上用4个字节来存储的；而双精度(double)是用8个字节来存储的，这是他们最本质的区别。由于存储位不同，他们能表示的数值的范围就不同，也就是能准确表示的数的位数就不同。
单精度浮点数在机内占4个字节、有效数字8位、表示范围：-3.40E+38 ~ +3.40E+38；
双精度浮点数在机内占8个字节、有效数字16位、表示范围：-1.79E+308 ~ +1.79E+308；
浮点数在计算机中存储方式：

Floating Point Representation - Basics - GeeksforGeeks
写代码时什么时候用单精度浮点型，什么时候用双精度浮点型？
分具体情况而言，一般为了节省空间用单精度float就行（也可以用double，不过占用空间大）；
- 如果只有整数的情况，就用整型；
- 可能有小数，但是位数不多或者对保留的小数位数要求不高，就用单精度；
- 小数位数比较多或者对精度要求较高（6位以上），用双精度；
- 如果可能有非数字类型的，就用字符型；
  写代码时什么时候用单精度浮点型什么时候用双精度浮点型？_慕课猿问20160813

torch.Tensor的数据类型转换

Pytorch的数据类型为各式各样的Tensor，Tensor可以理解为高维矩阵。与Numpy中的Array类似。Pytorch中的Tensor又包括CPU上的数据类型和GPU上的数据类型，一般GPU上的Tensor是CPU上的Tensor加cuda()函数得到。通过使用type()函数可以查看变量类型。一般默认采用torch.FloatTensor类型。例如data = torch.Tensor(2,3)是一个2*3的张量，类型为torch.FloatTensor；data.cuda()就转换为GPU上的张量类型，torch.cuda.FloatTensor类型。

(1) 数据类型转换

使用诸如self.float()的方法: self.int(), self.long(), self.float(), self.double()等;self.float() is equivalent to self.to(torch.float32);
使用诸如self.to(torch.float)的方法: self.to(torch.int), self.to(torch.long), self.to(torch.float), self.to(torch.double)等;
使用self.type(torch.float)方法；

tensor_1.type_as(tensor_2) is equivalent to tensor_1.type(tensor_2.type());

Pytorch变量类型转换_zchenack个人专栏-CSDN博客 20180124

(2) CPU/GPU转换

self.cpu();
self.cuda()或者cuda0 = torch.device(‘cuda:0’) \n self.to(cuda0)

[Pytorch学习]在GPU上训练_crabstew的博客-CSDN博客20190403

(3) tensor/np.adarray转换

np.adarray to tensor
import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
tensor to np.adarray
self.numpy(); 注意，转换后的tensor与np.adarray指向同一地址，所以改变一方的值，另一方的值也随之改变；
将GPU上的Tensor存储为np.adarray; 因为numpy()不能直接读取cuda上存储的Tensor；
self.data.cpu().numpy()
注意检索官方文档区分torch.from_numpy()和torch.as_tensor()
torch.from_numpy(ndarray) → Tensor
torch.as_tensor(data, dtype=None, device=None) → Tensor
torch.as_tensor()_Wanderer001的博客-CSDN博客 20200320

(待阅读) pytorch中把Tensor保存到可读文件的艰辛历程 20181005
(待阅读) Save a tensor to file - PyTorch Forums 20200219
(待阅读) What is the recommended format to save data in pytorch? - PyTorch Forums 20200714

搭建子网络

Most machine learning workflows involve

working with data,
creating models,
optimizing model parameters,
saving the trained models,
loading the saved models;

A collection of various deep learning architectures, models, and tips

GitHub - yunjey/pytorch-tutorial: PyTorch Tutorial for Deep Learning Researchers 20200706
GitHub - rasbt/deeplearning-models: A collection of various deep learning architectures, models, and tips

PyTorch打印输出网络结构

pytorch输出网络结构各层 & _modules.items()/model.modules()/model.children()_hxxjxw的博客-CSDN博客 20200801

model.trian()与model.eval()

model.trian()及model.eval() - Parallax - 博客园 20200703

区分理解BatchNorm，LayerNorm， InstanceNorm和GroupNorm

*** pytorch常用normalization函数 - 慢行厚积 - 博客园 20190521
BatchNorm、LayerNorm、InstanceNorm、GroupNorm区别_页页读-CSDN博客 20200831
通过代码理解BatchNorm，LayerNorm， InstanceNorm和GroupNorm归一化方式。_哔哩哔哩_bilibili 20210731
PyTorch学习之归一化层（BatchNorm、LayerNorm、InstanceNorm、GroupNorm）_mingo_敏-CSDN博客 20181218
Batch Norm 与 Group Norm_NEUXia的博客-CSDN博客 20190316

BatchNorm2d 的 affine, track_running_stats 参数

.train()状态时, BatchNorm2d 的 track_running_stats=True时, running_mean 和 running_var 会跟踪整个训练过程中所有 mini-batch 的统计特性, 而不只是仅仅依赖于当前 mini-batch 的统计特性;
.eval()状态时, BatchNorm2d 的 track_running_stats=True时, running_mean 和 running_var 使用的则是训练时得到的统计特性值, 该值在.eval()状态下是不会变化的;
xxx
.train()状态时, BatchNorm2d 的 track_running_stats=False时, running_mean 和 running_var 仅仅依赖于当前 mini-batch 的统计特性; 此时如果batch_size 比较小, 那么其统计特性就会和全局统计特性有着较大偏差, 可能导致糟糕的效果;
.eval()状态时, BatchNorm2d 的 track_running_stats=False时, running_mean 和 running_var 仅仅依赖于当前 mini-batch 的统计特性; 此时如果batch_size 比较小, 那么其统计特性就会和全局统计特性有着较大偏差, 可能导致糟糕的效果;
xxx
BatchNorm2d 的 track_running_stats=False时, 加载同一个已经训练好的模型在同一个测试集上进行模型评估, 每次模型评估的结果会都不一样(因为数据是先经过 shuffle 后再组成 mini-batch 的, 当前 mini-batch 的统计特性会发生变化); track_running_stats=True时, 每次模型评估的结果则都一样;
*** BatchNorm2d原理、作用及其pytorch中BatchNorm2d函数的参数讲解_LS_learner的博客-CSDN博客 20200816
running_mean和running_var_Ken的博客-CSDN博客 20200813
BatchNorm2d — PyTorch 1.10.1 documentation
- $\gamma$ and $\beta$ are learnable parameter vectors of size $C$ ;
- $E [x]$ and $V a r [x]$ are the computed mean running_mean and variance running_var of this layer; 在训练时, 这两个参数 are calculated per-dimension over the mini-batches;
- affine – a boolean value that when set to True, this module has learnable affine parameters ( $\gamma$ and $\beta$ ). Default: True.
** Why are BatchNorm layers set to trainable in a frozen model - Part 1 (2019) - Deep Learning Course Forums

激活函数

PyTorch之nn.ReLU与F.ReLU的区别_鹊踏枝-码农的专栏-CSDN博客 20190122
23种激活函数_梦的灰色边沿…-CSDN博客 20191107

PyTorch中的梯度计算, backward, requires_grad属性, zero_grad(),

pytorch的梯度计算以及backward方法_步步拾遗-CSDN博客 20190321
深入Pytorch中的Tensor，梯度以及权重_NeilPy的博客-CSDN博客 20190808
** 机器学习9:关于pytorch中的zero_grad（）函数_小娜美要努力努力的博客-CSDN博客 20191121
*** argmax为什么不能求导，然而最大池化却可以求导？ - gongel的回答 - 知乎 20200628

PyTorch中的计算图, retain_graph

**** Pytorch: detach 和 retain_graph,和 GAN的原理解析_qxqsunshine的博客-CSDN博客 20181008
Pytorch 中retain_graph的用法_happyday_d的博客-CSDN博客 20190101

PyTorch 可视化

How to use TensorBoard with PyTorch

torch.utils.tensorboard — PyTorch 1.10.1 documentation
Visualizing Models, Data, and Training with TensorBoard — PyTorch Tutorials 1.10.1+cu102 documentation
PyTorch TensorBoard Support — PyTorch Tutorials 1.10.1+cu102 documentation
How to use TensorBoard with PyTorch — PyTorch Tutorials 1.10.1+cu102 documentation
[PyTorch]Tensorboard可视化实现 | 大海 20211121

PyTorch 自带的可视化工具

Utils — Torchvision main documentation

Feature extraction for model inspection

Feature extraction for model inspection — Torchvision main documentation

PyTorch模型训练

** PyTorch显存机制分析 - Connolly的文章 - 知乎 20211105

PyTorch提升数据加载速度

pytorch dataloader数据加载占用了大部分时间，各位大佬都是怎么解决的？ - 知乎
优化pytorch DataLoader提升数据加载速度 - 简书 20210618

PyTorch 创建 data.DataLoader 时, 参数 pin_memory 的理解

pytorch创建data.DataLoader时，参数pin_memory的理解_敲代码的小风-CSDN博客 20201216
torch的dataloader中的‘pin_memory’指的是什么 · 大专栏 20191227

梯度下降

寻找同样的学习率SGD收敛，但Adam不收敛的问题 - 简书 20201229
本篇博客涵盖以下内容：SGD, Adagrad, Nesterov, RMSPropAdam;

PyTorch DDP模式单机多卡训练

PyTorch DDP模式单机多卡训练 - 简书 20200914

the method `tensor.new()` in Pytorch

the method tensor.new() in Pytorch的作用：
for example, x.data.new(x.size()) will create a tensor of same type and same size on the same device as x.

nonempty = torch.FloatTensor([[0, 0, 10, 9],])
empty = torch.FloatTensor([])
rows,cols=1,1  # 0,1
nonempty.new(rows,cols).shape

Pytorch_2020081716_tensor.new().jpg

# gpu到cpu的例子; compute overlap and assign gt on CPU when number of GT is large
if assign_on_cpu:
	device = bboxes.device
	bboxes = bboxes.cpu()
	gt_bboxes = gt_bboxes.cpu()

Pytorch beginner : tensor.new method - Stack Overflow

`torch.Tensor.scatter_`用法理解

torch.Tensor.scatter_(dim, index, src) → Tensor

torch.Tensor — PyTorch master documentation

incase value (float) is not specified, 即利用src张量中的元素来scatter

为避免混淆，这里用scatter_(param_dim, param_index, src) → Tensor表示scatter_(dim, index, src) → Tensor；
Writes all values from the tensor src into self at the indices specified in the param_index tensor. For each value in src, its output index is specified by its index in src for dimension != param_dim and by the corresponding value in param_index for dimension = param_dim.

如果用self[a][b][c]表示self中的元素，则self的index指的是位于dimension=0维度上的[a]、位于dimension=1维度上的[b]、位于dimension=2维度上的[c]；

# For a 3-D tensor, self is updated as:
self[index[i][j][k]][j][k] = src[i][j][k]  # if dim == 0
self[i][index[i][j][k]][k] = src[i][j][k]  # if dim == 1
self[i][j][index[i][j][k]] = src[i][j][k]  # if dim == 2

在上述示例中，等号左边表示的是each value in src的output index (也即是self的index)，等号右边表示的是each value in src其本身的index；
从右边往左边看，src[i][j][k]表示的是a value in src，
if dim == 0, 则由于

右边 src的[i] 位于dimension=0维度上，该维度==0，故the output index is specified by the corresponding value in param_index，即由param_index[i][j][k]指定; the corresponding value的含义是src[i][j][k]位于src中哪个位置，就取param_index中哪个位置的值；因此the size of param_index应该与the size of src一致；
右边 src的[j] 位于dimension=1维度上，该维度!==0，故the output index is specified by its index in src;
右边 src的[k] 位于dimension=2维度上，该维度!==0，故the output index is specified by its index in src;

因此，self[index[i][j][k]][j][k] = src[i][j][k]。

# Example:
>>> x = torch.rand(2, 5)
>>> x
tensor([[ 0.3992,  0.2908,  0.9044,  0.4850,  0.6004],
        [ 0.5735,  0.9006,  0.6797,  0.4152,  0.1732]])
>>> y1 = torch.zeros(3, 5).scatter_(0, torch.tensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), x)
>>> y1
tensor([[ 0.3992,  0.9006,  0.6797,  0.4850,  0.6004],
        [ 0.0000,  0.2908,  0.0000,  0.4152,  0.0000],
        [ 0.5735,  0.0000,  0.9044,  0.0000,  0.1732]])
>>> y2 = torch.zeros(3, 5).scatter_(0, torch.tensor([[0, 1, 2, 0, 0], [0, 0, 0, 1, 2]]), x)
>>> y2
tensor([[ 0.5735,  0.9006,  0.6797,  0.4850,  0.6004],
        [ 0.0000,  0.2908,  0.0000,  0.4152,  0.0000],
        [ 0.0000,  0.0000,  0.9044,  0.0000,  0.1732]])

此例中self是y1，y1 is a 2-D tensor，由于param_dim=0，故self[param_index[i][j]][j] = src[i][j]，因而有：
00 11 22 03 04
20 01 02 13 24

由于param_index[0][0]=0，故将x[0][0]=0.3992写入y1[param_index[0][0]][0]中，即写入y1[0][0]中；
由于param_index[0][1]=1，故将x[0][1]=0.2908写入y1[param_index[0][1]][1]中，即写入y1[1][1]中；
由于param_index[0][2]=2，故将x[0][2]=0.9044写入y1[param_index[0][2]][2]中，即写入y1[2][2]中；
依次类推…param_index[0][3], param_index[0][4],
由于param_index[1][0]=2，故将x[1][0]=0.5735写入y1[param_index[1][0]][0]中，即写入y1[2][0]中；注意到：当param_index[i][0]和param_index[i][1]相同时，会发生覆盖写入，例如y2[0][0]与y2[1][0]都是取0值，则x[1][0]=0.5735会覆盖掉x[0][0]=0.3992对y2[0][0]的写入。
依次类推…param_index[3][0], param_index[4][0], …

incase src (Tensor) is not specified, 即利用value标量来scatter

# Example:
>>> y1 = torch.zeros(3, 5).scatter_(0, torch.tensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), 6)
>>> y1
tensor([[6., 6., 6., 6., 6.],
        [0., 6., 0., 6., 0.],
        [6., 0., 6., 0., 6.]])

此例中self是y1，y1 is a 2-D tensor，由于param_dim=0，故self[param_index[i][j]][j] = value，因而有：
00 11 22 03 04
20 01 02 13 24

由于param_index[0][0]=0，故将 6 写入y1[param_index[0][0]][0]中，即写入y1[0][0]中；
由于param_index[0][1]=1，故将 6 写入y1[param_index[0][1]][1]中，即写入y1[1][1]中；
由于param_index[0][2]=2，故将 6 写入y1[param_index[0][2]][2]中，即写入y1[2][2]中；
依次类推…param_index[0][3], param_index[0][4],
由于param_index[1][0]=2，故将 6 写入y1[param_index[1][0]][0]中，即写入y1[2][0]中；注意到：当param_index[i][0]和param_index[i][1]相同时，同样会发生覆盖写入。
依次类推…param_index[3][0], param_index[4][0], …

# Example:
>>> z = torch.zeros(2, 4).scatter_(1, torch.tensor([[2], [3]]), 1.23)
>>> z
tensor([[ 0.0000,  0.0000,  1.2300,  0.0000],
        [ 0.0000,  0.0000,  0.0000,  1.2300]])

此例中self是z，z is a 2-D tensor，由于param_dim=1，故self[i][param_index[i][j]] = value，因而有：
00
10

由于param_index[0][0]=2，故将 1.23 写入z[0][param_index[0][0]]中，即写入z[0][2]中；
由于param_index[1][0]=3，故将 1.23 写入z[1][param_index[0][1]]中，即写入z[1][3]中；

torch.Tensor.scatter_() 一般可以用来对标签进行one-hot 编码，

这属于典型的利用标量来修改张量的例子。

# Example:
>>> import numpy as np
>>> index_a = np.array(3).astype('int64')
>>> print("index_a的shape:", index_a.shape, "\n", index_a)  # ()   3
>>> index_a = index_a[np.newaxis, np.newaxis]
>>> print("index_a的shape:", index_a.shape, "\n", index_a)  # (1,1)   [[3]]
>>> index_a = torch.from_numpy(index_a)  # torch.Size([1, 1]), index_a中只有1个元素，用index_a[0][0]索引
# torch.zeros(1, 10).shape为torch.Size([1, 10])
# 由于param_index[0][0]=3，故将 1 写入one_hot[0][param_index[0][0]]中，即写入one_hot[0][3]中；
>>> one_hot = torch.zeros(1, 10).scatter_(1, index_a, 1)  # self[0][index[0][0]] = 1
>>> print("one_hot的shape:", one_hot.shape, "\n", one_hot)
one_hot的shape: torch.Size([1, 10]) 
 tensor([[0., 0., 0., 1., 0., 0., 0., 0., 0., 0.]])


# Example:
>>> import torch
>>> class_num = 10
>>> batch_size = 4
>>> label = torch.tensor([[6], [0], [3], [2]])  # class_num
>>> print("label的shape:", label.shape, "\n", label)
label的shape: torch.Size([4, 1]) 
 tensor([[6],
        [0],
        [3],
        [2]])
>>> one_hot = torch.zeros(batch_size, class_num).scatter_(1, label, 1)
>>> print("one_hot的shape:", one_hot.shape, "\n", one_hot)  # 沿着dimension=1看，每行可看作是一个one-hot编码
one_hot的shape: torch.Size([4, 10]) 
 tensor([[0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
        [1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
        [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.]])

(待阅读)PyTorch笔记之 scatter() 函数 - 那少年和狗20191127

(待阅读)pytorch中torch.Tensor.scatter用法_qq_39004117的博客 20190716

(待阅读)Pytorch笔记 scatter_ - listenviolet 20190525

torch.gather

torch — PyTorch master documentation

torch.gather(input, param_dim, param_index, out=None, sparse_grad=False) → Tensor
Gathers values along an axis specified by param_dim.

# For a 3-D tensor the output is specified by:
out[i][j][k] = input[index[i][j][k]][j][k]  # if dim == 0
out[i][j][k] = input[i][index[i][j][k]][k]  # if dim == 1
out[i][j][k] = input[i][j][index[i][j][k]]  # if dim == 2

在上述示例中，从左边往右边看。

# Example:
>>> input = torch.tensor([[1,2,3],[4,5,6]])
>>> output = torch.gather(input, 1, torch.tensor([[0,0],[2,0]]))
>>> output
tensor([[ 1,  1],
        [ 6,  4]])

>>> output = torch.gather(input, 1, torch.tensor([[0,0],[3,0]]))  # input.size(1) - 1 = 2, 3超出了范围
Traceback (most recent call last):
  File "D:\***\Anaconda3\envs\my_cpu_py3\lib\site-packages\IPython\core\interactiveshell.py", line 3326, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "", line 1, in <module>
    output = torch.gather(input, 1, torch.tensor([[0,0],[3,0]]))
RuntimeError: Invalid index in gather at C:\w\1\s\tmp_conda_3.7_160731\conda\conda-bld\pytorch_1570810122324\work\aten\src\TH/generic/THTensorEvenMoreMath.cpp:657

此例中param_index is a 2-D tensor，故output2也是a 2-D tensor，由于param_dim=1，故out[i][j] = input[i][param_index[i][j]]，因而有：

对于output[0][0]，由于param_index[0][0]=0，故output[0][0]取input[0][0]=1；
对于output[0][1]，由于param_index[0][1]=0，故output[0][1]取input[0][0]=1；
对于output[1][0]，由于param_index[1][0]=2，故output[1][0]取input[1][2]=6；
对于output[1][1]，由于param_index[1][1]=0，故output[1][1]取input[1][0]=4；

Moreover, as for gather(), the values of param_index must be between 0 and self.size(param_dim) - 1 inclusive, and all values in a row along the specified dimension param_dim must be unique.
在上例中，param_index中的值必须位于0到input.size(1) - 1范围之内，否则会报错，后半句"all values in a row along the specified dimension param_dim must be unique"暂时没明白是什么意思。

保持Tensor的索引对齐(或者说索引一致性)

若需要将cls_scores转换成shape为torch.Size([2, 121515])的concat_cls_scores, 可以通过以下方法:

mmdet/models/dense_heads/anchor_head.py
def loss():
	cls_scores的shape: list[5Tensor], 5Tensor的shape分别为:
	torch.Size([2, 3, 200, 152])
	torch.Size([2, 3, 100, 76])
	torch.Size([2, 3, 50, 38])
	torch.Size([2, 3, 25, 19])
	torch.Size([2, 3, 13, 10])
	
	若需要将cls_scores转换成shape为torch.Size([2, 121515])的concat_cls_scores, 可以通过以下方法:
	concat_cls_scores = torch.cat(
                [cls_score.permute(0, 2, 3, 1).reshape(2, -1) for cls_score in cls_scores], 1)
	注: 由于从anchor_list到concat_anchor_list时沿dim=0方向.cat: 91200+22800+5700+1425+390=121515, 故这里是先操作.reshape()再操作.cat()；
	
	torch.Size([2, 200, 152, 3])
	torch.Size([2, 100, 76, 3])
	torch.Size([2, 50, 38, 3])
	torch.Size([2, 25, 19, 3])
	torch.Size([2, 13, 10, 3])
	
	torch.Size([2, 91200]) 
	torch.Size([2, 22800])
	torch.Size([2, 5700])
	torch.Size([2, 1425])
	torch.Size([2, 390])
	
	torch.Size([2, 121515])

202009031119保持Tensor的索引对齐索引一致性.jpg

202009031132保持Tensor的索引对齐索引一致性.jpg

mmdet/core/anchor/utils.py
def images_to_levels(target, num_levels):
    """Convert targets by image to targets by feature level.

    [target_img0, target_img1] -> [target_level0, target_level1, ...]
    """  
    target = torch.stack(target, 0)
    level_targets = []
    start = 0
    for n in num_levels:
        end = start + n
        # level_targets.append(target[:, start:end].squeeze(0))
        level_targets.append(target[:, start:end])
        start = end
    return level_targets


mmdet/models/dense_heads/anchor_head.py
def loss():
	concat_anchor_list = []
	for i in range(len(anchor_list)):
		concat_anchor_list.append(torch.cat(anchor_list[i]))
	all_anchor_list = images_to_levels(concat_anchor_list, num_level_anchors)

	losses_cls, losses_bbox = multi_apply(
		self.loss_single,
		cls_scores, bbox_preds,
		all_anchor_list,
		labels_list, label_weights_list,
		bbox_targets_list, bbox_weights_list,
		num_total_samples=num_total_samples)	

	anchor_list的shape: list[2list[5Tensor]], 5Tensor的shape分别为:
	torch.Size([91200, 4])  # 在[N, 4]中, N = height * width * num_base_anchors;
	torch.Size([22800, 4])
	torch.Size([5700, 4])
	torch.Size([1425, 4])
	torch.Size([390, 4])

	concat_anchor_list的shape: list[2Tensor], 2Tensor的shape分别为:
	torch.Size([121515, 4])
	torch.Size([121515, 4])

	all_anchor_list的shape: list[5Tensor], 5Tensor的shape分别为:
	torch.Size([2, 91200, 4])  # 在[2, N, 4]中, N = height * width * num_base_anchors;
	torch.Size([2, 22800, 4])
	torch.Size([2, 5700, 4])
	torch.Size([2, 1425, 4])
	torch.Size([2, 390, 4])
	
	cls_scores的shape: list[5Tensor], 5Tensor的shape分别为:
	torch.Size([2, 3, 200, 152])
	torch.Size([2, 3, 100, 76])
	torch.Size([2, 3, 50, 38])
	torch.Size([2, 3, 25, 19])
	torch.Size([2, 3, 13, 10])
	
	bbox_preds的shape: list[5Tensor], 5Tensor的shape分别为:
	torch.Size([2, 12, 200, 152])
	torch.Size([2, 12, 100, 76])
	torch.Size([2, 12, 50, 38])
	torch.Size([2, 12, 25, 19])
	torch.Size([2, 12, 13, 10])


mmdet/models/dense_heads/anchor_head.py
def loss_single(self, cls_score, bbox_pred, anchors, labels, label_weights,
                    bbox_targets, bbox_weights, num_total_samples):
	cls_score = cls_score.permute(0, 2, 3, 1).reshape(-1, self.cls_out_channels)
	bbox_pred = bbox_pred.permute(0, 2, 3, 1).reshape(-1, 4)
	
	anchors的shape: 1Tensor
	torch.Size([2, 91200, 4])  # 在[2, N, 4]中, N = height * width * num_base_anchors;
	
	cls_score的shape: 1Tensor
	torch.Size([2, 3, 200, 152]) --> torch.Size([2, 200, 152, 3]) --> torch.Size([182400, 1])
	
	bbox_pred的shape: 1Tensor
	torch.Size([2, 12, 200, 152]) --> torch.Size([2, 200, 152, 12]) --> torch.Size([182400, 4])
	 # 在[N, 4]中, N = num_img * height * width * num_base_anchors;

在共有的前提条件inds_B_in_A下, 由inds_C_in_B求inds_C_in_A 和由inds_C_in_A求inds_C_in_B

在共有的前提条件inds_B_in_A下, "已知inds_C_in_B, 求inds_C_in_A ?“和"已知inds_C_in_A, 求inds_C_in_B ?”;

共有的前提条件如下：

共有的前提条件如下：
import torch
import time


A = torch.tensor([100, 101, 102, 103, 104, 105, 106, 107])  # 则inds_A_in_A = torch.tensor([0, 1, 2, 3, 4, 5, 6, 7])
flags_B_in_A = torch.tensor([False, True, False, True, False, True, False, True])
B = A[flags_B_in_A]  # tensor([101, 103, 105, 107])
inds_B_in_A = torch.where(flags_B_in_A == True)[0]  # tensor([1, 3, 5, 7])
print('(B == A[inds_B_in_A]).all()的值:', (B == A[inds_B_in_A]).all())

例子一：已知inds_C_in_B, 求inds_C_in_A ?

例子一：已知inds_C_in_B, 求inds_C_in_A ?
inds_C_in_B = torch.tensor([2, 0])
C = B[inds_C_in_B]  # tensor([105, 101])

inds_C_in_A = torch.where(flags_B_in_A == True)[0][inds_C_in_B]
print('(C == A[inds_C_in_A]).all()的值:', (C == A[inds_C_in_A]).all())

例子二：已知inds_C_in_A, 求inds_C_in_B ?

例子二：已知inds_C_in_A, 求inds_C_in_B ?
inds_C_in_A = torch.tensor([5, 1])
C = A[inds_C_in_A]  # tensor([105, 101])

方法一：利用torch.where()找出ind_C_in_A在inds_B_in_A中的索引;
time_start = time.time()
inds_C_in_B = []
for i in range(inds_C_in_A.size(0)):
	ind_C_in_B = torch.where(inds_B_in_A == inds_C_in_A[i])[0]
	inds_C_in_B.append(ind_C_in_B)
inds_C_in_B = torch.cat(inds_C_in_B)
print('方法一耗时%10.7f sec' % (time.time() - time_start))  # 方法一耗时 0.0006711 sec
print('(C == B[inds_C_in_B]).all()的值:', (C == B[inds_C_in_B]).all())

方法二：计算flags_B_in_A中ind_C_in_A前面有多少个元素为True(假设有x个), 则在ind_C_in_B = x;
time_start = time.time()
inds_C_in_B = []
for i in range(inds_C_in_A.size(0)):
	ind_C_in_B = torch.where(flags_B_in_A[:inds_C_in_A[i]] == True)[0].size(0)
	inds_C_in_B.append(ind_C_in_B)
inds_C_in_B = torch.tensor(inds_C_in_B)
print('方法二耗时%10.7f sec' % (time.time() - time_start))  # 方法二耗时 0.0009015 sec
print('(C == B[inds_C_in_B]).all()的值:', (C == B[inds_C_in_B]).all())

PyTorch中模型的保存与加载

*** PyTorch入门学习（六）：model的保存与加载 20180130

PyTorch中tensor和nn.Module的复制 Copy.deepcopy() v.s. clone()

20201113记：

Copy.deepcopy() vs clone() - PyTorch Forums
spanev Serge Panev 20190903 comment:

Hi @Shisho_Sama,

For Tensors in most cases, you should go for .clone() since this is a PyTorch operation that will be recorded by autograd.

When it comes to Module, there is no clone method available so you can either use copy.deepcopy() or create a new instance of the model and just copy the parameters, as proposed in this post Deep copying PyTorch modules 894.

Deep copying PyTorch modules - PyTorch Forums
jpeg729 20180110 comment:

If I had to deep copy a model, I would do something like this…

model_copy = type(mymodel)()  # get a new instance
model_copy.load_state_dict(mymodel.state_dict())  # copy weights and stuff

I can’t see how that would help you “save it somewhere else in a database”. I assume you have read the docs on serialising models 303 and the recommendations and warnings on that page.

.clone(), .detach(), new_tensor(), .copy_()

Pytorch张量（Tensor）复制_winycg的博客-CSDN博客 20190913

pytorch中的detach和detach_ - 那抹阳光1994 - 博客园 20181119

此节转载自：【Pytorch】对比clone、detach以及copy_等张量复制操作_guofei_fly的博客 20200224
编程速记(25)：Pytorch篇-张量（Tensor）复制_weixin_38316806的博客-CSDN博客 20191223

1 .clone()

返回一个和源张量同shape、dtype和device的张量，与源张量不共享数据内存，但提供梯度的回溯。
下面，通过例子来详细说明：
示例：
（1）定义

import torch

a = torch.tensor(1.0, requires_grad=True, device="cuda", dtype=torch.float64)

a_ = a.clone()
print(a_)   # tensor(1., device='cuda:0', dtype=torch.float64, grad_fn=)

报错问题记录

查看torch所在的虚拟环境信息

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
from __future__ import print_function
import torch
print(torch.__version__)  # 得到结果’1.4.0’
x = torch.rand(5, 3)
print(x)
print(torch.cuda.is_available())

进入以下路径，运行命令python collect_env.py，便可获取当前的环境信息：

Linux系统下，进入\envs\my_gpu_py3\lib\python3.7\site-packages\torch\utils路径下；
Win系统下，进入\Anaconda3\envs\my_cpu_py3\lib\site-packages\torch\utils路径下；

(my_gpu_py3) E:\OtherProgramFiles\Anaconda3\envs\my_gpu_py3\lib\site-packages\to
rch\utils>python collect_env.py
Collecting environment information...
PyTorch version: 1.4.0
Is debug build: No
CUDA used to build PyTorch: Could not collect

OS: Microsoft Windows 8.1 China
GCC version: Could not collect
CMake version: version 3.11.0

Python version: 3.8
Is CUDA available: No
CUDA runtime version: 8.0.60
GPU models and configuration: GPU 0: GeForce GTX 750
Nvidia driver version: 376.51
cuDNN version: E:\Program Files\NVIDIA Corporation\NVIDIA GPU Computing Toolkit\
CUDA\v8.0\bin\cudnn64_7.dll

Versions of relevant libraries:
[pip3] numpy==1.18.5
[pip3] numpydoc==1.1.0
[pip3] torch==1.4.0
[pip3] torchsummary==1.5.1
[pip3] torchvision==0.5.0
[conda] _pytorch_select           0.1                       cpu_0
[conda] blas                      1.0                         mkl
[conda] mkl                       2020.1                      216
[conda] mkl-service               2.3.0            py38hb782905_0
[conda] mkl_fft                   1.1.0            py38h45dec08_0
[conda] mkl_random                1.1.1            py38h47e9c7a_0
[conda] pytorch                   1.4.0           cpu_py38ha775e86_0
[conda] torchsummary              1.5.1                    pypi_0    pypi
[conda] torchvision               0.5.0                    pypi_0    pypi

(my_gpu_py3) E:\OtherProgramFiles\Anaconda3\envs\my_gpu_py3\lib\site-packages\to
rch\utils>

one of the variables needed for gradient computation has been modified by an inplace operation

20201008记：

报错信息如下：

one of the variables needed for gradient computation has been modified by an inplace operation: 
[torch.cuda.FloatTensor [48, 1]] is at version 16; expected version 14 instead. Hint: enable 
anomaly detection to find the operation that failed to compute its gradient, 
with torch.autograd.set_detect_anomaly(True).

(***此博客分析了可能导致该报错的可能原因) pytorch detach函数 - fjlruo - 博客园 20201121

(待阅读) PyTorch报错“RuntimeError: one of the variables needed for gradient computation has been modified by……”_墨门 20200308

ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead.

**【已解决】ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead._ShuqiaoS的博客-CSDN博客 20190312
torch.utils.cpp_extension对c++/cuda进行拓展 - 知乎20200602
PyTorch运行时提示’ImportError: torch.utils.ffi is deprecated. Please use cpp extensions instead.’ – 默默的点滴20191116
torch.utils.ffi is deprecated. How do I use cpp extensions instead? • Issue #15645 • pytorch/pytorch • GitHub20190101

最省事的情况是降级torch版本到0.4，强烈建议使用Anaconda创建独立的Python开发环境，然后在干净的环境中运行。（博主注：未经测试此解决方案是否可行）

PyTorch: cannot import name `container_abc` form torch._six

PyTorch: cannot import name ‘container_abc‘ 或者 ‘int_classes‘ form torch._six_calabash_man的博客-CSDN博客 20210830

Unable to find a valid cuDNN algorithm to run convolution

问题描述：
开始
原因分析and解决方案：
很有可能是 GPU 显存不够的原因, 尝试把 batch_size 改小一点问题得以解决;
【问题解决】YOLOv5遇到Unable to find a valid cuDNN algorithm to run convolution_Gorgeous_wxd-CSDN博客 20210927
Unable to find a valid cuDNN algorithm to run convolution_weixin_43615569的博客-CSDN博客 20201005

待补充

二级标题

待补充

文字居中

数学公式粗体 $\textbf{}$ 或者 ${\bf memory}$
数学公式粗斜体 $\bm{}$

摘录自“bookname_author”
此文系转载，原文链接：名称 20200505

高亮颜色说明：突出重点
个人觉得，：待核准个人观点是否有误

分割线

我是颜色为00ffff的字体
我是字号为2的字体
我是颜色为00ffff, 字号为2的字体
我是字体类型为微软雅黑, 颜色为00ffff, 字号为2的字体

分割线

分割线
问题描述：
原因分析：
解决方案：

你可能感兴趣的:(CV,&,DL,编程实现,pytorch,深度学习,人工智能)

Windows下重叠I/O模型智驾 Windows开发 windows开发重叠IO模型
目录一.Windows下重叠I/O模型二．重叠模型的优点三．重叠模型的基本原理五、实现重叠模型的步骤六.客户端情况的注意事项七．已知问题原文链接：https://blog.csdn.net/zhongguoren666/article/details/1827928在此感谢原作者。一.Windows下重叠I/O模型重叠模型的优点重叠模型的基本原理关于重叠模型的基础知识重叠模型的实现步骤多客户端情况
如何用3个月零基础入门网络安全？_网络安全零基础怎么学习白帽黑客啊一学习 web安全安全 python 网安入门
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包前言写这篇教程的初衷是很多朋友都想了解如何入门/转行网络安全，实现自己的“黑客梦”。文章的宗旨是：1.指出一些自学的误区2.提供客观可行的学习表3.推荐我认为适合小白学习的资源.大佬绕道哈！基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包一、自学网络安全学习的误区和陷阱1.不要试图先成为一名程序员（以编程为基础的学习）
C++ 地图 + 配对组合！3 分钟吃透 map 和 pair 的黄金搭档 Reese_Cool STL 数据结构与算法 c++算法开发语言 stl
文章目录pair一、基本概念二、pair的声明与初始化三、成员访问与修改四、常用操作1.比较运算2.交换值3.tie函数（解包pair）五、pair的应用场景六、pair与结构体/类的对比七、pair与tuple的对比八、代码示例1.返回多个值2.存储键值对九、总结map一、基本概念二、map的声明与初始化三、常用操作四、map的应用场景五、注意事项在C++编程里，map和pair是标准库中十分实
TSL 和 SSL 是什么？它们有何关系？恶霸不委屈网络服务器运维
1.SSL（SecureSocketsLayer）定义：SSL（安全套接层）是一种早期的加密协议，用于在互联网通信中保障数据传输的安全性。它通过加密和身份验证机制，确保客户端（如浏览器）与服务器之间的通信不被窃听或篡改。版本：SSL1.0（未发布）、SSL2.0（1995年，已废弃）、SSL3.0（1996年，已淘汰）。问题：SSL3.0及早期版本存在严重安全漏洞（如POODLE攻击），目前已被现
【第22节】windows网络编程模型(WSAAsyncSelect模型) 攻城狮7号 Windows编程(C++)windows 网络编程 windows编程 windows sdk c++
目录引言一、WSAAsyncSelect模型概述二、WSAAsyncSelect模型流程2.1自定义消息2.2创建窗口例程2.3初始化套接字2.4注册网络事件2.5绑定和监听2.6消息循环三、完整示例代码引言在网络编程的广袤天地中，高效处理网络事件是构建稳定应用的关键。WSAAsyncSelect模型作为一种独特且实用的网络编程模型，为开发者提供了异步处理网络事件的有力手段。它巧妙地将Window
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
SpringBoot集成Flink-CDC，实现对数据库数据的监听 rkmhr_sef 面试学习路线阿里巴巴 spring boot flink 数据库
一、什么是CDC？CDC是ChangeDataCapture（变更数据获取）的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。二、Flink-CDC是什么？CDCConnectorsforApacheFlink是一组用于ApacheFlink的源连接器，使用变更数据捕获(CDC)从
11.网络编程的基础知识就很对网络 linux
11.网络编程的基础知识**1.OSI模型与TCP/IP模型****2.IP地址分类****3.Socket编程****4.TCP三次握手与四次挥手****5.常用网络测试工具****6.练习与作业****7.总结**1.OSI模型与TCP/IP模型OSI模型（开放系统互联模型）：7层结构：应用层：为网络用户提供各种服务（如HTTP、FTP）。表示层：数据加密解密、压缩解压缩。会话层：管理进程会话
uni-app 与webView 互相传值九亿少女无法触及的梦ى uni-app
uni-app向webView传值在uni-app传值有多种实现方式，主要推荐evalJS，次要webSorcket重点：1.webView要找到正确的children！如果页面中只有一个webView标签则直接可以currentWebview.children()[0]2.H5页面中的监听function必须写在全局，不要写在任何load事件中！//index.vueletcurrentWebv
Python匿名函数Lambda，不止是省略函数名这么简单橙色小博 python的学习之旅 python 开发语言
目录1.前言2.Lambda函数的基本用法3.关于Lambda函数的应用3.1与map函数结合3.2lambda与if-else语句3.3多参数lambda3.4嵌套lambda3.5字典与lambda（也是我本人最喜欢的用法）3.6lambda其他用法4.总结：Lambda的编程哲学1.前言在Python的广阔天地里，Lambda函数宛如一颗璀璨的明珠，以其简洁优雅的姿态，为代码增添了一份独特的
深入解析Flink Kafka Connector的分布式流数据采集架构与底层实现数据与算法架构提升之路 #Flink flink kafka conector 源码
目录1.FlinkKafka连接器的分布式流采集架构1.1架构组成1.2分布式流模型2.数据分区分配策略3.为什么重写序列化和偏移量管理3.1与Flink分布式架构集成3.2与Flink检查点机制集成同时承接多级并行架构3.3OffsetsInitializer与细粒度偏移量控制3.4与Flink的Source接口统一4.版本兼容性管理5.有界流处理支持5.1实现原理5.2API使用示例5.3多种
抗积分饱和（Anti-Windup）常见的处理方法鹿屿二向箔控制算法
抗积分饱和（Anti-Windup）是PID控制中防止积分项在输出受限时过度累积的关键技术。以下是主要方法及其实现步骤：1.积分限幅（IntegralClamping）原理：直接限制积分项的最大/最小值。实现：integral=max(min(integral+error*dt,integral_max),integral_min)优点：简单易实现。缺点：需合理设置限幅值，可能影响动态性能。2.积
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four 热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
java选择语句 FAQEW java
Java选择结构深度解析一、if结构体系1.单条件判断//基础if结构intscore=85;if(score>=60){System.out.println("考试通过");}//判断空值（防御性编程）Stringtext=null;if(text!=null&&!text.isEmpty()){System.out.println(text.length());}执行流程：truefalse条
Unity 与 JavaScript 的通信交互：实现跨平台的双向通信 Front_Yue 3D技术实践指南 unity javascript 3d
前言在现代游戏开发和Web应用中，Unity和JavaScript的结合越来越常见。Unity是一个强大的跨平台游戏引擎，而JavaScript是Web开发的核心技术之一。通过Unity和JavaScript的通信交互，开发者可以实现从Unity到Web页面的功能扩展，或者从Web页面控制Unity的行为。这种双向通信的能力为开发者提供了更多的可能性，例如在Unity中嵌入Web视图，或者在Web
Linux——Linux系统编程之基于TFTP实现服务器与开发板间的文件传输实战总结 Winter_world Linux系统 TFTP服务器搭建 TFTP文件传输
目录0引言1TFTP服务器搭建1.1TFTP基础1.2Ubuntu搭建TFTP服务器1.3测试TFTP服务器2开发板实现TFTP文件传输2.1同一网段2.2配置2.3客户端与服务器的通信0引言我们前面总结的Linux字符设备、串口编程博文中，在虚拟机中编译得到可执行文件后，都是通过U盘连接开发板进行测试验证的，或者就是把可执行文件编译到最小系统中，再OTG烧写进开发板，这两种方法都比较麻烦，这里我
A800核心加速技术深度剖析智能计算研究中心其他
内容概要作为第三代异构计算架构的典型代表，A800通过深度融合通用计算单元与专用加速模块，构建了高度灵活的资源调度体系。其核心突破在于将矩阵运算、并行任务分发与内存访问路径进行系统性重构，解决了传统架构中计算密度与能效失衡的行业痛点。通过实测数据显示，在典型AI训练场景下，A800相较于前代架构实现了3.2倍的吞吐量提升，同时单位功耗下的指令执行效率优化达47%。技术维度第二代架构A800架构提升
H200架构升级与实战解析智能计算研究中心其他
内容概要作为新一代高性能计算平台的核心载体，H200架构通过系统性硬件重构实现了计算性能的显著跃迁。本文将从芯片级设计革新出发，剖析其多维度升级路径：首先解读计算单元拓扑重组带来的并行效率提升，阐释内存子系统的带宽优化策略；继而拆解面向AI训练场景的混合精度加速机制，以及科学计算工作负载的动态资源调度方案。通过比对行业典型部署案例中的能效曲线与吞吐表现，系统化呈现H200在模型训练加速、大规模仿真
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
H800能效架构实战解析智能计算研究中心其他
内容概要H800能效架构以异构计算资源调度与动态功耗控制为核心，通过系统级协同设计实现算力密度与能耗优化的双重目标。其核心技术覆盖智能负载分配、电压频率动态调节及热管理三大模块，形成从芯片级到数据中心级的垂直优化链路。在架构设计中，异构资源调度算法通过实时分析任务特征与硬件状态，动态分配CPU、GPU及专用加速器资源，最大化硬件利用率；动态功耗模块则基于负载波动自适应调整供电策略，结合多级电压频率
模型优化驱动产业应用创新智能计算研究中心其他
内容概要当前模型优化技术的迭代正沿着多维路径快速演进，其核心驱动力在于突破算法性能与产业需求间的适配瓶颈。以自适应学习机制与迁移学习框架为基础的优化策略，显著提升了模型在跨场景应用中的泛化能力，而超参数自动调优技术则通过PyTorch、TensorFlow等主流框架的接口标准化，降低了复杂模型的开发门槛。在部署层面，边缘计算与联邦学习的协同应用不仅缩短了金融预测、医疗影像分析等场景的响应延迟，更通
DeepSeek多语言AI高效应用实践智能计算研究中心其他
内容概要在人工智能技术快速迭代的背景下，DeepSeek系列模型凭借混合专家架构（MoE）与670亿参数规模，在多语言处理、视觉语言理解及复杂任务生成领域实现了突破性进展。本文系统性拆解其技术架构设计逻辑，聚焦论文写作、代码生成、SEO关键词拓展三大核心场景，分析模型在高生成质量、低使用成本维度的差异化优势。技术维度DeepSeekProver传统单模态模型多语言支持97种语言动态切换单一语种优化
RTX 4090旗舰显卡效能实战剖析智能计算研究中心其他
内容概要作为NVIDIA新一代旗舰显卡，RTX4090凭借AdaLovelace架构的革新设计，在4K/8K分辨率下的游戏与创作场景中展现了突破性表现。本文将通过多维度实测数据，系统解析其核心性能：首先聚焦8K游戏帧率与光线追踪效果的实战表现，结合DLSS3.0技术的动态对比，揭示超分辨率技术对高负载场景的优化逻辑；随后深入探讨24GBGDDR6X显存在视频渲染与AI运算中的效率边界，同步验证显存
Android Compose 框架按钮与交互组件模块源码深度剖析(二) &有梦想的咸鱼& Androiod Compose原理 Android开发大全 android
一、引言在现代Android应用开发中，用户交互体验至关重要。AndroidCompose作为Google推出的声明式UI工具包，为开发者提供了简洁、高效且灵活的方式来构建用户界面。其中，按钮与交互组件模块是用户与应用进行交互的重要组成部分。本文将深入剖析AndroidCompose框架中按钮与交互组件模块的源码，从基础概念到具体实现，逐步揭示其工作原理和设计思路。二、AndroidCompose
LabVIEW实现LoRa通信不脱发的程序猿 LabVIEW物联网开发实战 labview
目录1、LoRa通信原理2、硬件环境部署3、程序架构4、前面板设计5、程序框图设计6、测试验证本专栏以LabVIEW为开发平台，讲解物联网通信组网原理与开发方法，覆盖RS232、TCP、MQTT、蓝牙、Wi-Fi、NB-IoT等协议。结合实际案例，展示如何利用LabVIEW和常用模块实现物联网系统的快速开发与原型设计，助你从基础到实战，全面掌握物联网开发技能。开源免费LabVIEW学习专栏分享：L
Trunk：Rust WASM 应用的终极打包工具徐天铭Paxton
Trunk：RustWASM应用的终极打包工具trunkBuild,bundle&shipyourRustWASMapplicationtotheweb.项目地址:https://gitcode.com/gh_mirrors/tr/trunk项目介绍Trunk是一款专为Rust语言设计的WASM网页应用打包工具。它能够帮助开发者轻松构建、打包并发布Rust编写的WASM应用到Web平台。Trunk
【第1章＞第6节】CMAC小脑模型神经网络的理论学习与MATLAB仿真 fpga和matlab #第1章·神经网络学习 matlab CMAC 小脑模型神经网络人工智能
目录1.使用软件和版本2.CMAC小脑模型神经网络概述2.1CMAC网络结构2.2CMAC地址映射2.3学习过程3.CMAC网络的MATLAB编程实现4.分辨率，重叠度，学习率对CMAC网络的训练性能影响分析4.1分辨率4.2重叠度4.3学习率5.视频操作步骤演示欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程
Java有哪些编程技巧？ java
Java编程技巧：提升效率与质量的实用指南在Java编程中，掌握一些高效的编程技巧不仅可以提高开发效率，还能提升代码的可读性、可维护性和性能。以下是一些实用的Java编程技巧，供开发者参考和应用。一、代码优化技巧（一）合理使用数据类型选择合适的数据类型：根据实际需求选择合适的数据类型。例如，如果只需要存储整数，且数值范围较小，可以使用int而不是long，以节省内存。使用包装类时需谨慎：Java的
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发