坚持不懈的小白白

Linux深入浅出PyTorch（一）安装及基础知识

PyTorch安装
- 工具使用
- - 1. 开发工具建议使用pycharm
  - 2. 安装包管理工具建议使用Anaconda
  - 3. 安装结果检查
- Pytorch安装
- - 2. 配置pytorch 虚拟环境
  - 3. 在PyCharm中配置PyTorch虚拟环境
- 丰富的PyTorch学习资源
张量
- 1. 张量介绍
- 2.创建张量
- - （1）随机初始化矩阵：使用 $t orc h . r an d (* s i ze, o u t = N o n e)$ 方法
  - （2）全0矩阵的构建：使用 $zero (* s i ze)$ 方法
  - （3）张量的构建：使用 $t orc h . t e n sor$ 方法
  - （4）基于已经存在的tensor，创建一个新的tensor
  - （5）总结 [5]：
- 3. 张量的操作
- - 1. 加法操作
  - 2. 索引操作
  - 3. 维度变换
  - 4. 取值操作
- 4. 广播机制
自动求导
- 1. Autograd简介
- - (1) $t orc h . T e n sor$ 的属性
  - (2) 创建一个张量并对其进行一些操作
- 2. 梯度
- 3. 并行计算简介
- - （1）CUDA
  - （2）常见的并行方法

PyTorch安装

工具使用

1. 开发工具建议使用pycharm

官网链接: PyCharm: 面向专业开发者的Python IDE
可以下载社区版和专业版，社区版免费，专业版收费。
但是如果是学生或者老师，可以申请JetBrains的免费教育许可证，具体申请条件看官网：
链接: 免费教育许可证
我选择的是社区版（一般使用足够）

2. 安装包管理工具建议使用Anaconda

Anaconda集成了常用于科学分析（机器学习，深度学习）的大量package，并且借助于conda我们可以实现对虚拟Python环境的管理，可以非常方便的用于机器学习及深度学习。
链接: Anaconda官网
我选择的是默认安装

3. 安装结果检查

安装好之后打开终端，分别输入以下命令可以看到conda的版本、conda默认的python的版本和已经创建的虚拟环境。

Pytorch安装

也可以在默认base环境中安装，但是为了防止太乱，Anaconda可以创建一个个不同的环境把这些包分开，比如需要一个tensorflow的环境，那就创建一个环境在这个环境内下载安装tensorflow，然后另一个环境装pytorch。

退出某一环境命令如下：

conda deactivate

虚拟环境创建命令如下：

conda create -n pytorch

注：1）输入conda deactivate后，退出base环境，终端行前面没有"(base)"字样即为退出
进入某一环境的命令为：

conda activate env_name # env_name就是你的环境名

如图：

2）如果想每次打开终端，不自动进入任何环境（现在打开终端自动进入base环境）可以设置如下操作：

conda config --set auto_activate_base false

设置好之后重新进入终端即可。

2. 配置pytorch 虚拟环境

首先终端进入pytorch环境：

conda activate pytorch

1）查看现在环境中所有已安装的包

conda list

从图一可以看到我的环境里面已经创建了一个专门用于pytorch的虚拟环境：pytorchenv，我主要是为运行MADDPG算法创建的环境，环境配置如下：

python(3.6.13)
OpenAI gym(0.10.5)
tensorflow(2.6.2)
numpy(1.19.5)
pytorch(1.10.2)

2）安装python 3.6版本

conda install python==3.6

在弹出的询问y/n中，选择 y

3）安装pytorch
首先进入pytorch官网查看自己电脑适合哪个版本：
链接: PyTorch官网
可以看到，官网会根据电脑配置给出安装pytorch的命令：

复制命令到终端下载即可。

测试如下：
在pytorchenv环境下打开python，import torch没有出错：

4）其他命令
如果想删除某个虚拟环境，则在终端中输入：

conda remove -n env_name --all # env_name用要删除的虚拟环境的名字替换即可

如果想卸载某个包，则在对应的虚拟环境终端中输入：

conda remove package_name # package_name用要删除的包的名字替换

其他不常用命令见Anaconda官网：
链接: Command Reference

3. 在PyCharm中配置PyTorch虚拟环境

打开PyCharm，新创建一个project: pytorch_learning
进入这个project，进入File->Settings->Project:pytorch_learning->Python Interpreter：
用Add Interpreter选择pytorchenv虚拟环境中的python3.6：

至此，配置完成，可以在PyCharm里愉快的使用pytorchenv虚拟环境了，如果还想安装其他包，比如matplotlib，再次打开终端进入pytorch虚拟环境，用安装命令安装即可。

丰富的PyTorch学习资源

Awesome-pytorch-list：目前已获12K Star，包含了NLP,CV,常见库，论文实现以及Pytorch的其他项目。
PyTorch官方文档：官方发布的文档，十分丰富。
PyTorch中文文档
Pytorch-handbook：GitHub上已经收获14.8K，pytorch手中书。
PyTorch官方社区：PyTorch拥有一个活跃的社区，在这里你可以和开发pytorch的人们进行交流。
PyTorch官方tutorials：官方编写的tutorials，可以结合colab边动手边学习
动手学深度学习：动手学深度学习是由李沐老师主讲的一门深度学习入门课，拥有成熟的书籍资源和课程资源，在B站，Youtube均有回放。
Awesome-PyTorch-Chinese：常见的中文优质PyTorch资源

张量

1. 张量介绍

在深度学习中，通常将数据以张量的形式进行表示。如：三维张量表示一个RGB图像，四维张量表示视频。

几何代数中定义的张量，是基于向量和矩阵的推广。

张量维度	代表含义
0维	代表标量（数字）
1维	代表向量
2维	代表矩阵
3维	时间序列数据、股价、文本数据、单张彩色图片(RGB)

张量是现代机器学习的基础，核心是一个容器，可以包含数字和字符串，但是包含字符串的情况比较少。所以，可以将张量想象成一个数字的水桶。
一些存储在各种类型张量的公用数据集类型：

维度	数据集
3维	时间序列
4维	图像
5维	视频
为什么这里图像又是4维的了呢？
这是因为，若是一张图片用这3个字段表示即可：

(width, height, channel) = 3D

但是若是一个数据集，则还需要有图片数量这个字段：

(batch_size, width, height, channel) = 4D

所以对图像数据集来说，是4维张量。

PyTorch中， $t orc h . T e n sor$ 是存储及变换数据的主要工具，虽然与Numpy库的多维数组比较相似，但是 $T e n sor$ 提供GPU计算和自动求梯度等更多功能。两者对比如下 [3]：

对比项	Numpy	Tensor
相同点	可以定义多维数组，进行切片、改变维度、数学运算等	可以定义多维数组，进行切片、改变维度、数学运算等
不同点	1. 产生的数组类型为numpy.ndarray; 2. 会将ndarray放入CPU中进行运算； 3. 导入方式为 import numpy as np，后续通过np.array([1,2])建立数组； 4. Numpy中没有x.type的用法，只能使用type(x)	1. 产生的数组类型为torch.Tensor； 2. 会将tensor放入GPU中进行加速运算（如果有GPU）； 3. 导入方式为import torch，后续通过torch.tensor([1, 2])或torch.Tensor([1,2])建立矩阵； 4. Tensor中查看数组类型使用type(x)和x.type()都可，但是x.type()的输出结果为’torch.LongTensor’或’torch.FloatTensor’，可以看出两个数组的种类区别。而采用type(x)，则清一色的输出结果都是torch.Tensor，无法体现类型区别。

2.创建张量

这时，就可以在上一节创建的，interpreter为pytorch虚拟环境的PyCharm项目中运行代码了。
常见的构造Tensor的方法如下：

函数	功能
Tensor(sizes)	基础构造函数
tensor(data)	类似于np.array
ones(sizes)	全1矩阵
zeros(sizes)	全0矩阵
eye(sizes)	对角为1，其余为0的单位矩阵
arange(s, e, step)	从s到e，步长为step
linspace(s, e, steps)	从s到e，均匀分成step份
rand/randn(sizes)	rand是生成数据服从[0, 1)均匀分布的矩阵；randn是生成服从N(0, 1)的正态分布的矩阵
normal(mean, std)	正态分布（均值为mean，标准差是std）
randperm(m)	随机排列

几个例子：

（1）随机初始化矩阵：使用 $t orc h . r an d (* s i ze, o u t = N o n e)$ 方法

$t orc h . r an d (* s i ze, o u t = N o n e)$ :

*size: 整数序列，定义了输出张量的形状

out(Tensor, optional)：结果张量

该方法返回一个张量，包含了从区间[0, 1)的均匀分布中抽取的一组随机数。

注：*size是sizes的意思，表示尺寸可以自由输入

# python
import torch
x = torch.rand(4, 3)
print(x)

因为是随机产生的矩阵，所以代码每次运行结果都不一样：

第一次运行：

第二次运行：

（2）全0矩阵的构建：使用 $zero (* s i ze)$ 方法

$zero (* s i ze)$ [1]：

*size: 整数序列，定义了输出张量的形状

out：指定输出的tensor。

dtype：指定返回tensor中数据的类型，如果为None，使用默认值（一般为torch.float32，可以使用 torch.set_default_tensor_type()更改）

layout：返回tensor所需要的布局，默认为strided（密集型张量），还有torch.sparse_coo 稀疏性张量，用于存储稀疏矩阵时使用的布局。

device：指定返回tensor所处的设备，可以是cpu或者cuda，如果不指定则为默认（一般为cpu，可以使用torch.set_default_tensor_type()进行更改。）

requires_grad：指定返回的tensor是否需要梯度，默认为False。

# python
import torch
x = torch.zeros(4, 3, dtype=torch.long)
print(x)
print(x.dtype) # 查看x数据的具体类型 [2]
print("----------------------------") # 分割线

y = torch.zeros(5)
print(y)
print(y.dtype) # 查看y数据的具体类型 [2]

运行结果如下：

（3）张量的构建：使用 $t orc h . t e n sor$ 方法

$t orc h . t e n sor ()$ :
直接输入一个list数组来得到tensor类型

# python
import torch
x = torch.tensor([5.5, 3])
print(x)

y = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(y)

代码运行结果如下：

可以看到，输入的数据中有float类型，tensor就自动把整个数组转换成float类型（数组x）；若是输入全为整数（数组y），则整个数组数据类型是整数类型。

注：torch.tensor和torch.Tensor的区别：
$t orc h . T e n sor$ 是默认的tensor类型 $t orc h . Fl o a tT e n sor$ 的简称[4]，所以用torch.Tensor得到的张量矩阵全是float类型。而torch.tensor是从数据中推断数据类型[3]。例子如下：

# pytorch
import torch
x = torch.tensor([[1, 2, 3], [4, 5, 6]]) # x是根据tensor生成的张量
print(x)
print(type(x))
print(x.type())
print("----------------------------")
y = torch.tensor([[1.1, 2, 3], [4, 5, 6]]) # y也是根据tensor生成的张量
print(y)
print(type(y))
print(y.type())
print("----------------------------")
z = torch.Tensor([[1, 2, 3], [4, 5, 6]]) # z是根据Tensor生成的张量
print(z)
print(type(z))
print(z.type())

运行结果如下：

分析：

对于x和y，其中的数据只有1和1.1不同，但是tensor根据x的数据类型把矩阵x归为整型数组，把y归为float型；而对于z，尽管数据都是整数，但是Tensor还是将其归为float型。
这里也同时看出type(x)与x.type()的不同，前者只会输出整个矩阵的类型是torch.Tensor型数据（而不是Numpy.adarray等类型），后者则会输出具体的矩阵中的数据是整型还是float型。

（4）基于已经存在的tensor，创建一个新的tensor

这里假设x是已经存在的tensor：

# python
![import torch
x = torch.tensor(\[\[1.1, 2, 3\], \[4, 5.6, 6\], \[7, 8, 9.2\], \[10.5, 11, 12\]\])
print(x)
print(x.type())
print("-------------------------------------")
y = x.new_ones(3, 3)  # new_ones创建一个新的全1矩阵，size是3*3，数据类型与x相同
print(y)
print(y.type())
print("-------------------------------------")
z = torch.rand_like(x)  # rand_like创建一个与矩阵x形状相同的矩阵，其中的数据服从[0, 1)分布
print(z)](https://img-blog.csdnimg.cn/5a2080fb96ab46598e2979f3e3cf82cf.png)

运行结果如下：

可以看到，y是与x数据类型相同，但是形状不同的矩阵；z是与x形状相同且数据类型相同的矩阵（如果x是整型矩阵，即矩阵之包含整数，则z = torch.rand_like(x)会报错，因为利用torch.rand生成的数据不可能是整数）。

（5）总结 [5]：

torch.tensor()：输入数据生成张量；
torch.*()：用于创建特殊形式的tensor：如torch.ones()生成全1的tensor，torch.zeros()生成全0的tensor;
torch.new_*()：用于创建一个与已知tensor数据类型相同的tensor；
torch.*_like()：用于创建一个与已知tensor形状相同且数据类型相同的tensor。

3. 张量的操作

1. 加法操作

(1) 方式1：用“+”直接将两个形状相同的tensor直接相加

# python
import torch
x = torch.tensor([[1.1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
# 方式1
y = torch.rand(4, 3)
print("x:", x)
print("y:", y)
print("x+y:", x+y)

运行结果：

（2）方式2：用add()方法

#python
# 方式2
print("y:\n", y)
print("用add()方法相加：\n", torch.add(x, y)) # x还是上面的tensor

结果如下：

（3）方式3：in place，原地修改

# python
# 方式3
print("y:\n", y)
y.add_(x) # x还是上面的tensor
print("原地修改y值：\n", y)

结果如下：

in place character：就地特征，就地操作不占用额外空间，也就是说这里将x直接加到y上，不会占用其他内存。

2. 索引操作

（1）取一列

# python
import torch
x = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]) # 4*3的tensor
print(x)
print(x[:, 1])  # 取第二列并打印出来

结果如下：

（2）对从x取出来的某一部分进行操作，x也会改变

# python
x = torch.tensor([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]) # 4*3的tensor

print("原tensor, x：\n", x)
y = x[0, :]  # 取x的第一行
print("初始y：\n", y)
y += 1
print("操作后的y：\n", y)
print("y操作后，x的值：\n", x)

结果如下：

这是因为索引出来的结果与原数据共享一个内存，修改一个，另一个也会跟着改变。

3. 维度变换

常见方法有torch.view() 和 torch.reshape()
（1）torch.view()

#python
import torch
x = torch.tensor([[1, 2, 3, 1], [4, 5, 6, 1], [7, 8, 9, 1], [10, 11, 12, 1]])  # 4*3的tensor
y = x.view(16)
z = x.view(-1, 8) # -1是指这个维度的维数由其他维决定
print("x:\n", x)
print(x.storage().data_ptr()) # 查看x的存储位置

print("y:\n", y)
print(y.storage().data_ptr())

print("z:\n", z)
print(z.storage().data_ptr())

运行结果如下：

可以看到，无论y和z把x变成了什么形状，它们共享同一个内存。可以说，view()仅仅是改变了对这个张量的观察角度。如果更改其中一个的数据，其他的都会跟着改变。

（2）torch.reshape()

# python
import torch
x = torch.arange(9)
print("x:\n", x)
y = x.reshape(3, 3) # 可以看到，调用方式与view是一样的
print("y:\n", y)

结果如下：

torch.reshape()与torch.view()对比[7]：

torch的view()与reshape()方法都可以用来重塑tensor的shape
view()方法只适用于满足连续性条件(细节看[7]的讲解)的tensor，并且该操作不会开辟新的内存空间，只是产生了对原存储空间的一个新别称和引用，返回值是视图
reshape()方法的返回值既可以是视图，也可以是副本，当满足连续性条件时返回view，否则返回副本（此时等价于先调用contiguous()方法在使用view() ）
当不确能否使用view时，可以使用reshape
如果只是想简单地重塑一个tensor的shape，那么就是用reshape，但是如果需要考虑内存的开销而且要确保重塑后的tensor与之前的tensor共享存储空间，那就使用view()

（3）利用torch.view()和clone()结合进行维度变换

当tensor是continuous时，view()和reshape()变换得出的结果所在地址都是tensor原来的地址，tensor在内存中并没有被改变；
当tensor不是continuous时，view()不可使用，reshape()得出的结果是对tensor拷贝后在新的内存地址储存的tensor。

为了防止这种糊里糊涂不知道用了reshape()之后tensor是否被拷贝，对view()不能工作的tensor可以选择先将其用clone()拷贝，再使用view()。
使用clone()的另外一个好处：
会被记录在计算图中，梯度传回到副本时也会传回到源tensor。

# python
import torch
x = torch.arange(9)
y = torch.clone(x)
z = y.view(3,3)
print("x存储位置：", x.storage().data_ptr())
print("y存储位置：", y.storage().data_ptr())
print("z存储位置：", z.storage().data_ptr())

结果如下：

可以发现，clone()之后，y是占用了一个新的内存；对clone()后的y进行view()操作，tensor内存不变。

4. 取值操作

可以用 .item() 获得tensor中值的值

# python
import torch
x = torch.tensor([1.0])
print(x, type(x))
print(x.item(), type(x.item()))

结果如下：

可以看到，得出的是tensor中的具体数值。
但是这个方法在tensor包含超过一个数的时候就不能用了，这时就要用tolist()进行取值操作了[8]：

# python
import torch
x = torch.tensor([1.0, 2, 3])
print(x, type(x))
print(x.tolist(), type(x.tolist()))

结果如下：

PyTorch中的 Tensor 支持超过一百种操作，包括转置、索引、切片、数学运算、线性代数、随机数等等，具体使用方法可参考链接: 官方文档。

4. 广播机制

当两个形状不同的tensor按元素进行相加时，会触发广播机制：先复制元素让这两个tensor形状相同，再对其进行相加：

import torch
x = torch.arange(1, 3).view(1, 2) # 只取前两个数
print(x)
y = torch.arange(1, 4).view(3, 1)
print(y)
print(x + y)

结果如下：

先将x第一行的元素复制到2，3行，再将y第一列的元素复制到第二列，x、y都变成3*2形状的矩阵，然后进行相加。

自动求导

1. Autograd简介

为张量的所有操作提供了自动求导机制。反向传播是根据代码如何运行来决定的，并且每次迭代可以是不同的。

(1) $t orc h . T e n sor$ 的属性

requires_grad：设置为True：追踪对于该张量的所有操作；完成计算后调用 .backward()来自动计算所有的梯度。
y.backward()：y是标量，不用传入参数；否则，传入一个与y同型的Tensor。
.detach() ：阻止一个张量被跟踪历史，且阻止未来的计算记录被跟踪。
可将代码块包装在with torch.no_grad():中。
Function类：每个张量都有一个 grad_fn 属性，该属性引用了创建tensor自身的Function；
tensor与function类互相连接并构建一个计算图，即有向无环图（DAG），用于保存整个完整计算过程的历史信息。
每当对tensor施加一个运算的时候，就会产生一个function对象，由tensor的.grad_fn属性指向这个function对象，来产生运算结果，记录运算的发生，并记录运算的输入。tensor使用.grad.fn属性记录这个计算图的入口，反向传播中，autograd引擎会按照逆序，通过function的backward依次计算梯度。[12]
用户手动创建的张量的 grad_fn 属性是None。如：

# python
from __future__ import print_function
import torch
x = torch.randn(3, 3, requires_grad=True)
print(x.grad_fn)

结果：

注：其中 from future import * 的作用就是将新版本的特性引进当前版本中，也就是说我们可以在当前版本使用新版本的一些特性[9]。其中的print_function就是运用新版本的打印函数的写法。

(2) 创建一个张量并对其进行一些操作

# python
import torch
x = torch.ones(2, 2, requires_grad=True) # 创建一个张量并设置可以进行跟踪历史操作
print("x:\n", x)

# 对这个张量做一次运算：
y = x ** 2
print("y:\n", y)
print("y是计算的结果，所以有grad_fn属性:")
print(y.grad_fn)

# 对y进行更多操作：
z = y * y * 3
out = z.mean() # 均值
print(" z:", z, "\n", "out:", out)

结果如下：

.requires_grad()：原地改变现有张量的 requires_grad 标志，默认值是False，如下：

# python
import torch
a = torch.randn(2, 2)  # 默认情况下 requires_grad 是 False
a = (a * 3) / (a - 1)
print(a.requires_grad)

a.requires_grad_(True) # 更改值为True
print(a.requires_grad)
b = (a * a).sum()
print(b.grad_fn) # b是a的计算结果，所以有 grad_fn

结果如下：

2. 梯度

梯度：方向导数，函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。[10]

对上面得出的 out 进行反向传播：因为 out 是一个标量，所以 out.backward() 和 out.backward(torch.tensor(1.))等价。

# python
out.backward()
print("导数 d(out)/dx: ", x.grad) # 输出导数 d(out)/dx

结果如下：

计算步骤如下：
$\frac{1}{4}\sum_{i}z_i \quad z_i = 3y^2 \quad y = x^2 \\ z_i = 3x^4 \quad z_i|_{x_i=1} = 3 \\ \frac{\partial out}{\partial x_i} = 3x^3 \quad \frac{\partial out}{\partial x_i}|_{x_i=1}=3$
也就是代码结果得到的全为3的tensor。

数学上，若有向量值函数 $y = f (x)$ ，那么y相对于x的梯度是一个雅可比矩阵[10]：

注意：grad在反向传播过程中是累加的，每次反向传播，梯度都会累加之前的梯度，所以一般在反向传播之前把梯度清零。如下：

# python
out2 = x.sum()
out2.backward()
print("第二次反向传播：", x.grad)

out3 = x.sum()
x.grad.data.zero_()
out3.backward()
print("第三次反向传播：", x.grad)

得到：

一个雅可比向量积的例子：

# python
import torch
x = torch.randn(3, requires_grad=True)
print(x)

y = x * 2
i = 0
while y.data.norm() < 1000:
    y = y * 2
    i = i + 1
print(y)
print(i)

代码结果：

注：data.norm()：先对张量y每个元素进行平方，然后对它们求和，最后取平方根。这些操作计算就是所谓的L2或欧几里德范数 [11]。

这种情况下，y不再是标量。torch.autograde()不能直接计算完整的雅可比矩阵，若进行反向传播的根节点为一个向量，则需要传入与该节点同等size的向量[12]：

# python
import torch
x = torch.ones(1, 2, dtype=torch.float, requires_grad=True)
y = torch.add(x, 2) # 对x进行加法操作
z = torch.zeros(1, 2)
z[0, 0] = y[0, 1]**3 + 3 * y[0, 0]
z[0, 1] = y[0, 0]**2 + 3 * y[0, 1]
z.backward(torch.FloatTensor([[1, 1]]), retain_graph=True)
# 一次反向传播后会销毁当前计算图，设置retain_graph为true可以在当前运算中保留运算图
print(x.grad)
x.grad.data.zero_() # grad更新时，每一次运算后都需要将上一次的梯度记录清空
z.backward(torch.FloatTensor([[0, 1]]), retain_graph=True)
print(x.grad)
x.grad.data.zero_()
z.backward(torch.FloatTensor([[1, 0]]), retain_graph=True)
print(x.grad)
# 通过设置参数[0, 1]和[1, 0]可以得到该计算的雅可比矩阵
x.grad.data.zero_()
z.backward(torch.FloatTensor([[2, 1]]), retain_graph=True)
print(x.grad)
x.grad.data.zero_()
z.backward(torch.FloatTensor([[2, 2]]))
print(x.grad)

代码结果：

可见这里传入的参数是对原本正常求出的Jacobian matrix进行了线性操作。torch.autograd不能直接计算整个雅克比，因此需要我们给backward()传递向量作为参数从而得到雅可比向量积。
雅可比向量积是说，对于函数 $y = f (x)$ 定义雅可比矩阵为 $J$ ，则对于给定的向量 $v = (v_1, v_2, ..., v_m)^T$ ，计算 $J * v$ 即为所求的雅可比向量积。[12]
关于backward()的具体输入参数的含义看这里：PyTorch中的backward()函数详解。

可以通过将代码块包装在with torch.no_grad：中来阻止autograd自动设置了 .requires_grad=True的张量的历史记录：

# python
import torch
x = torch.randn(3, requires_grad=True)
print(x.requires_grad)
print((x ** 2).requires_grad)

with torch.no_grad():
    print((x ** 2).requires_grad)

结果如下：

也就是说，不想被track的计算部分可以通过这么一个上下文管理器包裹起来。这样可以执行计算，但该计算不会在反向传播中被记录。[13]

如果想修改tensor的数值，但是又不希望被autograde记录（也不影响反向传播），可以对tensor.data进行操作：

# python
import torch
x = torch.ones(1, requires_grad=True)

print(x.data) # 还是一个tensor
print(x.data.requires_grad) # 但独立于反向传播计算图之外

y = 2 * x
x.data *= 100 # 只是改变了x值，但是不会记录在计算图中，所以不会影响原来的梯度传播

y.backward()
print(x) # 更改data的值也会影响原来x的值
print(x.grad) # 但是反向传播结果还是哟你用x原来的值计算的

结果如下：

3. 并行计算简介

并行计算：将复杂问题分解成若干个部分，将每一个部分交给独立的处理器（计算资源）进行计算，以提高效率。[14]

（1）CUDA

全称是 Compute Unified Device Architecture，是一个用于并行计算的平台和 API，允许开发人员使用支持 CUDA 的 GPU 进行并行编程；[14]
GPU 并不能独立进行运算，它需要与 CPU 通过 PCIe 总线连接到一起协同进行工作，使用 GPU 进行的并行计算可以被视为是 CPU 和 GPU 的异构计算架构，CPU 负责处理逻辑复杂的串行部分，GPU 负责处理数据密集的并行部分，其中 CPU 通常被称为 host 主机端，GPU 通常被称为 device 设备端; [14]
数据在GPU和CPU之间进行传递时会比较耗时，我们应当尽量避免数据的切换;
GPU运算很快，但是在使用简单的操作时，我们应该尽量使用CPU去完成;
当我们的服务器上有多个GPU，我们应该指明我们使用的GPU是哪一块，如果我们不设置的话，tensor.cuda()方法会默认将tensor保存到第一块GPU上，等价于tensor.cuda(0)，这将会导致爆出out of memory的错误。我们可以通过以下两种方式继续设置：
1）在代码中直接指定：

# python
import os
os.environ["CUDA_VISIBLE_DEVICE"] = "2" # 设置默认的显卡

或者：
2）在命令行中执行脚本文件时指定：

# python
CUDA_VISBLE_DEVICE = 0, 1 python train.py  # 使用0，1两块GPU

（2）常见的并行方法

1）网络结构分布到不同的设备中(Network partitioning)
将一个模型的各个部分拆分，然后将不同的部分放入到GPU来做不同任务的计算。其架构如下：

缺点是这种方法对GPU之间数据的传输要求很高。

2）同一层的任务分布到不同数据中(Layer-wise partitioning)
把同一个卷积层的任务拆分放到不同GPU中计算，但是可能出现的缺陷跟模型1）一样：数据传输速率太慢，成为瓶颈。

3）不同的数据分布到不同的设备中，执行相同的任务(Data parallelism)
不再拆分模型，而是拆分数据，每个GPU进行一个单独的训练，然后将输出的数据进行一个汇总，得到的模型进行一个综合，再反传到不同GPU。结构如下：

这种模式不会出现前面的问题，所以是现在的主流方式。

参考：
[1] torch.zeros方法: https://blog.csdn.net/Fluid_ray/article/details/109704614
[2] 查看张量数据的具体类型：https://blog.csdn.net/m0_37586991/article/details/87878632
[3] Numpy与Tensor两者的对比：https://cloud.tencent.com/developer/article/1737690
[4] torch.Tensor: https://pytorch-cn.readthedocs.io/zh/latest/package_references/Tensor/
[5] torch创建tensor方式总结：https://www.dounaite.com/article/625422047cc4ff68e645f524.html
[6] Datawhale深入浅出PyTorch项目 (强推)
[7] PyTorch：view() 与 reshape() 区别详解：https://blog.csdn.net/Flag_ing/article/details/109129752
[8] tensor.item()、tensor.tolist()方法使用举例：https://blog.csdn.net/weixin_47725177/article/details/124116914
[9] python中 from future import * 的作用：https://blog.csdn.net/zzc15806/article/details/81133045
[10] PyTorch自动求导：Autograd包案例详解: https://zhuanlan.zhihu.com/p/136454725
[11] PyTorch中data.norm（）的含义：https://blog.csdn.net/jnbfknasf113/article/details/110141537
[12] tensor与自动微分: https://www.jianshu.com/p/aa7e9f65fa3e
[13] with torch.no_grad() 详解: https://blog.csdn.net/weixin_46559271/article/details/105658654
[14] 并行计算入门：https://zhuanlan.zhihu.com/p/181669611

你可能感兴趣的:(linux,pytorch,python)

华为OD机试 - 商品推荐 - 深度优先搜索DFS（Python/JS/C/C++ 2024 D卷 200分）哪吒 python 华为od 深度优先
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。一、题目描述某电商APP希望基于用户的商品浏览历史记录
华为OD机试 - 模拟目录管理功能 - 栈（Python/JS/C/C++ 2024 E卷 100分）哪吒华为od python java
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。一、题目描述实现一个模拟目录管理功能的软件，输入一个命
华为OD机试 - 分割均衡字符串 - 贪心算法（Python/JS/C/C++ 2024 D卷 100分）哪吒华为od 贪心算法 java
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。一、题目描述均衡串定义:字符串只包含两种字符，且两种字
华为OD机试 - 查找充电设备组合 - 子集和问题（Python/JS/C/C++ 2024 E卷 100分）哪吒 python 华为od java javascript c语言 c++
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新，全天CSDN在线答疑。一、题目描述某个充电站，可提供n个充电设备，每个充电设
华为OD机试 - 最长的顺子 - 动态规划（Python/JS/C/C++ 2024 E卷 200分）哪吒 python 华为od 动态规划 java javascript c c++
华为OD机试2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述斗地主起源于湖北十堰房县，据说是一位叫吴修全的年轻人根据当地流行
Python 环境构建最佳实践：Mamba + Conda + PIP Laurence　付费专栏 python conda pip mamba 构建版本冲突虚拟环境
此前，我们单独介绍过PIP和Conda，在后续的实际应用中，还是遇到了不少Python环境构建的问题，特别是在Windows系统上，最突出的表现是：虽然PIP的包依赖解析和下载都很快，但在Windows上经常会因为缺失底层依赖的程序库（例如某些dll文件）而导致Python程序启动时报错，此时，改用Conda通常可以解决此类问题，但是，Conda的问题在于：它的包依赖解析问题很大，耗时很长，解决C
Python 中 ssl 模块所使用的 OpenSSL 版本（1.0.2k-fips）和系统中 openssl 命令所使用的 OpenSSL 版本（1.1.1u）不一致（已解决） Future_yzx python ssl 开发语言
在使用Linux中配置yolov5环境时遇到问题：[root@iZ2ze9bdu1sca12rizazfkZqcby-project]#python3-c"importssl;print(ssl.OPENSSL_VERSION)"OpenSSL1.0.2k-fips 26Jan2017[root@iZ2ze9bdu1sca12rizazfkZqcby-project]#opensslversion
Python 四大主流 Web 编程框架_python web开发主流 2401_87373506 python 前端 php
在目前Python语言的几十个开发框架中，几乎所有的全栈网络框架都强制或引导开发者使用MVC架构开发Web应用。所谓全栈网络框架，是指除了封装网络和线程操作，还提供HTTP栈、数据库读写管理、HTML模板引擎等一系列功能的网络框架。本文重点讲解的Django、Tornado和Flask是全栈网络框架的典型标杆；而Twisted更专注于网络底层的高性能封装而不提供HTML模板引擎等界面功能，所以不能
100天精通Python（爬虫篇）——第113天：‌爬虫基础模块之urllib详细教程大全袁袁袁袁满 100天精通Python python 爬虫开发语言 urllib 爬虫实战 urllib模块教程网络爬虫
文章目录1.urllib概述2.urllib.request模块1.urllib.request.urlopen()2.urllib.request.urlretrieve()3.urllib.request.Request()4.urllib.request.install_opener()5.urllib.request.build_opener()6.urllib.request.Abstr
深入解析：使用 Python 爬取二手车交易平台数据的全流程 Python爬虫项目 2025年爬虫实战项目 python 开发语言百度爬虫信息可视化
二手车交易平台提供了丰富的汽车交易数据，这些数据包含了车辆品牌、型号、价格、行驶里程、上牌时间等关键信息。这些数据对市场研究、价格预测、车辆性能分析等应用场景具有重要价值。本篇博客将带你深入学习如何用Python爬取二手车交易平台数据，提供详细的实现代码、突破反爬机制的技巧，以及数据清洗和分析的思路。一、二手车数据的价值与分析场景1.1数据价值二手车交易数据可以应用在以下场景：市场分析：了解当前二
Python酷库之旅-第三方库Pandas(189) 神奇夜光杯 python pandas 开发语言人工智能标准库及第三方库 excel 学习与成长
目录一、用法精讲876、pandas.Index.duplicated方法876-1、语法876-2、参数876-3、功能876-4、返回值876-5、说明876-6、用法876-6-1、数据准备876-6-2、代码示例876-6-3、结果输出877、pandas.Index.equals方法877-1、语法877-2、参数877-3、功能877-4、返回值877-5、说明877-6、用法877-
Python 爬虫入门的教程（1小时快速入门、简单易懂、快速上手）_一小时入门 python 3 网络爬虫 2401_86372526 python 爬虫深度优先
首先在PyCharm中安装requests库，为此打开PyCharm，单击“File”（文件）菜单，选择“SettingforNewProjects…”命令，如图4所示。图4选择“ProjectInterpreter”（项目编译器）命令，确认当前选择的编译器，然后单击右上角的加号，如图5所示。图5在搜索框输入：requests（注意，一定要输入完整，不然容易出错），然后单击左下角的“Install
【reflex】Python一种更直观和高效的方式来管理事件流模块山河不见老 python 开发语言
reflex1、简介2、安装3、特性4、基本功能4.1创建和触发基本事件4.2动态事件绑定5、高级功能5.1异步事件处理5.2事件优先级和调度5.3事件过滤和条件触发6、实际应用场景6.1用户界面事件处理6.2网络事件响应6.3系统信号处理7、总结1、简介在软件开发过程中，事件驱动编程模型越来越受欢迎，尤其是在处理复杂的系统和实时交互时。Reflex是一个轻量级的Python库，它专注于简化事件驱
探索Reflex：用纯Python构建高性能Web应用倪姿唯Kara
探索Reflex：用纯Python构建高性能Web应用项目地址:https://gitcode.com/gh_mirrors/re/reflex项目介绍Reflex，前身为Pynecone，是一个革命性的开源库，允许开发者使用纯Python构建全栈Web应用。Reflex的核心理念是简化Web开发的复杂性，通过提供一个统一的框架，让开发者能够专注于业务逻辑而非技术细节。无论是初学者还是经验丰富的开
机器学习：利用sklearn实现心脏病预测薄化克Oswald
机器学习：利用sklearn实现心脏病预测机器学习sklearn实现心脏病预测项目地址:https://gitcode.com/Resource-Bundle-Collection/171ff欢迎使用本资源仓库，本项目专注于利用Python的sklearn库进行心脏病预测的机器学习实践。通过详尽的步骤和示例代码，本项目为你展示了如何应用不同的机器学习算法来分析心脏病数据集，并预测患者是否有可能患有
探索Reflex：纯Python打造高性能web应用的未来孔岱怀
探索Reflex：纯Python打造高性能web应用的未来去发现同类优质开源项目:https://gitcode.com/在快速迭代的Web开发领域，寻找一种既高效又能让开发者以熟悉的方式工作的框架至关重要。今天，我们来深入了解一个革新性的开源项目——Reflex，它承诺让你在纯Python的环境中构建响应式web应用，并且能在几秒钟内完成部署。1.项目介绍Reflex是一个新兴的全栈web框架，
python | cudf，一个超实用的 Python 库！双木的木 python拓展学习 python库 python 开发语言人工智能深度学习算法 database 数据分析
本文来源公众号“python”，仅用于学术分享，侵权删，干货满满。原文链接：cudf，一个超实用的Python库！大家好，今天为大家分享一个超实用的Python库-cudf。Github地址：https://github.com/rapidsai/cudf在数据分析和科学计算领域，Pandas是最常用的Python工具之一，然而随着数据规模的增长，其单线程CPU的处理性能往往成为瓶颈。cuDF是N
2025年8个热门Python Web开发框架极道Jdon javascript reactjs
Python拥有适合各种用例的框架，从全栈Web开发到数据可视化，为每位开发人员提供了所需的工具。得益于其活跃的社区和强大的生态系统，开发人员在构建Web应用时拥有广泛的选择。然而，选择数量之多可能会使您难以为您的项目选择合适的框架。这就是为什么我们回顾了用于构建Web应用程序的顶级Python框架，并比较了每个框架的优缺点。在本文中，我们将回顾以下框架：Reflex、Django、Flask、G
【嵌入式面试】2024年嵌入式经典面试题汇总（Linux 文件IO）_嵌入式linux面试题 2401_83704192 程序员嵌入式
Linux主要通过shell命令进行安装。可以使用apt方式安装（软件包管理系统）、rpm包安装、deb包安装、tar.gz源代码包安装、tar.bz2源代码包安装、yum方式安装(安装rpm包)、bin文件安装。1.8占用系统资源linux是字符界面，占用的系统资源较于windows下的图形界面所占的资源小。Windows是图形界面，较于Linux的字符界面所占的资源大。参考链接2Linux的根
python | reflex，一个无敌的 Python 库！双木的木深度学习拓展阅读 python库 python拓展学习 python 开发语言算法人工智能深度学习硬件工程异步
本文来源公众号“python”，仅用于学术分享，侵权删，干货满满。原文链接：reflex，一个无敌的Python库！大家好，今天为大家分享一个无敌的Python库-reflex。Github地址：https://github.com/reflex-dev/reflex在软件开发过程中，事件驱动编程模型越来越受欢迎，尤其是在处理复杂的系统和实时交互时。Reflex是一个轻量级的Python库，它专注
遗传算法GA特征选择Python 明天早下班YEAH python 笔记其他
一、遗传算法GA特征选择——代码importpandasaspdimportnumpyasnpfromsklearn.model_selectionimporttrain_test_splitfromsklearn.ensembleimportRandomForestRegressorfromsklearn.metricsimportmean_squared_error,r2_scorefromg
CTF-web: YAML是什么 A5rZ 网络安全
YAML（YAMLAin’tMarkupLanguage）是一种常见的序列化数据格式，主要用于配置文件和数据交换。它的设计目标是简洁、易读，并且易于与编程语言交互。YAML使用缩进来表示层次结构，类似于Python的语法。：基本语法结构键值对：YAML中最基本的结构是键值对，用于表示映射（类似于Python的字典）。name:JohnDoeage:30列表：用破折号（-）表示列表项。items:-
python3调用arcpy地理加权回归_混合地理加权回归python实现代码 weixin_39942995
【实例简介】通过python编码实现MGWR、MGWTR模型的求解。能够解决空间非平稳性问题。【实例截图】【核心代码】mgwr-py└──mgwr-master├──CHANGELOG.md├──LICENSE├──MANIFEST.in├──README.md├──doc│├──Makefile│├──_static││├──images│││├──gwr-mgwr.png│││└──pysal
python在abaqus中的应用_Python在ABAQUS中的使用【z】 weixin_39835925
【篇首语】首先说，我不懂abaqus。只是一次帮同学处理混合编程问题查到这些资料，借机贴过来。拷贝过程中有些混乱字符，时间关系我没有删干净。因为我也是从转帖转过来，原出处找不到了。#开头的为注释行.9_-m2r;n%h-G第一节,建立建模环境,这一步中py将从abaqus中导入建模所需的所有程序模块frompartimport*接下来定义草图环境mdb.models['Model-1'].Sket
ctf python大法好_【技术分享】记CTF比赛中发现的Python反序列化漏洞 weixin_39631370 ctf python大法好
预估稿费：200RMB投稿方式：发送邮件至linwei#360.cn，或登陆网页版在线投稿写在前面的话在前几天，我有幸参加了ToorConCTF(https://twitter.com/toorconctf)，而在参加此次盛会的过程中我第一次在Python中发现了序列化漏洞。在我们的比赛过程中，有两个挑战中涉及到了能够接受序列化对象的Python库，而我们通过研究发现，这些Python库中存在的安
python3调用arcpy地理加权回归_分析地理加权回归分析结果的操作方法 weixin_39545269
1从地理加权回归(GWR)工具生成的输出包括以下内容：输出要素类可选系数栅格表面整体模型结果的消息窗口报告显示模型变量和诊断结果的辅助表预测输出要素类2下文中将使用一系列运行GWR和解释GWR结果的步骤对以上每项输出进行说明。通常将以普通最小二乘法(OLS)开始回归分析。有关详细信息，请参阅回归分析基础知识和解释OLS回归结果。回归分析的一种常用方法是在移动到GWR之前识别可能的最佳OLS模型。此
python炫酷特效代码_推荐几个炫酷的 Python 开源项目高杉峻 python炫酷特效代码
推荐几个炫酷的Python开源项目项目一:Supervisor简介:Supervisor是实际企业常用的一款Linux/Unix系统下的一个进程管理工具,基于Python开发,可以很方便的监听,启动,停止,重启一个或多个进程,而且当进程意外被杀死时,其可以实现自动恢复,很方便的做到进程自动恢复的功能,提高系统,服务的稳定性,多用于生产环境.下载地址:https://github.com/Super
利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络 drebander AI 编程 pytorch 神经网络人工智能
在深度学习任务中，不同任务的复杂度千差万别。为了解决复杂任务对模型容量的需求，同时避免简单任务因过度拟合导致的性能下降，我们可以构建一个能够根据任务自动调整网络结构的神经网络。在PyTorch中，动态计算图和自动求导机制为实现这一目标提供了强大的工具。动态网络结构设计PyTorch的动态计算图允许我们根据运行时的输入数据或任务复杂度，动态创建和修改网络结构。动态添加/移除层：可以在训练过程中根据需
198、Django安全攻略：全方位防护Web应用常见漏洞多多的编程笔记 django 安全前端
Python开发框架Django之安全性：防止常见的Web安全漏洞本文将为大家介绍Python开发框架Django的安全性，重点关注如何防止常见的Web安全漏洞。我们将简要了解Web安全漏洞的背景知识，然后深入探讨Django框架在防止这些漏洞方面的优势，最后提供一些实用的技巧和案例。一、Web安全漏洞概述在互联网时代，Web安全漏洞已经成为黑客攻击的首选目标。常见的Web安全漏洞包括：跨站脚本攻
Python语言在Abaqus中的应用---2.3.1.1Abaqus对象模型之概述 Coder_Zeus python 经验分享
在Python语言基础上，Abaqus脚本接口增加了许多新的对象模型这些对象之间的层次（hierarchy）和关系（relationship）称为Abaqus对象模型（Abaqusobjectmodel）本文将详细介绍Abaqus对象模型的相关知识，包括：概述、导入模块、抽象基本模型、查询对象模型、[Tab]键自动完成功能等内容一、概述Abaqus对象模型描述了各个对象之间的关系1）定义对象的方法
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开

Linux深入浅出PyTorch（一）安装及基础知识

目录

PyTorch安装

工具使用

1. 开发工具建议使用pycharm

2. 安装包管理工具建议使用Anaconda

3. 安装结果检查

Pytorch安装

2. 配置pytorch 虚拟环境

3. 在PyCharm中配置PyTorch虚拟环境

丰富的PyTorch学习资源

张量

1. 张量介绍

2.创建张量

（1）随机初始化矩阵：使用 t o r c h . r a n d ( ∗ s i z e , o u t = N o n e ) torch.rand(*size, out=None) torch.rand(∗size,out=None)方法

（2）全0矩阵的构建：使用 z e r o ( ∗ s i z e ) zero(*size) zero(∗size)方法

（3）张量的构建：使用 t o r c h . t e n s o r torch.tensor torch.tensor方法

（4）基于已经存在的tensor，创建一个新的tensor

（5）总结 [5]：

3. 张量的操作

1. 加法操作

2. 索引操作

3. 维度变换

4. 取值操作

4. 广播机制

自动求导

1. Autograd简介

(1) t o r c h . T e n s o r torch.Tensor torch.Tensor的属性

(2) 创建一个张量并对其进行一些操作

2. 梯度

3. 并行计算简介

（1）CUDA

（2）常见的并行方法

你可能感兴趣的:(linux,pytorch,python)

（1）随机初始化矩阵：使用 $t orc h . r an d (* s i ze, o u t = N o n e)$ 方法

（2）全0矩阵的构建：使用 $zero (* s i ze)$ 方法

（3）张量的构建：使用 $t orc h . t e n sor$ 方法

(1) $t orc h . T e n sor$ 的属性