niklaus.z.lee

pytorch学习笔记5--pytorch基本运算

文章目录

基本运算

add/minus/multiply/divide
matmul
基本函数
统计属性

norm
mean,sum,min,max,prod,
argmin,argmax
kthvalue,topk
\>,>=,<,<=,!=,==

高阶操作(GPU)

where
Gather

梯度
loss

Mean Squared Error(MSE)：
自动求导：torch.autograd.grad[loss,[w1,w2,...]]和loss.backward()
Cross Entropy Loss

基本运算

add/minus/multiply/divide

matmul

注意：torch.mm：仅适用于2d矩阵相乘，不建议使用，建议使用matmul来计算矩阵乘法

* :表示相同位置上元素相乘
matmul（@）:表示矩阵相乘

a = torch.rand(4,3,28,64)
b = torch.rand(4,3,64,32)
torch.matmul(a,b).shape # 只计算最后两维的乘积
:torch.Size([4,3,28,32])

a = torch.rand(4,3,28,64)
b = torch.rand(4,1,64,32)  
torch.matmul(a,b).shape # 有broadcasting 操作
:torch.Size([4,3,28,32])

基本函数

使用pow，其作用等价于： a ** num
sqrt等价于pow(a,1/2)
rsqrt是对平方根求导
exp()
log()
tensor.floor():向下取整
tensor.ceil():向上取整
tensor.trunc():把一个浮点数裁剪出整数部分
tensor.frac()：把一个浮点数裁剪出小数部分
tensor.round():四舍五入
tensor.clamp():裁剪
1. tensor.clamp(min):对于小于tensor中的数如果小于min就修改成min
2. tensor.clamp(min,max):对于tensor中的数值，如果大于max都修改成max

统计属性

norm

norm vs normalize and batch_norm是有区别的：norm是范数的意思，normalize、batch_norm是归一化
matrix norm 和vector norm 是有区别的

a = torch.full([8],1)
b = a.view(2,4)
c = a.view(2,2,2)
a.norm(1) # a tensor 的一范式
： tensor(8.)
b.norm(1)
: tensor(8.)
c.norm(1)
: tensor(8.)

b.norm(2) # b tensor 的二范式 
: tensor(2.8284)
b.norm(1,dim=1)
:tensor(4.,4.)

mean,sum,min,max,prod,

对于argmin,argmax：如果不给出固定的dimension，会把tensor打平成dim=1，然后返回最小、最大的索引。

a = torch.arange(8).view(2,3).float()
: tensor([[0,1,2,3],
            [4,5,6,7]])
a.min(),a.max(),a.mean(),a.prod(),a.sum(),a.argmin(),a.argmax()
:tensor(0.),tensor(7.),tensor(3.5000),tensor(0.),tensor(28.),tensor(0),tensor(7)

argmin,argmax

a = torch.rand(4,10)
: tensor([[0.4992, 0.4095, 0.5239, 0.8184, 0.3184, 0.6433, 0.2028, 0.1133, 0.6991,0.3260],
        [0.1473, 0.2765, 0.1476, 0.2192, 0.8490, 0.7610, 0.0072, 0.6767, 0.1496, 0.2772],
        [0.0691, 0.4229, 0.6794, 0.9665, 0.3935, 0.9259, 0.3509, 0.6875, 0.8682, 0.0592],
        [0.2496, 0.3506, 0.8447, 0.2141, 0.4849, 0.2772, 0.3786, 0.6603, 0.8913, 0.1118]])
     
a.max(dim=1)
:(tensor([0.8184, 0.8490, 0.9665, 0.8913]), tensor([3, 4, 3, 8]))

a.argmax(dim=1)
tensor([3, 4, 3, 8])

a.max(dim=1,keepdim=True) # 希望结果的维度（dim）和a保持一致
:(tensor([[0.8184],
         [0.8490],
         [0.9665],
         [0.8913]]), tensor([[3],
         [4],
         [3],
         [8]]))
         
 a.argmax(dim=1,keepdim=True)
 :tensor([[3],
        [4],
        [3],
        [8]])

kthvalue,topk

kthvalue 第几小的值

a = torch.rand(4,10)
: tensor([[0.4992, 0.4095, 0.5239, 0.8184, 0.3184, 0.6433, 0.2028, 0.1133, 0.6991,0.3260],
        [0.1473, 0.2765, 0.1476, 0.2192, 0.8490, 0.7610, 0.0072, 0.6767, 0.1496, 0.2772],
        [0.0691, 0.4229, 0.6794, 0.9665, 0.3935, 0.9259, 0.3509, 0.6875, 0.8682, 0.0592],
        [0.2496, 0.3506, 0.8447, 0.2141, 0.4849, 0.2772, 0.3786, 0.6603, 0.8913, 0.1118]])

a.topk(3,dim=1)
:(tensor([[0.8184, 0.6991, 0.6433],
         [0.8490, 0.7610, 0.6767],
         [0.9665, 0.9259, 0.8682],
         [0.8913, 0.8447, 0.6603]]), tensor([[3, 8, 5],
         [4, 5, 7],
         [3, 5, 8],
         [8, 2, 7]]))

a.topk(3,dim=1,largest=False):概率最小的几个
:(tensor([[0.1133, 0.2028, 0.3184],
         [0.0072, 0.1473, 0.1476],
         [0.0592, 0.0691, 0.3509],
         [0.1118, 0.2141, 0.2496]]), tensor([[7, 6, 4],
         [6, 0, 2],
         [9, 0, 6],
         [9, 3, 0]]))
         
a.kthvalue(8,dim=1)# 第八小的值，在这里就是第三大的值
:(tensor([0.6433, 0.6767, 0.8682, 0.6603]), tensor([5, 7, 8, 7]))

a.kthvalue(8)
:(tensor([0.6433, 0.6767, 0.8682, 0.6603]), tensor([5, 7, 8, 7]))

>,>=,<,<=,!=,==

a>0 返回的是对应的mask
a>0 等价于torch.ge(a,0)
torch.eq(a,b),比较a,b中的每个元素的值，返回一个mask
torch.equal(a,b) 比较a,b中每个值，返回True or False

高阶操作(GPU)

where

torch.where(condition,a,b)->tensor c:c中数值的来源于：a，b

cond = torch.rand(2,2)
:tensor([[0.9019, 0.2225],
        [0.4002, 0.4745]])
        
a = torch.zeros(2,2)
:tensor([[0., 0.],
        [0., 0.]])

b = torch.ones(2,2)
:tensor([[1., 1.],
        [1., 1.]])
        
torch.where(cond>0.5,a,b)# 免去了for循环的嵌套，可以在gpu上运行
:tensor([[0., 1.],
        [1., 1.]])

Gather

torch.gather(input,dim,index,out=None) -> Tensor
input:表示要查的表
dim：对input查找的维度
index：查找的索引值

prob = torch.randn(4,10)
idx = prob.topk(dim=1,k=3)
:(tensor([[1.3720, 1.0751, 1.0114],
         [2.3205, 0.9811, 0.5586],
         [1.1462, 0.9951, 0.9102],
         [1.9489, 0.9159, 0.7970]]), tensor([[9, 3, 2],
         [9, 4, 5],
         [0, 2, 9],
         [3, 8, 6]]))
 
 label = torch.arange(10)+100
 :tensor([100, 101, 102, 103, 104, 105, 106, 107, 108, 109])
 
 idx = idx[1]
 :tensor([[9, 3, 2],
        [9, 4, 5],
        [0, 2, 9],
        [3, 8, 6]])

torch.gather(label.expand(4,10),dim=1,index=idx.long())
:tensor([[109, 103, 102],
        [109, 104, 105],
        [100, 102, 109],
        [103, 108, 106]])

梯度

梯度是一个向量

how to search for minima?
$\theta_{t+1} = \theta_t - \alpha_t * \Delta * f(\theta_t)$
function:
$J(\theta_1,\theta_2)=\theta_1^2+\theta_2^2$
objective:
$min_{\theta_1,\theta_2}J(\theta_1,\theta_2)$
Update rules:
$\theta_1 := \theta_1 - \alpha \frac{d}{d \theta_1}J(\theta_1,\theta_2)$
$\theta_2 := \theta_2 - \alpha \frac{d}{d \theta_2}J(\theta_1,\theta_2)$
derivatives:
$\frac{d}{d \theta_1}J(\theta_1,\theta_2)=\frac{d}{d \theta_1}\theta_1^2+\frac{d}{d \theta_1}\theta_2^2=2\theta_1$
$\frac{d}{d \theta_2}J(\theta_1,\theta_2)=\frac{d}{d \theta_2}\theta_1^2+\frac{d}{d \theta_2}\theta_2^2=2\theta_2$
鞍点和局部极小值会影响到搜索最小值
optimizer
1. initialization status
2. learning rate （stepLR）
3. momentum
4. etc

loss

Mean Squared Error(MSE)：

1. MSE:$loss = \sum(y-y^-)^2$
2. L2_norm = $||y-y^-||_2$ : $\sqrt{\sum{(y-y^-)}^2}$,注意有一个开根号的过程
3. torch.norm((y-pred),2),是开过根号的

自动求导：torch.autograd.grad[loss,[w1,w2,…]]和loss.backward()

x = torch.ones(1)
w = torch.full([1],2)
w.required_grad_()# 设置w可以求导
mse = F.mse_loss(torch.ones(1),x * w)
torch.auto.grad.grad(mse,[w])# mse 代表损失，[w]表示哪些参数要求导数。
：（tensor([2.])）

mse.backward() # 也可以这样计算导数，因为网络图已经记住计算导数的路径了,并且该函数把计算出来的导数保存到对应需要梯度的变量上，通过tensor.grad 来获取导数值
w.grad
:tensor([2.])

Cross Entropy Loss

注意：softmax可以让所有变量的概率和为1

sigmoid : $\frac{1}{1+e^{-x}}$
softmax : $S(y_i) = \frac{e^{y_i}}{\sum_j{e^{y_j}}}$
logits scores:[2.0,1.0,0.1],需要经过softmax函数，转变成概率值[0.7,0.2,0.1]
对softmax函数求导： $p_i$ 是对应概率值， $a_j$ 是参数

a = torch.rand(3)
a.requires_grad_()
p = F.softmax(a,dim=0)
# p.backward()# 如果后面还需要在使用torch.backward(),需要设置retain_graph=True
torch.autograd.grad(p[1],[a],retain_graph=True)
:(tensor([-0.1143,  0.2311, -0.1168]),)

1. binary
2. multi-class
3. +softmax
4. leave it to Logistic Regression Part

你可能感兴趣的:(pytorch)

Development Problems Based On PyTorch woxiwangxuehaocpp pytorch 深度学习人工智能
问题解决RuntimeError:unabletowritetofile:Nospaceleftondevice(28)问题描述：Traceback(mostrecentcalllast):File"/opt/conda/lib/python3.10/multiprocessing/queues.py",line244,in_feedobj=_ForkingPickler.dumps(obj)Fi
Pycharm中import torch报错解决方案（Python+Pycharm+Pytorch cpu版）波波仔86 人工智能 python pycharm pytorch import 解释器配置
pycharm环境搭建完毕后，编写一个py文件demo，importtorch报错，提示没有。设置python解释器：选择conda环境，使用现有环境，conda执行文件找到Anaconda安装路径下Scripts文件夹内的conda.exe，最后选择含有torch软件包的虚拟环境，题主创建名为pytorch。创建完解释器后，下方会显示出该解释器/虚拟环境下的所有软件包，看到有pytorch包即选
【python error】cannot import name ‘TorchDispatchMode‘ from ‘torch.utils._python_dispatch‘ Eternal-Student Jetson Orin NX Python python 开发语言
报错：cannotimportname‘TorchDispatchMode’from‘torch.utils._python_dispatch’(/home/nvidia/.conda/envs/pytorch/lib/python3.8/site-packages/torch/utils/_python_dispatch.py)File“/media/nvidia/Ubuntu/xxxxx/ev
梯度下降法以及随机梯度下降法 HKkuaidou 人工智能深度学习 python pytorch
梯度下降法就是在更新weight的时候，向函数值下降的最快方向进行更新，具体的原理我就不再写了，就是一个求偏导的过程，有高数基础的都能够很快的理解过程。我在我的github里面会一直更新自己学习pytorch的过程，地址为：https://github.com/00paning/Pytorch_Learning这里我直接展示一个简易实现的python代码，我们还是先看一下运行的效果图：相关pyth
pytorch实现cifar10多分类总结 L_pyu 人工智能 pytorch 分类
cifar-10简介：CIFAR-10是一个常用的图像分类数据集，每张图片都是3×32×32，3通道彩色图片，分辨率32×32。它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。CIFAR-10分类任务是将这些图像正确地分类到它们所属的类别中。对于这个任务，可以使用深度学习模型，如卷积
【PyTorch】torch.nn.functional.log_softmax() 函数：计算 log(softmax)，用于多分类任务彬彬侠 PyTorch基础 log_softmax 多分类交叉熵损失分类 pytorch python 深度学习
torch.nn.functional.log_softmaxtorch.nn.functional.log_softmax是PyTorch提供的用于计算log(softmax)的函数，通常用于多分类任务和计算交叉熵损失，可以提高数值稳定性并防止数值溢出。1.log_softmax的数学公式对于输入张量XXX，softmax计算如下：softmax(Xi)=eXi∑jeXj\text{softma
【PyTorch】torch.nn.functional.cross_entropy() 函数：分类任务的交叉熵损失函数彬彬侠 PyTorch基础 cross_entropy 交叉熵损失函数分类 pytorch python 深度学习
torch.nn.functional.cross_entropytorch.nn.functional.cross_entropy是PyTorch中用于分类任务的交叉熵损失函数，用于衡量预测概率分布与真实类别分布之间的差异，常用于多分类任务（multi-classclassification）。1.交叉熵损失的数学公式对于单个样本，交叉熵损失的计算公式为：L=−∑i=1Cyilog⁡(yi^)\
每天五分钟玩转深度学习PyTorch：基于GoogLeNet完成CAFIR10分类每天五分钟玩转人工智能深度学习框架pytorch 深度学习 pytorch 分类 GoogLeNet 人工智能 CAFIR10
本文重点前面我们终于使用pytorch搭建了GoogLeNet，本文我们使用该网络模型解决一个实际问题，也就是使用它完成CAFIR10分类，其实就这些任务而言，我们只要搭建好模型，然后把数据喂进去就行了，其它的地方都是一样的，就是网络模型不一样。代码
深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现羊小猪~~ 深度学习网络 pytorch 人工智能 python 机器学习分类
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言如果说最经典的神经网络，ResNet肯定是一个，从ResNet发布后，很多人做了修改，denseNet网络无疑是最成功的一个，它采用密集型连接，将通道数连接在一起；本文是基于上一篇复现DenseNet121模型，做一个乳腺癌图像识别，效果还行，准确率0.9+;CNN经典网络之“DenseNet”简介，源码研究与复现(pytorch)：
PyTorch 深度学习实战（13）：Proximal Policy Optimization (PPO) 算法进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们介绍了Actor-Critic算法，并使用它解决了CartPole问题。本文将深入探讨ProximalPolicyOptimization(PPO)算法，这是一种更稳定、更高效的策略优化方法。我们将使用PyTorch实现PPO算法，并应用于经典的CartPole问题。一、PPO算法基础PPO是OpenAI提出的一种强化学习算法，旨在解决策略梯度方法中的训练不稳定问题。PPO通过
机器学习(二) 本文(2.5万字) | KNN算法原理及Python复现 | 小酒馆燃着灯机器学习算法 k近邻算法
文章目录一KNN算法原理二KNN三要素三机器学习中标准化四KNN分类预测规则五KNN回归预测规则六KNN算法实现方式七KDTree7.1构造KDtree7.2KDtree查找最近邻八KNN特点九KNN算法实现案例一案例二1.机器学习2.深度学习与目标检测3.YOLOv54.YOLOv5改进5.YOLOv8及其改进6.Python与PyTorch7.工具8.小知识点9.杂记一KNN算法原理K近邻分类
【大模型LLM面试合集】分布式训练_总结 X.AI666 大模型LLM面试合集面试分布式人工智能语言模型
9.总结1.数据并行数据并行，由于其原理相对比较简单，是目前使用最广泛的分布式并行技术。数据并行不仅仅指对训练的数据并行操作，还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。我们首先以PyTorch数据并行的发展（DataParallel、DistributedDataParallel、FullyShardedDataParallel）为主线进行讲述了数据并行的技术原理。同时，也简述了D
【vLLM 学习】使用 TPU 安装 HyperAI超神经 vLLM 学习人工智能 vLLM 深度学习 TPU 机器学习教程
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM使用PyTorchXLA支持GoogleCloudTPU。依赖环境GoogleCloudTPUVM（单主机和多主机）TPU版本:v5e、v5p、v4Python:3.10安装选项：href=“https://v
在windows下运行ollama用5600XT (其实旧的a卡应该都可以）步骤同时用ComfyUI + RX 5600 XT + DirectML 安装与配置 Zalo2 AI deepseek windows llama stable diffusion linux AI作画
Linux部分5600XT这个卡是gfx1010的核心，这个是rand1架构，这是被amd放弃的老古董包裹其他的rand1或者rand2都是。没钱也要玩AI(自能简单运用，不能训练，微调等)这张卡只有6g远远不够ai使用所以我发现好像是能和cpu一起混用的。#警告这张卡不要在linux下尝试安装rocm版本进行pytorch编译，然后进行模型微调，反正我是浪费时间了，根本行不通，因为amd根本就没
PyTorch 和 Python关系一只积极向上的小咸鱼 python pytorch 人工智能
1PyTorch和Python关系PyTorch和Python是两个不同但相互关联的工具，主要用于机器学习和深度学习领域。以下是它们之间的关系和各自的作用：Python编程语言:Python是一种高级编程语言，以其简洁易读的语法而闻名。广泛使用:Python在数据科学、人工智能、Web开发、自动化等多个领域有着广泛的应用。库和生态系统丰富:Python拥有丰富的第三方库和工具，如NumPy、pan
python和pytorch关系_PyTorch：Python优先的深度学习框架 weixin_39877182
最近，Torch7团队开源了PyTorch。据该项目官网介绍，PyTorch是一个Python优先的深度学习框架，能够在强大的GPU加速基础上实现张量和动态神经网络。PyTorch是一个Python软件包，其提供了两种高层面的功能：使用强大的GPU加速的Tensor计算（类似numpy）构建于基于tape的autograd系统的深度神经网络如有需要，你也可以复用你最喜欢的Python软件包（如nu
点云空洞的边界识别提取 pso-bp 神经网络的模型来修复点云空洞附python代码点云-激光雷达-Slam-三维牙齿激光雷达点云 c++为主神经网络人工智能深度学习点云 python
代码是一个Python程序，用于处理3D点云数据，特别是检测和修复点云中的孔洞区域。1.**导入库**：-`numpy`：用于数学运算。-`open3d`：用于处理3D数据和可视化。-`torch`：PyTorch库，用于深度学习。-`torch.nn`和`torch.optim`：PyTorch的神经网络和优化器模块。-`mpl_toolkits.mplot3d`和`matplotlib.pyp
OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file, 小李飞刀李寻欢 Notebook huggingface bert 分类大模型
场景：训练bert-base-chinese下游任务：分类。在一个服务器可以用，但GPU只有一个卡，只能换一个服务器，换个服务器又要重装环境，但后者下载模型有问题，手动用git-lfs下载后指定位置报错：Traceback(mostrecentcalllast):/examples/pytorch/text-classification/run_glue.py",line622,inmain()/
Python深度学习033：Python、PyTorch、CUDA和显卡驱动之间的关系若北辰 Python深度学习 python 深度学习 pytorch
Python、PyTorch、CUDA和显卡驱动之间的关系相当紧密，它们共同构成了一个能够执行深度学习模型的高效计算环境。下面是它们之间关系的简要概述：PythonPython是一种编程语言，广泛用于科学计算、数据分析和机器学习。它是开发和运行PyTorch代码的基础环境。PyTorchPyTorch是一个开源的机器学习库，用于应用如自然语言处理和计算机视觉的深度学习模型。它提供了丰富的API，使
PyTorch深度学习框架进阶学习计划 - 第21天：自然语言处理基础凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程 AIGC 自然语言处理
PyTorch深度学习框架进阶学习计划-第21天自然语言处理基础今天我们将深入学习自然语言处理(NLP)的基础概念，重点关注词嵌入技术、序列建模原理以及主流模型之间的区别和优缺点。通过理解这些基础知识，你将能够更好地应用PyTorch构建NLP应用。1.词嵌入原理与实现词嵌入(WordEmbeddings)是NLP中的核心概念，它将单词映射到连续向量空间，使得语义相似的词在向量空间中距离较近。为什
PyTorch深度学习框架60天进阶学习计划 - 第19天：时间序列预测凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程迁移学习 python
PyTorch深度学习框架60天进阶学习计划-第19天：时间序列预测目录时间序列预测概述滑动窗口数据构造方法归一化策略对比：MinMaxvsZ-ScoreLSTM基础原理Attention机制与LSTM结合LSTM-Attention模型实现TeacherForcing技术与应用Prophet基准模型对比多步预测的滚动验证方法综合实战：股票价格预测1.时间序列预测概述时间序列预测是机器学习中的一个
PyTorch深度学习框架60天进阶学习计划 - 第18天：模型压缩技术凡人的AI工具箱深度学习 pytorch 学习 python 人工智能
PyTorch深度学习框架60天进阶学习计划-第18天：模型压缩技术目录模型压缩技术概述知识蒸馏详解软标签生成策略KL散度损失推导温度参数调节结构化剪枝技术通道剪枝评估准则L1-norm剪枝算法APoZ剪枝算法量化训练基础量化类型与精度PyTorch量化API剪枝与量化协同优化Torch.fx动态计算图修改自动化模型压缩流程实现实战案例：ResNet模型压缩性能评估与分析进阶挑战与思考1.模型压缩
五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook 芝帕先生深度学习 windows pycharm python conda pip 人工智能
目录前言下载并安装Anaconda下载途径安装步骤下载并安装PyCharm安装pytorch安装jupyternotebook前言新手五分钟掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch配置的时候遇到了很多问题，总结了一下，可以按这个流程无脑配置。通过本流程下载的版本Anaconda2023.03PyCharmCommunity2023.1.3Pytorch2
python,pycharm,pytorch，向量数据库，环境搭建记录 dept123 python pycharm pytorch 向量数据库
修改ubuntu上的pycharm镜像源，详细步骤-腾讯云开发者社区-腾讯云【超详细教程】2024最新Pytorch安装教程（同时讲解安装CPU和GPU版本）-CSDN博客https://zhuanlan.zhihu.com/p/667447891Quickstart|MilvusDocumentation
【图像去噪】论文复现：TPAMI 2025！全面提升单图像去噪泛化性！像素级零样本去噪方法Pixel2Pixel的Pytorch源码复现，跑通源码，修改各种报错，框架详解，注释详细！十小大 pytorch 人工智能 python 深度学习计算机视觉图像处理图像去噪
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通Pixel2Pixel全部源码，包含数据集准备、制作像素库(PixelBank)、训练和推理等，
(4-8)基于DeepSeekMoE架构的DeepSeek-V3：测试模型码农三叔训练 RAG 多模态)架构 transformer deekseek 人工智能大模型
4.8测试模型DeepSeek-V3是一款基于PyTorch的深度学习模型，主要用于文本生成任务。在加载模型时，首先需要从指定路径加载模型的配置文件和预训练权重。加载完成后，模型被设置为评估模式，并移动到GPU上以加速推理过程。在生成文本时，用户可以输入提示文本，模型会根据这些提示生成相应的文本输出。生成过程支持交互式输入和批量处理两种模式，用户可以根据需要选择适合的方式进行文本生成。此外，模型的
一个基于LSTM的字符级文本生成模型的训练+使用(pytorch) 一只小铁柱 lstm pytorch 人工智能
一、代码实现1.配置文件config.pyimporttorch#设备配置DEVICE=torch.device('cuda'iftorch.cuda.is_available()else'cpu')#超参数和配置SEQ_LENGTH=100#输入序列长度BATCH_SIZE=64#批大小EMBEDDING_DIM=256#嵌入层维度HIDDEN_SIZE=512#LSTM隐藏层大小NUM_LAY
PyTorch安装与环境配置终极指南：从零搭建高效深度学习开发环境（一） WHCIS python pytorch 人工智能深度学习机器学习
一、环境搭建的核心意义与准备工作1.1深度学习环境的核心挑战深度学习开发环境涉及复杂的软件栈依赖关系：硬件兼容性：GPU型号（NVIDIA系列）与CUDA版本的匹配软件依赖链：Python版本→PyTorch版本→CUDA驱动→cuDNN加速库环境隔离需求：不同项目可能依赖冲突的库版本1.2硬件准备清单硬件类型最低要求推荐配置CPU4核8核以上内存8GB32GB+GPU支持CUDANVIDIART
RNN 实战指南：用 PyTorch 从零实现文本分类吴师兄大模型 PyTorch pytorch python 人工智能 RNN 循环神经网络文本分类开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
Pytorch实现之利用普通GAN的人脸修复这张生成的图像能检测吗优质GAN模型训练自己的数据集 GAN系列 pytorch 生成对抗网络人工智能神经网络深度学习计算机视觉 python
简介简介：利用遮挡真实样本的部分面貌，输入给生成器，让生成器输出未被遮挡的面貌，以达到修复人脸的效果。论文题目：FACERESTORATIONVIAGENERATIVEADVERSARIALNETWORKS（基于生成对抗网络的人脸恢复）会议：2023ThirdInternationalConferenceonSecureCyberComputingandCommunication(ICSCCC)摘
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他