E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cuda混合编程
CUDA
简介——
CUDA
内存模式
1.引言前序博客:
CUDA
简介——基本概念
CUDA
简介——编程模式
CUDA
简介——For循环并行化
CUDA
简介——Grid和Block内Thread索引
CUDA
内存模式,采用分层设计,是
CUDA
程序与正常
mutourend
·
2023-12-04 23:11
基础理论
CUDA
简介——编程模式
1.引言前序博客:
CUDA
简介——基本概念CPU是用于控制的。即,host控制整个程序流程:1)程序以Host代码main函数开始,然后顺序执行。Host代码是顺序执行的,并执行在CPU之上。
mutourend
·
2023-12-04 23:10
基础理论
基础理论
CUDA
简介——基本概念
1.引言使用GPU的主要原因在于GPU的超级算力。GPU相对CPU的两大优势在于:1)巨大的计算吞吐量2)超级高的内存带宽下图展示了NVIDAGPU和Intel处理器的计算吞吐量在过去十来年的增长变化,对应的计算单位为每秒10亿次浮点运算。绿线表示NVIDA系列GPU在不同时间点的计算吞吐量变化。蓝线表示Intel系列CPU在不同时间点的计算吞吐量变化。以GeForceGTXTITAN为例:所提供
mutourend
·
2023-12-04 23:40
基础理论
基础理论
CUDA
简介——同步
1.引言前序博客:
CUDA
简介——基本概念
CUDA
简介——编程模式
CUDA
简介——For循环并行化
CUDA
简介——Grid和Block内Thread索引
CUDA
简介——
CUDA
内存模式本文重点关注Thread
mutourend
·
2023-12-04 23:39
基础理论
基础理论
【已解决】ModuleNotFoundError: No module named ‘tensorboardX‘
infromtensorboardXimportSummaryWriterModuleNotFoundError:Nomodulenamed'tensorboardX'解决办法pipinstalltensorboardX但是这里需要注意的一点是,由于我用的是
cuda
118
鳗小鱼
·
2023-12-04 20:57
Bugs(程序报错)
python
开发语言
机器学习
深度学习
人工智能
opencv
scikit-learn
pytorch使用GPU炼丹笔记
如何使用GPU训练/测试模型使用单GPU设置设备将数据转换成
CUDA
张量将模型参数转换成
CUDA
张量使用指定GPU1.使用
CUDA
_VISIBLE_DEVICES。
赤坂·龙之介
·
2023-12-04 16:45
深度学习pytorch笔记
深度学习
深度学习
神经网络
pytorch
安装
CUDA
,CUDNN和tensorflow-gpu涉及的一些网站
经过测试的构建配置,查看
CUDA
、CUDNN、Tensorflow、python版本匹配点击查看:https://www.tensorflow.org/install/source_windows?
米个蛋
·
2023-12-04 14:01
tensorflow
人工智能
python
有用的安装Pytorch Debug网站
一、Pytorch官网https://pytorch.org/用于下载指定版本的pytorch(根据自己电脑上的python版本和
cuda
版本)二、
Cuda
安装官网https://developer.nvidia.com
BugMaker2002
·
2023-12-04 13:22
pytorch
人工智能
python
Ubuntu 18.04.3 LTS上调试LIFT: Learned Invariant Feature Points
本人电脑配置:处理器:Intel®Core™
[email protected]
×8显卡驱动:NVIDIA430
CUDA
:10.0和8.0(8.0是后来安的)cuDNN:7.4.2和5.1.10(5.1.10
赖子啊
·
2023-12-04 10:54
Pytorch实现bidirectional_recurrent_neural_network
Importnecessarypackages.importtorchimporttorch.nnasnnimporttorchvisionimporttorchvision.transformsastransforms#Deviceconfiguration.device=torch.device('
cuda
'ifto
AIHUBEI
·
2023-12-04 10:02
Pytorch教程
pytorch
深度学习
人工智能
rnn
神经网络
Pytorch实现生成对抗网络GAN(generative_adversarial_network)
Importnecessarypackages.importosimporttorchimporttorchvisionimporttorch.nnasnnfromtorchvisionimporttransformsfromtorchvision.utilsimportsave_image#Deviceconfiguration.device=torch.device('
cuda
'iftorc
AIHUBEI
·
2023-12-04 10:31
Pytorch教程
pytorch
生成对抗网络
人工智能
深度学习
NVIDIA控制面板打开后闪退
亲测有效点击左下角“系统信息”->“组件”查看
CUDA
版本,与命令行nvidia-smi相同
SevenBerry
·
2023-12-04 09:16
tensorflow2.6.0 安装教程 windows10
参考:tensorflow-gpu2.6.0版本安装教程史上最强tensorflow2.6.0安装教程更新
CUDA
驱动此处可参考:如何在windows上安装&更新显卡的驱动建议将
cuda
driver(显卡驱动
SevenBerry
·
2023-12-04 09:16
tensorflow
python
Ubuntu系统配置深度学习环境之nvidia显卡驱动和
cuda
安装
CUDA
是NVIDIA推出的一种并行计算平台和编程模型。它充分利用NVIDIA显卡的并行处理能力,使开发人员能够通过编写并行计算任务来加速各种计算工作。
CUDA
提供
番茄小能手
·
2023-12-04 08:20
Linux
ubuntu
深度学习
linux
训练自己的个性化Stable diffusion模型,LORA
训练开源web界面两个开源训练界面1、秋叶写的SD-Trainerhttps://github.com/Akegarasu/lora-scripts/没成功,主要也是cudnn和nvidia-smi中的
CUDA
君臣Andy
·
2023-12-04 07:16
stable
diffusion
人工智能
Jetson Nano部署YOLOv5与Tensorrtx加速
一、烧录镜像1、JetsonNano烧写系统镜像JetsonNano是一款形状、外接口类似于树莓派的嵌入式主板,搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA
CUDA
核心的NVIDIAMaxwell
C君莫笑
·
2023-12-04 06:03
代码管控
YOLO
解决办法:gpu显卡不能用tf.test.is_gpu_available() 显示false
tf.test.is_gpu_available()显示false打开cmd输入ipython进入ipython环境输入“importtensorflowastf”提示错误:Couldnotloaddynamiclibrary‘
cuda
rt64
xuanxi
·
2023-12-04 05:26
2021-01-24
如果是CPU的这样就行,但好多训练是借助于GPU的,还得安装
CUDA
这个我没试过。这个对电脑配置要求比较高。我是在云主机上运行的,计算速度比自己的电脑快,而且有些平台提供免费的GPU。
ee6572fb2619
·
2023-12-04 01:43
synxflow 安装环境
介绍:该软件可以动态模拟洪水淹没,滑坡跳动和泥石流使用多个
cuda
支持的gpu。它还提供了一个用户友好但多功能的Python界面,可以完全集成到数据科学工作流程中,旨在简化和加速危害风险评估任务。
王小葱鸭
·
2023-12-04 00:17
python
synxflow
nn.dropout 导致报错 one of the variables needed for gradient computation has been modified...
RuntimeError:oneofthevariablesneededforgradientcomputationhasbeenmodifiedbyaninplaceoperation:[torch.
cuda
.FloatTensor
微凉的衣柜
·
2023-12-04 00:07
深度学习
深度学习
pytorch
python
VS2017 +
CUDA
11.0配置
CUDA
应用程序,成功编译但结果不正确解决方案
本人参考《基于GPU加速的计算机视觉编程》配置好
CUDA
11.0的vs2017开发环境,创建了项目,并编译以下代码:#include#include#include#include//Definitionofkernelfunctiontoaddtwovariables
微凉的衣柜
·
2023-12-04 00:06
深度学习
软件开发
c语言
c++
cuda
libtorch1.8.1,
cuda
10.2+vs2017+Qt5.9.9安装配置
安装libtorch快被折磨疯了,终于可以在Qt窗口程序中集成训练好的模型了。此处记录配置过程中的坑。各位老铁在配置的过程中有任何经验心得也一定要写下来啊,让我们一起战胜这该死的环境配置。本文主要参考https://blog.csdn.net/qq_41375318/article/details/110556350。该教程在b站上还有对应的视频。如果第一次配置libtorch,可以先看看视频教程
微凉的衣柜
·
2023-12-04 00:36
深度学习
软件开发
c++
人工智能
pytorch
深度学习
libtorch
cuda
推理时间测量
主要需要解决一个GPU热身问题和
cuda
CPU同步问题。
微凉的衣柜
·
2023-12-04 00:06
深度学习
c++
深度学习
使用docker切换任意版本
cuda
使用GPU
但是,运行代码的过程中,存在匹配的问题:1.不同的版本的tensorflow-gpu或pytorch对
cuda
版本的适配也不一样。
挽 阳
·
2023-12-03 23:15
付费服务
docker
容器
运维
BEVFormer环境配置
参考一些博客以及官方安装教程后(blog1,blog2),安装过程如下:P.S.
cuda
版本是11.3,安装pytorch版本要对应,以及后面安装包也要对应
指间理想
·
2023-12-03 23:47
python
人工智能
Langchain-Chatchat的安装过程
等多款主流LLMs+多款embe_一个处女座的程序猿的博客-CSDN博客1、安装过程中出现了GPU驱动版本是11.8而python-c"importtorch;print(torch.version.
cuda
wangqiaowq
·
2023-12-03 21:31
langchain
pytorch TensorRT 官方例子
1、common.pyfromitertoolsimportchainimportargparseimportosimportpy
cuda
.driveras
cuda
importpy
cuda
.autoinitimportnumpyasnpimporttensorrtastrttry
DYF-AI
·
2023-12-03 20:58
学习新知识
使用numba
cuda
加速Python运算
使用numba
cuda
加速Python运算1.随机数生成2.numbanjit与numba
cuda
性能的比较2.1scipy实现2.2个人编程实现2.3numbanjit实现2.4numba
cuda
实现参考文献习惯了
L1_Zhang
·
2023-12-03 20:57
cuda开发
python
python
numba
cuda
torch.nn.DataParallel保存,单GPU加载
GPU训练的设置torch.nn.DataParallel保存,单GPU加载1.torch.nn.DataParallel保存,多GPU加载保存torch.nn.DataParallel(model).
cuda
zhaosuyuan
·
2023-12-03 19:05
torch
pytorch
深度学习
基于AI模型实现行政区识别
pytorch环境搭建下载pytorch与
CUDA
会快一些,在本地下载好了pytorch的whl文件后,直接在下载目录中打开cmd窗口,使用pipinstallxxxx.whl安装pytorch即可。
softshow1026
·
2023-12-03 19:33
人工智能
一个完整的
cuda
动态链接库工程 01记
0.思路为了能把理念说通,使用了stepbystep的方式,一步步迭代会觉得比较合理。源代码从nv官方vectorAdd改过来的。step1,单cu文件的可执行文件版本源代码main_app.cu#include#includetemplate__global__voidvector_square_add(T*A,T*B,T*C,intn){inti=blockDim.x*blockIdx.x+t
Eloudy
·
2023-12-03 18:51
算法
Linux
cuda
一个完整的
cuda
动态链接库工程 02记
step3,两个API函数的动态链接库Makefile版本对比之前的文件树:现在的文件树:添加了3个新文件,修改了4个旧文件,其中include/ic_add.h其实可以改成icmm.h,作为整个sharedlibrary被调用的头文件。现将新文件和更改的文件罗列如下:gpu/sub.cu#include#include__global__voidvector_sub_kernel(float*A
Eloudy
·
2023-12-03 18:18
linux
运维
服务器
Pytorch .numpy(), .item(), .detach(), .cpu(), .
cuda
(), .tensor(), .as_tensor(), Tensor(), .clone(),
Pytorch中有以下这么多命令涉及到tensor和numpy之间的转化:.numpy(),.item(),.detach(),.cpu(),.
cuda
(),.tensor(),.as_tensor()
Ordgod_new
·
2023-12-03 13:19
python学习
pytorch
dlib的安装或者运行错误
配置:windows11,python3.8,
cuda
11.7尝试了许多方法,包括1.下载cudnn放在
cuda
文件夹;2.卸载重装dlib;3.根据stackflow的大佬的方法进行修改;4.查看dlib
无风起波澜
·
2023-12-03 11:54
python
Safe and Practical GPU Computation in TrustZone论文阅读笔记
Session2A-GPUReplay:A50-KBGPUStackforClientML-YouTubeGPU软件栈:概念:"GPU软件栈"指的是与GPU硬件相关的全部软件组件,通常包括GPU驱动程序、
CUDA
Blanche117
·
2023-12-03 09:37
论文阅读笔记
论文阅读
笔记
深度学习(三):pytorch搭建卷积神经网络
1.常用函数介绍0设备准备device=torch.device("
cuda
:0"iftorch.
cuda
.is_available()else"cpu")这行代码是用来选择设备的,根据是否有可用的
CUDA
从零开始的奋豆
·
2023-12-03 08:30
深度学习
深度学习
pytorch
cnn
2018-05-10
cuda
报错处理
cuda
报错大早上的跑程序,发现failedcalltocuInit:
CUDA
_ERROR_UNKNOWN程序找不到
cuda
了。。
hyhchaos
·
2023-12-03 06:33
模型实验代码技巧
1234os.environ['PYTHONHASHSEED']=str(seed)random.seed(seed)np.random.seed(seed)torch.manual_seed(seed)torch.
cuda
.manual_seed
贪钱算法还我头发
·
2023-12-03 03:00
#
Deep
Learning
AI
pytorch
深度学习
python
conda环境下numpy模块ValueError: setting an array element with a sequence.问题解决
1问题描述[Info]Using
cuda
forinference.
智慧医疗探索者
·
2023-12-03 01:14
AI运行环境
conda
numpy
conda环境下Intel MKL FATAL ERROR: cannot load libmkl_vml_avx512.so.1 or libmkl_vml_def.so.1.问题解决
1问题描述[Info]Using
cuda
forinference.
智慧医疗探索者
·
2023-12-03 01:14
AI运行环境
conda
mkl
【深度学习】深度学习框架的环境配置
目录1.配置
cuda
环境1.1.安装
cuda
和cudnn1.1.1.显卡驱动配置1.1.2.下载安装
cuda
1.1.3.下载cudnn,将解压后文件复制到
cuda
目录下1.2.验证是否安装成功2.配置conda
盛世隐者
·
2023-12-03 00:28
深度学习
深度学习
CutMix的代码
F.cross_entropy(pred,y_b)defmixup_data(x,y,alpha):lam=np.random.beta(alpha,alpha)index=torch.randperm(x.size(0)).
cuda
Dream Algorithm
·
2023-12-02 22:14
python
深度学习
pytorch
Linux Jellyfin 硬解4K HEVC HDR报错,“该客户端与媒体不兼容,服务器未发送兼容的媒体格式”
此项需要对应的OpenCL或
CUDA
运行库。解决方法:关闭色调映射。视频可以正常播放,缺点:
百度CV程序员
·
2023-12-02 19:11
linux
媒体
ffmpeg
FlowNet2 30系显卡
cuda
11.1 编译
FlowNet230系显卡
cuda
11.1编译:https://blog.csdn.net/qq_24002549/article/details/120114046
Zero_to_zero1234
·
2023-12-02 17:49
python
监控系统与gpu调用
watch-n1nvidia-smiarm架构下的torch安装1.查看arm域控
cuda
版本nvcc-V出现
cuda
版本
cuda
已完成安装2.下载archcondaa)命令shArchiconda3-
白云千载尽
·
2023-12-02 16:56
python
ros
torch
tensorflow-gpu1.15 + win11 + RTX 4050环境配置
组了一套,不知道行不行windows11GPURTX4050python3.7.12tensorflow-gpu1.15.0
cuda
toolkit10.0.130cudnn7.6.5Keras2.3.1
xiaohuoma7620
·
2023-12-02 14:37
python
tensorflow
人工智能
python
conda 安装指定Version的指定Build
入下图,我想装cudnn的7.6.5的指定Build版本
cuda
10.0_0应该使用如下命令:mambainstallcudnn=7.6.5=
cuda
10.0_0没有mamba用condainstall
xiaohuoma7620
·
2023-12-02 14:35
python
conda
python
Pytorch——多卡GPU训练与单卡GPU训练相互切换
多卡训练1.1修改配置文件1.2修改主训练文件1.3显卡使用情况二、单卡训练2.1修改配置文件2.2显卡使用情况三、总结一、多卡训练1.1修改配置文件1.2修改主训练文件上面红框中代码解析:iftorch.
cuda
.is_available
佐咖
·
2023-12-02 14:07
Pytorch
深度学习
pytorch
人工智能
python
编译代码性能优化实践:理解循环展开(pragma unroll)
引言:
CUDA
的矩阵乘优化经常见到pragmaunroll的使用,本文通过简单的示例,展示了CPU和
CUDA
对循环展开前后的性能表现,来通俗理解循环展开的优化策略。一、什么是循环展开?
Briwisdom
·
2023-12-02 13:13
性能测试
性能优化
编译器
pragma
unroll
CUDA
循环展开
cuda
在 torch神经网络中哪些地方可以用?
简言之,3部分:1、数据data可以放在GPU上2、网络net可以放在GPU上3、损失函数loss可以放在GPU上
CUDA
可以用于在torch神经网络中进行GPU加速计算,包括模型的训练和推理过程。
高山莫衣
·
2023-12-02 12:26
pytorch
神经网络
深度学习
pytorch
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他