E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU&CUDA
修改predict实现acc计算
importosimportjsonimporttorchfromPILimportImagefromtorchvisionimporttransformsimportmatplotlib.pyplotaspltfrommodelimportefficientnet_b0ascreate_modeldefmain():device=torch.device("
cuda
yyfhq
·
2023-10-22 14:24
图像分类
python
NVIDIA NCCL 源码学习(一)- 初始化及ncclUniqueId的产生
NCCL是英伟达开源的GPU通信库,支持集合通信和点对点通信看下官方给的一个demo#include#include"
cuda
_runtime.h"#include"nccl.h"#include"mpi.h
KIDGINBROOK
·
2023-10-22 13:42
nccl
nccl
gpu
cuda
NVIDIA NCCL 源码学习(九)- 单机内ncclSend和ncclRecv的过程
#include#include"
cuda
_runtime.h"#include"ncc
KIDGINBROOK
·
2023-10-22 13:42
nccl
nccl
gpu
cuda
nvcc -V和nvidia-smi的关系
nvcc-V:nvcc是NVIDIA
CUDA
编译器的命令,用于获取
CUDA
工具包的版本信息。
重剑DS
·
2023-10-22 12:36
杂项
深度学习
深度学习
笔记
nvcc
-V
nvidia-smi
Linux & Windows 的Tensorflow 配置: Nvidia 老显卡运算能力低于3.0
实测成功配置信息1:Windows10,GT755m,Capability3.0Ana(Mini)conda管理,环境Python3.6(.13)
Cuda
=9.0Cudnn=7.0Tensorflow_gpu
Zhenghaowencsdn
·
2023-10-22 10:14
tensorflow
问题记录:GPU显卡提高后,代码总体运行效率没有提高
问题:GPU显卡提高后,代码总体运行效率没有提高原先显卡NIVIDAT400换成NVIDIARTXA4000,
CUDA
核心(物理GPU线程单位)从三百多提升到了六千多,但是程序总体运行的时间没有变化。
魔法自动机
·
2023-10-22 10:43
GPU编程
GPU
CUDA
nvprof
nvvp
CUDA
学习笔记(LESSON5)——GPU优化
CUDA
系列笔记
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
CUDA
学习笔记(LESSON3)——GPU基本算法(PartI)
CUDA
学习笔记(LESSON4)——GPU基本算法
Veropatrinica
·
2023-10-22 06:25
CUDA
GPU
CUDA编程
并行计算
优化
APOD
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
最近在看视频拼接的代码,师兄说要用
CUDA
加速,于是开始学习
CUDA
编程,课程链接:UdacityCS344
CUDA
系列笔记
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
CUDA
学习笔记
Veropatrinica
·
2023-10-22 06:24
CUDA
GPU
CUDA编程
并行计算
thread
kernel
CUDA
学习笔记(六)Warp解析
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:54
学习
笔记
CUDA
学习笔记(四)device管理
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:24
学习
笔记
cuda
学习笔记
一、
cuda
的替代选择OpenCL:允许使用多种计算设备的开放标准,计算设备可以是GPU,CPU或者其他存在OpenCL驱动程序的专业设备DirectCompute:微软开发的可替代
Cuda
和OpenCl
renlubo-qingdao
·
2023-10-22 06:24
学习
CUDA
学习笔记(三)
CUDA
简介
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:53
学习
笔记
【
CUDA
编程】学习笔记(二) GPU硬件架构
一、CPU与GPU的链接模型在计算机的硬件架构中,CPU与GPU有多种链接模式,下面介绍几种典型的架构北桥多CPU(SMP)多CPU(NUMA)多CPU(NUMA)多总线具有集成PCIExpress的多CPU集成GPU集成GPU与独立GPU多个插槽中的GPU多GPU板简化了CPU/GPU架构二、开普勒架构下面这张图是各代GPU架构的迭代顺序,目前最新的架构是Turing开普勒微架构以GTX680为
Swocky
·
2023-10-22 06:21
CUDA编程
GPU
NVIDIA
Kepler
Fermi
CUDA
编程模型与GPU硬件结构关系
目录一、
CUDA
编程模型1、线程管理2、内存管理二、GPU硬件结构1、SM硬件2、硬件逻辑抽象2.1共享内存的逻辑划分2.2寄存器的逻辑划分2.3GPU内存分级3、
CUDA
程序的一些优化点3.1一个core
Hunter_pcx
·
2023-10-22 06:50
工程技能
人工智能
python
深度学习
CUDA
并行程序设计 GPU硬件架构与线程 学习笔记
GPU硬件架构GPU实际上是一个SM的阵列,每个SM包含若干个SP。一个SP可以执行一个thread,但是实际上并不是所有的thread能够在同一时刻执行。Nvidia把32个threads组成一个warp,warp是调度和运行的基本单元。warp中所有threads并行的执行相同的指令。一个warp需要占用一个SM运行,多个warps需要轮流进入SM。由SM的硬件warpscheduler负责调
Morizen
·
2023-10-22 06:50
并行计算
Cuda
多线程
cuda
gpu
并行计算
硬件
CUDA
学习笔记(五)GPU架构
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:17
学习
笔记
架构
ubuntu +
cuda
+tensorflow
installNVIDIAdriverinstalldriverbyapt-get(ref),withaVPNtoturnovertheGFWsudoapt-getpurgenvidia*sudoadd-apt-repositoryppa:graphics-driverssudoapt-getupdatesudoapt-cachesearchnvidiasudoapt-getinstallnvid
youngblood_5ceb
·
2023-10-22 04:53
FunASR安装
condacreate-nfunasrpython=3.8condaactivatefunasr安装pytorchtorchaudio等condainstallpytorch=1.12.1torchvisiontorchaudio
cuda
toolkit
weixin_43870390
·
2023-10-22 00:47
深度学习
pytorch
服务器重装Nvidia驱动
Cuda
步骤
由于服务器上多个用户都已经安装了多个不同版本的
cuda
,而这些不同版本的
cuda
全都依赖于之前安装的nvidia驱动,现在面临这着两个窘境:1、可能直接重新安装一下先前版本的nvidia驱动就直接可以解决问题
Seaton
·
2023-10-21 23:22
CUDA
编程- 瓦片(Tiling)技术
瓦片(Tiling)技术是
CUDA
编程中的一个常见策略,用于优化内存访问模式,特别是在矩阵乘法这类计算密集型操作中。
青衫客36
·
2023-10-21 22:27
CUDA
CUDA
编程- __syncthreads()函数
基本概念__syncthreads()是
CUDA
编程中非常关键的一个同步原语。它的功能是确保在某个线程块中的所有线程在执行到这个函数之前都已完成它们之前的所有指令。
青衫客36
·
2023-10-21 22:27
算法
CUDA
【
CUDA
】nvcc和nvidia-smi显示的版本不一致?
Date:2020/11/22Coder:CWForeword:CW近日在自己的机子上发现,nvcc--version和nvidia-smi显示出来的
CUDA
版本不一致,其中前者显示的版本是10.2,而后者是
CW不要无聊的风格
·
2023-10-21 19:32
Pytorch与
CUDA
对应关系
参考这篇文章的情况1即可解决!:ModuleNotFoundError:Nomodulenamed‘torch‘
阿维的博客日记
·
2023-10-21 17:10
pycharm
pytorch
python
ROS学习记录
ROS学习记录1.系统环境Ubuntu16.04
CUDA
10.2cudnn7.6.5TensorRT7.1.3.4奥比中光astra-mini摄像头2.ROS系统路径/root/catkin_ws3.相关指令
Alex-Leung
·
2023-10-21 14:58
ROS
ros
cuda
PyTorch
1.GPU对应的
CUDA
版本nvidia-smi
CUDA
Version:12.2GPUdiver大于
cuda
toolkit,pytorch版本根据
cuda
toolkit2.查看nvcc的版本(即
cuda
toolkit
破壁者-燕
·
2023-10-21 07:24
pytorch
人工智能
python
widnows安装audiocraft
首先查看
cuda
版本如何安装
cuda
,可以自行搜索获取程序可以进入这个地址https://github.com/facebookresearch/audiocraft.git,下载源码,并进行安装如果配置不成功
小~小
·
2023-10-21 04:52
人工智能
音乐
audiocraft
YOLOV4在Windows10下训练
软件环境:WIN10,
CUDA
10.1,CUDNN8.0.3,python3.7,VS2017,OpenCV4.4.0硬件环境:GTX10606G
CUDA
:https://developer.nvidia.com
XXX_UUU_XXX
·
2023-10-21 03:47
深度学习
深度学习
YOLOv4
Windows训练YOLOv4
GCC 安装 (Linux + 非root)
非root用户安装于
cuda
版本相对应的gcc降低或升高服务器上的GCC版本报错:configure:error:BuildingGCCrequiresGMP4.2+,MPFR2.4.0+andMPC0.8.0
spring_willow
·
2023-10-21 03:36
GCC
g++
非root
【非root用户、CentOS系统】中使用源码安装gcc/g++的教程
1.引言系统:CentOS-7.9显卡驱动版本:460
CUDA
Version:11.2基于本地环境选择安装gcc-10.1.0gcc下载网址gcc与
cuda
版本的对应关系:2.安装说明下载好对应的gcc
菜鸟的追梦旅行
·
2023-10-21 02:30
环境配置
centos
python
搭建Pytorch环境(GPU版本,含
CUDA
、cuDNN),并在Pycharm上使用(零基础小白向)
VS2019https://visualstudio.microsoft.com/zh-hans/vs/older-downloads/登录需要用户名和密码安装的时候要勾选使用C++的桌面开发文章目录前言一、安装
CUDA
1
GIS从业者
·
2023-10-21 02:57
python
pytorch
pycharm
人工智能
1.pytorch中的dir()函数和help()函数
pytorch中的dir函数和help函数1.理解2.实践1.理解2.实践dir(torch)dir(torch.
cuda
)dir(torch.
cuda
.is_available)help(torch.
cuda
.is_available
zx428621
·
2023-10-21 00:49
pytorch学习
pytorch
深度学习
机器学习
docker内MPI调试技巧xterm -e gdb调试python
mpirunxterm-egdbmpirun-np2-tag-output-output-filename.result-x
CUDA
_VISIBLE_DEVICES=2,3-mcapmlob1-mcabtl
gb_QA_log
·
2023-10-20 23:53
安装
cuda
-toolkit
nvcc-V提示commandnotfound,usr/local下没有
cuda
目录,
CUDA
_HOMEenvironmentvariableisnotset解决方案:sudoapt-getinstallnvidia-
cuda
-toolkit
最爱那个微笑的麦蒂
·
2023-10-20 21:57
工程问题记录
[深度学习]OSError:
CUDA
_HOME environment variable is not set. Please set it to your
CUDA
install root.
As
cuda
installedthroughanacondaisnottheentirepackage.Pleaseinstall
cuda
driversmanuallyfromNvidiaWebsite
溡沭
·
2023-10-20 21:55
深度学习
人工智能
python
cannot find -l****问题的解决办法
在ubuntu下编译C或cpp文件时,可能会出现找不到链接库的问题,其形式为:cannotfind-l****如下所示:我在自己电脑上出现的错误就是找不到以下库cannotfind-l
cuda
rtcannotfind-lnppccannotfind-lnppicannotfind-lnppccannotfind-lnpps
lvhaidong520
·
2023-10-20 20:57
linux
debian
centos
小白入手Tensorflow-gpu==2.10.0安装教程(最新教程23/8/8.N卡驱动.windows.)
tensorflow官方信息Note:GPUsupportonnative-Windowsisonlyavailablefor2.10orearlierversions,startinginTF2.11,
CUDA
buildisnotsupportedforWindows.ForusingTensorFlowGPUonW
YYaung
·
2023-10-20 14:47
人工智能
tensorflow
windows
人工智能
python
深度学习
CUDA
学习笔记5——
CUDA
程序错误检测
CUDA
程序错误检测所有
CUDA
的API函数都有一个类型为
cuda
Error_t的返回值,代表了一种错误信息;只有返回
cuda
Success时,才是成功调用。
阿卡蒂奥
·
2023-10-20 14:08
CUDA
学习
笔记
CUDA
your
cuda
software stack is old.we fall back to the NIVIDIA driver for some compilation. Update your
报错信息:your
cuda
softwarestackisold.wefallbacktotheNIVIDIAdriverforsomecompilation.Updateyour
CUDA
versiontogetthebestperformance.Theptxaserrorwas
JACOBWHY
·
2023-10-20 13:45
python
深度学习
深度学习
pytorch
python
tensorflow
人工智能
安装mmcv及GPU版本的pytorch及torchvision
cu111torchvision==0.10.1+cu111torchaudio==0.9.1-fhttps://download.pytorch.org/whl/torch_stable.html注意:以上适用
cuda
11.1
monster&&summit
·
2023-10-20 12:33
系统及环境配置
pytorch
人工智能
python
CUDA
编程入门系列(九)
CUDA
程序执行与硬件映射
2.GPU硬件的一个核心组件时SM,streamingmultiprocessor流式多处理器3.SM的核心组件包括
CUDA
核心即SP,共享内存,寄存器等,SM可以并发地执行数百个线程,并发能力取决于SM
我来了!!!
·
2023-10-20 04:46
硬件架构
CUDA
编程入门系列(七) GPU内存如何管理
一、内存使用1.
CUDA
程序会使用GPU内存与CPU内存2.CPU内存的分配与释放是标准的,例如new和delete,malloc与free3.GPU上内存涉及分配和释放使用
CUDA
提供的库函数实现4.
我来了!!!
·
2023-10-20 04:16
人工智能
CUDA
编程入门系列(八) 内存管理示例代码
[tid]+=1;}intmain(){intN=32;intnbytes=N*sizeof(FLOAT);FLOAT*dx=NULL,*hx=NULL;inti;/*allocateGPUmem*/
cuda
Malloc
我来了!!!
·
2023-10-20 04:16
硬件架构
CUDA
编程入门系列(二) GPU硬件架构综述
一、FermiGPUFermiGPU如下图所示,由16个SM(streammultiprocessor)组成,不同的SM之间通过L2Cache和全局内存进行相连。整个架构大致分为两个层次,①总体架构由多个SM组成②每个SM由多个SPcore(streamprocessor)组成。SP之间通过互连的网络和L1Cache和WarpScheduler等结构进行相连。二、GT200体系架构下图为GT200
我来了!!!
·
2023-10-20 04:14
硬件架构
python
人工智能
ubuntu18.04 RTX3060 rangnet++训练
代码链接:https://github.com/PRBonn/lidar-bonnetal安装anaconda环境为
CUDA
11.0(11.1也可以)anaconda环境如下numpy==1.17.2torchvision
Nico_J ??
·
2023-10-20 02:50
slam
深度学习
激光雷达
编译[Bug]——too few arguments for template template parameter “Tuple“ detected
项目场景:当使用高版本的
cuda
去安装低版本pytorch,并且编译用低版本pytorch写的
cuda
算子时,或者说是VS的版本过高如2022和2019,都有可能会出现某个.h文件或者.c文件报错,如:
lzzzzzzm
·
2023-10-20 02:42
Debug
Debug
bug
win10下
CUDA
9.0 + CuDNN7.0.5 安装回顾
但是由于tensorflow最近更新了,
CUDA
8.0不能支持,得改用
CUDA
9.0。而网上资料对应的是老版本tensorflow,只支持
CUDA
8.0上,结果走了不少弯路。
潇萧客
·
2023-10-20 02:53
计算机视觉
深度学习
ModuleNotFoundError: No module named ‘torch‘
目录情况1,真的没有安装pytorch情况2(安装了与
CUDA
不对应的pytorch版本导致无法识别出torch)情况1,真的没有安装pytorch虚拟环境里面真的是没有torch,这种情况就easyjob
阿维的博客日记
·
2023-10-20 01:42
pycharm
torch
深度学习YOLOv4环境配置
软件安装1、什么是
CUDA
CUDA
(ComputeUnifiedDeviceArchitecture),是显卡厂商NVIDIA推出的运算平台。
大块奶酪----
·
2023-10-20 01:36
yolov4
目标检测
YOLO
人工智能
ubuntu20.04卸载
cuda
11.4重装
cuda
11.0
目前
CUDA
版本为11.4。
wzg2016
·
2023-10-19 22:43
ubuntu
ffmpeg解码
本文分别介绍软解和硬解两种方式,同时将获取的每一帧,转换成二进制或者图片格式本文只是介绍如何解码,硬解码,这个类中将每一帧转换成二进制格式,然后存放到队列中,注意硬解码需要安装
cuda
,百度一下你就知道
Li丶Chong
·
2023-10-19 19:03
QT
qt
ffmpeg
上一页
37
38
39
40
41
42
43
44
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他