E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
CUDA并行编程
LeNet(pytorch实现
数据集上进行测试,允许使用GPU计算在这里插入代码片importtorchfromtorchimportnn,optimimportd2lzh_pytorchasd2ldevice=torch.device('
cuda
'iftorch.
cuda
.is_available
平平平安喔
·
2023-10-23 02:21
pytorch
python
人工智能
【模型推理学习笔记】
cuda
基础操作 -向量相加和元素相乘
https://mp.weixin.qq.com/s/Izsg-mLZIfjyNtWlDgaWnQ两个向量相加(1)//Kerneldefinition__global__voidVecAdd(float*A,float*B,float*C){inti=threadIdx.x;C[i]=A[i]+B[i];}intmain(){...//KernelinvocationwithNthreadsVe
Go 鹏ya
·
2023-10-22 23:17
cuda
推理优化
并行计算
学习
笔记
openCV的
CUDA
GPU 版本安装 (Ubuntu windows 通用)
需要做templatematch,比较注重时间,因此opencv的普通版本不适用。需要用GPU的。下载gitclonehttps://github.com/opencv/opencv.gitgitclonehttps://github.com/opencv/opencv_contrib.git确保准备好以下内容1:visualstudio(不是vscode)2:下载后的两个包裹会放在以下结构这样放
EmoC001
·
2023-10-22 23:59
opencv
人工智能
计算机视觉
CUDA
学习笔记(八)Branch Divergence and Unrolling Loop
AvoidingBranchDivergence有时,控制流依赖于thread索引。同一个warp中,一个条件分支可能导致很差的性能。通过重新组织数据获取模式可以减少或避免warpdivergence(该问题的解释请查看warp解析篇)。TheParallelReductionProblem我们现在要计算一个数组N个元素的和。这个过程用CPU编程很容易实现:intsum=0;for(inti=0;
我来了!!!
·
2023-10-22 22:24
学习
笔记
CUDA
学习笔记(二)
CUDA
简介
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
CUDA
是并行计算的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样。
我来了!!!
·
2023-10-22 22:20
学习
笔记
Anaconda下载、安装、使用教程
使用教程创建环境查看当前存在的虚拟环境激活环境退出环境删除环境镜像加速配置conda镜像pip镜像临时使用长期使用WindowsLinux&&WSL工具升级升级conda升级pip高级应用整体环境迁移环境更新环境克隆深度学习GPU加速
cuda
kit
Walden-2020
·
2023-10-22 19:46
WSL
深度学习环境搭建
linux
python
ubuntu
动手学深度学习-准备工作-利用WSL2安装Ubuntu系统并搭建深度学习环境
Windows功能1.2下载ubuntu1.3更新内核2.深度学习环境搭建2.1安装miniconda2.1.1创建虚拟环境2.1.2激活环境2.2安装英伟达驱动2.3安装pytorch测试是否安装成功2.4安装
cuda
库行僧
·
2023-10-22 19:14
pytorch
深度学习
python
ubuntu
【WSL2笔记2】 搭建深度学习开发环境踩坑笔记
管理各环境)1.1创建软件下载目录1.2安装Anaconda1.3错误的画蛇添足2、NVIDIADriver(系统级-各环境共享)2.1官网2.2安装win10版本NVIDIA驱动2.3查看Nvidia-
cuda
老富2012
·
2023-10-22 19:43
Ubuntu
深度学习
python
ubuntu
pytorch
tensorflow
【2023 · CANN训练营第一季】——Ascend C算子开发入门——第三次课
不同于采用Python的DSL和TIK方式,AscendC使用C/C++作为前端语言的算子开发工具,通过四层接口抽象、
并行编程
范式、孪生调试等技术,极大提高了算子的开发效率,助力AI开发者低成本完成算子开发和模型调优部署
大姚_54022960
·
2023-10-22 18:42
人工智能
【2023 · CANN训练营第一季】昇腾AI高阶课(Ascend C算子开发入门-第一章)学习笔记
昇腾AI高阶课AscendC算子开发入门AscendC介绍使用c/c++作为前端语言的算子开发工具四层接口抽象、
并行编程
范式、孪生调试等技术使用c/c++愿语编程编程模型屏蔽硬件差异,编程范式提高开发效率多层级
仰望星YJ光J
·
2023-10-22 18:31
c++
人工智能
学习
C++命名空间namespace的使用
C++中命名空间namespace有点像文件夹意思,比如我在一个头文件myhead.h中做了一个如下声明与定义:namespacelis{namespace
cuda
{intb=8;}}那么其他文件如果想使用
骑码找马
·
2023-10-22 16:09
C++
CUDA
学习笔记(七)Kernel性能调节
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 15:22
学习
笔记
修改predict实现acc计算
importosimportjsonimporttorchfromPILimportImagefromtorchvisionimporttransformsimportmatplotlib.pyplotaspltfrommodelimportefficientnet_b0ascreate_modeldefmain():device=torch.device("
cuda
yyfhq
·
2023-10-22 14:24
图像分类
python
NVIDIA NCCL 源码学习(一)- 初始化及ncclUniqueId的产生
NCCL是英伟达开源的GPU通信库,支持集合通信和点对点通信看下官方给的一个demo#include#include"
cuda
_runtime.h"#include"nccl.h"#include"mpi.h
KIDGINBROOK
·
2023-10-22 13:42
nccl
nccl
gpu
cuda
NVIDIA NCCL 源码学习(九)- 单机内ncclSend和ncclRecv的过程
#include#include"
cuda
_runtime.h"#include"ncc
KIDGINBROOK
·
2023-10-22 13:42
nccl
nccl
gpu
cuda
nvcc -V和nvidia-smi的关系
nvcc-V:nvcc是NVIDIA
CUDA
编译器的命令,用于获取
CUDA
工具包的版本信息。
重剑DS
·
2023-10-22 12:36
杂项
深度学习
深度学习
笔记
nvcc
-V
nvidia-smi
Linux & Windows 的Tensorflow 配置: Nvidia 老显卡运算能力低于3.0
实测成功配置信息1:Windows10,GT755m,Capability3.0Ana(Mini)conda管理,环境Python3.6(.13)
Cuda
=9.0Cudnn=7.0Tensorflow_gpu
Zhenghaowencsdn
·
2023-10-22 10:14
tensorflow
问题记录:GPU显卡提高后,代码总体运行效率没有提高
问题:GPU显卡提高后,代码总体运行效率没有提高原先显卡NIVIDAT400换成NVIDIARTXA4000,
CUDA
核心(物理GPU线程单位)从三百多提升到了六千多,但是程序总体运行的时间没有变化。
魔法自动机
·
2023-10-22 10:43
GPU编程
GPU
CUDA
nvprof
nvvp
CUDA
学习笔记(LESSON5)——GPU优化
CUDA
系列笔记
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
CUDA
学习笔记(LESSON3)——GPU基本算法(PartI)
CUDA
学习笔记(LESSON4)——GPU基本算法
Veropatrinica
·
2023-10-22 06:25
CUDA
GPU
CUDA编程
并行计算
优化
APOD
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
最近在看视频拼接的代码,师兄说要用
CUDA
加速,于是开始学习
CUDA
编程,课程链接:UdacityCS344
CUDA
系列笔记
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
CUDA
学习笔记
Veropatrinica
·
2023-10-22 06:24
CUDA
GPU
CUDA编程
并行计算
thread
kernel
CUDA
学习笔记(六)Warp解析
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:54
学习
笔记
CUDA
学习笔记(四)device管理
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:24
学习
笔记
cuda
学习笔记
一、
cuda
的替代选择OpenCL:允许使用多种计算设备的开放标准,计算设备可以是GPU,CPU或者其他存在OpenCL驱动程序的专业设备DirectCompute:微软开发的可替代
Cuda
和OpenCl
renlubo-qingdao
·
2023-10-22 06:24
学习
CUDA
学习笔记(三)
CUDA
简介
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:53
学习
笔记
【
CUDA
编程】学习笔记(二) GPU硬件架构
一、CPU与GPU的链接模型在计算机的硬件架构中,CPU与GPU有多种链接模式,下面介绍几种典型的架构北桥多CPU(SMP)多CPU(NUMA)多CPU(NUMA)多总线具有集成PCIExpress的多CPU集成GPU集成GPU与独立GPU多个插槽中的GPU多GPU板简化了CPU/GPU架构二、开普勒架构下面这张图是各代GPU架构的迭代顺序,目前最新的架构是Turing开普勒微架构以GTX680为
Swocky
·
2023-10-22 06:21
CUDA编程
GPU
NVIDIA
Kepler
Fermi
CUDA
编程模型与GPU硬件结构关系
目录一、
CUDA
编程模型1、线程管理2、内存管理二、GPU硬件结构1、SM硬件2、硬件逻辑抽象2.1共享内存的逻辑划分2.2寄存器的逻辑划分2.3GPU内存分级3、
CUDA
程序的一些优化点3.1一个core
Hunter_pcx
·
2023-10-22 06:50
工程技能
人工智能
python
深度学习
CUDA
并行程序设计 GPU硬件架构与线程 学习笔记
GPU硬件架构GPU实际上是一个SM的阵列,每个SM包含若干个SP。一个SP可以执行一个thread,但是实际上并不是所有的thread能够在同一时刻执行。Nvidia把32个threads组成一个warp,warp是调度和运行的基本单元。warp中所有threads并行的执行相同的指令。一个warp需要占用一个SM运行,多个warps需要轮流进入SM。由SM的硬件warpscheduler负责调
Morizen
·
2023-10-22 06:50
并行计算
Cuda
多线程
cuda
gpu
并行计算
硬件
CUDA
学习笔记(五)GPU架构
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:17
学习
笔记
架构
ubuntu +
cuda
+tensorflow
installNVIDIAdriverinstalldriverbyapt-get(ref),withaVPNtoturnovertheGFWsudoapt-getpurgenvidia*sudoadd-apt-repositoryppa:graphics-driverssudoapt-getupdatesudoapt-cachesearchnvidiasudoapt-getinstallnvid
youngblood_5ceb
·
2023-10-22 04:53
FunASR安装
condacreate-nfunasrpython=3.8condaactivatefunasr安装pytorchtorchaudio等condainstallpytorch=1.12.1torchvisiontorchaudio
cuda
toolkit
weixin_43870390
·
2023-10-22 00:47
深度学习
pytorch
服务器重装Nvidia驱动
Cuda
步骤
由于服务器上多个用户都已经安装了多个不同版本的
cuda
,而这些不同版本的
cuda
全都依赖于之前安装的nvidia驱动,现在面临这着两个窘境:1、可能直接重新安装一下先前版本的nvidia驱动就直接可以解决问题
Seaton
·
2023-10-21 23:22
CUDA
编程- 瓦片(Tiling)技术
瓦片(Tiling)技术是
CUDA
编程中的一个常见策略,用于优化内存访问模式,特别是在矩阵乘法这类计算密集型操作中。
青衫客36
·
2023-10-21 22:27
CUDA
CUDA
编程- __syncthreads()函数
基本概念__syncthreads()是
CUDA
编程中非常关键的一个同步原语。它的功能是确保在某个线程块中的所有线程在执行到这个函数之前都已完成它们之前的所有指令。
青衫客36
·
2023-10-21 22:27
算法
CUDA
线程同步辅助类CyclicBarrier
CyclicBarrier是一个可重置的多路同步点,在某些
并行编程
风格中很有用。
SummerChillCoder
·
2023-10-21 19:14
【
CUDA
】nvcc和nvidia-smi显示的版本不一致?
Date:2020/11/22Coder:CWForeword:CW近日在自己的机子上发现,nvcc--version和nvidia-smi显示出来的
CUDA
版本不一致,其中前者显示的版本是10.2,而后者是
CW不要无聊的风格
·
2023-10-21 19:32
Pytorch与
CUDA
对应关系
参考这篇文章的情况1即可解决!:ModuleNotFoundError:Nomodulenamed‘torch‘
阿维的博客日记
·
2023-10-21 17:10
pycharm
pytorch
python
ROS学习记录
ROS学习记录1.系统环境Ubuntu16.04
CUDA
10.2cudnn7.6.5TensorRT7.1.3.4奥比中光astra-mini摄像头2.ROS系统路径/root/catkin_ws3.相关指令
Alex-Leung
·
2023-10-21 14:58
ROS
ros
cuda
PyTorch
1.GPU对应的
CUDA
版本nvidia-smi
CUDA
Version:12.2GPUdiver大于
cuda
toolkit,pytorch版本根据
cuda
toolkit2.查看nvcc的版本(即
cuda
toolkit
破壁者-燕
·
2023-10-21 07:24
pytorch
人工智能
python
widnows安装audiocraft
首先查看
cuda
版本如何安装
cuda
,可以自行搜索获取程序可以进入这个地址https://github.com/facebookresearch/audiocraft.git,下载源码,并进行安装如果配置不成功
小~小
·
2023-10-21 04:52
人工智能
音乐
audiocraft
YOLOV4在Windows10下训练
软件环境:WIN10,
CUDA
10.1,CUDNN8.0.3,python3.7,VS2017,OpenCV4.4.0硬件环境:GTX10606G
CUDA
:https://developer.nvidia.com
XXX_UUU_XXX
·
2023-10-21 03:47
深度学习
深度学习
YOLOv4
Windows训练YOLOv4
GCC 安装 (Linux + 非root)
非root用户安装于
cuda
版本相对应的gcc降低或升高服务器上的GCC版本报错:configure:error:BuildingGCCrequiresGMP4.2+,MPFR2.4.0+andMPC0.8.0
spring_willow
·
2023-10-21 03:36
GCC
g++
非root
【非root用户、CentOS系统】中使用源码安装gcc/g++的教程
1.引言系统:CentOS-7.9显卡驱动版本:460
CUDA
Version:11.2基于本地环境选择安装gcc-10.1.0gcc下载网址gcc与
cuda
版本的对应关系:2.安装说明下载好对应的gcc
菜鸟的追梦旅行
·
2023-10-21 02:30
环境配置
centos
python
搭建Pytorch环境(GPU版本,含
CUDA
、cuDNN),并在Pycharm上使用(零基础小白向)
VS2019https://visualstudio.microsoft.com/zh-hans/vs/older-downloads/登录需要用户名和密码安装的时候要勾选使用C++的桌面开发文章目录前言一、安装
CUDA
1
GIS从业者
·
2023-10-21 02:57
python
pytorch
pycharm
人工智能
1.pytorch中的dir()函数和help()函数
pytorch中的dir函数和help函数1.理解2.实践1.理解2.实践dir(torch)dir(torch.
cuda
)dir(torch.
cuda
.is_available)help(torch.
cuda
.is_available
zx428621
·
2023-10-21 00:49
pytorch学习
pytorch
深度学习
机器学习
docker内MPI调试技巧xterm -e gdb调试python
mpirunxterm-egdbmpirun-np2-tag-output-output-filename.result-x
CUDA
_VISIBLE_DEVICES=2,3-mcapmlob1-mcabtl
gb_QA_log
·
2023-10-20 23:53
安装
cuda
-toolkit
nvcc-V提示commandnotfound,usr/local下没有
cuda
目录,
CUDA
_HOMEenvironmentvariableisnotset解决方案:sudoapt-getinstallnvidia-
cuda
-toolkit
最爱那个微笑的麦蒂
·
2023-10-20 21:57
工程问题记录
[深度学习]OSError:
CUDA
_HOME environment variable is not set. Please set it to your
CUDA
install root.
As
cuda
installedthroughanacondaisnottheentirepackage.Pleaseinstall
cuda
driversmanuallyfromNvidiaWebsite
溡沭
·
2023-10-20 21:55
深度学习
人工智能
python
【多线程、单线程、异步编程】三个版本--在爬虫中的应用
并发编程在爬虫中的应用之前的课程,我们已经为大家介绍了Python中的多线程、多进程和异步编程,通过这三种手段,我们可以实现并发或
并行编程
,这一方面可以加速代码的执行,另一方面也可以带来更好的用户体验。
wusp1994
·
2023-10-20 21:55
爬虫
python
cannot find -l****问题的解决办法
在ubuntu下编译C或cpp文件时,可能会出现找不到链接库的问题,其形式为:cannotfind-l****如下所示:我在自己电脑上出现的错误就是找不到以下库cannotfind-l
cuda
rtcannotfind-lnppccannotfind-lnppicannotfind-lnppccannotfind-lnpps
lvhaidong520
·
2023-10-20 20:57
linux
debian
centos
【大数据技术原理】MapReduce详解
文章目录简介背景比较模型模型策略模型理念模型架构Map和Reduce函数体系结构工作流程过程拆解概览shuffle注意点应用程序执行流程实例:wordCount简介MapReduce是一种分布式
并行编程
框架
YoHu人家
·
2023-10-20 18:10
数据
mapreduce
big
data
hadoop
上一页
43
44
45
46
47
48
49
50
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他