E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
CUDA)
cmake工程出现“CMAKE_
CUDA
_ARCHITECTURES must be non-empty if set.“的解决方法
解决方法1:cmake工程出现“CMAKE_
CUDA
_ARCHITECTURESmustbenon-emptyifset.
鼾声鼾语
·
2023-10-23 19:19
python
linux
开发语言
c语言
服务器
机器人
CUDA
学习笔记(十五)Stream and Event
Stream一般来说,
cuda
c并行性表现在下面两个层面上:KernellevelGridlevel到目前为止,我们讨论的一直是kernellevel的,也就是一个kernel或者一个task由许多thread
我来了!!!
·
2023-10-23 18:29
学习
笔记
人工智能
CUDA
学习笔记(十三) Shared Memory
CUDA
SHAREDMEMORYsharedmemory在之前的博文有些介绍,这部分会专门讲解其内容。
我来了!!!
·
2023-10-23 18:58
学习
笔记
spring
CUDA
学习笔记(十四) Constant Memory
转载至https://www.cnblogs.com/1024incn/tag/
CUDA
/CONSTANTMEMORYconstantMemory对于device来说只读但是对于host是可读可写。
我来了!!!
·
2023-10-23 18:58
学习
笔记
CUDA
学习笔记(十)Memory Model
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。Memorykernel性能高低是不能单纯的从warp的执行上来解释的。
我来了!!!
·
2023-10-23 18:27
学习
笔记
5.data_parallel_tutorial
PyTorch非常容易就可以使用多GPU,用如下方式把一个模型放到GPU上:device=torch.device("
cuda
:0")model.to(device)GPU:然后复制所有的张量到G
许志辉Albert
·
2023-10-23 18:13
MNIST手写数字识别实战演练
可以在命令行使用pip命令安装,也可以在pycharm中安装,按图中步骤,点一下
cuda
库,然后在搜索框搜索tqdm直接点击install即可。
Zkaisen
·
2023-10-23 16:43
图像识别
pycharm
深度学习
计算机视觉
pytorch
tensorflow用不了 tensorflow.examples.tutorials
首先:(本文仅仅是做笔记,方便之后改环境自己对着)当前环境window10+
CUDA
10.0+python3.6+tensorflow-gpu2.0.0先上参考资料:Tensorflow2.0!!!!
广大菜鸟
·
2023-10-23 13:59
python
tensorflow
人工智能
python
autoware.ai中检测模块lidar_detector caffe
安装步骤:gitclonehttps://github.com/BVLC/caffecdcaffe&&mdkirbuild&&cdbuildcmake..出现报错:CMakeErroratcmake/
Cuda
.cmake
lsyhaoshuai
·
2023-10-23 13:17
人工智能
caffe
CUDA
学习笔记(九)Dynamic Parallelism
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-23 12:17
学习
笔记
深度学习 框架代码(草稿)
train.pydataload_five_flower.pytrain_engin.pylr_methods.py__init__.pytrain_sample.py和test.py见文章:深度学习-AlexNet代码实现用parser方便服务器中的终端操作第三个代码将mac的mps和
cuda
小蒋的技术栈记录
·
2023-10-23 11:26
深度学习
深度学习
人工智能
各类深度学习框架详解+深度学习训练环境搭建-GPU版本
目录前言一、深度学习框架TensorFlowPyTorchKerasCaffePaddlePaddle二、深度学习框架环境搭建1.
CUDA
部署
CUDA
特性
CUDA
下载2.cuDNNcuDNN的主要特性cuDNN
fanstuck
·
2023-10-23 11:55
一文速学-深度学习项目实战
深度学习
pytorch
人工智能
神经网络
ai
如何在 Linux 服务器上安装 pytorch
一.查看服务器的
cuda
版本使用如下命令:nvcc-V博主的
cuda
版本为10.1二.安装对应版本的pytorch进入pytorch官网https://pytorch.org/选择对应的版本输入提示的安装命令
一棵栗子树
·
2023-10-23 07:49
软件安装
如何在
Linux
服务器上安装
pytorch
安装
pytorch
在
Linux
服务器上安装
pytorch
记录一次tf-faster-rcnn代码强行升级环境的过程
因为原机器的版本是
cuda
9+tensorflow_gpu的1.
conner是位好少年
·
2023-10-23 07:03
如何在你的电脑上完成whisper的简单部署
如何在你的电脑上完成whisper的简单部署(超详细教程)前言一、显卡驱动、
CUDA
ToolKit、cuDNN的下载1.显卡驱动2.
CUDA
ToolKit3.cuDNN的安装二、windows下安装conda
Wayne_WX
·
2023-10-23 07:36
人工智能
conda
Docker-mmdetection3d
Docker-mmdetection3dubuntu18.043090Ti文章目录Docker-mmdetection3ddocker安装部署
cuda
报错安装mmdetection3d测试使用现成的镜像
BLACKVEIL
·
2023-10-23 07:32
3D视觉
环境
docker
3d
容器
Ubuntu18.04从零开始安装显卡驱动、配置MMDetection3D环境
Ubuntu18.04从零开始安装显卡驱动、配置MMDetection3D环境概要安装NVIDIA英伟达显卡驱动参考文献其他安装
CUDA
11.3、CuDNN、Anaconda安装
CUDA
安装CuDNN安装
AGI_Player
·
2023-10-23 07:32
OpenMMLab
ubuntu
linux
MMDetection3D
安装python caffe过程中遇到的一些问题以及对应的解决方案
关于系统环境:Ubuntu16.04LTS
cuda
8.0cudnn6.5Anaconda3编译pycaffe之前需要配置文件Makefile.config1##Refertohttp://caffe.berkeleyvision.org
weixin_30561177
·
2023-10-23 06:06
python
shell
人工智能
ubuntu16.04安装caffe依赖项遇到的问题与解决方式[非root权限]
ubuntu16.04安装caffe依赖项遇到的问题与解决方式[非root权限]源码编译安装caffe需要的依赖项1、源码编译安装Glog遇到的问题及对caffe安装的影响2、源码编译caffe过程中的问题和解决方式
cuda
qq_28139523
·
2023-10-23 06:04
Caffe
源码编译caffe依赖项
caffe版crpn训练过程及遇到问题
环境:centos、
cuda
9、protobuf3、python2.7、anaconda2、OpenCV3其中x86_64-redhat-linux-c++、x86_64-redhat-linux-gcc
ab0902cd
·
2023-10-23 05:31
算法
LeNet(pytorch实现
数据集上进行测试,允许使用GPU计算在这里插入代码片importtorchfromtorchimportnn,optimimportd2lzh_pytorchasd2ldevice=torch.device('
cuda
'iftorch.
cuda
.is_available
平平平安喔
·
2023-10-23 02:21
pytorch
python
人工智能
【模型推理学习笔记】
cuda
基础操作 -向量相加和元素相乘
https://mp.weixin.qq.com/s/Izsg-mLZIfjyNtWlDgaWnQ两个向量相加(1)//Kerneldefinition__global__voidVecAdd(float*A,float*B,float*C){inti=threadIdx.x;C[i]=A[i]+B[i];}intmain(){...//KernelinvocationwithNthreadsVe
Go 鹏ya
·
2023-10-22 23:17
cuda
推理优化
并行计算
学习
笔记
openCV的
CUDA
GPU 版本安装 (Ubuntu windows 通用)
需要做templatematch,比较注重时间,因此opencv的普通版本不适用。需要用GPU的。下载gitclonehttps://github.com/opencv/opencv.gitgitclonehttps://github.com/opencv/opencv_contrib.git确保准备好以下内容1:visualstudio(不是vscode)2:下载后的两个包裹会放在以下结构这样放
EmoC001
·
2023-10-22 23:59
opencv
人工智能
计算机视觉
CUDA
学习笔记(八)Branch Divergence and Unrolling Loop
AvoidingBranchDivergence有时,控制流依赖于thread索引。同一个warp中,一个条件分支可能导致很差的性能。通过重新组织数据获取模式可以减少或避免warpdivergence(该问题的解释请查看warp解析篇)。TheParallelReductionProblem我们现在要计算一个数组N个元素的和。这个过程用CPU编程很容易实现:intsum=0;for(inti=0;
我来了!!!
·
2023-10-22 22:24
学习
笔记
CUDA
学习笔记(二)
CUDA
简介
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
CUDA
是并行计算的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样。
我来了!!!
·
2023-10-22 22:20
学习
笔记
Anaconda下载、安装、使用教程
使用教程创建环境查看当前存在的虚拟环境激活环境退出环境删除环境镜像加速配置conda镜像pip镜像临时使用长期使用WindowsLinux&&WSL工具升级升级conda升级pip高级应用整体环境迁移环境更新环境克隆深度学习GPU加速
cuda
kit
Walden-2020
·
2023-10-22 19:46
WSL
深度学习环境搭建
linux
python
ubuntu
动手学深度学习-准备工作-利用WSL2安装Ubuntu系统并搭建深度学习环境
Windows功能1.2下载ubuntu1.3更新内核2.深度学习环境搭建2.1安装miniconda2.1.1创建虚拟环境2.1.2激活环境2.2安装英伟达驱动2.3安装pytorch测试是否安装成功2.4安装
cuda
库行僧
·
2023-10-22 19:14
pytorch
深度学习
python
ubuntu
【WSL2笔记2】 搭建深度学习开发环境踩坑笔记
管理各环境)1.1创建软件下载目录1.2安装Anaconda1.3错误的画蛇添足2、NVIDIADriver(系统级-各环境共享)2.1官网2.2安装win10版本NVIDIA驱动2.3查看Nvidia-
cuda
老富2012
·
2023-10-22 19:43
Ubuntu
深度学习
python
ubuntu
pytorch
tensorflow
C++命名空间namespace的使用
C++中命名空间namespace有点像文件夹意思,比如我在一个头文件myhead.h中做了一个如下声明与定义:namespacelis{namespace
cuda
{intb=8;}}那么其他文件如果想使用
骑码找马
·
2023-10-22 16:09
C++
CUDA
学习笔记(七)Kernel性能调节
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 15:22
学习
笔记
修改predict实现acc计算
importosimportjsonimporttorchfromPILimportImagefromtorchvisionimporttransformsimportmatplotlib.pyplotaspltfrommodelimportefficientnet_b0ascreate_modeldefmain():device=torch.device("
cuda
yyfhq
·
2023-10-22 14:24
图像分类
python
NVIDIA NCCL 源码学习(一)- 初始化及ncclUniqueId的产生
NCCL是英伟达开源的GPU通信库,支持集合通信和点对点通信看下官方给的一个demo#include#include"
cuda
_runtime.h"#include"nccl.h"#include"mpi.h
KIDGINBROOK
·
2023-10-22 13:42
nccl
nccl
gpu
cuda
NVIDIA NCCL 源码学习(九)- 单机内ncclSend和ncclRecv的过程
#include#include"
cuda
_runtime.h"#include"ncc
KIDGINBROOK
·
2023-10-22 13:42
nccl
nccl
gpu
cuda
nvcc -V和nvidia-smi的关系
nvcc-V:nvcc是NVIDIA
CUDA
编译器的命令,用于获取
CUDA
工具包的版本信息。
重剑DS
·
2023-10-22 12:36
杂项
深度学习
深度学习
笔记
nvcc
-V
nvidia-smi
Linux & Windows 的Tensorflow 配置: Nvidia 老显卡运算能力低于3.0
实测成功配置信息1:Windows10,GT755m,Capability3.0Ana(Mini)conda管理,环境Python3.6(.13)
Cuda
=9.0Cudnn=7.0Tensorflow_gpu
Zhenghaowencsdn
·
2023-10-22 10:14
tensorflow
问题记录:GPU显卡提高后,代码总体运行效率没有提高
问题:GPU显卡提高后,代码总体运行效率没有提高原先显卡NIVIDAT400换成NVIDIARTXA4000,
CUDA
核心(物理GPU线程单位)从三百多提升到了六千多,但是程序总体运行的时间没有变化。
魔法自动机
·
2023-10-22 10:43
GPU编程
GPU
CUDA
nvprof
nvvp
CUDA
学习笔记(LESSON5)——GPU优化
CUDA
系列笔记
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
CUDA
学习笔记(LESSON3)——GPU基本算法(PartI)
CUDA
学习笔记(LESSON4)——GPU基本算法
Veropatrinica
·
2023-10-22 06:25
CUDA
GPU
CUDA编程
并行计算
优化
APOD
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
最近在看视频拼接的代码,师兄说要用
CUDA
加速,于是开始学习
CUDA
编程,课程链接:UdacityCS344
CUDA
系列笔记
CUDA
学习笔记(LESSON1/2)——架构、通信模式与GPU硬件
CUDA
学习笔记
Veropatrinica
·
2023-10-22 06:24
CUDA
GPU
CUDA编程
并行计算
thread
kernel
CUDA
学习笔记(六)Warp解析
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:54
学习
笔记
CUDA
学习笔记(四)device管理
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:24
学习
笔记
cuda
学习笔记
一、
cuda
的替代选择OpenCL:允许使用多种计算设备的开放标准,计算设备可以是GPU,CPU或者其他存在OpenCL驱动程序的专业设备DirectCompute:微软开发的可替代
Cuda
和OpenCl
renlubo-qingdao
·
2023-10-22 06:24
学习
CUDA
学习笔记(三)
CUDA
简介
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:53
学习
笔记
【
CUDA
编程】学习笔记(二) GPU硬件架构
一、CPU与GPU的链接模型在计算机的硬件架构中,CPU与GPU有多种链接模式,下面介绍几种典型的架构北桥多CPU(SMP)多CPU(NUMA)多CPU(NUMA)多总线具有集成PCIExpress的多CPU集成GPU集成GPU与独立GPU多个插槽中的GPU多GPU板简化了CPU/GPU架构二、开普勒架构下面这张图是各代GPU架构的迭代顺序,目前最新的架构是Turing开普勒微架构以GTX680为
Swocky
·
2023-10-22 06:21
CUDA编程
GPU
NVIDIA
Kepler
Fermi
CUDA
编程模型与GPU硬件结构关系
目录一、
CUDA
编程模型1、线程管理2、内存管理二、GPU硬件结构1、SM硬件2、硬件逻辑抽象2.1共享内存的逻辑划分2.2寄存器的逻辑划分2.3GPU内存分级3、
CUDA
程序的一些优化点3.1一个core
Hunter_pcx
·
2023-10-22 06:50
工程技能
人工智能
python
深度学习
CUDA
并行程序设计 GPU硬件架构与线程 学习笔记
GPU硬件架构GPU实际上是一个SM的阵列,每个SM包含若干个SP。一个SP可以执行一个thread,但是实际上并不是所有的thread能够在同一时刻执行。Nvidia把32个threads组成一个warp,warp是调度和运行的基本单元。warp中所有threads并行的执行相同的指令。一个warp需要占用一个SM运行,多个warps需要轮流进入SM。由SM的硬件warpscheduler负责调
Morizen
·
2023-10-22 06:50
并行计算
Cuda
多线程
cuda
gpu
并行计算
硬件
CUDA
学习笔记(五)GPU架构
本篇博文转载于https://www.cnblogs.com/1024incn/tag/
CUDA
/,仅用于学习。
我来了!!!
·
2023-10-22 06:17
学习
笔记
架构
ubuntu +
cuda
+tensorflow
installNVIDIAdriverinstalldriverbyapt-get(ref),withaVPNtoturnovertheGFWsudoapt-getpurgenvidia*sudoadd-apt-repositoryppa:graphics-driverssudoapt-getupdatesudoapt-cachesearchnvidiasudoapt-getinstallnvid
youngblood_5ceb
·
2023-10-22 04:53
FunASR安装
condacreate-nfunasrpython=3.8condaactivatefunasr安装pytorchtorchaudio等condainstallpytorch=1.12.1torchvisiontorchaudio
cuda
toolkit
weixin_43870390
·
2023-10-22 00:47
深度学习
pytorch
服务器重装Nvidia驱动
Cuda
步骤
由于服务器上多个用户都已经安装了多个不同版本的
cuda
,而这些不同版本的
cuda
全都依赖于之前安装的nvidia驱动,现在面临这着两个窘境:1、可能直接重新安装一下先前版本的nvidia驱动就直接可以解决问题
Seaton
·
2023-10-21 23:22
CUDA
编程- 瓦片(Tiling)技术
瓦片(Tiling)技术是
CUDA
编程中的一个常见策略,用于优化内存访问模式,特别是在矩阵乘法这类计算密集型操作中。
青衫客36
·
2023-10-21 22:27
CUDA
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他