E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
CUDA
GPU编程2---
CUDA
核函数和线程配置
CUDA
核函数 在GPU上执行的函数称为
CUDA
核函数(KernelFunction),核函数会被GPU上多个线程执行,我们可以在核函数中获取当前线程的ID。
张海军2013
·
2024-01-28 06:58
GPU
GPU
教程
CUDA
核函数
线程配置
【
cuda
编程】
CUDA
的运行方式以及grid、block结构关系
文章目录1.
CUDA
基础知识1.1程序基本运行顺序1.2grid与block1.3dim类型定义2.
CUDA
的第一个程序3.
CUDA
线程的组织结构——grid与block关系1.
CUDA
基础知识1.1程序基本运行顺序一般来说
非晚非晚
·
2024-01-28 05:49
GPU&CUDA
c++
c语言
CUDA
GPU
CPU
CUDA
编程- - GPU线程的理解 thread,block,grid - 再次学习
GPU线程的理解thread,block,grid一、从cpu多线程角度理解gpu多线程1、cpu多线程并行加速2、gpu多线程并行加速2.1、cpu线程与gpu线程的理解(核函数)2.1.1、第一步:编写核函数2.1.2、第二步:调用核函数(使用内核函数)2.1.3、第三步:编写CMakeLists&编译代码二、重要概念&与线程索引的直观理解2.1、重要概念2.2、dim3与启动内核2.3、如何
Nice_cool.
·
2024-01-28 05:17
Cuda与TensorRT
学习
算法
人工智能
Ubuntu20.04安装
cuda
12.11
显卡驱动首先就是安装显卡驱动,我是双3090,不知道为什么,官网死活安不上,最后从软件更新那里直接安装上了,绷不住了
cuda
首先从官网下载runfile文件安装的时候记得驱动和KernelObjects
Zqchang
·
2024-01-28 04:46
#
电脑环境
pytorch
深度学习
人工智能
机器学习环境配置
本文讲述内容包含python、tensorflow、anaconda、Numpy、jupyter、
CUDA
、PyCharm、Pytorch的安装。
惘栀箱
·
2024-01-27 18:22
环境配置
机器学习
人工智能
python
windows环境下配置tensorflow_gpu版本——无需更改本地的
cuda
大家可以在tensorflow学习中,可能会遇到使用tensorflow_gpu版本的安装,但是一般涉及到gpu的安装,就需要配置
cuda
,这个过程很麻烦且浪费时间,下面给出一个简单的方法配置环境。
筱筱西雨
·
2024-01-27 14:41
tool
windows
tensorflow
人工智能
深度学习
linux深度学习开发基础命令——极简版
condacreate-yourenv_namepyhton=3.x查看全部虚拟环境condaenvlist激活虚拟环境condaactivateenv_name或者找到activate.bat文件2.查看
cuda
Walt_像道光
·
2024-01-27 12:18
linux
深度学习
运维
深度学习编译器后端和运行时
编译器后端做的优化就和具体的设备有关了(不同设备有不同的allocator,不同的编程模型,比如英伟达的
CUDA
),后端优化更加贴合硬件,会针对硬件特点为IR中的计算节点选择在硬件上的算子,然后为每个算子的输入输出分配硬件内存
RJ_theMag
·
2024-01-27 09:39
机器学习编译
深度学习
人工智能
FlashInternImage实战:使用FlashInternImage实现图像分类任务(一)
文章目录摘要安装包安装timm数据增强Cutout和MixupEMA项目结构编译安装DCNv4环境安装过程配置
CUDA
HOME解决权限不够的问题按装ninja编译DCNv4计算mean和std生成数据集摘要
AI浩
·
2024-01-27 09:06
人工智能
图像分类
分类
数据挖掘
人工智能
openmp编程在linux下编译命令,OpenMP在ARM-Linux以及NDK中的编译和使用
以前对OpenCV在ARM-Linux,ARM-Android上的优化做了很多编译方面的努力,例如添加TBB支持,添加
CUDA
支持(NvidiaK1平台上)。
半生瓜Cc
·
2024-01-27 08:58
win10+tensorflow2.7-gpu安装
1.查看自己显卡的
cuda
版本在cmd输入:nvidia-smi如果提示没有此命令,说明你要装gpu驱动了2.查看tensorflow2.x与
cuda
和cudnn版本关系点击这里查看所以我选tensorflow2.7
吴天德少侠
·
2024-01-27 08:49
深度学习
tensorflow2
tensorflow
深度学习
python
onnx推理python代码
前提pipinstallonnxruntime-gpu代码importosos.environ["
CUDA
_VISIBLE_DEVICES"]="4"importonnxruntimeasortimportnumpyasnpimportSimpleITKassitkimportmathimporttime
吴天德少侠
·
2024-01-27 08:18
部署问题
python
开发语言
CUDA
、cudNN版本号,tensorflow对应版本查询
CUDA
版本查询:win+Rcmd命令行输入nvidia-smi查询右上角可见
CUDA
Version11.6cudNN版本查询:按照路径查询文件:cudnn_version.hC:\ProgramFiles
MayYou-HHH
·
2024-01-27 04:37
tensorflow
人工智能
python
【
cuda
】RuntimeError: Unexpected error from
cuda
GetDeviceCount()
解决会发现nvidia-smi不管用了。不要立即重启,会黑屏的。赶紧记录使用的驱动版本号,最好找到安装包位置。直接重装原版驱动,环境还能用。参考我的安装博客。已经黑屏就进入安全模式,network模式。卸载可视化桌面和显卡驱动。驱动程序已经更新,可以尝试回滚到之前的版本。原因分析包管理器问题,安装包的时候把驱动搞坏了。nvidia-fabricmanager包的问题:如果你的系统中安装了nvidi
prinTao
·
2024-01-27 04:19
linux
CUDA编程
pytorch
linux
运维
服务器
【一次性解决】
CUDA
和PyTorch的安装与多版本管理的三种方式
但是如果服务器多人使用,或者复现代码多(pytorch版本和
cuda
版本是互相依赖的),就需要更进一步的版本管理方法。这里将详细介绍用于深度学习或者CPP开发的
CUDA
版本管理方式。
prinTao
·
2024-01-27 04:19
CUDA编程
pytorch
python
pytorch
人工智能
python
cuda
ubuntu系统环境指定GPU的使用
法1:
CUDA
_VISIBLE_DEVICES=0,1,2pythontest.py法1中,0,1,2为显卡的编号。
计算机视觉-Archer
·
2024-01-27 01:20
ubuntu
深度学习
linux
成功编译TensorRT-LLM
1.准备工作启动已下载的docker镜像,查看编译TRT-LLM的主要依赖项版本OS:Ubuntu22.04
cuda
:12.2cudnn:8.9.4tensorrt:9.1.0python:3.
有来有去9527
·
2024-01-26 16:53
llm
人工智能
深度学习
TensorRT-LLM的AutoDL部署
安装
cuda
wgethttps://developer.download.nvidia.com/compute/
cuda
/12.2.1/local_installers/
cuda
_12.2.1_535.86.10
wwwsctvcom
·
2024-01-26 16:21
人工智能
nvidia-smi报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver 原因及避坑解决方案
发现
cuda
不可用,于是输入“nvidia-smi”才发现了一个错误,如下:nvidia-smiNVIDIA-SMIhasfailedbecauseitcouldn'tcommunicatewiththeNVIDIAdriver.MakesurethatthelatestNVIDIAdriverisinstalledandrunning
baidu_huihui
·
2024-01-26 14:05
nvidia-smi
gcc
g++
dkms
ubantu tensorflow problem
libcusolver.so.8.0:cannotopensharedobjectfile:Nosuchfileordirectoryecho$LD_LIBRARY_PATH我的结果:/usr/local/
cuda
AICVer
·
2024-01-26 11:36
ubuntu
解决ChatGML启动报错:RuntimeError: expected scalar type Half but found Float
.half()原始命令:model=AutoModel.from_pretrained("/app/model/chatglm2-6b",trust_remote_code=True).half().
cuda
Levi_
·
2024-01-26 11:46
大模型
人工智能
chatGML
yolov5训练自己的数据
环境搭建2.数据准备3.数据标注4.数据整理4.1数据集切分4.2修改数据文件4.3修改模型文件5.训练模型5.1训练5.2验证5.3测试6.训练结果分析1.环境搭建安装anaconda、python、
cuda
wyw0000
·
2024-01-26 11:42
yolo
YOLO
linux conda 配置 stable video diffusion
Stability-AI/generative-models.git2创建conda环境condacreate-nsvdpython=3.10condaactivatesvd3安装pytorchgpu
cuda
lanlinbuaa
·
2024-01-26 07:33
linux
conda
Ubuntu22.04安装4090显卡驱动
1、安装完Ubuntu系统,打完所有补丁后再进行后续操作2、下载系统所需要的版本的NV显卡驱动,本次由于使用
CUDA
12.1,故选用的驱动版本为NVIDIA-Linux-x86_64-530.41.03
baidu_huihui
·
2024-01-26 07:32
CUDA12.1
Ubuntu22.04
4090显卡
在ubuntu20.04 安装nvidia驱动 (亲测有效,这是方法二)
一.前言1.你可能需要安装
cuda
。下面附上了一个安装
cuda
的教程。
baidu_huihui
·
2024-01-26 07:28
ubuntu
linux
nvidia驱动
ICCV 2021 广义源无关领域自适应
该论文采用了基于PyTorch1.3和
CUDA
10.0的代码,通过阅读’requireme
OverlordDuke
·
2024-01-26 06:38
深度学习
神经网络
机器学习
人工智能
广义源
自适应
/sbin/ldconfig.real: /usr/local/
cuda
-11.1/targets/x86_64-linux/lib/libcudnn.so.8 is not a symbolic
在sudoapt-getxxx时总会报以下错误:/sbin/ldconfig.real:/usr/local/
cuda
-11.1/targets/x86_64-linux/lib/libcudnn.so
0208hsq
·
2024-01-26 04:43
ubuntu记录
linux
运维
服务器
关于深度学习服务器配置的一些问题(二)——硬盘挂载、IP配置、端口映射和SSH配置文件
校园网)中IP不变的情况,使用的路由器为TP-LINK系列硬件环境和系统配置服务器为DellPrecision7920,操作系统Ubuntu20.04server,系统安装过程,换源,ssh基本配置,
CUDA
NekoTom
·
2024-01-26 03:44
服务器
tcp/ip
ubuntu
linux
如何正确配置pytorch环境
1各种镜像源的问题因为pytorch原生的服务器在国外,而pytorch(
cuda
版本)大小为1G以上,使用国外源下载是不太可能的。因此衍生出了很多国内的下载源。
Lvjawag
·
2024-01-26 00:24
pytorch
人工智能
python
2080Ti NVIDIA显卡安装教程记录
1、硬件安装——找到卡槽,顺位安装,找到电源插头,配套孔位即可2、软件安装——搞个NVIDIA控制面板此外,安装
CUDA
和cuDNNwin10下
CUDA
和CUDNN的安装(超详细)!亲测有效!
我看到你啦滴
·
2024-01-25 22:32
环境配置
深度学习
PyTorch踩过的12坑精选
nn.Module.
cuda
()和Tensor.
cuda
()的作用效果差异无论是对于模型还是数据,
cuda
()函数都能实现从CPU到GPU的内存迁移,但是他们的作用效果有所不同。
头顶一根发的程序猿
·
2024-01-25 21:42
怎么查看
cuda
的版本
查看
CUDA
版本的方法主要有以下几种:1.使用命令行在命令行中,您可以使用以下命令来查看安装的
CUDA
版本。
MonkeyKing.sun
·
2024-01-25 19:06
python
cuda
CUDA
学习笔记9——
CUDA
共享内存 / Shared Memory
#include#include"
cuda
_runtime.h"#in
阿卡蒂奥
·
2024-01-25 19:54
CUDA
学习
笔记
算法
CUDA
学习笔记8——GPU硬件资源
简单来说就是为了充分利用GPU,不要让分出去的
CUDA
核心摸鱼闲置;GPU每次干活,都是以最小的组分配的,因此分派任务的时候就尽量充分发挥每个小组里
CUDA
核心的作用。
阿卡蒂奥
·
2024-01-25 19:24
CUDA
学习
笔记
CUDA
学习笔记10——VS运行
CUDA
demo 报错
问题描述VisualStudi运行
CUDA
自带demo报错:错误MSB4019找不到导入的项目“D:\ProgramFiles(x86)\MicrosoftVisualStudio\2019\Enterprise
阿卡蒂奥
·
2024-01-25 19:23
CUDA
学习
笔记
python中pytorch框架loss函数配置
importtorch.nn.modulespre=net(data)target=labeldefloss_seg(pre,target,hnm_ratio=0,**kwargs):target=target.
cuda
用编程减轻生活压力
·
2024-01-25 18:00
python
pytorch
python
pytorch
yolov7配置环境全过程,写给自己(小白级别)
需要的下载pytorch版本以及
cuda
和cudnn的链接,直接下载使用即可,然后需要的python是3.7版本的即可https://download.pytorch.org/whl/lts/1.8/cu111
夏456
·
2024-01-25 18:21
YOLO
声音模拟训练
环境配置1:打开CMDnvidia-smi.exe查询显卡
cuda
VERSION:12.32:打开https://pytorch.org/get-started我的系统是12.33:使用google搜索
鬼鲛先生000
·
2024-01-25 18:10
AI
stable
diffusion
Ubuntu安装Opencv、opencv_contrib、
cuda
(都是细节)
如要用windows的msvc编译opencv,参考我另外一篇文章windows编译opencv、opencv-python、opencv_contrib、
cuda
-CSDN博客。
严就方法
·
2024-01-25 15:19
open
cv
ubuntu
opencv
windows用mingw(g++)编译opencv,opencv_contrib,并install安装
windows下用mingw编译opencv貌似不支持
cuda
,选
cuda
会报错,我无法解决,所以没选
cuda
,下面两种编译方式支持。
严就方法
·
2024-01-25 15:17
open
cv
windows
CUDA
笔记2
1、培训003生成线程,每个线程处理哪些数据呢?如右图,0-47共48个数,申请48个线程,需找到每个元素在所有线程的坐标。即一维的坐标,下面展示二维的坐标例子:矩阵相乘申请很多个thread,每个thread处理P矩阵中的一个元素。P当中有多少个元素,就申请多少个thread,每个线程读取一行,一列。threadIdx.x和threadIdx.y分别是2和0blockIdx.x和blockIdx
tensor.shape
·
2024-01-25 15:01
CUDA
笔记
CUDA
笔记3
CUDA
编程-入门、加法、乘法例子1:入门#include__global__voidhello_from_gpu(){constintbid=blockIdx.x;constinttid=threadIdx.x
tensor.shape
·
2024-01-25 15:01
CUDA
笔记
算法
Cuda
笔记1
下图是用NVPROF时间分析下图是资源分析1)
CUDA
线程层次一个SM执行多个block所有线程执行同一个kernel,每个线程处理的数据不一样线程在
cuda
core里面,block以块为单位分配到sm
tensor.shape
·
2024-01-25 15:58
CUDA
笔记
fix bug: FileNotFoundError: [Errno 2] No such file or directory: ‘nvcc‘
1.问题描述运行的代码设计py
cuda
,会调用nvcc,确定已经安装
cuda
toolkit,在terminal中云运行nvcc-V能得到想到的结果:但是在pycharm中运行代码时提示:FileNotFoundError
zhangjipinggom
·
2024-01-25 14:04
bug
Qt+YOLOv4实现目标检测
环境:系统:win10(显卡:NVIDIAGTX1050)Yolo版本:V4
cuda
:11.2cudnn:8.1.1opencv:3.4.15VS:20191.编译前准备1.1opencv首先要安装opencv
QtHalcon
·
2024-01-25 14:01
计算机视觉
qt
目标检测
yolo
查看Pytorch的GPU是否可用
查看Pytorch的GPU是否可用importtorchtorch.
cuda
.is_available()返回为True表示Pytorch的GPU可用,返回为False表示Pytorch的GPU不可用。
鱼儿也有烦恼
·
2024-01-25 13:47
深度学习
pytorch
人工智能
python
Windows配置GPU环境
1、重装了电脑显卡:显卡版本号为nvidiaquadroP2000,重装之前nvidia控制面板--帮助--系统信息中的NV
CUDA
64.dll对应的产品名称为Nvidia
cuda
10.0driver下载重装后发现为
沉默魔导师LV7
·
2024-01-25 12:21
NVIDIA GeForce RTX 3090 with
CUDA
capability sm_86 is not compatible with the current PyTorch
NVIDIAGeForceRTX3090with
CUDA
capabilitysm_86isnotcompatiblewiththecurrentPyTorchinstallation.ThecurrentPyTorchinstallsupports
CUDA
capabilitiessm
Q_pril
·
2024-01-25 10:36
pytorch
人工智能
python
conda
AutoDL安装colmap
因为自己的电脑无法安装
CUDA
,实验室服务器又没有root权限(并且终于装好之后,我的IP还被回收更新了),所以转到AutoDL安装colmap了,分享一篇帖子记录一下首先不能直接git到colmap之后就
Q_pril
·
2024-01-25 10:05
git
ubuntu
linux
CMAKE 编译
CUDA
的设置——CMakeLists.txt的编写
CMAKE编译
CUDA
的设置,关于CMAKE语法请自行参考官方文档。这里给出CMakeLists.txt的设置。
HIT夜枭
·
2024-01-25 08:46
CUDA
与硬件加速
零知识证明
rust
c++
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他