cuda并行计算

CUDA——内存

内存形式静态全局内存#include#include__device__floatdevData;//-GPU静态变量（所有设备代码均可见，主机代码不允许直接访问）__global__voidcheckGlobalVariable(){printf("threadIdx.x=%ddevData=%0.2f\n",threadIdx.x,devData);devData+=2.0f;}intmain

UCAS_HMM·2024-03-25 04:19

高质量 Git 仓库汇总（持续更新，方便查看）

pvs-studio-cmake-examples3D目标检测Awesome-3D-Object-DetectionAwesome-3D-Object-Detection-for-Autonomous-DrivingCudaCod

Nice_cool.·2024-03-17 21:31

tang-0203·2024-03-16 22:30

深度学习踩坑记录（持续更新）

目录4060显卡cuda版本异常transformers初始化TrainingArguments时output_dir指定问题4060显卡cuda版本异常环境：torch1.11.0+cu113程序报错

芒果不茫QAQ·2024-03-13 15:39

RuntimeError: (PreconditionNotMet) The third-party dynamic library (cublas64_102.dll；cublas64_10.dll

cublas64_10.dll)thatPaddledependsonisnotconfiguredcorrectly.C:\ProgramFiles\NVIDIAGPUComputingToolkit\CUDA

xxxggany·2024-03-12 21:13

大模型加速与性能对比

本人环境torch2.0.1+cu118cuda11.8nvidia-driver535.98gcc9

__如风__·2024-03-12 11:58

Ubuntu20.04安装并配置vscode

Ubuntu20.04安装并配置vscodevscode安装miniconda安装创建虚拟python3.8环境pytorch和匹配的cuda安装vscode安装VSCode可以通过Snapcraft商店或者微软源仓库中的一个

double_c之·2024-03-07 12:05

深入了解OpenCVSharp中常见的图像处理功能

5.图像分割6.特征检测与描述子7.目标识别与跟踪8.图像融合与拼接9.形状匹配与模板匹配10.颜色空间转换与直方图11.图像转换与绘制12.图像分类与机器学习13.高级图像处理算法14.GPU加速与并行计算前言

仰望大佬007·2024-03-06 21:48

ChatGPT引领的AI面试攻略系列：cuda和tensorRT

系列文章目录cuda和tensorRT（本文）AI全栈工程师文章目录系列文章目录一、前言二、面试题1.CUDA编程基础2.CUDA编程进阶3.性能优化4.TensorRT基础5.TensorRT进阶6.

梦想的理由·2024-03-05 12:04

【GPU驱动开发】-GPU架构简介

GPU（GraphicsProcessingUnit，图形处理单元）是一种专门用于处理图形和并行计算的处理器。GPU系统架构通常包括硬件和软件层面的组件。

怪怪王·2024-03-04 01:19

Transformer结构介绍和Pyotrch代码实现

bilibili.com)基本结构介绍Transformer结构是近年来自然语言处理（NLP）领域的重要突破，它完全基于注意力机制（AttentionMechanism）来实现，克服了传统RNN模型无法并行计算以及容易丢失长距离依赖信息的问题

肆十二·2024-03-03 15:35

Made In Heaven，LLM要加速了

这些都离不开Nvidia的Cuda计算，而目前适配这一驱动的只有Windows和Linux。

DisonTangor·2024-03-03 12:31

什么是Rust 语言

它强调零开销的抽象和安全的并行计算。Rust语言的前景非常广阔，包括以下几个方面：系统编程：由于Rust的出色性能和

chunmiao3032·2024-03-02 20:09

Ubuntu 22.04.4 LTS 安装cuda和cudnn

Ubuntu22.04.4LTS安装cuda和cudnn最简单最直接最快速的方法直接在命令行输入下面两行代码安装cudasudoaptinstallnvidia-cuda-toolkit安装cudnnsudoaptinstallnvidia-cudnn

鹤蓝桉·2024-03-01 14:56

解决conda环境下import TensorFlow失败的问题

于是在终端打开python并执行代码importtensorflowastfprint(1)除了提示2024-02-2721:50:00.801427:Iexternal/local_tsl/tsl/cuda

绿竹巷人·2024-02-28 07:17

图像数据增强

#coding:utf-8importtensorflowastfimportcv2importrandomimportsysimportosimportshutil#os.environ["CUDA_VISIBLE_DEVICES

菜鸟瞎编·2024-02-20 21:34

基于Diffusion Model的数据增强方法应用——毕业设计其三

文章目录题目简介前言StableDiffusionLatentdiffusion自动编码器(VAE)U-NetText-EncoderStableDiffusion的推理过程从零开始配置实验环境IDEAnacondaCUDA

大鸟仙童·2024-02-20 21:06

渲染对硬件的要求有哪些？渲染100邀请码1a12

如果用的软件支持Nvidia的CUDA并行运算，那对CPU的性能要求就降低了。2、GPUGPU或图形处

千野竹之卫·2024-02-20 19:54

MIT-BEVFusion系列九--CUDA-BEVFusion部署1 debug代码

目录开启Debug常用数据在一起看CUDA-BEVFusion的代码前，我们把后面会常见到的变量以及他的含义写在前方，看代码的时候如果看到同名的变量，可以过来看一看数据的形状和含义。

端木的AI探索屋·2024-02-20 14:25

MIT-BEVFusion系列九--CUDA-BEVFusion部署2 create_core之参数设置

create_core图像归一化参数体素化参数稀疏卷积网络参数真实世界几何空间参数(雷达坐标系下体素网格的参数)解码后边界框的参数构建bevfusion::Core存储推理时需要的参数本章开始，我们将一起看CUDA-BEVFusion

端木的AI探索屋·2024-02-20 14:53

CUDA和cudnn安装教程

查看本机的CUDA驱动适配版本检查是否有合适的GPU,若有安装Cuda与CuDNN在桌面上右击如果能找到NVIDA控制面板，则说明该电脑有GPU。

悲伤的拾荒·2024-02-20 13:52

CUDA与CUDNN 关系

CUDA与cuDNN1、什么是CUDACUDA(ComputeUnifiedDeviceArchitecture)，是显卡厂商NVIDIA推出的运算平台。

XF鸭·2024-02-20 13:52

无需注册登录NVIDIA官网下载CUDNN

https://developer.nvidia.com/rdp/cudnn-archive点击cuDNNArchive|NVIDIADeveloper进入下图界面：找到需要的版本，点击展开下一层比如我想找CUDA

justablackacat·2024-02-20 13:49

在使用cuda12 报错Library cublas64_11.dll is not found

因为nvidia的升级基本上都是是CUDA12了,在我发表文章的时候如果去官网下载CUDA包默认安装CUDA版本就是12了.今天在调用fast-whisper的时候使用GPU报错Librarycublas64

atlasroben·2024-02-20 13:18

Unity中的Compute Shader

ComputeShader前言一、定义二、创建三、computer代码解析四、c#调用方式五、计算关系六、平台支持七、引用前言游戏开发中，dot编程在处理大数量级的运算应用已经越来越广泛了，而GPU本身对大规模数据的并行计算已经越来越强了

popcorn丶·2024-02-20 13:13

【踩坑系列记录】Anaconda环境将torch由cpu换成gpu

condainstallpytorch==1.12.1torchvision==0.13.1torchaudio==0.12.1cudatoolkit=11.3-

RoyZz_·2024-02-20 13:37

GPU服务器安装显卡驱动、CUDA和cuDNN

GPU服务器安装cuda和cudnn1.服务器驱动安装2.cuda安装3.cudNN安装4.安装docker环境5.安装nvidia-docker25.1ubuntu系统安装5.2centos系统安装6

嘻哈记·2024-02-20 08:45

LSTM 08：超详细LSTM调参指南

本文代码运行环境：cudatoolkit=10.1.243cudnn=7.6.5tensorflow-gpu=2.1.0keras-gpu=2.3.1相关文章LSTM01：理解LSTM网络及训练方法LSTM02

datamonday·2024-02-20 08:00

TiDB 7.5.0 LTS 高性能数据批处理方案

TiDB在面向这种超大规模数据的批处理场景，其能力也一直在演进，其复杂度也变得越来越低：○从TiDB5.0开始，TiFlash支持MPP并行计算能力，在大批量数据上进行聚合、关联的查询性能有了极大的提升

TiDB_PingCAP·2024-02-20 07:46

2018-11-23

expectedtofindtorch.FloatTensorbutfoundtorch.cuda.FloatTensorinstead"So!!!

啊啊啊啊啊1231·2024-02-20 07:45

Pytorch backward报错2次访问计算图需要 retain_graph=True 的一种情况

importtorchimportnumpyasnpimporttorch.optimasoptimtorch.autograd.set_detect_anomaly(True)device=torch.device('cuda'iftorch.cuda.is_available

培之·2024-02-20 06:55

将pytorch中变量的梯度为 nan 的替换成 1 还是 0？

替换成0，则变量保持不动0:xtensor([1.0000,2.0000,3.0000,4.5000],device='cuda:0',requires_grad=True)0:xtensor([1.0000,2.0000,3.0000,4.5000

培之·2024-02-20 06:25

C/C++/Cuda不依赖任何三方库求解3x3矩阵的特征值和特征向量

/适用于C/C++下载dsyevv3-C-1.1.tar.gz采用LGPL协议，不适合商业开发https://github.com/PointCloudLibrary/pcl/blob/master/cuda

OTZ_2333·2024-02-20 03:34

GPU，CUDA，cuDNN的理解

我们知道做深度学习离不开GPU，不过一直以来对GPU和CPU的差别，CUDA以及cuDNN都不是很了解，所以找了些资料整理下，希望不仅可以帮助自己理解，也能够帮助到其他人理解。

达微·2024-02-20 00:58

AI芯片技术架构有哪些？FPGA芯片定义及结构分析

GPU架构采用多个计算单元（CUDA核心）进行并行计算，能够高效地执行浮点运算和矩阵计算。NVIDIA的Tens

Hack电子·2024-02-20 00:43

TiDB 7.5.0 LTS 高性能数据批处理方案

TiDB在面向这种超大规模数据的批处理场景，其能力也一直在演进，其复杂度也变得越来越低：○从TiDB5.0开始，TiFlash支持MPP并行计算能力，在大批量数据上进行聚合、关联的查询性能有了极大的提升

·2024-02-19 21:30

英伟达（NVIDIA）和CUDA

英伟达（NVIDIA）是一家知名的图形处理器（GPU）制造公司，而CUDA则是NVIDIA推出的一种并行计算架构和编程模型。

小米人er·2024-02-19 20:57

Fork/Join线程池

Fork/Join框架主要用于任务需要分解为多个子任务执行的场景，是一种分而治之的并行计算模型。

青衫客36·2024-02-19 18:25

ChatGPT魔法1：背后的原理

Deeplearning，有神经网络，最有代表性的是ChatGPT,GPT(GenerativePre-TrainedTransformer)2.深度神经网络llyaSutskever:做图像识别，使用了GPT去并行计算及训练

王丰博·2024-02-19 18:22

深度神经网络中的BNN和DNN：基于存内计算的原理、实现与能量效率

尽管图形处理单元（GPU）在许多应用中被用于提供并行计算能力，但较低能耗的平台有可能实现一系列新的应用。

·2024-02-19 16:10

深度学习环境配置常见指令

__version__检查cuda是否可用torch.cuda.is_available()获取CUDA设备数torch.cuda.device_count()获

牛哥带你学代码·2024-02-19 15:22

OlMo--doc文件阅读

condacreate-y-nLLMpython=3.10ipythoncondaactivateLLMcondainstall-ypytorchtorchvisiontorchaudiopytorch-cuda

瓶子好亮·2024-02-19 15:47

Windows11(非WSL)安装Installing llama-cpp-python with GPU Support

1.安装CUDAToolkit(NVIDIACUDAToolkit(availableathttps://developer.nvidia.com/cuda-downloads)2.安装如下物件：gitpythoncmakeVisualStudioCommunity

aiXpert·2024-02-19 14:30

【安装pytorch】

问题描述提示：这里描述项目中遇到的问题：安装pytorch官网https://pytorch.org/详细看官方提供的手册安装时选择cuda11.8的版本（与电脑安装的驱动版本一致，需要提前安装好驱动）

Winner1300·2024-02-15 10:34

paddlepaddle 2.6版本在WSL2环境中如何使用NVIDIA显卡运行神经网络

paddlepaddle2.6版本发布后，官网上可以使用NVIDIAcuda12.x进行机器学习了，训练神经网络的效率大为提升。

kampoo·2024-02-15 09:47

[机器学习]详解transformer---小白篇

1.背景：Transformer是2017年的一篇论文《AttentionisAllYouNeed》提出的一种模型架构，这篇论文里只针对机器翻译这一种场景做了实验，并且由于encoder端是并行计算的，

是安澜啊·2024-02-15 08:11

cuBLAS Level-1 Function

仅为学习记录，具体内容请以nvidia官方文档为准：https://docs.nvidia.com/cuda/cublas/index.html#cublas-level-1-function-reference

Junr_0926·2024-02-15 04:17

C++ 11新特性之并发

C++11标准引入了一套全面且强大的并发编程支持库，为开发者提供了一个安全、高效地利用多核CPU资源进行并行计算的新框架，极大地简化了多线程开发。

hope_wisdom·2024-02-15 04:09

[ubuntu]ubuntu如何查看已安装cudnn版本

cudnn由于在8.0版本前后版本存储头文件不一样，所以需要分情况查询，如果你是8.0版本以前可以输入：cat/usr/local/cuda/include/cudnn.h|grepCUDNN_MAJOR-A2

FL1623863129·2024-02-15 02:10

多机多卡运行nccl-tests和channel获取

openmpi3.单机测试4.多机测试mpirun多机多进程多节点运行nccl-testschannel获取环境Ubuntu22.04.3LTS(GNU/Linux5.15.0-91-genericx86_64)cuda11.8

Pretend ^^·2024-02-15 02:03

推荐频道

cuda并行计算

CUDA——内存

高质量 Git 仓库汇总（持续更新，方便查看）

NVIDIA相关工具

深度学习踩坑记录（持续更新）

RuntimeError: (PreconditionNotMet) The third-party dynamic library (cublas64_102.dll；cublas64_10.dll

大模型加速与性能对比

Ubuntu20.04安装并配置vscode

深入了解OpenCVSharp中常见的图像处理功能

ChatGPT引领的AI面试攻略系列：cuda和tensorRT

【GPU驱动开发】-GPU架构简介

Transformer结构介绍和Pyotrch代码实现

Made In Heaven，LLM要加速了

什么是Rust 语言

Ubuntu 22.04.4 LTS 安装cuda和cudnn

解决conda环境下import TensorFlow失败的问题

图像数据增强

基于Diffusion Model的数据增强方法应用——毕业设计 其三

渲染对硬件的要求有哪些？渲染100邀请码1a12

MIT-BEVFusion系列九--CUDA-BEVFusion部署1 debug代码

MIT-BEVFusion系列九--CUDA-BEVFusion部署2 create_core之参数设置

CUDA和cudnn安装教程

CUDA与CUDNN 关系

无需注册登录NVIDIA官网下载CUDNN

在使用cuda12 报错Library cublas64_11.dll is not found

Unity中的Compute Shader

【踩坑系列记录 】Anaconda环境将torch由cpu换成gpu

GPU服务器安装显卡驱动、CUDA和cuDNN

LSTM 08：超详细LSTM调参指南

TiDB 7.5.0 LTS 高性能数据批处理方案

2018-11-23

Pytorch backward报错2次访问计算图需要 retain_graph=True 的一种情况

将pytorch中变量的梯度为 nan 的替换成 1 还是 0？

C/C++/Cuda不依赖任何三方库求解3x3矩阵的特征值和特征向量

GPU，CUDA，cuDNN的理解

AI芯片技术架构有哪些？FPGA芯片定义及结构分析

TiDB 7.5.0 LTS 高性能数据批处理方案

英伟达（NVIDIA）和CUDA

Fork/Join线程池

ChatGPT魔法1： 背后的原理

深度神经网络中的BNN和DNN：基于存内计算的原理、实现与能量效率

深度学习环境配置常见指令

OlMo--doc文件阅读

Windows11(非WSL)安装Installing llama-cpp-python with GPU Support

【安装pytorch】

paddlepaddle 2.6版本在WSL2环境中如何使用NVIDIA显卡运行神经网络

[机器学习]详解transformer---小白篇

cuBLAS Level-1 Function

C++ 11新特性之并发

[ubuntu]ubuntu如何查看已安装cudnn版本

多机多卡运行nccl-tests和channel获取

基于Diffusion Model的数据增强方法应用——毕业设计其三

【踩坑系列记录】Anaconda环境将torch由cpu换成gpu

ChatGPT魔法1：背后的原理