E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
CUDA并行计算
英伟达(NVIDIA)和
CUDA
英伟达(NVIDIA)是一家知名的图形处理器(GPU)制造公司,而
CUDA
则是NVIDIA推出的一种
并行计算
架构和编程模型。
小米人er
·
2024-02-19 20:57
我的博客
英伟达
Fork/Join线程池
Fork/Join框架主要用于任务需要分解为多个子任务执行的场景,是一种分而治之的
并行计算
模型。
青衫客36
·
2024-02-19 18:25
并发编程
java
开发语言
ChatGPT魔法1: 背后的原理
Deeplearning,有神经网络,最有代表性的是ChatGPT,GPT(GenerativePre-TrainedTransformer)2.深度神经网络llyaSutskever:做图像识别,使用了GPT去
并行计算
及训练
王丰博
·
2024-02-19 18:22
GPT
chatgpt
深度神经网络中的BNN和DNN:基于存内计算的原理、实现与能量效率
尽管图形处理单元(GPU)在许多应用中被用于提供
并行计算
能力,但较低能耗的平台有可能实现一系列新的应用。
·
2024-02-19 16:10
算法
深度学习环境配置常见指令
__version__检查
cuda
是否可用torch.
cuda
.is_available()获取
CUDA
设备数torch.
cuda
.device_count()获
牛哥带你学代码
·
2024-02-19 15:22
Python数据分析
YOLO目标检测
深度学习
人工智能
OlMo--doc文件阅读
condacreate-y-nLLMpython=3.10ipythoncondaactivateLLMcondainstall-ypytorchtorchvisiontorchaudiopytorch-
cuda
瓶子好亮
·
2024-02-19 15:47
10天学完OLMo
语言模型
Windows11(非WSL)安装Installing llama-cpp-python with GPU Support
1.安装
CUDA
Toolkit(NVIDIA
CUDA
Toolkit(availableathttps://developer.nvidia.com/
cuda
-downloads)2.安装如下物件:gitpythoncmakeVisualStudioCommunity
aiXpert
·
2024-02-19 14:30
llama
python
开发语言
【安装pytorch】
问题描述提示:这里描述项目中遇到的问题:安装pytorch官网https://pytorch.org/详细看官方提供的手册安装时选择
cuda
11.8的版本(与电脑安装的驱动版本一致,需要提前安装好驱动)
Winner1300
·
2024-02-15 10:34
神经网络
pytorch
人工智能
python
paddlepaddle 2.6版本在WSL2环境中如何使用NVIDIA显卡运行神经网络
paddlepaddle2.6版本发布后,官网上可以使用NVIDIA
cuda
12.x进行机器学习了,训练神经网络的效率大为提升。
kampoo
·
2024-02-15 09:47
paddlepaddle
神经网络
人工智能
[机器学习]详解transformer---小白篇
1.背景:Transformer是2017年的一篇论文《AttentionisAllYouNeed》提出的一种模型架构,这篇论文里只针对机器翻译这一种场景做了实验,并且由于encoder端是
并行计算
的,
是安澜啊
·
2024-02-15 08:11
深度学习
神经网络
cuBLAS Level-1 Function
仅为学习记录,具体内容请以nvidia官方文档为准:https://docs.nvidia.com/
cuda
/cublas/index.html#cublas-level-1-function-reference
Junr_0926
·
2024-02-15 04:17
C++ 11新特性之并发
C++11标准引入了一套全面且强大的并发编程支持库,为开发者提供了一个安全、高效地利用多核CPU资源进行
并行计算
的新框架,极大地简化了多线程开发。
hope_wisdom
·
2024-02-15 04:09
C++
11新特性
c++
开发语言
并发
C++
11
[ubuntu]ubuntu如何查看已安装cudnn版本
cudnn由于在8.0版本前后版本存储头文件不一样,所以需要分情况查询,如果你是8.0版本以前可以输入:cat/usr/local/
cuda
/include/cudnn.h|grepCUDNN_MAJOR-A2
FL1623863129
·
2024-02-15 02:10
环境配置
ubuntu
ubuntu
linux
运维
多机多卡运行nccl-tests和channel获取
openmpi3.单机测试4.多机测试mpirun多机多进程多节点运行nccl-testschannel获取环境Ubuntu22.04.3LTS(GNU/Linux5.15.0-91-genericx86_64)
cuda
11.8
Pretend ^^
·
2024-02-15 02:03
#
NCCL
NCCL
分布式
mpi
深度学习
ubuntu
网络
大模型
cuda
。
CUDA
是由NVIDIA推出的通用
并行计算
架构,它允许开发人员利用NVIDIA的GPU进行高效的计算。
小小娱乐
·
2024-02-14 18:14
python
Pytorch环境详细安装教程【Win10+
CUDA
11.6+cudNN8.6+Anaconda3虚拟环境+pycharm】
Win10+
CUDA
11.6+cudNN8.6的安装可参考笔者另一篇文章:http://t.csdnimg.cn/inyAiAnaconda创建pytorch虚拟环境1、安装AnacondaCSDN中有很多
写点什么呢
·
2024-02-14 17:31
软件/环境配置
pytorch
pycharm
人工智能
机器学习
深度学习
学习
Win10 GTX1650 安装
CUDA
11.6+CuDnn-8.6
打开自己电脑的任务管理器,查看自己电脑的显卡版本,如下图,笔者的为GTX1650流程:anaconda----VisualStudio2019----
Cuda
+CuDNN----配置环境变量----Tensorflow
写点什么呢
·
2024-02-14 17:01
软件/环境配置
机器学习
人工智能
学习
pytorch
博客摘录「 Could not locate zlibwapi.dll. Please make sure it is in your library path」2023年11月8日
不要放在
cuda
里
o0Orange
·
2024-02-14 16:23
笔记
英文TTS的实现
pipinstall-UqqWhisperSpeechdefis_colab():try:importgoogle.colab;returnTrueexcept:returnFalseimporttorch#ifnottorch.
cuda
.is_available
hehui0921
·
2024-02-14 11:18
huggingface
python
深度学习
开发语言
关于GPU一些笔记(SIMT方面)
在英伟达GPU中core一般称之为之为
cuda
core,GPU内部一般集成了成千上万个
cuda
core。为了方便进行进行对这么多的核进行管理调度,GPU将按照一定数量的
Huo的藏经阁
·
2024-02-14 10:11
#
CUDA
gpu
gpgpu
[
CUDA
学习笔记] Reduce 算子优化
Reduce算子优化注:本文主要是对文章【BBuf的
CUDA
笔记】三,reduce优化入门学习笔记-知乎的学习整理Reduce又称之为归约,即根据数组中的每个元素得到一个输出值,常见的包括求和(sum)
PeakCrosser
·
2024-02-14 10:39
CUDA
学习
笔记
CUDA
chatglm3-6b使用
ChatGLM3:ChatGLM3series:OpenBilingualChatLLMs|开源双语对话语言模型创建环境condacreate-nchatglm36python=3.11.7修改源码中依赖,使得使用
cuda
一个java开发
·
2024-02-14 06:43
大模型
人工智能
自然语言处理
【白话前端】快速区分webGL,webGPU,unity3D和UE4
一、四者都能进行3D图形渲染它们之间有一些区别,下面我将对它们进行简单的区分:WebGPU:WebGPU是一种Web图形API,是基于底层的GPU硬件架构设计的,可以更好地利用现代GPU的
并行计算
能力,
贝格前端工场
·
2024-02-14 05:54
前端
webgl
ue4
unity3d
three.js
web
3d
飞桨和torch随机数对齐
traindataloader的时候,建议设置randomseed,对于PyTorch来说#initializerandomseedtorch.manual_seed(config.SEED)torch.
cuda
.manual_seed_all
skywalk8163
·
2024-02-14 04:06
项目实践
paddlepaddle
人工智能
pytorch:.
cuda
() & .cpu() & .data & .numpy()
下面将将tensor转成numpy的几种情况1.GPU中的Variable变量:a.
cuda
().data.cpu().numpy()2.GPU中的tensor变量:a.
cuda
().cpu().numpy
不太聪明的亚子
·
2024-02-14 00:39
ModuleNotFoundError: No module named ‘mmcv._ext‘
我的是torch1.6.
cuda
10.2:pipinstallmmc
Mr.Q
·
2024-02-13 21:03
Debug
mmdetection
mmsegmentation
深度学习
pytorch
python
python3.8.8显示ModuleNotFoundError: No module named ‘mmcv’
ModuleNotFoundError:Nomodulenamed‘mmcv’pipinstallmmcv不管用打开https://github.com/open-mmlab/mmcv按照torch和
cuda
曹家小圆宝
·
2024-02-13 21:32
pytorch
mmcv
pytorch
机器学习
深度学习
Mac版 stable diffusion点生成没反应(M2)
upsample_nearest2d_channels_last"notimplementedfor'Half'查阅资料后发现有两种方法:1.打开webui-macos-env.sh文件进行如下更改Change:exportCOMMANDLINE_ARGS="--skip-torch-
cuda
-test
duan030
·
2024-02-13 14:58
macos
stable
diffusion
人工智能
Windows安装DeepSpeed
解决方案需要提前安装:PyTorch,版本最好>=1.9
CUDA
或ROCm编译器,如nvcc或hipcc安装VisualStudio,如2019自行编译pythonsetup.pybdist_
XerCis
·
2024-02-13 12:30
windows
2019-05-31
从
CUDA
的加速可以看到,即使是性能一般的650M显卡,相比单纯CPU渲染也提升了15%的速度,如果用NVidiaGTX1080等显卡了,这个速度提升会更明显。但AE渲染不是每次都会
循序渐进1655
·
2024-02-13 09:25
解决gpu没有运行进程,但是显存一直占用的方式
------------------------------------------------------------+|NVIDIA-SMI410.104DriverVersion:410.104
CUDA
Version
喝粥也会胖的唐僧
·
2024-02-13 08:08
深度学习
nvidia
fuser
多GPU-TensorFlow
首先,TensorFlow
并行计算
分为:模型并行,数据并行。模型并行:根据不同模型设计不同并行方式,模型不同计算节点放在不同GPU或者机器上进行计算。
听风1996
·
2024-02-13 05:22
Hadoop分布式系统架构-MapReduce-02
可以进行拆分的前提是这些小任务可以
并行计算
,彼此间几乎没有依赖关系。Reduce负责“合”,即对map阶段的结果进行全局汇总。MapRedu
一直上上签X
·
2024-02-12 16:41
大模型推理优化实践:KV cache 复用与投机采样
该引擎与当前广泛使用的多种主流模型兼容,并通过采用高性能的
CUDA
算子来实现了如PagedAttention和ContinuousBatching等多项优化措施。
阿里技术
·
2024-02-12 15:01
RTP-LLM
大模型
KV
cache
推理优化
投机采样
快速构建 Tensorflow GPU 开发环境(Ubuntu / macOS)- 2023年
文章目录安装Anaconda/Miniconda安装NividaGPU驱动安装
cuda
toolkit和cudnn设置环境变量安装Tensorflow测试GPU是否开启成功AppleM1/M2安装GPU支持
Ryan HUST
·
2024-02-12 13:05
tensorflow
ubuntu
macos
并行计算
导论 笔记 1
目录并行编程平台隐式并行超标量执行/指令流水线超长指令字处理器VLIW内存性能系统的局限避免内存延迟的方法
并行计算
平台控制结构通信模型共享地址空间平台消息传递平台对比物理组织理想
并行计算
机
并行计算
机互联网络网络拓朴结构基于总线的网络交叉开关网络多级网络全连接星形线性阵列
hijackedbycsdn
·
2024-02-12 12:20
笔记
pytorch_quantization/
cuda
_ext.cpython-310-x86_64-linux-gnu.so: undefined symbol: _ZN3c106detail1
pytorch_quantization/
cuda
_ext.cpython-310-x86_64-linux-gnu.so:undefinedsymbol:_ZN3c106detail1pytorch_quantization
szZack
·
2024-02-12 12:46
人工智能
深度学习
多模态
pytorch
量化
OSError: lib
cuda
rt.so.11.0: cannot open shared object file: No such file or directory
OSError:lib
cuda
rt.so.11.0:cannotopensharedobjectfile:Nosuchfileordirectory完美解决:OSError:lib
cuda
rt.so.11.0
szZack
·
2024-02-12 12:16
人工智能
深度学习
libcudart.so.11
torch
CentOS 7.9安装Tesla M4驱动、
CUDA
和cuDNN
1、下载软件结合上次的经验教训,我们本次先确定合适的
CUDA
(ComputeUnifi
Danileaf_Guo
·
2024-02-12 08:41
centos
linux
运维
服务器
【orbslam2+nerf】
1.需要安装
cuda
cudnneigen-3.4.0opencv4.4以上(推荐opencv-4.5.5)需要gui,还要安装glfw:sudoapt-getinstalllibglfw3-devlibgl1
cashap27149
·
2024-02-12 06:47
webpack
前端
node.js
CUDA
安装和使用
下载GEFORCEEXPERIENCE更新显卡驱动根据查看自己的支持
CUDA
,桌面右键,打开英伟达控制面板->帮助->系统信息下载对应的
CUDA
,选择自定义安装,第一次安装可能失败,找到失败原因
龙行泽雨
·
2024-02-12 04:13
pytorch
yolov8 1650TI训练报错
ributeError:‘str’objecthasnoattribute‘values’GTX16xx用户的大坑,基本上每个GTX16xx用户使用YOLO系列算法,都会遇到这些问题这个没办法,唯一的解决办法是使用
cuda
10.2
Dakchueng
·
2024-02-12 02:06
win10+yolov8分割
C++
TRT和vino部署
YOLO
python
深度学习
并行计算
工具 MPI 简单教程
UsingMPIwithC并行程序使用户能够充分利用超级计算集群的多节点结构。消息传递接口(MPI)是一种标准,用于允许集群上的多个不同处理器相互通信。在本教程中,我们将使用英特尔C++编译器、GCC、IntelMPI和OpenMPI用C++创建多处理器“helloworld”程序。本教程假设用户具有Linux终端和C++经验。Setupand“Hello,World”这应该为您的环境准备好编译和
疯狂的泰码君
·
2024-02-12 02:54
MPI
并行计算
MPI
Mamba 环境安装踩坑问题汇总及解决方法
笔者在配置相关环境(版本安装要求:PyTorch1.12+;
CUDA
11.6+)时,发现按照他们给的安装方法12安装时会遇到非常多的bug,主要集中在causal-conv1d和mamba-ssm上,原因都是版本兼容问题
yyywxk
·
2024-02-11 21:51
#
Python模块有关问题
Mamba
python
pytorch
深度神经网络中的BNN和DNN:基于存内计算的原理、实现与能量效率
尽管图形处理单元(GPU)在许多应用中被用于提供
并行计算
能力,但较低能耗的平台有可能实现一系列新的应用。
·
2024-02-11 18:53
算法
pytorch的安装及其在pycharm中的使用
1.首先配置Anaconda虚拟环境在AnacondaPrompt中输入condacreate-npytorchpython==3.72.在该环境中安装pytorch因为前面已经安装了
cuda
10.0.130
Kerin637
·
2024-02-11 18:55
配置过程记录
VSCode
CUDA
C/C++ 远程开发环境配置
本文讨论配置VSCode
CUDA
C/C++的远程开发环境。
·
2024-02-11 18:07
Stable Diffusion WebUI 绘画【官方教程】
大模型配置环境介绍目前平台集成了StableDiffusionWebUI的官方镜像,该镜像中整合如下资源:StableDiffusionWebUI版本:v1.7.0Python版本:3.10.6Pytorch版本:2.0.1
CUDA
·
2024-02-11 18:27
PyTorch版本说明与安装
文章目录一、基于GPU和基于CPU的PyTorch区别二、查看是否能够安装GPU版本的PyTorch三、如何安装基于GPU的PyTorch1.检查本机
CUDA
2.PyTorch安装一、基于GPU和基于CPU
YuanDaima2048
·
2024-02-11 13:52
工具使用
深度学习
pytorch
机器学习
人工智能
python
笔记
tensorflow安装版本问题
TensorFlow安装问题解决查看安装版本信息TensorFlow与
cuda
对应关系cudnn和
cuda
版本对应创建Anconda环境自己创建的环境配置如下:环境名称Python版本tensorflow-gpu
YuanDaima2048
·
2024-02-11 13:51
工具使用
tensorflow
人工智能
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他