E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
CUDA并行计算
GPU编程与
CUDA
CUDA
编程
并行计算
整体流程从主机端申请内存,把内存部分的内容拷贝到设备端在设备端的核函数计算从设备端拷贝到主机端,并且释放内存显存主机端:cpu设备端:gpu核函数:在gpu上运行的函数
CUDA
内存模型
Nice_cool.
·
2025-01-30 21:17
Cuda与TensorRT
c++
GPU-
CUDA
编程学习(一)
Hello,
CUDA
最近在学习GUP编程,故此记录下学习进度。
☞北海北☜
·
2025-01-30 21:45
c++
多版本
cuda
+多版本cudnn+gcc+cmake+opencv+darknet爬坑记录
本次针对darknet框架部署—centos7.x一、
CUDA
多版本安装1、很早前安装了很多
cuda
现在忘了步骤了,这里不再安装,下次再补上,可以看其他贴安装,记清楚自己的安装目录,一般默认在/usr/
LMM_AI
·
2025-01-30 21:41
系统学习
深度学习
RTX4060+ubuntu22.04+
cuda
11.8.0+cuDNN8.6.0 & 如何根据显卡型号和系统配置
cuda
和cuDNN所需的安装环境
文章目录电脑原配置安装
cuda
和cuDNN前的环境选择cuDNN与
CUDA
tookit和nvidiadriver的对应关系
cuda
版本选择⭐查看自己的nvidiadriver版本和最大支持的
CUDA
版本
computer_vision_chen
·
2025-01-30 20:05
带你跑通人工智能项目
cuda
cuDNN
ubuntu22.04 + isaac gym环境配置流程
1.
CUDA
安装1.看系统架构:uname-m2.去官网下载适配你显卡驱动的最新
cuda
,可以通过nvidia-smi查看https://developer.nvidia.com/
cuda
-toolkit-archive3
Yakusha
·
2025-01-30 20:02
linux
bash
c++
Transformer架构的GPU并行和之前的NLP算法并行有什么不同?
1.什么是GPU
并行计算
?GPU
并行计算
是一种利用图形处理单元(GPU)进行大规模并行数据处理的技术。
AI大模型学习不迷路
·
2025-01-30 07:49
transformer
自然语言处理
大模型
深度学习
NLP
LLM
大语言模型
cuda
线程调度
比如RTX2070有36个StreamingMultiprocessors,而每个SM有64个
CUDA
Cores,RTX2070具有36*64=2304个
CUDA
Cores。
weiwei0319
·
2025-01-30 05:31
CUDA
并发编程
Window 下Mamba 环境安装踩坑问题汇总及解决方法 (无需绕过selective_scan_
cuda
)
安装问题参看本人博客:Mamba环境安装踩坑问题汇总及解决方法(重置版)Windows下Mamba的安装参看本人博客:Window下Mamba环境安装踩坑问题汇总及解决方法(无需绕过selective_scan_
cuda
yyywxk
·
2025-01-30 03:45
#
Python模块有关问题
python
Windows
Mamba
vmamba 尝试安装记录
安装虚拟环境condacreate-nvmambapython==3.102、激活环境condaactivatevmamba3、安装附加环境pipinstall-rrequirements.txt4、确保
cuda
青雉007
·
2025-01-30 02:41
conda
python
Window Mamba 环境安装【
CUDA
】
直接安装Mamba及其依赖3.手动编译Mamba及其依赖1.安装PyTorch环境condacreate-nmambapython=3.10condaactivatemambacondainstall
cuda
toolkit
红豆布丁
·
2025-01-30 02:11
python
mamba
ssm
cuda
云计算技术深度解析与代码使用案例
云计算技术特点云计算是网格计算、分布式计算、
并行计算
、效
我的运维人生
·
2025-01-29 17:19
云计算
运维开发
技术共享
【人工智能】Python常用库-PyTorch常用方法教程
1.安装与导入1.1安装PyTorch访问PyTorch官方网站,根据系统、Python版本和
CUDA
支持选择安装命令。
IT古董
·
2025-01-29 15:08
人工智能
机器学习
Python
人工智能
python
pytorch
机器学习
Ubuntu22.04安装
CUDA
10.1
Ubuntu22.04安装
CUDA
10.1前言gcc降级添加软件源更新软件源安装gcc-7更换gcc版本安装
CUDA
10.1前言ubuntu22.04支持
cuda
10.7以上的版本,而在一些情况下我们需要用到低级的
想夹逼但不收敛
·
2025-01-29 11:00
ubuntu
c++
docker镜像报错ERROR: failed to solve: DeadlineExceeded:
--------------------1|#基于NVIDIA
CUDA
镜像,确保GPU支持2|>>>FROMnvidia/
cuda
:12.6.2-cudnn-devel-ubuntu20.043|4|#
柠檬编程工作室
·
2025-01-28 11:05
Docker
docker
eureka
容器
Transformer架构和Transformers 库和Hugging Face
特点:
并行计算
能力
大哥喝阔落
·
2025-01-28 04:50
transformer
架构
深度学习
实验踩坑 flash_attn_2_
cuda
undifiend symol
Failedtoimporttransformers.models.llama.modeling_llamabecauseofthefollowingerror(lookuptoseeitstraceback):…/lib/python3.10/site-packages/flash_attn_2_
cuda
.cpython
崩溃李
·
2025-01-28 00:51
linux
LLaVA微调debug:ImportError: xxx/flash_attn_2_
cuda
.cpython-310-x86_64-linux-gnu.so: undefined symbol:
完整报错信息:ImportError:/home/linjl/anaconda3/envs/sd/lib/python3.10/site-packages/flash_attn_2_
cuda
.cpython
同屿Firmirin
·
2025-01-28 00:46
大模型debug笔记
linux
运维
服务器
深度学习
语言模型
从Nvidia切换到华为云昇腾芯片的入门技巧
等价命令Nvidia昇腾说明nvidia-sminpu-smiinfo查看机器上显卡信息npu-smiinfo-tusages-i查看显卡使用率
CUDA
_VISIBLE_DEVICESASCEND_RT_VISIBLE_DEVICES
sunrise_ccx
·
2025-01-27 23:40
华为云
人工智能
Python&aconda系列:
CUDA
+Anaconda的安装以及 Conda实用命令
这里写目录标题一.深度学习环境配置:
CUDA
+Anaconda的安装3.1.1
CUDA
简介3.1.2查看电脑显卡型号是否支持
CUDA
的安装3.1.3查看电脑显卡的驱动版本3.1.4根据显卡驱动版本下载支持的
坦笑&&life
·
2025-01-27 20:54
#
python
python
conda
开发语言
pytorch单机多卡训练_数据并行DataParallel
模型并行是指,多张GPUs使用同一batch的数据,分别训练模型的不同部分.2.DataParallel源码2.1需要传入的参数module(Module):被并行运算的模型device_ids=None:
CUDA
devicesoutput
Major Tom _
·
2025-01-27 13:03
pytorch
人工智能
python
Tesla V100驱动安装
确认操作系统kernel版本,参考链接:https://docs.nvidia.com/
cuda
/archive/12.2.0/
cuda
-installation-guide-linux/index.html
郭宝才
·
2025-01-26 17:17
linux
服务器
运维
《剖析Transformer架构:自然语言处理飞跃的幕后英雄》
打破传统枷锁,开创
并行计算
新时代在Transformer出现之前,循环神经网络(RNN)及其变体,如
·
2025-01-26 11:25
人工智能深度学习
训练入口+保存模型
frommodels.model_coupled_v1importUnetfromdata.data_loadimport*importglobfromcollectionsimportOrderedDictdevice="
cuda
如若123
·
2025-01-26 04:30
深度学习
python
人工智能
使用Python实现
并行计算
算法:效率提升的利器
并行计算
作为一种提升计算效率的重要手段,能够充分利用多核处理器的优势,加速任务的完成。Python作为一种灵活且功能强大的编程语言,提供了丰富的
并行计算
工具。
Echo_Wish
·
2025-01-25 13:32
Python进阶
python
算法
开发语言
python做
并行计算
_python做
并行计算
可以吗
python可以做
并行计算
,下面是相关介绍:一、概览ParallelPython是一个python模块,提供在SMP(具有多个处理器或多核的系统)和集群(通过网络连接的计算机)上并行执行python代码的机制
角动量不守恒
·
2025-01-25 13:31
python做并行计算
python
并行计算
0.基础并行/发:multiprocessing/threading1.concurrent2.并发:asynico3.Ipython下的
并行计算
:使用ipyparallel库的IPython提供了前所未有的能力
weixin_30894389
·
2025-01-25 12:00
Python
并行计算
:提高效率的利器
为了应对这些挑战,一种常见的解决方案是利用
并行计算
技术。Python作为一种流行的编程语言,也提供了强大的工具和库来支持
并行计算
。本文将介绍Python中的
并行计算
概念和技术,并提供一些示例代码。
uote_e
·
2025-01-25 12:00
python
java
linux
Python
花费上万元的 RTX4090,普通人真的需要它的性能吗?
01RTX4090的性能规格它拥有超多的
CUDA
核心,数量高达16384个。这就好比有一支庞大的计算大军,能够快速处理各种复杂的图形计算任务。
·
2025-01-24 16:32
显卡
Windows 下Mamba2 环境安装问题记录及解决方法(causal_conv1d=1.4.0,mamba_ssm=2.2.2)
安装问题参看本人博客:Mamba环境安装踩坑问题汇总及解决方法(重置版)Windows下Mamba的安装参看本人博客:Window下Mamba环境安装踩坑问题汇总及解决方法(无需绕过selective_scan_
cuda
yyywxk
·
2025-01-24 14:38
#
Python模块有关问题
mamba
python
windows
mamba2
Linux 下 Vim 环境安装踩坑问题汇总及解决方法(重置版)
安装问题参看本人博客:Mamba环境安装踩坑问题汇总及解决方法(重置版)Windows下Mamba的安装参看本人博客:Window下Mamba环境安装踩坑问题汇总及解决方法(无需绕过selective_scan_
cuda
yyywxk
·
2025-01-24 14:38
#
Python模块有关问题
linux
vim
mamba
GPU 集群和分布式计算
《GPU集群和分布式计算》关键词:GPU集群、分布式计算、
CUDA
、OpenACC、OpenMP、性能优化、故障处理、案例分析摘要:本文详细探讨了GPU集群和分布式计算的基本概念、架构、编程模型以及应用场景
AI天才研究院
·
2025-01-23 21:28
计算
AI大模型企业级应用开发实战
大数据AI人工智能
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
error: [Errno 2] No such file or directory: ‘:/usr/local/
cuda
-12.1/bin/nvcc‘: ‘:/usr/local/
cuda
-12.1
一背景最近在服务器使用
cuda
报错,昨天使用还可以,今日就出问题,在此记录解决方案。
鲤鱼不懂
·
2025-01-23 19:46
bug
cuda
【
CUDA
-BEVFusion】tool/build_trt_engine.sh 文件解读
build_trt_engine.sh#configuretheenvironment.tool/environment.shif["$ConfigurationStatus"!="Success"];thenecho"Exitduetoconfigurefailure."exitfi#tensorrtversion#version=`trtexec|grep-m1TensorRT|sed-n"s
old_power
·
2025-01-23 18:37
计算机视觉
计算机视觉
深度学习
小土堆学习笔记10(利用GPU训练于模型验证)
1.利用GPU训练GPU可优化操作如下操作方法1方法2数据获取判断是否可以使用GPU,如果可以直接model.
cuda
()先设定device,用的时候直接model.to(“device”)损失函数1.1
干啥都是小小白
·
2025-01-22 11:03
pytorch学习——小土堆
学习
笔记
深度学习
安装
CUDA
Cudnn Pytorch(GPU版本)步骤
一.先看自己的电脑NVIDIA支持
CUDA
版本是多少?
学乐乐
·
2025-01-22 08:43
pytorch
人工智能
python
【环境安装】安装LLaMA-Factory
Linux-Centos7;显卡驱动:DriverVersion:460.106.00;TeslaP40*2【目标环境说明】torch==1.13.1+cu116llamafactory==0.9.2.dev01.
CUDA
11.6
BoostingIsm
·
2025-01-22 05:47
环境安装
深度学习
人工智能
async++源码阅读——parallel部分
1、背景async++框架中提供了多种
并行计算
的工具,其中包括parallel_for、parallel_invoke、parallel_reduce。
哎呦,帅小伙哦
·
2025-01-22 02:23
#
async++
c++
异步编程
async++
linux下jax-GPU安装
安装命令详细内容可查看jax官方文档在已有
cuda
的情况下,先使用命令1,再使用命令2,即可完成安装命令1:linux下jax安装命令pipinstalljax[cpu]==0.3.25-fhttps:
liu_zhaoda
·
2025-01-21 13:00
深度学习-jax
linux
python
pytorch
jax 和 jaxlib 的
cuda
版本安装
笔者花费时间才在Ubuntu20.04适配上jax和jaxlib的
cuda
版本安装,以及chex版本。
正经市民
·
2025-01-21 12:20
linux
人工智能
python
pip
全面解析NVIDIA显卡:从入门级到旗舰级显卡详解
入门级显卡NVIDIAGeForceGT1030
CUDA
核心数:384基础频率:1227MHz加速频率:1468MHz显存:2GB
花千树-010
·
2025-01-20 18:05
大模型
人工智能
算法
智能电视
Matlab多核CPU并行和多线程
简介这里需要明白的概念有:多核、多进程、多线程、
并行计算
、并发计算的区别。什么是多核在计算机设计早期,为了响应更多计算性能的需要,单处理器系统发展成为多处理器系统。
m0_74823021
·
2025-01-19 22:39
面试
学习路线
阿里巴巴资料职业发展
matlab
java
数据库
后端
从零开始的 AI Infra 学习之路
概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM五、AI编译&计算架构5.1
CUDA
5.2CANN
SSS不知-道
·
2025-01-19 15:15
MLSys
人工智能
深度学习
pytorch
ImportError: libnvinfer.so.8: cannot open shared object file: No such file or directory
Nosuchfileordirectory上面报错信息的意思主要是liblibcudnn.so.8这个文件找不到在网上查资料后知道了这个文件是在cudnn的安装包里的,那需要先安装cudnnNVIDIA官网下载cuDNN8.2.1
CUDA
11
kyle-fang
·
2025-01-19 14:37
模型部署
经验分享
构建高效GPU算力平台:挑战、策略与未来展望
引言随着深度学习、高性能计算和大数据分析等领域的快速发展,GPU(图形处理器)因其强大的
并行计算
能力和浮点运算速度而成为首选的计算平台。
Mr' 郑
·
2025-01-19 11:43
gpu算力
AI技术架构:从基础设施到应用
1.GPU(图形处理单元):
并行计算
的核心GPU是深度学习的核心引擎,专为大规模
并行计算
设计。技术优
fuqinyijiu
·
2025-01-19 06:31
AI
人工智能
架构
Jetson显卡上运行Qwen2-1.5b模型时报错“RuntimeError triu_tril_
cuda
_template not implemented for ‘BFloat16‘”
Jetson显卡上运行Qwen2-1.5b模型时报错“RuntimeErrortriu_tril_
cuda
_templatenotimplementedfor‘BFloat16’”问题描述:
CUDA
_DEVICE
wang151038606
·
2025-01-19 00:31
python中bug
人工智能
pytorch
人工智能
python
深度学习(1)
一、torch的安装基于直接设备情况,选择合适的torch版本,有显卡的建议安装GPU版本,可以通过nvidia-smi命令来查看显卡驱动的版本,在官网中根据
cuda
版本,选择合适的版本号,下面是安装示例代码
浅忆へ梦微凉
·
2025-01-18 18:57
深度学习
人工智能
深度学习
学习方法
python
[python]通过whl文件安装torchvision和torchaudio及国内whl文件下载地址汇总
你可以从PyTorch的官方网站获取适合你系统的安装命令例如,如果你使用的是
CUDA
11.3和Python3.8,你可以使用以下命令安装PyTorch:p
萌萌哒240
·
2025-01-18 16:40
环境配置
python
开发语言
centos7安装
cuda
、dudnn、Nvidia驱动[最详细的教程和报错解决方案]
现在很多教程都没有覆盖全报错问题,本文几乎把所有问题都描述到位首先说下我电脑的环境:centos7x86-64:uname-r命令显示为3.10.0-1160.el7.x86_64;物理显卡为单卡2080ti;gcc通过yum安装,yuminstallgcc版本为4.8.5,同时会显示安装一些其他包,如glibc版本为2.17;安装准备以下为驱动和官网文件名一致,可到nvidia官网下载,选择历史
LensonYuan
·
2025-01-18 08:10
自然语言处理
深度学习
自然语言处理
数据挖掘
机器学习
深度学习
云计算技术深度解析与代码实践
云计算技术特点云计算技术融合了网格计算、分布式计算、
并行计算
、效用计算、网络存储、虚拟化以及负载均衡等多种先进技
我的运维人生
·
2025-01-17 19:27
云计算
flask
python
运维开发
技术共享
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他