E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cuda(GPU
【Pytorch】cumsum的实现逻辑
本文只记录cumsum的实现逻辑的
CUDA
部分,也即底层调用了
CUDA
的什么实现算子。
栏杆拍遍看吴钩
·
2024-09-09 20:13
pytorch
pytorch
人工智能
python
OSError: libnccl.so.2: cannot open shared object file: No such file or directory
linux安装完torch或者tensorflow的
gpu
版本,安装没问题,但是import就有问题,报错OSError:libnccl.so.2:cannotopensharedobjectfile:
王小葱鸭
·
2024-09-09 17:16
python
百度飞桨paddle安装 包括
CUDA
,cuDNN,opencv的安装
conda创建新环境这部分代码均在AnacondaPrompt中写,要求已有Anaconda第一步:创建condacreate--nameyourEnvpython=3.6–name:也可以缩写为【-n】,【yourEnv】是新创建的虚拟环境的名字,创建完,可以装anaconda的目录下找到envs/yourEnv目录python=2.7:是python的版本号。也可以指定为【python=3.6
小甲学长
·
2024-09-09 16:13
opencv
百度
paddlepaddle
深度学习回归任务训练代码模版
+验证迭代使用`tensorboard`输出模型训练过程和指标可视化(可选)结果预测参考参数设置超参设置:config包含所有训练需要的超参数(便于后续的调参),以及模型需要存储的位置device='
cuda
'iftorch.
cuda
.is_av
槐月初叁
·
2024-09-09 13:17
深度学习
深度学习
回归
人工智能
cpu运行
gpu
上的pytorch 报错:AssertionError:torch not compiled with
cuda
enabled——已解决
感觉今天介绍的这种方法可以解决所有这种报错出现的问题事件发生:报错:AssertionError:torchnotcompiledwith
cuda
enabled解决方法:后来看到这个代码parser.add_argument
霍格沃茨电气魔法师
·
2024-09-09 11:35
python
java
python
数据库
js
深度学习
Transiting from
CUDA
to HIP(三)
一、Workarounds1.memcpyToSymbol在HIP(Heterogeneous-computeInterfaceforPortability)中,hipMemcpyToSymbol函数用于将数据从主机内存复制到设备上的全局内存或常量内存中,这样可以在设备端的内核中访问这些数据。这个功能特别有用,因为它允许在主机端定义数据符号,并在设备端的内核中使用这些符号。#include#inc
青禾子的夏
·
2024-09-09 05:55
HIP
异构计算
Rocm
开发语言
Infiniband网络架构的技术与性能分析
集群算力优化的关键在于
GPU
利用率和线性加速比。其中,
GPU
利用率受限于
科技互联人生
·
2024-09-09 04:51
科技
数码
人工智能
网络
系统架构
【车载智能座舱域控制器】-【测试】
目录一、座舱SOC芯片历程介绍1、注解:1.CPU(中央处理器)2.
GPU
(图形处理器)3.NPU(神经处理单元)2、具体应用示例3、性能指标的重要性二、智能座舱包含哪些功能三、智能座舱测试包括:四、智能座舱
@逝水流年轻染尘@
·
2024-09-09 01:56
测试工具
【已解决】Halcon错误代码4104
结果如下图所示,正常在使用
GPU
训练。搞定,手工~
聪明不喝牛奶
·
2024-09-08 23:12
深度学习
Halcon+CSharp
halcon
深度学习
HALCON 错误代码 #7709
原因报7709主要的原因有如下几个原因:1、就是你选的
cuda
版本和cudnn的不匹配,这个原因应该大家在选择的时候注意一下版本对比的话可以避免,基本上不是这个原因造成的。
聪明不喝牛奶
·
2024-09-08 23:41
Halcon+CSharp
深度学习
halcon
深度学习
10 自研rgbd相机基于rk3566之OPENCL加速库测试与开发
3opencl移植与调用:opencl加速库核函数编写1开发流程:2核函数编写接口函数定义如下:示例代码如下:opencl加速库示例代码opencl加速库介绍1OpenCL概念opencl是可以直接调用
gpu
三十度角阳光的问候
·
2024-09-08 21:03
opencl
gpu加速
rk3566/rk3588
核函数
异构加速
【DeepSpeed 教程翻译】三,在 DeepSpeed 中使用 PyTorch Profiler做性能调试和Flops Profiler教程翻译
文章目录0x0.前言0x1.在DeepSpeed中使用PyTorchProfiler做性能调试Profile模型训练的循环标记任意代码范围ProfileCPU/
GPU
的活动Profile内存消耗0x2.
just_sort
·
2024-09-08 17:39
pytorch
深度学习
人工智能
Vortex GP
GPU
的硬件代码分析(Cache篇3)
文章目录前言一、VX_cache.sv代码部分解读3——bank1.1bankrequestdispatch1.1.1解释VX_stream_xbar模块1.1.2解释VX_stream_arb模块1.1.3解释VX_generic_arbiter模块1.1.4解释VX_priority_arbiter模块1.1.5解释VX_rr_arbiter模块1.1.6解释VX_fair_arbiter模块
DentionY
·
2024-09-08 13:09
Vortex
GPGPU硬件代码分析
架构开发
缓存
关于隐语架构概览的知识
包括但不限于CPU、
GPU
、内存以
m0_67966665
·
2024-09-08 11:25
架构
ERROR: No matching distribution found for torch-geometri satisfies the requirement torch-geometric
试了网上的whl下载确保虚拟环境下nvcc和
cuda
版本一致,还不行遂找淘宝大佬,大佬换了pytorch版本python版本都不行最后根据报错出现的setup安装了pytest-runner,然后pipsearch
zzzzz忠杰
·
2024-09-08 05:14
笔记
pytorch
python
深度学习
解决安装依赖项时的ERROR: No matching distribution found for torch==1.10.0+cu111问题
在这种情况下,+cu111表示你正在安装针对
CUDA
11.1的Torch版本。因此,你需要确保你的环境中已经安装了
CUDA
11.1,并且你正在使用与之兼容的Torch版本。
CAI2256
·
2024-09-08 05:43
python
深度学习
神经网络
pytorch
ERROR: No matching distribution found for torch==1.4.0 (from torchvision)
pipinstall--no-depstorchvision==0.5.0下面是
cuda
版本,Torch版本,Torchvision版本以及python版本的对应关系做了一个表,仅供大家参考
迷雾总会解
·
2024-09-08 05:12
机器学习/深度学习
坑
python
pytorch
第十四节:学习Springboot 的restful接口风格(自学Spring boot 3.x的第三天)
增(PostMapping)/***保存学生*@return*/@PostMappin
gpu
blicStudentsave(@RequestBodyStudentstudent){studentService.save
Mero技术博客
·
2024-09-08 05:11
从零开始学习Spring
Boot
3.x
学习
spring
boot
restful
微软开源 Phi-3.5 视觉模型
512个H100
GPU
,3.4万亿个tokens训练了10天。Phi3.5MoE:16x3.8B参数
三花AI
·
2024-09-08 02:19
三花AI
microsoft
人工智能
深度学习
元学习(meta learning)(一)
实际上没有什么好方法来调这些超参,今天工业界最常拿来解决调整超参数的方法是买很多张
GPU
,然后一次训练多个模型,有的训练不起来、训练效果比较差的话就输入掉,最后只看那些可以训练的比较好的模型会得到什么样的性能
前行居士
·
2024-09-08 02:48
学习
人工智能
神经网络
深度学习
机器学习
元学习
大模型推理框架 RTP-LLM 架构解析
RTP-LLM与当前广泛使用的多种主流模型兼容,使用高性能的
CUDA
kernel,包括PagedAttention、FlashAttention、FlashDecoding等,支持多模态、LoRA、P-Tuning
阿里技术
·
2024-09-07 23:32
架构
LLM
推理
阿里巴巴
RPT
OSError: [WinError 126] 找不到指定的模块---caffe2_detectron_ops_
gpu
.dll
Errorloading"C:\Anaconda\Anaconda3\envs\TIN\lib\site-packages\torch\lib\caffe2_detectron_ops_
gpu
.dll"oroneofitsdependencies
努力的小柚
·
2024-09-07 15:34
python运行问题
python
pytorch
深度学习框架相关-Python模块的介绍和使用---torch
PyTorch的设计目标是提供灵活且高效的工具集,用于深度学习和科学计算;2.下面主要介绍torch模块的五个功能:数据加载和处理,
GPU
加速,建立网络模型,模型的保存和加载,梯度更新和参数优化;上面功能主要用到的子模块如下
sccum
·
2024-09-07 09:22
Python常用库的介绍和使用
深度学习
python
人工智能
[
GPU
与CPU100倍性能之谜,论文个人阅读分享]Debunking the 100X
GPU
vs. CPU myth: an evaluation of throughput computing
Debunkingthe100X
GPU
vs.CPUmyth:anevaluationofthroughputcomputingonCPUand
GPU
*Authors:VictorW.Lee,ChangkyuKim
GutsShinyHero
·
2024-09-07 04:17
杂项学习
性能优化
gpu算力
apex安装,解决ModuleNotFoundError: No module named ‘packaging‘ error: subprocess-exited-with-error
apexcdapexpipinstall-v--no-cache-dir--global-option="--pyprof"--global-option="--cpp_ext"--global-option="--
cuda
_ext
pingtaner1105
·
2024-09-06 20:00
python
pip
PyTorch 版本与
CUDA
版本的兼容性示例
PyTorch1.9.0及以上版本支持
CUDA
11.1。PyTorch1.8.0支持
CUDA
11.0。PyTorch1.7.0支持
CUDA
10.2。PyTorch1.6.0支持
CUDA
10.1。
小赖同学啊
·
2024-09-06 17:36
智能硬件
大数据
pytorch
人工智能
python
python opencv
cuda
tensorrt pytorch之间的版本对应
python3.7opencv4.4
cuda
10.2tensorrt7xpytorch1.5DeepStream5.xOpenCV2.x:支持Python2.xOpenCV3.x:支持Python2.7
YIACA
·
2024-09-06 16:33
python
opencv
pytorch
在PyTorch中使用
CUDA
, pytorch与
cuda
不同版本对应安装指南,查看
CUDA
版本,安装对应版本pytorch_pytorch
cuda
在PyTorch中使用
CUDA
,根据你的具体环境和需求调整版本号,确保安装的PyTorch版本与你的
CUDA
版本兼容。
2401_84009626
·
2024-09-06 16:31
程序员
pytorch
人工智能
python
Python、PyTorch与
cuda
的版本对应表
常见的Python和PyTorch版本对应关系。PyTorch版本对应的PythonPyTorch1.0Python2.7,3.5,3.6,3.7PyTorch1.1Python2.7,3.5,3.6,3.7PyTorch1.2Python2.7,3.5,3.6,3.7PyTorch1.3Python2.7,3.5,3.6,3.7PyTorch1.4Python2.7,3.5,3.6,3.7,3.
码韵
·
2024-09-06 16:31
环境搭建
python
开发语言
【FFMPEG】Install FFmpeg
CUDA
gltransition in Ubuntu
因为比较复杂,记录一下自己安装过程,方便后续查找,所有都是在docker环境安装
cuda
11.7的**ffmpeg4.2.2nv-codec-headers-9.1.23.3**手动下载安装吧https
RockWang.
·
2024-09-06 14:48
环境配置
ffmpeg
ubuntu
linux
环境安装-1:Python3.8+
CUDA
11.6.1+cuDNN8.6+Tensorflow-
gpu
2.6.1
一、知识储备1.
CUDA
CUDA
是显卡厂商NVIDIA推出的运算平台。
CUDA
™是一种由NVIDIA推出的通用并行计算架构,该架构使
GPU
能够解决复杂的计算问题。
w坐看云起时
·
2024-09-06 10:50
环境安装
tensorflow
python
人工智能
window下安装pytorch出现的两个问题:1.OSError: [WinError 126] 找不到指定的模块。2.from torch._C import *
首先,你的确保自己装的pytorch版本正确,有
cuda
的话要查看其版本,如果没有
cuda
一定要选None,还有建议python版本不要太低,我选的是python=3.7主要是出现以下两个问题:1.OSError
kahuifu
·
2024-09-06 07:59
pytorch
arm a7 支持虚拟化吗_Arm增加CPU、
GPU
和ISP,实现自主和视觉安全_Mali
原标题:Arm增加CPU、
GPU
和ISP,实现自主和视觉安全Arm引入了一套新的知识产权(IP),包括新的CPU、
GPU
和ISP(图像信号处理器),以实现可扩展、高效的计算能力,以实现跨汽车和工业应用的安全
weixin_39569112
·
2024-09-06 06:22
arm
a7
支持虚拟化吗
GPU
编程
CPU
异同点
nas918+支持的cpu
用ARM编写
显示当前系统时间
ISP(图像信号处理器)是什么?
和电脑的
GPU
类似,通常采并行计算。功能:Bayertransformation图像传感器(就是光电转换器)中的光电二极管(吸收光子产生电流)其实是无法识别颜色的,为了能够识别颜
FoGoiN
·
2024-09-06 05:16
嵌入式硬件
单片机
物联网
英伟达A100算力卡性能及应用
以下是关于A100的性能参数及应用的详细介绍:性能参数架构与制程:架构:Ampere制程:7纳米核心与频率:
CUDA
核心数:6912个Tensor核心数:432个Boost时钟频率:1.41GHz性能:
算力资源比较多
·
2024-09-06 05:16
算力
英伟达
大模型
人工智能
gpu算力
语言模型
大数据
推荐算法
NPU技术总结
NPUs的设计架构:NPUs通常采用不同于传统CPU或
GPU
的架构,优化了矩阵运算和并行处理。指令集:它们拥有专门的指令集,用于加速神经网络中的常见操作,如卷积和激活函数。
技术学习分享
·
2024-09-06 00:47
webgl
processon
Nvidia
GPU
benchmark压力测试工具
一、参考资料使用Pytorch测试
cuda
设备的性能(单卡或多卡并行)
GPU
:使用
gpu
-burn压测
GPU
二、
GPU
压力测试方法1.PyTorch方式使用torch.ones测试
CUDA
设备。
花花少年
·
2024-09-06 00:13
运维
Nvidia
benchmark
GPU
gpu_burn
快速搭建本地 Whisper 语音识别大模型
前置准备在开始之前,你需要确保计算机符合以下条件:Python3.7+环境
GPU
支持(
CUDA
驱动):尽管CPU也能运行,但
GPU
会更快。足够的存储空间:模型可能需要几个GB。步骤一:
码上飞扬
·
2024-09-05 18:31
whisper
AI创业必备:
GPU
云、
GPU
租赁或自建,你选对了吗?
在快速发展的机器学习领域,人工智能初创公司对
GPU
的需求与日俱增。
GPU
成了AI创业公司们构建核心资源,甚至颠覆创新的关键资源和基础设施。然而,这也让
GPU
资源的价格水涨船高。
DO_Community
·
2024-09-05 17:25
商业建议
技术科普
人工智能
gpu算力
ai
语言模型
服务器
Linux 编译 qtav,QtAV 1.3.3 发布,跨平台音视频播放库
QtAV1.3.3发布-支持调用NVIDIA的cuvid库进行
CUDA
硬解。支持平台:windows,linux。(是linux上第一个支持
cuda
硬解的么?)。有些视频播放会抖动,目前原因还不清楚。
丶本心灬
·
2024-09-05 14:35
Linux
编译
qtav
为什么深度学习用
GPU
而不是CPU
首先,我们深度理解一下中央处理器(CentralProcessingUnit,CPU)的核心。CPU的每个核心都拥有高时钟频率的运行能力,和高达数MB的三级缓存(L3Cache)。它们非常适合执行各种指令,具有分支预测器、深层流水线和其他使CPU能够运行各种程序的功能。然而,这种明显的优势也是它的致命弱点:通用核心的制造成本非常高。它们需要大量的芯片面积、复杂的支持结构(内存接口、内核之间的缓存逻
小锐->技术成就梦想,梦想成就辉煌。
·
2024-09-05 13:59
深度学习
人工智能
Unity3D 如何提升游戏运行效率详解
1.优化渲染性能1.1使用合适的纹理压缩和格式技术详解:使用适当的纹理压缩可以显著减少内存使用和
GPU
负担。Unity支持多种纹理压缩格式,如ETC2、PVRTC
Clank的游戏栈
·
2024-09-05 11:14
游戏
Unity3D Compute Shader如何进行同步详解
前言在Unity3D中,ComputeShaders是一种利用
GPU
并行处理能力执行复杂计算的方法。
Clank的游戏栈
·
2024-09-05 11:44
java
开发语言
Ubuntu下安装
CUDA
和cuDNN
Ubuntu下安装
CUDA
和cuDNN
CUDA
1.查看显卡是否支持
CUDA
网址https://developer.nvidia.com/
cuda
-
gpu
s。
_Mallow_
·
2024-09-05 08:26
ubuntu
linux
Ubuntu20.04安装
CUDA
和cuDNN
这里写目录标题1.简介1.1测试TensorFlow能否使用
GPU
2.安装
CUDA
11.22.1下载安装包2.2安装2.3配置环境变量2.3.1打开bashrc2.3.2末尾加上2.3.3内容生效2.4
Czi.
·
2024-09-05 08:26
Python学习
tensorflow
python
深度学习
NVIDIA NCCL 源码学习(八)- 数据通信链路transport的建立
上节说到nccl通过ncclTransportP2pSetup完成了数据通信链路的建立,还是以上节两机十六卡的环为例:第一台机器的环:graph->intra:
GPU
/0
GPU
/7
GPU
/
KIDGINBROOK
·
2024-09-04 22:57
nccl
nccl
gpu
cuda
第T4周:使用TensorFlow实现猴痘病识别
本文为365天深度学习训练营中的学习记录博客原作者:K同学啊文章目录一、前期工作1.设置
GPU
(如果使用的是CPU可以忽略这步)2.导入数据3.查看数据二、数据预处理1、加载数据2、数据可视化3、再次检查数据
oufoc
·
2024-09-04 18:03
tensorflow
人工智能
python
支持nvidia显卡硬件加速的ffmpeg库编译
前提是安装了
cuda
#安装nvidia-codec-headergitclonehttps://github.com/FFmpeg/nv-codec-headers.gitcdnv-codec-headers
wjsiou123
·
2024-09-04 15:10
ffmpeg
Rocm-Programming with HIP 内存分配
这种内存有以下特点和用途:
GPU
地址空间映射:分配的内存被映射到系统中所有
GPU
的地址空间。这意味着
GPU
可以直接访问这块内存,而不需要数据复制操作。
青禾子的夏
·
2024-09-04 12:49
HIP
Rocm
异构计算
使用PotPlayer播放器查看软解和硬解4K高清视频时的CPU及
GPU
占用情况
目录1、问题说明2、PotPlayer播放器介绍3、视频的软解与硬解4、使用PotPlayer查看4K高清视频软解和硬解时的CPU占用情况4.1、使用软解时CPU和
GPU
占用情况4.2、使用硬解时CPU
dvlinker
·
2024-09-04 11:12
开源组件及数据库技术
C/C++实战专栏
PotPlayer
视频播放器
视频软解
视频硬解
CPU
GPU
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他