E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU并行计算-CUDA编程
自然语言处理---Transformer机制详解之Transformer优势
1Transformer的
并行计算
对于Transformer比传统序列模型RNN/LSTM具备优势的第一大原因就是强大的
并行计算
能力.对于RNN来说,任意时刻t的输入是时刻t的输入x(t)和上一时刻的隐藏层输出
lichunericli
·
2023-10-23 02:52
自然语言处理
自然语言处理
transformer
人工智能
LeNet(pytorch实现
LeNet本文编写了一个简单易懂的LeNet网络,并在F-MNIST数据集上进行测试,允许使用
GPU
计算在这里插入代码片importtorchfromtorchimportnn,optimimportd2lzh_pytorchasd2ldevice
平平平安喔
·
2023-10-23 02:21
pytorch
python
人工智能
OpenGL-着色器
着色器(shader)其本质是运行在
GPU
上的小程序,这些小程序为图形渲染管线的某个特点部分而运行。从基本意义上来讲,着色器只是一种把输入转化为输出的程序。
STL_f36e
·
2023-10-23 01:56
Tensorboard安装及简单使用
2.安装必备环境安装TensorBoard,必须要配一个带
GPU
的环境,
我说你别说
·
2023-10-23 01:07
pytorch
python
学习
深度学习
并发编程-线程池ForkJoinPool(二)
Fork/Join框架介绍什么是Fork/JoinFork/Join是一个是一个
并行计算
的框架,主要就是用来支持分治任务模型。Fork对应的是分治任务模型里的任务分解,Join对应的是结果合并。
有梦想的年轻人6174
·
2023-10-23 00:54
java
No171.精选前端面试题,享受每天的挑战和学习
前端面试必备》蓝桥云课签约作者、已在蓝桥云课上架的前后端实战课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》文章目录页面渲染的时候,哪种情况下需要用
GPU
阿珊和她的猫
·
2023-10-23 00:19
前端高频面试册(校招和社招)
前端
学习
【模型推理优化学习笔记】张量并行和流水线并行简介
张量并行当每个张量被分成多个块时,就会发生张量并行性,并且张量的每个块都可以放置在单独的
GPU
上。
Go 鹏ya
·
2023-10-22 23:11
推理优化
学习
笔记
openCV的CUDA
GPU
版本安装 (Ubuntu windows 通用)
需要用
GPU
的。
EmoC001
·
2023-10-22 23:59
opencv
人工智能
计算机视觉
CUDA学习笔记(二)CUDA简介
CUDA是
并行计算
的平台和类C编程模型,我们能很容易的实现并行算法,就像写C代码一样。只要配备的NVIDIA
GPU
,就可以在许多设备上运行你的并行程序,无论是台式机、笔记本抑或平板电脑。
我来了!!!
·
2023-10-22 22:20
学习
笔记
在Colab下快速训练yolov5
在Colab下快速训练yolov51.学习链接2.数据准备2.1图片标注方法3.项目迁移到Colab平台4.开始训练4.1.选择
GPU
4.2.下载源码4.3.上传和解压自己的数据集4.4.修改ymal配置文件
淡然的回忆568
·
2023-10-22 20:55
yolov5
python
目标检测
opencv
Android自定义相机自动对焦、定点对焦
Android相机实时自动对焦的完美实现Android图像滤镜框架
GPU
Image从配置到应用
GPU
ImageforAndroidAndroidCamera对焦相关加速度控制器当设备移动时,认定需要对焦
沐左
·
2023-10-22 20:08
Anaconda下载、安装、使用教程
使用教程创建环境查看当前存在的虚拟环境激活环境退出环境删除环境镜像加速配置conda镜像pip镜像临时使用长期使用WindowsLinux&&WSL工具升级升级conda升级pip高级应用整体环境迁移环境更新环境克隆深度学习
GPU
Walden-2020
·
2023-10-22 19:46
WSL
深度学习环境搭建
linux
python
ubuntu
TensorFlow
GPU
不可用,WSL2安装
win11,安装的tensorflow的版本都是2.12的,但是从2.10开始tensorflow就不支持
gpu
了,这点在英文版的安装页面里有而中文版是没有这个提示的,估计也是很多人试了很多遍,检查了很多次环境
坠星不坠
·
2023-10-22 19:45
tensorflow
python
深度学习
并行计算
与Python(系统架构和程序模型)
认识
并行计算
与Pytohn(一)简介(二)为何要进行
并行计算
(三)
并行计算
的内存架构(1)单处理器,单数据(SISD)(2)多处理器,单数据(MISD)(3)单处理器,多数据(SIMD)(4)多处理器,
大佛plus
·
2023-10-22 18:56
Python
Linux
分布式
python
3天上手Ascend C编程 | Day3 Ascend C算子调试调优方法
AscendC是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,最大化匹配用户开发习惯;通过多层接口抽象、自动
并行计算
、孪生调试等关键技术,极大提高算子开发效率,助力AI开发者低成本完成算子开发和模型调优部署
昇腾CANN
·
2023-10-22 18:35
Ascend
C
c语言
python
人工智能
Windows Server 2019 AD域组策略自动连接共享文件夹到域用户的网络位置(驱动器)
一、在DC上建立共享文件夹二、在需要自动连接的组织单位创建GPO三、编辑该策略,来到用户配置-首选项-windows设置-驱动器映射四、新建映射驱动器五、在DC及客户端强制刷新策略
gpu
pdate/force
獨孤記憶
·
2023-10-22 17:30
2023CANN训练营第二季——Ascend C算子开发(入门)——基础概念
第一章AscendC算子开发入门一、基础概念1.AscendC概念:AscendC是CANN针对算子开发场景推出的编程语言,原生支持C和C++标准规范,最大化匹配用户开发习惯;通过多层接口抽象、自动
并行计算
STRUGGLE_xlf
·
2023-10-22 16:12
c++
【Ascend C算子开发(入门)】——Ascend C编程模式与范式
AscendC编程模型与范式1.
并行计算
架构抽象AscendC编程开发的算子是运行在AICore上的,所以我们需要了解一下AICore的结构。AICore主要包括计算单元、存储单元、搬运单元。
STRUGGLE_xlf
·
2023-10-22 16:09
c语言
人工智能
开发语言
ASTRA Toolbox——使用笔记
1.ASTRA工具箱简介ASTRA工具箱是MATLAB和Python的高性能
GPU
工具箱,用于2D和3D断层扫描。支持2D平行和风扇束几何,以及3D平行和锥束几何。它们都有高度灵活的源/探测器定位。
小屁孩__
·
2023-10-22 16:03
python
matlab
开发语言
资源超分是什么?
https://www.modb.pro/db/1993683.超线程技术管理及如何开启超线程是intel研发的技术,利用特殊的硬件指令,把一个物理CPU核模拟成两个逻辑内核,使单个处理器能够使用线程级
并行计算
TaiKuLaHa
·
2023-10-22 15:35
spark
数据工程
spark
自学OpenGL(七)-着色器
前言着色器是运行在
GPU
上的程序,为图形渲染管线特定部分而运行,从某种意义上来说,着色器是把输入转化为输出的程序。着色器程序是完全独立的程序,着色器之间不能直接通信,只能通过输入输出实现通信。
朽木自雕也
·
2023-10-22 15:30
CUDA学习笔记(七)Kernel性能调节
代码准备下面是我们的kernel函数sumMatrixOn
GPU
D:__global__voidsumMatrixOn
GPU
2D(fl
我来了!!!
·
2023-10-22 15:22
学习
笔记
影响stable diffusion的embedding训练效率的部分问题和拟解决办法
(小细节)关于图片大小影响未知,电脑配置不够,试过云环境:配置是13RAM,15
GPU
,78G磁盘以微量关键词,使用一个训练的model做正向,没有反向关键词,面部以及高清修复,39采样,8.5相关
羽墨link
·
2023-10-22 14:44
stable
diffusion
ai绘画
stable
diffusion
人工智能
【深度学习】AI芯片:上游产业率先爆发
深度学习要求极高的
并行计算
能力,大数据、算力、训练方法等领域的突破使AI芯片作为上游产业率先爆发。
Finovy Cloud
·
2023-10-22 14:14
人工智能
深度学习
flash attention 2论文学习
优化点主要如下:一、减少non-matmulFLOPsA00中由于tensorcore的存在,使得
gpu
对于浮点矩阵运算吞吐很高,如FP16/BF16可以达到312TFLOPs/s,而对于非矩阵乘的浮点运算吞吐较低
KIDGINBROOK
·
2023-10-22 13:13
cuda
gpu
cuda
NVIDIA NCCL 源码学习(一)- 初始化及ncclUniqueId的产生
NCCL是英伟达开源的
GPU
通信库,支持集合通信和点对点通信看下官方给的一个demo#include#include"cuda_runtime.h"#include"nccl.h"#include"mpi.h
KIDGINBROOK
·
2023-10-22 13:42
nccl
nccl
gpu
cuda
NVIDIA NCCL 源码学习(十一)- ring allreduce
单机搜索ring在nccl初始化的过程中会分析机内拓扑,建立CPU,
GPU
,网卡等PCI节点的拓扑图,并基于这个图搜索一系列的channel,假设单机内执行ncc
KIDGINBROOK
·
2023-10-22 13:41
nccl
nccl
gpu
cuda
机器学习——利用jupyter-notebook实现工资预测
本文开发环境tensorflow-
gpu
-2.6.0miniconda但其实大家一般都在pycharm里面写,这个只是为了了解一下这种写法
重邮研究森
·
2023-10-22 13:35
深度学习
人工智能
自然语言处理---Transformer模型
Transformer概述相比LSTM和GRU模型,Transformer模型有两个显著的优势:Transformer能够利用分布式
GPU
进行并行训练,提升模型训练效率。
lichunericli
·
2023-10-22 13:28
自然语言处理
自然语言处理
transformer
人工智能
如何将PyTorch模型迁移到昇腾平台
PyTorch是业界流行的深度学习框架,用于开发深度学习训练脚本,默认运行在CPU/
GPU
上。为了使这些脚本能够利用昇腾AI处理器的强大算力执行训练,需要对PyTorch的训练脚本进行迁移。
昇腾CANN
·
2023-10-22 13:51
pytorch
深度学习
人工智能
昇腾CANN
迁移学习
『ARM』和『x86』处理器架构解析指南
但是如果继续问大家是否了解ARM和X86架构,他们的区别又是什么,相信可能部分人就会哑口无言了目前随着深度学习、高性能计算、NLP、AIGC、GLM、AGI的技术迭代,助力大模型快速发展,对于多元算力结合(CPU+
GPU
ReturnTmp
·
2023-10-22 13:04
随笔摘录
CPU
x86
ARM
处理器
云计算与大数据技术 第一章
1.1什么是云计算云计算概述云计算(CloudComputing)是基于互联网的相关服务的增加,使用和交付模式,通常涉及通过互联网来提供动态易扩展且常为虚拟化的资源,是
并行计算
(ParallelComputing
常愿43
·
2023-10-22 12:22
云计算
hadoop
mapreduce
1 - 进程 - Windows 10 - Python - multiprocessing - 简单多进程切换、进程传参、异步进程、守护进程(进程睡眠/堵塞和线程堵塞的区别)、主/子进程区分
七、关于多进程必须加上`if__name__=="__main__"`的理由(进程区分):八、JupyterNotebook与进程区分的关联九、关于多进程与
GPU
的关系参考链接测试环境:操作系统:Window10
沐 修
·
2023-10-22 12:18
Python
python
开发语言
学习
经验分享
后端
使用恒源云
GPU
进行远程训练
最近同学参加比赛需要使用云
GPU
,经过比对多个云
GPU
平台,从价格和
GPU
可用稳定性上,最终选择了恒源云,我购买使用了一下,可以支持一场Kaggle比赛或者实验论文没有问题,大家可以按照步骤进行操作,记录下来
cskywit
·
2023-10-22 12:54
深度学习
深度学习
人工智能
nvcc -V和nvidia-smi的关系
nvcc-V和nvidia-smi都与NVIDIA
GPU
相关,但它们提供的信息和功能有所不同。nvcc-V:nvcc是NVIDIACUDA编译器的命令,用于获取CUDA工具包的版本信息。
重剑DS
·
2023-10-22 12:36
杂项
深度学习
深度学习
笔记
nvcc
-V
nvidia-smi
拨开算力的迷雾:聊聊不同
GPU
计算能力的上限
文|卜居@知乎编|兔子酱通过深入了解自己手头
GPU
的计算能力上限,能够在买新卡时做出更理性判断。本文深入
GPU
架构,重点介绍了其中的ampere架构。
夕小瑶
·
2023-10-22 10:22
编程语言
并行计算
cuda
opengl
xhtml
java 异构类型_TornadoVM:在异构硬件上运行Java程序
java异构类型几乎所有计算系统中都存在异构硬件:我们的智能手机包含中央处理器(CPU)和具有多个内核的图形处理单元(
GPU
);我们的笔记本电脑很可能包含带有集成
GPU
和专用
GPU
的多核CPU;数据中心正在向其系统添加附加的现场可编程门阵列
diluan6799
·
2023-10-22 10:16
大数据
编程语言
python
人工智能
深度学习
Linux & Windows 的Tensorflow 配置: Nvidia 老显卡运算能力低于3.0
实测成功配置信息1:Windows10,GT755m,Capability3.0Ana(Mini)conda管理,环境Python3.6(.13)Cuda=9.0Cudnn=7.0Tensorflow_
gpu
Zhenghaowencsdn
·
2023-10-22 10:14
tensorflow
问题记录:
GPU
显卡提高后,代码总体运行效率没有提高
问题:
GPU
显卡提高后,代码总体运行效率没有提高原先显卡NIVIDAT400换成NVIDIARTXA4000,CUDA核心(物理
GPU
线程单位)从三百多提升到了六千多,但是程序总体运行的时间没有变化。
魔法自动机
·
2023-10-22 10:43
GPU编程
GPU
CUDA
nvprof
nvvp
GitHub 上排名前 100 的 IOS 开源库简介
这个便是其中之一,AFNetworking采用NSURLConnection+NSOperation,主要方便与服务端API进行数据交换,操作简单,功能强大,现在许多人都用它取代ASIHTTPRequest
GPU
Image
孙卓卓
·
2023-10-22 08:07
UserWarning: Failed to load image Python extension: warn(f“Failed to load image Python extension: {e
EmbeddedSystems/JetsonAGXOrin-NVIDIADeveloperForums原因可能是从yolo5内文件requirements.txt下载的下载的并且无法支持nvidia定制的
gpu
pip3install-rrequirements.txtWARNING
无证驾驶梁嗖嗖
·
2023-10-22 06:27
Jetson
torch
嵌入式
python
matplotlib
numpy
pytorch
CUDA学习笔记(LESSON5)——
GPU
优化
CUDA系列笔记CUDA学习笔记(LESSON1/2)——架构、通信模式与
GPU
硬件CUDA学习笔记(LESSON3)——
GPU
基本算法(PartI)CUDA学习笔记(LESSON4)——
GPU
基本算法
Veropatrinica
·
2023-10-22 06:25
CUDA
GPU
CUDA编程
并行计算
优化
APOD
CUDA学习笔记(LESSON1/2)——架构、通信模式与
GPU
硬件
最近在看视频拼接的代码,师兄说要用CUDA加速,于是开始学习
CUDA编程
,课程链接:UdacityCS344CUDA系列笔记CUDA学习笔记(LESSON1/2)——架构、通信模式与
GPU
硬件CUDA学习笔记
Veropatrinica
·
2023-10-22 06:24
CUDA
GPU
CUDA编程
并行计算
thread
kernel
CUDA学习笔记(四)device管理
device管理NVIDIA提供了集中凡是来查询和管理
GPU
device,掌握
GPU
信息查询很重要,因为这可以帮助你设置kernel的执行配置。
我来了!!!
·
2023-10-22 06:24
学习
笔记
cuda学习笔记
一、cuda的替代选择OpenCL:允许使用多种计算设备的开放标准,计算设备可以是
GPU
,CPU或者其他存在OpenCL驱动程序的专业设备DirectCompute:微软开发的可替代Cuda和OpenCl
renlubo-qingdao
·
2023-10-22 06:24
学习
【
CUDA编程
】学习笔记(二)
GPU
硬件架构
一、CPU与
GPU
的链接模型在计算机的硬件架构中,CPU与
GPU
有多种链接模式,下面介绍几种典型的架构北桥多CPU(SMP)多CPU(NUMA)多CPU(NUMA)多总线具有集成PCIExpress的多
Swocky
·
2023-10-22 06:21
CUDA编程
GPU
NVIDIA
Kepler
Fermi
CUDA编程
模型与
GPU
硬件结构关系
目录一、
CUDA编程
模型1、线程管理2、内存管理二、
GPU
硬件结构1、SM硬件2、硬件逻辑抽象2.1共享内存的逻辑划分2.2寄存器的逻辑划分2.3
GPU
内存分级3、CUDA程序的一些优化点3.1一个core
Hunter_pcx
·
2023-10-22 06:50
工程技能
人工智能
python
深度学习
CUDA并行程序设计
GPU
硬件架构与线程 学习笔记
GPU
硬件架构
GPU
实际上是一个SM的阵列,每个SM包含若干个SP。一个SP可以执行一个thread,但是实际上并不是所有的thread能够在同一时刻执行。
Morizen
·
2023-10-22 06:50
并行计算
Cuda
多线程
cuda
gpu
并行计算
硬件
CUDA学习笔记(五)
GPU
架构
GPU
架构SM(StreamingMultiprocessors)是
GPU
架构中非常重要的部分,
GPU
硬件的并行性就是由SM决定的。
我来了!!!
·
2023-10-22 06:17
学习
笔记
架构
小土堆-pytorch-神经网络-完整的验证套路16_笔记
模型的保存:当你在cpu上使用
gpu
训练的模型时model=torch.load(r"E:\pycharm\Py_Projects\logs\tudui_2.pth")改为(就是把
gpu
训练完的东西映射到
Beginner x_u
·
2023-10-22 06:46
小土堆-pytorch-笔记
pytorch
神经网络
笔记
人工智能
深度学习
上一页
73
74
75
76
77
78
79
80
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他