gpu并行计算第2页

Vortex GPGPU的硬件代码分析（Cache篇3）

文章目录前言一、VX_cache.sv代码部分解读3——bank1.1bankrequestdispatch1.1.1解释VX_stream_xbar模块1.1.2解释VX_stream_arb模块1.1.3解释VX_generic_arbiter模块1.1.4解释VX_priority_arbiter模块1.1.5解释VX_rr_arbiter模块1.1.6解释VX_fair_arbiter模块

DentionY·2024-09-08 13:09

关于隐语架构概览的知识

包括但不限于CPU、GPU、内存以

m0_67966665·2024-09-08 11:25

模式转变-并行编程方面的设计注意事项

本文将介绍以下内容：并行计算并发编程性能提高本文使用了以下技术：多线程目录并发和并行结构化多线程数据并行性数据流数据并行性单程序，多数据并发数据结构总结从1986到2002年，微处理器的性能每年提高了52%

guoxiaoqian8028·2024-09-08 09:40

CPU服务器如何应对大规模并行计算需求？

大规模并行计算是指利用多个处理单元同时处理计算任务，以提高计算效率和缩短完成时间。

Jtti·2024-09-08 08:01

第十四节：学习Springboot 的restful接口风格（自学Spring boot 3.x的第三天）

增(PostMapping)/***保存学生*@return*/@PostMappingpublicStudentsave(@RequestBodyStudentstudent){studentService.save

Mero技术博客·2024-09-08 05:11

微软开源 Phi-3.5 视觉模型

512个H100GPU，3.4万亿个tokens训练了10天。Phi3.5MoE:16x3.8B参数

三花AI·2024-09-08 02:19

元学习（meta learning）（一）

实际上没有什么好方法来调这些超参，今天工业界最常拿来解决调整超参数的方法是买很多张GPU，然后一次训练多个模型，有的训练不起来、训练效果比较差的话就输入掉，最后只看那些可以训练的比较好的模型会得到什么样的性能

前行居士·2024-09-08 02:48

OSError: [WinError 126] 找不到指定的模块---caffe2_detectron_ops_gpu.dll

Errorloading"C:\Anaconda\Anaconda3\envs\TIN\lib\site-packages\torch\lib\caffe2_detectron_ops_gpu.dll"oroneofitsdependencies

努力的小柚·2024-09-07 15:34

深度学习框架相关-Python模块的介绍和使用---torch

PyTorch的设计目标是提供灵活且高效的工具集，用于深度学习和科学计算；2.下面主要介绍torch模块的五个功能：数据加载和处理，GPU加速，建立网络模型，模型的保存和加载，梯度更新和参数优化；上面功能主要用到的子模块如下

sccum·2024-09-07 09:22

[GPU与CPU100倍性能之谜，论文个人阅读分享]Debunking the 100X GPU vs. CPU myth: an evaluation of throughput computing

Debunkingthe100XGPUvs.CPUmyth:anevaluationofthroughputcomputingonCPUandGPU*Authors:VictorW.Lee,ChangkyuKim

GutsShinyHero·2024-09-07 04:17

在PyTorch中使用CUDA, pytorch与cuda不同版本对应安装指南，查看CUDA版本，安装对应版本pytorch_pytorch cuda

在PyTorch中使用CUDA，你需要确保正确安装了匹配你的GPU的CUDAToolkit。以下是在PyTorch中使用CUDA的一般步骤：检查CUDA支持：首先，确保你的GPU支持CUDA。

2401_84009626·2024-09-06 16:31

环境安装-1：Python3.8+CUDA11.6.1+cuDNN8.6+Tensorflow-gpu2.6.1

CUDA™是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。

w坐看云起时·2024-09-06 10:50

arm a7 支持虚拟化吗_Arm增加CPU、GPU和ISP，实现自主和视觉安全_Mali

原标题：Arm增加CPU、GPU和ISP，实现自主和视觉安全Arm引入了一套新的知识产权(IP)，包括新的CPU、GPU和ISP(图像信号处理器)，以实现可扩展、高效的计算能力，以实现跨汽车和工业应用的安全

weixin_39569112·2024-09-06 06:22

ISP(图像信号处理器)是什么？

和电脑的GPU类似，通常采并行计算。功能：Bayertransformation图像传感器（就是光电转换器）中的光电二极管（吸收光子产生电流）其实是无法识别颜色的，为了能够识别颜

FoGoiN·2024-09-06 05:16

NPU技术总结

NPUs的设计架构:NPUs通常采用不同于传统CPU或GPU的架构，优化了矩阵运算和并行处理。指令集:它们拥有专门的指令集，用于加速神经网络中的常见操作，如卷积和激活函数。

技术学习分享·2024-09-06 00:47

Nvidia GPU benchmark压力测试工具

一、参考资料使用Pytorch测试cuda设备的性能（单卡或多卡并行）GPU：使用gpu-burn压测GPU二、GPU压力测试方法1.PyTorch方式使用torch.ones测试CUDA设备。

花花少年·2024-09-06 00:13

快速搭建本地 Whisper 语音识别大模型

前置准备在开始之前，你需要确保计算机符合以下条件：Python3.7+环境GPU支持（CUDA驱动）：尽管CPU也能运行，但GPU会更快。足够的存储空间：模型可能需要几个GB。步骤一：

码上飞扬·2024-09-05 18:31

AI创业必备：GPU云、GPU 租赁或自建，你选对了吗？

在快速发展的机器学习领域，人工智能初创公司对GPU的需求与日俱增。GPU成了AI创业公司们构建核心资源，甚至颠覆创新的关键资源和基础设施。然而，这也让GPU资源的价格水涨船高。

DO_Community·2024-09-05 17:25

为什么深度学习用GPU而不是CPU

首先，我们深度理解一下中央处理器（CentralProcessingUnit，CPU）的核心。CPU的每个核心都拥有高时钟频率的运行能力，和高达数MB的三级缓存（L3Cache）。它们非常适合执行各种指令，具有分支预测器、深层流水线和其他使CPU能够运行各种程序的功能。然而，这种明显的优势也是它的致命弱点：通用核心的制造成本非常高。它们需要大量的芯片面积、复杂的支持结构（内存接口、内核之间的缓存逻

小锐->技术成就梦想,梦想成就辉煌。·2024-09-05 13:59

Unity3D 如何提升游戏运行效率详解

1.优化渲染性能1.1使用合适的纹理压缩和格式技术详解：使用适当的纹理压缩可以显著减少内存使用和GPU负担。Unity支持多种纹理压缩格式，如ETC2、PVRTC

Clank的游戏栈·2024-09-05 11:14

Unity3D Compute Shader如何进行同步详解

前言在Unity3D中，ComputeShaders是一种利用GPU并行处理能力执行复杂计算的方法。

Clank的游戏栈·2024-09-05 11:44

Ubuntu下安装CUDA和cuDNN

Ubuntu下安装CUDA和cuDNNCUDA1.查看显卡是否支持CUDA网址https://developer.nvidia.com/cuda-gpus。

_Mallow_·2024-09-05 08:26

Ubuntu20.04安装CUDA和cuDNN

这里写目录标题1.简介1.1测试TensorFlow能否使用GPU2.安装CUDA11.22.1下载安装包2.2安装2.3配置环境变量2.3.1打开bashrc2.3.2末尾加上2.3.3内容生效2.4

Czi.·2024-09-05 08:26

NVIDIA NCCL 源码学习（八）- 数据通信链路transport的建立

上节说到nccl通过ncclTransportP2pSetup完成了数据通信链路的建立，还是以上节两机十六卡的环为例：第一台机器的环：graph->intra:GPU/0GPU/7GPU/

KIDGINBROOK·2024-09-04 22:57

第T4周：使用TensorFlow实现猴痘病识别

本文为365天深度学习训练营中的学习记录博客原作者：K同学啊文章目录一、前期工作1.设置GPU（如果使用的是CPU可以忽略这步）2.导入数据3.查看数据二、数据预处理1、加载数据2、数据可视化3、再次检查数据

oufoc·2024-09-04 18:03

Rocm-Programming with HIP 内存分配

这种内存有以下特点和用途：GPU地址空间映射：分配的内存被映射到系统中所有GPU的地址空间。这意味着GPU可以直接访问这块内存，而不需要数据复制操作。

青禾子的夏·2024-09-04 12:49

使用PotPlayer播放器查看软解和硬解4K高清视频时的CPU及GPU占用情况

目录1、问题说明2、PotPlayer播放器介绍3、视频的软解与硬解4、使用PotPlayer查看4K高清视频软解和硬解时的CPU占用情况4.1、使用软解时CPU和GPU占用情况4.2、使用硬解时CPU

dvlinker·2024-09-04 11:12

免费GPU平台教程，助力你的AI, pytorch tensorflow 支持cuda

Colab：https://drive.google.com/drive/home阿里天池实验室：https://tianchi.aliyun.com/60个小时gputianchi.aliyun.com

zhangfeng1133·2024-09-04 08:57

ChatGLM3-6B-32K 在linux(Ubuntu) GPU P100(16G)复现记录

ChatGLM3-6B-32K在linux(Ubuntu)GPUP100(16G)复现记录时间：2024年6月12日1.创建Conda环境condacreate--namechatglm3python=

beneficial·2024-09-04 06:11

并行处理的艺术：深入探索PyTorch中的torch.nn.parallel模块

PyTorch，作为当前流行的深度学习框架之一，提供了torch.nn.parallel模块，允许我们轻松地将模型部署到多个GPU上。

杨哥带你写代码·2024-09-04 06:10

[python]python onnxruntime gpu是否可用

在Python中，要检查ONNXRuntime是否可以使用GPU，可以使用以下代码：importonnxruntimeasort#检查CUDA是否可用defis_cuda_available():try

FL1623863129·2024-09-04 05:29

caffe/PyTorch/TensorFlow 在Jupyter Notebook GPU中运用

在JupyterNotebook中使用Caffe框架并利用GPU加速，可以实现多种效果和目的，主要集中在深度学习领域。以下是一些主要的应用场景：快速训练模型：GPU加速可以显著提高模型训练的速度。

俊俏的萌妹纸·2024-09-04 04:26

3维线程格 gpu_GPU编程2--CUDA核函数和线程配置

CUDA核函数在GPU上执行的函数称为CUDA核函数(KernelFunction)，核函数会被GPU上多个线程执行，我们可以在核函数中获取当前线程的ID。

weixin_39575502·2024-09-04 03:22

算法学习-2024.8.16

TensorRT对于网络结构进行了重构，把一些能够合并的运算合并在了一起，针对GPU的特性做了优化。

蓝纹绿茶·2024-09-04 01:42

离屏渲染

在屏渲染On-ScreenRenderingGPU的渲染操作是在当前用于显示的屏幕缓冲区中进行离屏渲染Off-ScreenRendering离屏幕渲染是在GPU层面发生的，即GPU在当前屏幕缓冲区外，新开辟了一个缓冲区进行渲染当设置某一些视图的图层属性时

滨滨_57b5·2024-09-03 16:44

AI深度学习项目-yolo4_tiny 垃圾分类识别系统

技术栈深度学习框架：PyTorch目标检测算法：YOLOv4-tiny编程语言：Python硬件加速：GPU（如果可用）功能特

毕设宇航·2024-09-03 13:20

当科技企业存在多类型的服务器资源时，如何确保访问安全？

为节约计算资源使用成本，该企业在服务器上的配置较高，如GPU、高性能CPU等，开发及运营人员通过普通桌面终端远程到服务器上进行开发和运营工作。

宁盾Nington·2024-09-03 07:48

深度学习(二)

CuDNN（CUDADeepNeuralNetworklibrary）是NVIDIA为加速深度学习计算而开发的高性能GPU加速库，专门优化了深度神经网络（DNN）的常见操作，如卷积、池化、归一化和激活函数等

小泽爱刷题·2024-09-03 06:10

ubuntu 常用指令笔记

目录：一.查看文件大小二.查看当前文件系统各分区的大小三.查看当前文件系统cpu，内存四.查看当前文件系统gpu五.清除回收站命令一.查看文件大小查看文件大小的命令：~$ls-lfilename会在终端输出

Kimx510·2024-09-03 03:41

cornerstonejs介绍

利用GPU加速（

花花进修·2024-09-02 13:28

Datawhale AI夏令营第五期CV Task01

一、报名参加2024大运河杯数据开发大赛1.登录赛事平台2.修改昵称，实名认证3.打开比赛链接报名参赛4.修改队伍名称二、领取厚德云支持的GPU在线算力！

m0_60530253·2024-09-02 07:21

vscode远程调试 bash 文件的 launch.json写法示例

request":"launch","args":["--config-file","configs/coco-stuff-164k-156/mask2former_maft.yaml","--num-gpus

my墨羽·2024-09-01 22:56

Python 多线程和多进程用法

它提供了一种便捷的方法来创建和管理多个进程，以实现并行计算。multiproc

SmallerFL·2024-09-01 21:49

windows C++ 并行编程-在 UWP 应用中使用 C++ AMP

可以在通用Windows平台(UWP)应用中使用C++AMP(C++AcceleratedMassiveParallelism)在GPU（图形处理单元）或其他计算加速器上执行计算。

sului·2024-09-01 19:07

在浏览器上使用transformers.js运行（WebGPU）RMBG-1.4进行抠图（背景移除）

在浏览器上使用transformers.js运行（WebGPU）RMBG-1.4进行抠图（背景移除）说明：首次发表日期：2024-08-28官方Github仓库地址：https://github.com

shizidushu·2024-09-01 17:55

[UE4] 常用控制台命令

~“键调用控制台命令0，技巧键盘↑键可以看到之前输入过的指令控制台指令并不需要打全名，空格+指令可以模糊搜索Ctrl+Shift+逗号，打开GPUProfile面1，调试类statfps——显示帧率statunit

somnusand·2024-09-01 14:04

使用docker从零构建python、cuda、pytorch等环境

一、docker和nvidia-docker安装本机先安装docker，然后安装nvidia-docker（在docker中使用gpu需要安装nvidia-docker，同时本机需要有nvidia显卡驱动

ken_asr·2024-09-01 11:14

【小本本笔记】yolov8跑模型缓慢，内存提示不足？

GPU-mem=0跑模型跑的慢，gpu-mem=0是什么意思。

hhhhhhkkkyyy·2024-09-01 10:09

《C++与新兴硬件技术的完美融合：开启未来科技新篇章》

首先，在与GPU（图形处理单元）的结合方面，C++展现出了巨大的潜力。GPU拥有强大的并行计算能力，能够快速处理大量的数据和复杂的计算任务。

程序猿阿伟·2024-09-01 06:41

Unity3D 如何提升游戏运行效率详解

1.优化渲染性能1.1使用合适的纹理压缩和格式技术详解：使用适当的纹理压缩可以显著减少内存使用和GPU负担。Unity支持多种纹理压缩格式，如ETC2、PVRTC

Thomas_YXQ·2024-08-31 20:41

推荐频道

gpu并行计算

Vortex GPGPU的硬件代码分析（Cache篇3）

关于隐语架构概览的知识

模式转变-并行编程方面的设计注意事项

CPU服务器如何应对大规模并行计算需求？

第十四节：学习Springboot 的restful接口风格（自学Spring boot 3.x的第三天）

微软开源 Phi-3.5 视觉模型

元学习（meta learning）（一）

OSError: [WinError 126] 找不到指定的模块---caffe2_detectron_ops_gpu.dll

深度学习框架相关-Python模块的介绍和使用---torch

[GPU与CPU100倍性能之谜，论文个人阅读分享]Debunking the 100X GPU vs. CPU myth: an evaluation of throughput computing

在PyTorch中使用CUDA, pytorch与cuda不同版本对应安装指南，查看CUDA版本，安装对应版本pytorch_pytorch cuda

环境安装-1：Python3.8+CUDA11.6.1+cuDNN8.6+Tensorflow-gpu2.6.1

arm a7 支持虚拟化吗_Arm增加CPU、GPU和ISP，实现自主和视觉安全_Mali

ISP(图像信号处理器)是什么？

NPU技术总结

Nvidia GPU benchmark压力测试工具

快速搭建本地 Whisper 语音识别大模型

AI创业必备：GPU云、GPU 租赁或自建，你选对了吗？

为什么深度学习用GPU而不是CPU

Unity3D 如何提升游戏运行效率详解

Unity3D Compute Shader如何进行同步详解

Ubuntu下安装CUDA和cuDNN

Ubuntu20.04安装CUDA和cuDNN

NVIDIA NCCL 源码学习（八）- 数据通信链路transport的建立

第T4周：使用TensorFlow实现猴痘病识别

Rocm-Programming with HIP 内存分配

使用PotPlayer播放器查看软解和硬解4K高清视频时的CPU及GPU占用情况

免费GPU平台教程，助力你的AI, pytorch tensorflow 支持cuda

ChatGLM3-6B-32K 在linux(Ubuntu) GPU P100(16G)复现记录

并行处理的艺术：深入探索PyTorch中的torch.nn.parallel模块

[python]python onnxruntime gpu是否可用

caffe/PyTorch/TensorFlow 在Jupyter Notebook GPU中运用

3维线程格 gpu_GPU编程2--CUDA核函数和线程配置

算法学习-2024.8.16

离屏渲染

AI深度学习项目-yolo4_tiny 垃圾分类识别系统

当科技企业存在多类型的服务器资源时，如何确保访问安全？

深度学习(二)

ubuntu 常用指令笔记

cornerstonejs介绍

Datawhale AI夏令营第五期CV Task01

vscode远程调试 bash 文件的 launch.json写法示例

Python 多线程和多进程用法

windows C++ 并行编程-在 UWP 应用中使用 C++ AMP

在浏览器上使用transformers.js运行（WebGPU）RMBG-1.4进行抠图（背景移除）

[UE4] 常用控制台命令

使用docker从零构建python、cuda、pytorch等环境

【小本本笔记】yolov8跑模型缓慢，内存提示不足？

《C++与新兴硬件技术的完美融合：开启未来科技新篇章》

Unity3D 如何提升游戏运行效率详解