cuda(GPU 第5页

[服务器运维] gpu幽灵进程处理

僵尸进程是指那些已经完成任务但没有正确关闭的进程，它们可能因为各种原因未能释放占用的GPU资源。这会导致资源浪费，并且阻碍其他任务的执行。

PigeonGuan·2024-08-26 18:38

Python(PyTorch)多语言图像感知质量指标算法

LabVIEW单尺度质量指标算法|MATLAB单尺度质量指标算法|PyTorch完整参考图像质量测量指标、和分布式图像特征质量测量指标|多尺度质量模型应用：图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU

亚图跨际·2024-08-26 16:57

5分钟 Stable Diffusion 本地安装

安装前的准备确保系统要求：您需要一台安装了NVIDIA显卡的计算机（最好支持CUDA，至少6GB显存）。操作系统：Wind

狒狒伯尼·2024-08-26 10:45

人工智能开源库有哪些

TensorFlow：由Google开发的深度学习库，提供了丰富的工具和API，支持CPU和GPU计算。PyTorch：由Facebook开发的深度学习框架，提供动态图和静态图两种模式，并且易于使用。

openwin_top·2024-08-26 02:59

英伟达A100、A800、H100、H800、V100以及RTX 4090的详细性能参数对比

英伟达A100、A800、H100、H800、V100以及RTX4090的详细性能参数对比：英伟达A100架构与制程：架构：Ampere制程：7纳米核心与频率：CUDA核心数：6912个Tensor核心数

算力资源比较多·2024-08-26 00:48

深度学习多GPU训练原理

详细参考《动手学深度学习》P233，8.4节多GPU计算。数据并行的方法把一个batch的所有数据平均分配到每块GPU的显存里，把模型参数在每个GPU显存上拷贝一份。

浦东新村轱天乐·2024-08-25 22:31

TensorFlow库详解：Python中的深度学习框架

它能够处理大规模的多维数据，并支持在多种硬件平台上运行，如CPU、GPU和TPU（TensorProcessingUnit）。

Ambition_LAO·2024-08-25 21:28

OpenCL在移动端GPU计算中的应用与实践

在Android设备上，GPU，尤其是高通Adreno和华为Mali，因其卓越的浮点运算能力，成为了异构计算中的重要组成部分。百度APP已经利用GPU计算加速深度模型推理和计算密集型业务。

m0_67544708·2024-08-25 10:51

向量数据库Faiss的搭建与使用｜Faiss｜向量数据库｜高效检索｜机器学习｜大规模数据

Faiss的安装与环境配置2.1环境要求2.2Faiss的安装2.3验证安装3.Faiss的基本使用3.1创建索引与添加向量3.2执行查询3.3向量的压缩与内存优化4.Faiss的高级功能与优化4.1GPU

concisedistinct·2024-08-25 09:10

pytorch实现模型搭建

模型就是获取设备，以方便后面的模型与变量进行内存迁移，设备名只有两种：'cuda'和'cpu'。通常是在你有GPU的情况下需要这样显式进行设备的设置，从而在需要时，你可以将变量从主存迁移到显存中。

Fiona.y·2024-08-24 21:30

ubuntu18.04+cuda11.4+nccl安装

本文参考自，但更加详细的介绍了安装方法，避免走弯路ubuntu下安装nccl具体教程_ubuntu安装nccl-CSDN博客文章浏览阅读1w次，点赞5次，收藏12次。使用paddlepaddle框架进行多卡训练时报错：Traceback(mostrecentcalllast):File"train.py",line210,indo_train()File"train.py",line91,indo

袁泽斌的学习记录·2024-08-24 20:57

关于离屏渲染

1、当前屏幕渲染一般情况下界面的呈现是在当前屏幕渲染，首先CPU计算好frame等属性，将计算好的内容提交给GPU去渲染，GPU渲染完成之后就会放入屏幕帧缓冲区，然后控制器每隔一段时间会去屏幕缓存区读取渲染好的内容

晨枫阳·2024-08-24 16:29

启用Microsoft Edge浏览器的“硬件加速”功能

MicrosoftEdge浏览器提供了“硬件加速”选项，允许浏览器利用计算机的GPU来提升渲染性能，从而加快页面加载速度和改善用户体验。本文将详细介绍如何在Edge浏览器中启用“硬件加速”功能。

哎呦没·2024-08-24 16:28

https://developer.nvidia.com/cuda-toolkit-archive

CUDAToolkitArchive|NVIDIADeveloperhttps://developer.nvidia.com/cuda-toolkit-archive

aiotud·2024-08-24 14:17

Ubuntu20.04部署Ollama

在Ubuntu20.04上面安装完RTX4060的NvidiaCuda和TensorRT环境后，就开始跑些大模型看看。

stxinu·2024-08-24 05:22

K8S集群中驱逐节点

K8S集群中驱逐node节点下面以驱逐节点上的GPU节点为例：1.驱逐节点上的资源使用以下命令从节点上驱逐GPU资源：kubectldrain--delete-local-data--force--ignore-daemonsets

听说唐僧不吃肉·2024-08-24 02:32

C# 获取当前电脑的mac地址

一个方法GetMacByIpConfigpublicstringGetMacByIpConfig(){Listmacs=newList();varrunCmd=ExecuteInCmd("chcp437&

Net蚂蚁代码·2024-08-23 21:59

【PyTorch】torch.backends.cudnn.benchmark 和 torch.backends.cudnn.deterministic

这个设置特别针对使用CUDA和cuDNN库进行的运算，并在使用具有变化输入尺寸的网络时有很大帮助。让我们更详细地解释这个设置的功能和应用场景。什么是cuDNN？cuDNN(CUDADeep

读思辨·2024-08-23 15:49

GPGPU

1、GPGPU(general-purposegraphicsprocessorunitsarchitecture，通用图像处理器）:是一种利用处理图形任务的图形处理器来计算原本由中央处理器处理的通用计算任务

朝朝暮暮Quake·2024-08-23 10:19

【Story】《现代芯片架构全景图：架构、内存系统与外设接口》

目录芯片架构详解1.处理器核心（CPUCore）1.1RISC（精简指令集计算）1.2CISC（复杂指令集计算）1.3VLIW（超长指令字）1.4SIMD（单指令流多数据流）1.5MIMD（多指令流多数据流）1.6GPU

LuckiBit·2024-08-23 05:21

nll_loss_forward_reduce_cuda_kernel_2d: Assertion `t ＞= 0 && t ＜ n__classes` failed.

nll_loss_forward_reduce_cuda_kernel_2d:Assertion`t＞=0&&t＜n__classes`failed._..

特立独行的Q·2024-08-23 04:45

【flash attention安装】成功解决flash attention安装: undefined symbol: _ZN2at4_ops9_pad_enum4callERKNS_6Tensor

【大模型-flashattention安装】成功解决flashattention安装site-packages/flash_attn_2_cuda.cpython-310-x86_64-linux-gnu.so

算法驯化师·2024-08-23 04:44

安装cuml和cupy

在windows虚拟linux环境wsl中安装cuml和cupy命令：（假设你的cuda安装的是12.x版本）pipinstallcupy-cuda12xpipinstallcuml-cu12--extra-index-url

luofengxxs·2024-08-23 02:01

CentOS7安装NVIDIA GPU驱动程序和CUDA工具包

1.查看本地环境检查GPU型号lspci|grep-invidia查看linux系统版本uname-m&&cat/etc/redhat-release禁用nouveaulsmod|grepnouveau

2级选手·2024-08-23 02:30

cuML installation guidence

Mycomputer’sgpuisgtx3060ti,cudaversionis11.4.FirstChecktheversionofyourgcc,type“gcc-v”,ensuringthatyourgccversionis9orhigher

clancy_wu·2024-08-23 02:29

GPU 架构概述费米（Feimi）、开普勒（Kepler）、麦克斯韦（Maxwell）、帕斯卡（Pashcal）和伏特（Volt）架构

GPU架构概述本文主要介绍NVIDIAGPU每一代架构的技术发展和架构之间的区别和联系，时间跨度从2010年至2017年，包括费米（Feimi）、开普勒（Kepler）、麦克斯韦（Maxwell）、帕斯卡

EwenWanW·2024-08-22 19:49

阿里云服务器X86计算、Arm计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算架构区别

在我们选购阿里云服务器的时候，云服务器架构有X86计算、ARM计算、GPU/FPGA/ASIC、弹性裸金属服务器、高性能计算可选，有的用户并不清楚他们之间有何区别，本文主要简单介绍下不同类型的云服务器有何不同

阿里云最新优惠和活动汇总·2024-08-22 16:13

pyinstaller打包onnxruntime-gpu报错找不到CUDA的解决方案

问题说明：使用onnxruntime-gpu完成了深度学习模型部署，但在打包时发生了报错：找不到CUDA具体问题描述：RuntimeError:D:\a\_work\1\s\onnxruntime\python

布呐呐na·2024-08-22 15:56

opencv | cv::cuda::GpuMat upload函数用法

cv::cuda::GpuMat是OpenCV中用于表示GPU上的图像数据的类，它继承自cv::cuda::GpuMatBase类，提供了一些常用的操作函数，例如upload、download、copyTo

Ddddddd_158·2024-08-22 08:40

计算机四个方面：计算、存储、通信与程序；操作系统

CPU和GPU信息：lscpu：显示CPU的架构信息。cat/proc/

loong_XL·2024-08-22 07:06

java与python-java和python的比较

python干活，需求再学习python各种库，pyhton的强壮在于库，为什么python的库强壮，原因是python的库能够用python，c言语,c++等规划，再提供给python运用，所以无论gpu

weixin_37988176·2024-08-22 05:52

DeepSpeed与Megatron的区别和联系

DeepSeedDeepSeed代表性功能MegatronMegatron代表性功能备注GPU底层优化有开创性的全栈GPU内核设计FP6量化更牛逼FusedCUDAKernels毕竟Megatron是Nvidia

爱串门的小马驹·2024-08-22 04:16

bigbig猩猩·2024-08-21 23:15

大模型的学习 LLaMa和ChatGLM，minichatgpt4

NLU（自然语言理解）任务效果很好，单卡GPU可以部署，速度快，V100GPU下1秒能处理2千条以上。ChatGLM-6B,

贝猫说python·2024-03-27 07:55

@llvm.amdgcn.workitem.id.x()引发的一些前后端的调研

记录资料：UserGuideforAMDGPUBackend—LLVM5documentationintrinsic函数会执行lowerintrinsicspassllvm-project-main/llvm

jc小小川+幻幻融hr·2024-03-25 05:50

CUDA——内存

内存形式静态全局内存#include#include__device__floatdevData;//-GPU静态变量（所有设备代码均可见，主机代码不允许直接访问）__global__voidcheckGlobalVariable

UCAS_HMM·2024-03-25 04:19

2024最新华为OD机试试题库全 -【执行时长】- C卷

1.题目详情1.1⚠️题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。

算法小叮当·2024-03-20 19:32

MATLAB使用OMP实现图像的压缩感知实例

OMP（OrthogonalMatchingPursuit）是一种用于稀疏信号恢复的迭代算法。它的目标是从一组测量值中重建具有少量非零元素的信号。

superdont·2024-03-18 09:16

高质量 Git 仓库汇总（持续更新，方便查看）

pvs-studio-cmake-examples3D目标检测Awesome-3D-Object-DetectionAwesome-3D-Object-Detection-for-Autonomous-DrivingCudaCod

Nice_cool.·2024-03-17 21:31

加速 PyTorch 模型预测常见方法梳理

目录1.使用GPU加速2.批量推理3.使用半精度浮点数(FP16)4.禁用梯度计算5.模型简化与量化6.使用TorchScript7.模型并行和数据并行结论在使用PyTorch进行模型预测时，可以通过多种方法来加快推理速度

samoyan·2024-03-17 16:54

数据科学简讯 2023-04-14

他购买了大约10,000个GPU，并且一直在聘请AI专家，同时探索与ChatGPT竞争的可能性。Twitter的这种生成式AI的确切用途尚不清楚，但它有可能用于增强搜索功能或广告。

数科每日·2024-03-17 09:53

tang-0203·2024-03-16 22:30

【深度学习笔记】1 数据操作

然而，Tensor提供GPU计算和自动求梯度等更多功能，这些使

RIKI_1·2024-03-16 02:02

阿里云分布式深度学习训练架构Whale

阿里云分布式深度学习训练架构Whale参考文献Whale基于Tensorflow深度学习分布式训练框架|学习笔记Whale:EfficientGiantModelTrainingoverHeterogeneousGPUs

qwfys200·2024-03-14 07:30

深度学习踩坑记录（持续更新）

目录4060显卡cuda版本异常transformers初始化TrainingArguments时output_dir指定问题4060显卡cuda版本异常环境：torch1.11.0+cu113程序报错

芒果不茫QAQ·2024-03-13 15:39

RuntimeError: (PreconditionNotMet) The third-party dynamic library (cublas64_102.dll；cublas64_10.dll

(cublas64_102.dll;cublas64_10.dll)thatPaddledependsonisnotconfiguredcorrectly.C:\ProgramFiles\NVIDIAGPUComputingToolkit

xxxggany·2024-03-12 21:13

大模型加速与性能对比

本人环境torch2.0.1+cu118cuda11.8nvidia-driver535.98gcc9

__如风__·2024-03-12 11:58

c#截取两个指定字符串中间的字符串列表

localization:50-50},jdjsi{emoj,{localization:12-58}}"截取中间的坐标，根据"{localization:"和"}"进行匹配，得到结果如下打印image.pngpubliccl

好怕怕·2024-03-12 08:01

ARM系统控制和管理接口System Control and Management Interface

•性能管理，即控制由计算引擎组成的域（例如应用处理器（AP）、GPU或其他加速

安全二次方·2024-03-09 16:15

Ubuntu20.04安装并配置vscode

Ubuntu20.04安装并配置vscodevscode安装miniconda安装创建虚拟python3.8环境pytorch和匹配的cuda安装vscode安装VSCode可以通过Snapcraft商店或者微软源仓库中的一个

double_c之·2024-03-07 12:05

推荐频道

cuda(GPU