E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Gpu
OpenCV CUDA模块直方图计算------在
GPU
上计算输入图像的直方图(histogram)函数histEven()
操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:VisualStudioCode编程语言:C++11算法描述该函数用于在
GPU
上计算输入图像的直方图(histogram)。
村北头的码农
·
2025-05-30 07:56
OpenCV
opencv
人工智能
计算机视觉
在CuPy中使用多节点多
GPU
环境
在CuPy中使用多节点多
GPU
环境CuPy本身主要设计用于单节点多
GPU
计算,但可以通过一些方法扩展到多节点环境。
东北豆子哥
·
2025-05-29 20:34
CFD/OpenFOAM
CUDA
HPC/MPI
CUDA
HPC
python
CUDA Fortran 使用介绍与资源
CUDAFortran使用介绍与资源CUDAFortran简介CUDAFortran是NVIDIA与PGI(现为NVIDIA所有)合作开发的Fortran语言扩展,允许Fortran程序员直接使用NVIDIA
GPU
东北豆子哥
·
2025-05-29 20:33
CUDA
Fortran
HPC
CUDA
Python中使用CUDA/
GPU
的方式比较
Python中使用CUDA/
GPU
的方式比较在Python中利用
GPU
加速计算有多种方式,以下是主要的几种方法及其比较:1.CUDA原生开发方式:使用NVIDIA提供的CUDAC/C++API开发内核通过
东北豆子哥
·
2025-05-29 19:30
CUDA
HPC/MPI
python
CUDA
块压缩与图片压缩优缺点对比
块压缩与图片压缩优缺点对比块压缩(BlockCompression)✅优点硬件加速支持直接被
GPU
读取,无需CPU解压显著降低内存带宽消耗(适合移动设备)随机访问特性4×4/8×8像素块独立压缩支持直接定位读取特定纹理区域固定压缩比
wcjwdq
·
2025-05-29 15:59
纹理压缩
探秘
GPU
关键组件HBM:AI 时代的内存新宠
HBM,全称HighBandwidthMemory,直译为高带宽内存,是一种新型的CPU/
GPU
内存芯片。它将多个DDR芯片堆叠后与
GPU
封装,形成大容量、高位宽的DDR组合阵列。
芥子沫
·
2025-05-29 12:41
人工智能
深入了解AI人工智能深度学习的硬件加速方案
深入了解AI人工智能深度学习的硬件加速方案关键词:AI人工智能、深度学习、硬件加速方案、
GPU
、TPU、FPGA摘要:本文旨在深入探讨AI人工智能深度学习的硬件加速方案。
AI大模型应用之禅
·
2025-05-29 09:25
人工智能
深度学习
ai
服务器配置采集
一、
GPU
信息收集查看
GPU
型号和驱动信息nvidia-smi-q>
gpu
_info.txt(输出会包含
GPU
型号、显存、驱动版本、温度等信息)查看CUDA版本nvcc--version2>&1|teecuda_version.txt
bloglin99999
·
2025-05-29 06:24
服务器
运维
OpenCV CUDA模块图像处理------颜色空间处理之拜耳模式去马赛克函数demosaicing()
操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:VisualStudioCode编程语言:C++11算法描述该函数用于在
GPU
上执行拜耳图像(BayerPattern)的去马赛克操作
村北头的码农
·
2025-05-29 06:53
OpenCV
opencv
图像处理
人工智能
YOLOv7在自定义数据集上的Jupyter Notebook训练指南
若没有
GPU
,DigitalOceanGP
t0_54program
·
2025-05-29 02:51
大数据与人工智能
YOLO
jupyter
ide
个人开发
Android 监控性能指标的工具:
5.
GPU
Profiler:专门监测
GPU
相关性能。6.Hierarch
Frank_HarmonyOS
·
2025-05-28 23:36
android
PHP生成pdf方法
browsershot”:“3.57”】使用这个扩展生成PDF需要环境安装以下依赖1.1:NPM【版本:9.2.0】1.2:NODE【版本:v18.19.1】1.3:puppeteer【npminstall-
gpu
ppeteer
huazeci
·
2025-05-28 21:51
php
pdf
开发语言
OpenCV CUDA模块图像处理------颜色空间处理之颜色空间转换函数cvtColor()
操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:VisualStudioCode编程语言:C++11算法描述该函数用于在
GPU
上进行颜色空间转换,支持多种常见的颜色空间转换操作
村北头的码农
·
2025-05-28 16:17
OpenCV
opencv
图像处理
人工智能
ImageMagick 是默认使用 CPU 来处理图像,也具备利用
GPU
加速的潜力
不过,它也具备利用
GPU
加速的潜力,下面为你详细介绍相关情况:1.默认运行模式(CPU)ImageMagick在默认状态下,会调用CPU进行图像处理操作。
专注VB编程开发20年
·
2025-05-28 13:55
人工智能
算法
深度学习
图像处理
OpenCV CUDA模块图像处理------颜色空间处理之
GPU
上对两张带有 Alpha 通道的图像进行合成操作函数alphaComp()
操作系统:ubuntu22.04OpenCV版本:OpenCV4.9IDE:VisualStudioCode编程语言:C++11算法描述该函数用于在
GPU
上对两张带有Alpha通道的图像进行合成操作。
村北头的码农
·
2025-05-28 13:17
OpenCV
opencv
图像处理
人工智能
Day 34
GPU
训练要让模型在
GPU
上训练,主要是将模型和数据迁移到
GPU
设备上。在PyTorch里,.to(device)方法的作用是把张量或者模型转移到指定的计算设备(像CPU或者
GPU
)上。
LiuSu789k
·
2025-05-28 12:42
每日打卡
python
手机发烫怎么解决?
这类程序运行时,CPU和
GPU
会长时间处于高负荷运转状态,产生大量热量。以玩热门手游为例,连续激战两三个小时,手机背
易我数据恢复大师
·
2025-05-28 10:29
手机
手机发烫
Unity引擎 Profiler工具架构设计
Profiler就像是Unity引擎的“体检仪”,能实时监控游戏运行时的各项“生命体征”,比如CPU、
GPU
、内存、渲染、物理、网络等模块的性能数据,帮助开发者定位性能瓶颈。
你一身傲骨怎能输
·
2025-05-27 22:34
商业化游戏开发技术专栏
unity
Profiler
【Linux】Linux系统中升级CUDA到最新版本
1.前期准备1.1检查系统兼容性确认
GPU
支持CUDA:检查系统中是否有NVIDIA
GPU
:lspci|grep-invidi
彬彬侠
·
2025-05-27 20:19
Linux
linux
CUDA
CUDA
Toolkit
Ubuntu
CentOS
GPU
UE4中性能优化和检测工具
中性能优化和检测工具合集简述CPUUnrealInsightUnrealProfilerSimpleperfAndroidStudioPerfettoXCodeTimeprofilerBestPractice
GPU
Adreno
GPU
Mali
GPU
Android
GPU
Inspector
Yuk丶
·
2025-05-27 19:39
UE4
ue4
性能优化
Android
GPU
Inspector深度解析:从零掌握驱动级性能数据抓取与优化
简介在移动应用开发中,
GPU
性能优化是提升用户体验的关键环节。
Android洋芋
·
2025-05-27 18:06
android
GPU性能优化
图形渲染
驱动级数据
性能分析
游戏优化
AR应用
SDL2常用函数:SDL_Texture 数据结构及使用介绍
相比SDL_Surface,它直接在
GPU
显存中存储纹理数据,提供更快的渲染性能。
EtpBot-萧阳
·
2025-05-27 17:27
SDL
Sdl2
图形渲染
硬件加速
window 显示驱动开发-呈现开销改进
从Windows8.1开始,MicrosoftDirect3D运行时更高效地处理内部交换缓冲区,从而减少
GPU
上的处理负载。
程序员王马
·
2025-05-27 14:11
windows图形显示驱动开发
驱动开发
window 显示驱动开发-图形内核性能改进
为了帮助评估图形硬件性能,Windows显示驱动程序模型(WDDM)1.3及更高版本驱动程序可以选择为
GPU
处理的API调用提供准确的计时信息。从Windows8.1开始,此功能是新的。
程序员王马
·
2025-05-27 13:08
windows图形显示驱动开发
驱动开发
进阶篇09ChatGLM一键微调微调过程
阿里云ChatGLM模型微调实战教程一、环境初始化与模型部署1.1环境加载流程正常异常开始环境初始化加载基础镜像检查
GPU
状态下载ChatGLM-6B提交工单排查安装Python依赖加载测试数据集1.2
monday_CN
·
2025-05-27 13:07
langchain
AI 芯片与异构计算在 Android 端的实战深度解析:国产 NPU 架构、NNAPI 编程与性能调优路径全景
在Android生态中,如何充分发挥CPU、
GPU
、NPU、D
观熵
·
2025-05-27 13:06
智能终端Ai探索与创新实践
人工智能
android
架构
DearPyGui 教程
这个库利用
GPU
加速渲染和高效的C/C++底层代码,确保了出色的性能和稳定性。DearPyGui支持异步函数,能够绘制大量数据点而不影响帧率,还内置了一个节点编辑器和实时开发调试
邬楠满Seaman
·
2025-05-27 02:59
芯片巨头英伟达NVIDI发展简史:从1993到2025,从GeForce256到Blackwell
从BlackwellUltra
GPU
撕裂物理定律的性能曲线,到量子-经典混合计算平台突破产业应用临界点;从开源人形机器人模型打破制造业自动化僵局,到L4级自动驾驶方案跨越量产生死线——这场技术盛宴的每个章节都在重塑产业规则
北京王老师
·
2025-05-27 01:51
人工智能
机器智能
人工智能
deepseek
英伟达
Blackwell
ComfyUI web API 接口 python 调用工具 简单实现
代码的人以及"AI程序开发者"阅读主要想法和初衷:通过python程序调用comfyUIworkflow生成图片批量替换workflow中的prompt节点,批量生成图片.自动化,一键完成,无需等待图片生成,让
GPU
weixin_39286961
·
2025-05-26 23:13
python
ai绘画
stable
diffusion
人工智能作画
Python打卡DAY34
知识点回归:CPU性能的查看:看架构代际、核心数、线程数
GPU
性能的查看:看显存、看级别、看架构代际
GPU
训练的方法:数据和模型移动到
GPU
device上类的call方法:为什么定义前向传播时可以直接写作
chicpopoo
·
2025-05-26 20:29
浙大疏锦行打卡
python
开发语言
Python打卡day34!!!
DAY34
GPU
训练及类的call方法知识点回归:CPU性能的查看:看架构代际、核心数、线程数
GPU
性能的查看:看显存、看级别、看架构代际
GPU
训练的方法:数据和模型移动到
GPU
device上类的call
dragon0907
·
2025-05-26 20:58
python打卡
python
开发语言
python打卡day34@浙大疏锦行
知识点回归:CPU性能的查看:看架构代际、核心数、线程数
GPU
性能的查看:看显存、看级别、看架构代际
GPU
训练的方法:数据和模型移动到
GPU
device上类的call方法:为什么定义前向传播时可以直接写作
风逸hhh
·
2025-05-26 20:26
python打卡60天行动
python
开发语言
【TVM 教程】开发环境中加入 microTVM
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
·
2025-05-26 19:40
英伟达破局1000 Token/秒!Llama 4以光速重塑AI推理边界
Llama4Maverick模型在单节点(8颗Blackwell
GPU
)上实现每秒1000token的生成速度,这一数字不仅超越了前代Blackwell的基线表现,更让单台服务器(72颗
GPU
)的吞吐量飙升至
TGITCIC
·
2025-05-26 17:14
AI-大模型的落地之道
人工智能
llama
大模型
大模型速度
英伟达
AI赛道
大模型基座
NIPS-2013《Distributed PCA and $k$-Means Clustering》
推荐深蓝学院的《深度神经网络加速:cuDNN与TensorRT》,课程面向就业,细致讲解CUDA运算的理论支撑与实践,学完可以系统化掌握CUDA基础编程知识以及TensorRT实战,并且能够利用
GPU
开发高性能
Christo3
·
2025-05-26 02:08
机器学习
kmeans
算法
大数据
人工智能
深入理解浏览器原理、性能优化和调试调优
一、深入理解浏览器原理1.浏览器整体架构多进程模型:BrowserProcess、RendererProcess、
GPU
Process、NetworkProcess浏览器沙箱、隔离机制(SiteIsolation
Mr丶疯孑
·
2025-05-25 10:55
性能优化
前端
【HarmonyOS NEXT】FAQ之DevEco Studio(工程管理)
1、环境诊断、创建工程/模块界面全部显示空白A:导致该问题的可能原因为电脑
GPU
不兼容,或在云桌面的场景下使用DevEcoStudio。
这货就是木子全呀
·
2025-05-25 10:23
前端
harmonyos
华为
Mac的显卡架构种类
目录一、Intel架构时期的Mac显卡(2006年至2020年)1.Intel集成显卡(i
GPU
)2.独立显卡(d
GPU
)——AMD和NVIDIA(1)AMDRadeon(主流独显选择)(2)NVIDIA
王景程
·
2025-05-25 05:49
macos
架构
ai之pdf解析工具 PPStructure 还是PaddleOCR
目录重点是四先用PPStructure版面分析,分成不同的块儿,再选用PaddleOCR、或PPStructure基础路径OCR模型配置OCR模型配置
GPU
配置硬件配置性能配置一、框架选型对比分析1.
不懂球的小胖
·
2025-05-25 02:25
ai
python
pdf
ai
python
python打卡训练营打卡记录day34
知识点回归:CPU性能的查看:看架构代际、核心数、线程数
GPU
性能的查看:看显存、看级别、看架构代际
GPU
训练的方法:数据和模型移动到
GPU
device上类的call方法:为什么定义前向传播时可以直接写作
yorushika_
·
2025-05-24 19:14
python打卡训练营
python
开发语言
GPU训练
深度学习
Python打卡训练营学习记录Day34
知识点回归:CPU性能的查看:看架构代际、核心数、线程数
GPU
性能的查看:看显存、看级别、看架构代际
GPU
训练的方法:数据和模型移动到
GPU
device上类的call方法:为什么定义前向传播时可以直接写作
FanfanPyt
·
2025-05-24 13:06
python
学习
开发语言
facebook开源Triton编写
GPU
内核的编程模型速读:KernelLLM
KernelLLM一、引言KernelLLM是一个基于Llama3.1Instruct的大型语言模型,专为使用Triton编写
GPU
内核的任务而训练。
Open-source-AI
·
2025-05-24 13:06
前沿
开源
语言模型
人工智能
自然语言处理
大模型
代码生成
PyTorch性能调优实战:从算子优化到分布式训练全攻略
一、自定义层的CUDA优化:榨取
GPU
极限算力PyTorch原生算子在复杂计算场景
灏瀚星空
·
2025-05-24 08:58
浩瀚星空的AI筑梦工作站
pytorch
分布式
人工智能
NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署【2025年 5月 2日】
现在,开发者能够基于NVIDIA
GPU
,使用NVIDIATensorRT-LLM、Ollama、SGLang、vLL
u013250861
·
2025-05-24 05:39
#
LLM/部署&推理
jetson
Bert-VITS-2 效果挺好的声音克隆工具
教程地址:sjjCodeWith
GPU
|能复现才是好算法CodeWith
GPU
|GitHubAI算法复现社区,能复现才是好算法https://www.codewith
gpu
.com/i/fishaudio
java_lilin
·
2025-05-24 05:03
bert
人工智能
深度学习
WebGL基本概念
它通过JavaScript与
GPU
交互,实现高性能的图形渲染。(2)WebGL的核心组件Canvas:WebGL的渲染目标,通过元素创建。
香蕉可乐荷包蛋
·
2025-05-24 04:58
前端
webgl
前端
C#编写双色球选号程序-双色球类的创建
//实体类:双色球号码,球有多个,则需要用List保存双色球的号码,双色球号码是strin
gpu
blicListRedBalls{get;set;}//设置List类,保存双色球号码publicListBlueBalls
学编程的小白狼
·
2025-05-23 15:31
C#学习
c#
开发语言
Dify+RAGFlow企业级智能知识库:PDF表格秒变结构化数据,检索精准度大幅提升!
Dify与RAGFlow结合部署本地知识库并提升检索准确率的详细教程及原理分析:一、环境准备与部署架构硬件要求:CPU≥4核(推荐支持AVX指令集)内存≥16GB磁盘≥50GB(用于存储向量索引)
GPU
AI大模型-王哥
·
2025-05-23 15:26
RAG
大模型
人工智能
AI大模型
程序员
RAGflow
大模型入门
【第15章:量子深度学习与未来趋势—15.2 量子深度学习模型的基础理论与实现方法探索】
今天AI领域正面临类似的困境——GPT-4训练需要消耗1.7万个NVIDIAA100
GPU
运行3个月,能耗相当于300个家庭一年的用电量。
再见孙悟空_
·
2025-05-23 07:37
#
【
深度学习・探索智能核心奥秘】
深度学习
DeepSeek
人工智能
计算机视觉
强化学习
量子计算
量子深度学习
GPU
集群的“碳中和”策略:从DVFS调频到液冷散热系统的能效模型
引言在超算中心年均能耗突破百万度电的背景下(典型规模的1000节点
GPU
集群年耗电约2.5亿度,≈CNY1.8亿元),实现能耗优化已成为各国超算中心的核心任务。
学术猿之吻
·
2025-05-23 05:22
架构
pytorch
人工智能
python
开发语言
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他