E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU并行计算-CUDA编程
Unity3D 如何提升游戏运行效率详解
1.优化渲染性能1.1使用合适的纹理压缩和格式技术详解:使用适当的纹理压缩可以显著减少内存使用和
GPU
负担。Unity支持多种纹理压缩格式,如ETC2、PVRTC
Thomas_YXQ
·
2024-08-31 20:41
游戏
Unity3D
架构
游戏开发
Unity
Unity3D UI Toolkit数据动态绑定详解
前言在Unity3D中,ComputeShader是一种强大的工具,用于在
GPU
上执行
并行计算
任务,这些任务通常涉及大量的数据处理,如图像处理、物理模拟等。
Thomas_YXQ
·
2024-08-31 19:40
ui
java
开发语言
Unity
游戏开发
前端
c#
前端性能优化-CSS性能优化
文件压缩四、去除无用CSS五、有选择地使用选择器六、减少使用昂贵的属性七、优化重排与重绘1.减少重排2.避免不必要的重绘八、让元素及其内容尽可能独立于文档树的其余部分九、避免使用@import十、开启
GPU
LYFlied
·
2024-08-31 16:46
css
前端
css
性能优化
面试
【笔试】03
在高性能计算领域,FLOPS被广泛用来评估超级计算机、CPU、
GPU
和其他处理器的计算能力。FLOPS数值越高,计算机执行涉及浮点数的计算能力越强。
yogurt=b
·
2024-08-31 13:28
笔试记录
数据库
数据结构
最新视频合成后调优技术ExVideo模型部署
ExVideo提出了一种新的后调优策略,无需对整个模型进行大规模重训,仅通过对模型中时序相关组件的微调,就能够显著增强其生成更长视频片段的能力,大大降低了对计算资源的需求,仅需1.5k
gpu
小时就能将视频生成帧数提高至原模型的
杰说新技术
·
2024-08-31 09:56
AIGC
多模态
AIGC
人工智能
深度学习系列70:模型部署torchserve
内容包含:读取args,创建pid文件找到java,启动model-server.jar程序,同时读取log-config文件,TEMP文件夹地址,TS_CONFIG_FILE文件根据cpu核数、
gpu
IE06
·
2024-08-31 00:25
深度学习系列
深度学习
人工智能
做大模型 千万别买苹果笔记本电脑
以下是一些主要原因:1.
GPU
不适合深度学习AppleSilicon
GPU
限制:Apple自家芯片(如M1和M2)的
GPU
架构与传统的NVIDIA
GPU
(通常是深度学习和大模型训练的首选)不同。
路人与大师
·
2024-08-30 16:06
电脑
[2020]tensorflow2.1-
GPU
+ CUDA +CUDNN配置过程记录
最近几天做视频数据集的时候要用到tensorflow2的
gpu
训练版本,要安装对应版本的cuda和cudnn,网上的教程五花八门,我尝试了很多论坛的方法,有些能用有些不可以(也可能是我操作错误),经过两天调试终于能够运行了
夏迪End
·
2024-08-30 15:56
PyTorch深度学习实战(26)—— PyTorch与Multi-
GPU
当拥有多块
GPU
时,可以利用分布式计算(DistributedComputation)与
并行计算
(ParallelComputation)的方式加速网络的训练过程。
shangjg3
·
2024-08-30 12:10
PyTorch深度学习实战
深度学习
pytorch
人工智能
C语言中的多线程编程:POSIX线程库(Pthreads)入门与实战(一)
这种架构变革使得单个处理器芯片能够容纳多个执行核心,从而显著提升了
并行计算
能力。面对这样的
JJJ69
·
2024-08-30 09:51
学习C语言吧
开发语言
c语言
SK Hynix明年将开发基于96/128 GB DDR5的CXL 2.0内存解决方案
CXL指的是ComputeExpressLink,这是一种互联技术,可以在CPU和
GPU
之间实现更快的数据传输,但在人工智能领域,它实际上是CPU和加速器之间的数据传输。
吴脑的键客
·
2024-08-30 08:43
人工智能
人工智能
gpu算力
PyTorch深度学习实战(27)—— PyTorch分布式训练
这里主要介绍的是数据并行的分布式方法:每一块
GPU
都有同一个模型的副本,仅加载不同的数据
shangjg3
·
2024-08-30 07:37
PyTorch深度学习实战
深度学习
pytorch
分布式
python
大模型训练优化方法
本文主要参考HF上的一篇文章:https://huggingface.co/docs/transformers/perf_train_
gpu
_one,以及笔者在实际训练中的一些经验,给出一些比较实用的方法
少喝冰美式
·
2024-08-30 05:28
人工智能
大语言模型
ai大模型
大模型应用
LLM
大模型训练
计算机技术
查看 linux 系统信息
文章目录查看系统信息查看
GPU
信息查看系统信息在Linux系统中,查看系统信息是一项基本而重要的操作。这可以提供关键的系统配置和状态信息,帮助用户和管理员对系统进行监控、诊断和优化。
彷徨而立
·
2024-08-30 05:57
linux
【学习笔记】:Ubuntu 22 使用模型量化工具llama.cpp部署大模型 CPU+
GPU
学习笔记:Ubuntu22使用模型量化工具llama.cpp部署大模型CPU+
GPU
前言1下载并编译llama.cpp1.1git下载llama.cpp仓库源码1.2编译源码(make)1.2.1选择一
淮序_
·
2024-08-30 02:00
笔记
ubuntu
llama
python
免费部署Flux.1模型,搭载ComfyUI配置与评测
每天签到最少可获得5小时免费
GPU
时长,如果每一次机器运行时长不超过30分钟,就不计算时长。
fysuccess
·
2024-08-29 19:14
其他文档
最新AI绘画
FLUX.1
comfyUI
免费部署
2019-05-16
TensorFlow安装CPU版本pipinstalltensorflow
GPU
版本pipinstalltensorflow-
gpu
(显卡必须支持)259.7MB如果装完不支持1.是否显卡不支持删除
gpu
微软czw
·
2024-08-29 17:12
TensorFlow和它的弟弟们
以下是它们之间的主要区别:1.TensorFlow(PC\
GPU
)设计目标:TensorFlow是一个开源的机器学习框架,由GoogleBrain团队开发,旨在帮助开发者构建和训练深度学习模型。
活蹦乱跳酸菜鱼
·
2024-08-29 08:31
tensorflow
人工智能
python
买电脑如何选择显卡?
了解显卡性能:
GPU
型号:NVIDIA和AMD是市场上的两大主流品牌,NVIDI
是毛毛吧
·
2024-08-29 07:57
硬件架构
电脑
RK3568笔记二十二:基于TACO的垃圾检测和识别
一、环境1、测试训练环境:AutoDL.2、平台:rk35683、开发板:ATK-RK3568正点原子板子4、环境:buildroot5、虚拟机:正点原子提供的ubuntu20二、测试个人电脑没有
GPU
殷忆枫
·
2024-08-29 06:52
RK3568学习笔记
笔记
释放
GPU
潜能:PyTorch中torch.nn.DataParallel的数据并行实践
释放
GPU
潜能:PyTorch中torch.nn.DataParallel的数据并行实践在深度学习模型的训练过程中,计算资源的需求往往随着模型复杂度的提升而增加。
2401_85762266
·
2024-08-29 05:45
pytorch
人工智能
python
OpenGL学习笔记(十六)缓冲区(一)像素缓冲区
缓冲区保存在
GPU
内存中,它
龙行天下01
·
2024-08-29 02:24
opengl
开发语言
图形渲染
CUDA C++ 编程指南
目录1.Introduction1.1.TheBenefitsofUsing
GPU
s1.2.CUDA®:AGeneral-PurposeParallelComputing1.3.AScalableProgrammingModelCUDAC
疯狂的码泰君
·
2024-08-29 02:51
CUDA
c++
开发语言
CUDA
GPUs
向量数据库Faiss的详细介绍和搭建使用教程
它通过将候选向量集封装成一个index数据库,加速检索相似向量的过程,尤其在一些最有用的算法上实现了
GPU
加速。二、Faiss的安装Faiss支持多种操作系统,包
大白菜程序猿
·
2024-08-29 01:14
运维
faiss
GPU
算力租用平台推荐
在当前快速发展的AI和深度学习领域,
GPU
算力租用平台成为了研究者、开发者及企业不可或缺的工具。
hong161688
·
2024-08-29 00:07
gpu算力
高通骁龙800系列处理器规格型号及代表机型大全
高通骁龙800系列处理器规格型号及代表机型大全:处理器型号制造工艺CPU架构核心频率
GPU
内存基带出货时间代表机型骁龙800(MSM8x74)28nmHPM四核Krait4002.26GHzAdreno330450MHz
szx940213
·
2024-08-28 20:10
高通骁龙
骁龙800
处理器规格
骁龙处理器
[论文笔记] eval-big-refactor lm_eval 每两个任务使用一个
gpu
,并保证端口未被使用
1.5B在eval时候两个任务一个
gpu
是可以的。7B+在evalbelebele时会OOM,所以分配时脚本不同。
心心喵
·
2024-08-28 19:00
论文笔记
restful
后端
docker: Error response from daemon: could not select device driver with capabilities: [[
gpu
]]问题记录解决
具体参考:docker:Errorresponsefromdaemon:couldnotselectdevicedriverwithcapabilities:[[
gpu
]]问题记录解决_奶茶不加冰的博客
爱科技Ai
·
2024-08-28 12:47
docker
容器
运维
yolo v8 + flask部署到云服务器,以及问题记录
环境安装1、运行项目报错:nopythonapplicationfound,checkyourstartuplogsforerrors在云服务器pytorch版本安装错了,安装了
GPU
版本,需要安装CPU
智商不够_熬夜来凑
·
2024-08-28 11:07
YOLO
pytorch
python
flask
并行计算
的艺术:PyTorch中torch.cuda.nccl的多
GPU
通信精粹
并行计算
的艺术:PyTorch中torch.cuda.nccl的多
GPU
通信精粹在深度学习领域,模型的规模和复杂性不断增长,单
GPU
的计算能力已难以满足需求。多
GPU
并行计算
成为提升训练效率的关键。
2401_85763639
·
2024-08-28 09:56
pytorch
人工智能
python
苹果M4芯片Mac全面曝光 或10月发布
其中三台Mac配备了10核CPU和10核
GPU
;第四台机器配备了8核CPU和8核
GPU
(首次亮相),所有四台M4Mac都有16GB
一一一一一一__1
·
2024-08-28 08:22
macos
精准掌控
GPU
:深度学习中PyTorch的torch.cuda.device应用指南
精准掌控
GPU
:深度学习中PyTorch的torch.cuda.device应用指南在深度学习的世界里,
GPU
加速已成为提升模型训练和推理速度的关键。
2401_85760095
·
2024-08-28 06:41
深度学习
pytorch
人工智能
编译运行 llama.cpp (vulkan, Intel
GPU
SYCL)
llama.cpp是一个运行AI(神经网络)语言大模型的推理程序,支持多种后端(backend),也就是不同的具体的运行方式,比如CPU运行,
GPU
运行等.但是编译运行llama.cpp并不是那么容易的
穷人小水滴
·
2024-08-28 05:27
llama.cpp
AI
Intel
GPU
SYCL
vulkan
A770
大模型推理测速 (llama.cpp, Intel
GPU
A770)
由于本文太长,分开发布,方便阅读.3.1CPU(i5-6200U,2C/4T/2.8GHz)x86_64AVX2在4号PC(物理机)上运行.版本:>./llama-b3617-bin-ubuntu-x64/build/bin/llama-cli--versionversion:3617(a07c32ea)builtwithcc(Ubuntu11.4.0-1ubuntu1~22.04)11.4.0f
穷人小水滴
·
2024-08-28 05:57
人工智能
llama
llama.cpp
A770
vulkan
SYCL
GNU/Linux
Windows下编译libevent 64位静态库总结
参照:https://my.oschina.net/jacobin/blog/146567http://blog.csdn.net/qingfen
gpu
99/article/details/45113841http
岩屿
·
2024-08-28 01:09
libevent
详细说明:向量数据库Faiss的搭建与使用
它能够处理大型数据集,并且在
GPU
上的性能表现尤为出色。下面详细介绍Faiss的搭建与使用。1.搭建Faiss1.1安装依赖包首先,需要安装Faiss及其依赖包。
AI逍遥子
·
2024-08-28 01:09
faiss
PYTORCH 官方文档,开发文档,Python编程 人工智能 深度机器学习
PYTORCH文档PyTorchdocumentation—PyTorchmasterdocumentationPyTorch是一个使用
GPU
和CPU进行深度学习的优化张量库。
zhangfeng1133
·
2024-08-27 13:21
pytorch
人工智能
python
HPC&AI
并行计算
集群Slurm作业调度系统对通用资源(GRES)的调度
为特定GRES类型启用了其他内置功能,包括图形处理单元(
GPU
)、CUDA多进程服务(MPS)设备,并通过可扩展的插件机制进行分片。二、配置默认情况下,群集的配置中未启用任何GRES。
技术瘾君子1573
·
2024-08-27 09:25
并行计算
AI并行计算
Slurm调度系统
MPS管理
GPU管理
MIG多实例管理
GPU切片
运维系列&AI系列&Lenovo-G双系统系列(前传-装之前搜索的):pytorch cuda安装报错的解决方法
pytorchcuda安装报错的解决方法pytorchcuda安装报错的解决方法前言2022.12.8在win+cuda11.8下安装最新Pytorch
GPU
版时遇到包不兼容的问题,该文记录安装的整个流程一
坦笑&&life
·
2024-08-27 06:33
AI系列
人工智能
运维
pytorch
【
CUDA编程
笔记】如何使用CUDA统一内存来优化多进程多线程程序的性能?
理解统一内存统一内存是
CUDA编程
模型的一个组件,它定义了一个所有处理器都可访问的单一连贯内存映像,允许数据在CPU和
GPU
之间透明迁移,无需显式复制。
qq2108462953
·
2024-08-26 23:26
CUDA编程笔记
笔记
人工智能
CUDA指南-CUDA简介与开发环境搭建
CUDA(ComputeUnifiedDeviceArchitecture)是由NVIDIA开发的
并行计算
平台和编程模型,它允许开发者利用NVIDIA
GPU
进行高效的通用计算任务。
小虾米欸
·
2024-08-26 21:41
CUDA指南
CUDA
关于苹果M1和Intel等芯片的区别
这颗芯片采用5纳米制程工艺,CPU、
GPU
、缓存集成在一起,其中包含160亿个晶体管。虽然股价没涨,市场反应也不温不火,但是,苹果变革的暗流,已经汹涌袭来。
丿星纟彖彳亍
·
2024-08-26 19:15
[服务器运维]
gpu
幽灵进程处理
僵尸进程是指那些已经完成任务但没有正确关闭的进程,它们可能因为各种原因未能释放占用的
GPU
资源。这会导致资源浪费,并且阻碍其他任务的执行。
PigeonGuan
·
2024-08-26 18:38
服务器
运维
Python(PyTorch)多语言图像感知质量指标算法
LabVIEW单尺度质量指标算法|MATLAB单尺度质量指标算法|PyTorch完整参考图像质量测量指标、和分布式图像特征质量测量指标|多尺度质量模型应用:图像压缩,视频压缩、端到端优化图像压缩、神经图像压缩、
GPU
亚图跨际
·
2024-08-26 16:57
Python
算法
交叉知识
算法
单尺度
多尺度
图像感知质量
分布式图像特征
GPU变速图像压缩
视频压缩
【赵渝强老师】Spark中的RDD
它由分区组成,每个分区被一个Spark的Worker从节点处理,从而支持分布式的
并行计算
。RDD通过检查点Checkpoint的方式提供自动容错的功能,并且具有位置感知性调度和可伸缩的特性。
赵渝强老师
·
2024-08-26 11:52
大数据技术
spark
大数据
分布式
人工智能开源库有哪些
TensorFlow:由Google开发的深度学习库,提供了丰富的工具和API,支持CPU和
GPU
计算。PyTorch:由Facebook开发的深度学习框架,提供动态图和静态图两种模式,并且易于使用。
openwin_top
·
2024-08-26 02:59
人工智能
人工智能
开源
python
深度学习多
GPU
训练原理
详细参考《动手学深度学习》P233,8.4节多
GPU
计算。数据并行的方法把一个batch的所有数据平均分配到每块
GPU
的显存里,把模型参数在每个
GPU
显存上拷贝一份。
浦东新村轱天乐
·
2024-08-25 22:31
深度学习
深度学习
人工智能
TensorFlow库详解:Python中的深度学习框架
它能够处理大规模的多维数据,并支持在多种硬件平台上运行,如CPU、
GPU
和TPU(TensorProcessingUnit)。
Ambition_LAO
·
2024-08-25 21:28
tensorflow
深度学习
OpenCL在移动端
GPU
计算中的应用与实践
在Android设备上,
GPU
,尤其是高通Adreno和华为Mali,因其卓越的浮点运算能力,成为了异构计算中的重要组成部分。百度APP已经利用
GPU
计算加速深度模型推理和计算密集型业务。
m0_67544708
·
2024-08-25 10:51
java
GPU
OpenCL
向量数据库Faiss的搭建与使用|Faiss|向量数据库|高效检索|机器学习|大规模数据
Faiss的安装与环境配置2.1环境要求2.2Faiss的安装2.3验证安装3.Faiss的基本使用3.1创建索引与添加向量3.2执行查询3.3向量的压缩与内存优化4.Faiss的高级功能与优化4.1
GPU
concisedistinct
·
2024-08-25 09:10
人工智能
faiss
数据库
人工智能
机器学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他