E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
gpu
Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进(四)
1.1现代
GPU
架构演变graphLRA[传统IMR架构]
程序员王马
·
2025-04-20 00:54
windows图形显示驱动开发
驱动开发
Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进(一)
双精度着色器功能:高级着色器模型性能改进,使你可以在
GPU
上执行更多操作,而无需占用CPU。独立于目标的光栅化:适用于Direct2D应用程序的高性能抗锯齿路径。无覆盖和丢弃:使用基
程序员王马
·
2025-04-20 00:24
windows图形显示驱动开发
windows
Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进(二)
1.1WDDM1.2双精度支持矩阵graphLRA[功能级别11_0+]-->|必须支持|B(基础双精度)A-->C[可选支持扩展指令]D[WDDM1.2驱动]-->|硬件加速|E[FMA指令集]F[
GPU
程序员王马
·
2025-04-20 00:24
windows图形显示驱动开发
windows
驱动开发
Pytorch与深度学习自查手册1-张量、自动求导和
GPU
Pytorch与深度学习自查手册1-张量、自动求导和
GPU
张量构造Tensordtype类型:dtype=torch.long,torch.float,torch.double常见的构造Tensor的函数
冬于
·
2025-04-19 23:47
深度学习
word2vec
自然语言处理
深度学习
pytorch
平板个人计算机的品牌和配置,比较热销十大平板电脑排行榜
www.chinapp.com品牌网比较热销十大平板电脑排行榜:1、三星GalaxyTab7.0Plus显示屏分辨率为1024像素X600像素,配置三星ExynosS5PV210处理器和ARMMali-400MP
GPU
易三叨
·
2025-04-19 22:40
平板个人计算机的品牌和配置
conda创建虚拟环境并安装
GPU
版torch全过程(cuda11.8+py3.10+torch2.4.1+torchvision0.19.0)
目录1.创建虚拟环境2.安装pytorch2.1查找对应版本2.2安装pytorch2.3测试是否安装成功3.安装torchvision3.1查找对应版本3.2安装torchvision3.3测试是否安装成功4.Others4.1安装numpy报错4.2安装timm报错1.创建虚拟环境condacreate-nenv_name-y##指定python版本condacreate-nenv_namep
哇噻_123
·
2025-04-19 14:49
conda
人工智能
pytorch
python
深度学习
在企业级部署中如何优化NVIDIA
GPU
和容器环境配置:最佳实践与常见误区20250414
在企业级部署中如何优化NVIDIA
GPU
和容器环境配置:最佳实践与常见误区引言随着AI和深度学习技术的迅速发展,企业对
GPU
加速计算的需求愈加迫切。
Narutolxy
·
2025-04-19 14:18
技术干货分享
智浪初航
docker
AIGC
Tensorflow、Pytorch与Python、CUDA版本的对应关系(更新时间:2025年4月)
要在Windows上使用TensorFlow
GPU
,您需要在WSL2中构建/安装TensorFlow或将tensorflow-cpu与TensorFlow-DirectML-Plugin一起使用1.1、
芥子沫
·
2025-04-19 11:56
python
tensorflow
pytorch
深入理解DeepSeek与企业实践(二):32B多卡推理的原理、硬件散热与性能实测
前言在《深入理解DeepSeek与企业实践(一):蒸馏、部署与评测》文章中,我们详细介绍了深度模型的蒸馏、量化技术,以及7B模型的部署基础,通常单张
GPU
显存即可满足7B模型完整参数的运行需求。
ZStack开发者社区
·
2025-04-19 11:54
人工智能
云计算
科技
yolov8复现
若有,后续可安装
GPU
版本的pytorch以加速训练;若没有,则安装CPU版本,不过训练速度会较慢。安装所需软件Anaconda3安装:可从清华镜像源选择对应系统版本的Anaconda3安装包下载。
吹风看太阳
·
2025-04-19 10:22
YOLO
树莓派超全系列教程文档--(29)config.txt介绍
在ArmCPU和Linux初始化之前,
GPU
会读取config.txt。Rasp
想躺在地上晒成地瓜干
·
2025-04-19 09:11
树莓派
树莓派
linux
树莓派教程
RaspberryPi
config.txt
CUDA_全局内存及访问优化
全局内存
GPU
全局内存,CPU和
GPU
都可以进行读写操作。任何设备都可以通过PCI-E总线对其进行访问,
GPU
之间不通过CPU,直接将数据从一块
GPU
卡上的数据传输到另一块
GPU
上。
一介草民李老四
·
2025-04-19 07:33
CUDA
c++
c语言
服务器
大数据
linux运行程序开启了opencl,Linux上使用AMD的OpenCL开发运行环境
AMDSDKAPP开发包,另一部分是AMD的Catalyst驱动软件包.AMDSDKAPP开发包主要包括开发OpenCL应用所需要的头文件,文档和例子程序.Catalyst驱动包括OpenCL运行库,AMD
GPU
某友善的微笑
·
2025-04-19 06:56
PoCL Runtime开发笔记
1UMDAPI开源PoCL代码中有些例子是可以参考的,路径在pocl/lib/CL/devices,有:basic:以hostCPU作为targetdevice,仅有一个执行单元cuda:NV
GPU
为targetdevicepthread
小小蚂蚁fcy
·
2025-04-19 06:23
高性能计算
人工智能
大模型面试题
分布式训练是一种利用多个计算节点(如多个
GPU
或多个机器)协同工作来加速训练机器学习模型的方法。它通过将训练任务分配给多个计算资源并行执行,以减少训练时间和处理大规模数据。
钢门狂鸭
·
2025-04-19 04:11
ai
使用docker 安装向量数据库Milvus
Miluvs官网www.milvus.io/https://milvus.io/docs/zh/install_standalone-docker-compose-
gpu
.md一、基本概念向量数据库:Milvus
❀͜͡傀儡师
·
2025-04-19 03:05
docker
数据库
milvus
spring boot+mybatis-plus 时间查询精确到分秒
日期yyyy-MM-dd查询前端get请求传递参数String类型@GetMappin
gpu
blicResultfinddate(@RequestParam(defaultValue="2021-
克里斯李逵
·
2025-04-19 00:48
spring
spring
boot
java
mybatis
api
在Ubuntu服务器上部署xinference
一、拉取镜像dockerpullxprobe/xinference:latest二、启动容器(
GPU
)dockerrun-d--namexinference-eXINFERENCE_MODEL_SRC=
你喜欢喝可乐吗?
·
2025-04-19 00:44
deploy
LLM
ubuntu
服务器
运维
人工智能
ubuntu 20.04上docker 使用
gpu
要在Docker容器中使用
GPU
,你需要确保系统上已经安装了正确的NVIDIA驱动程序,并且安装了NVIDIAContainerToolkit。
AI拉呱
·
2025-04-18 23:07
linux实战从入门到精通
ubuntu
docker
linux
GPU
在机器学习中的应用优势:从技术特性到云端赋能
正如蒸汽引擎重塑工业革命,
GPU
(图形处理器)的出现为机器学习带来了前所未有的算力突破,而云
GPU
的普及更是让这场算力革命进入"云计算时代",让每个开发者和企
·
2025-04-18 22:39
Qt 性能优化总结
1.Qt性能优化简介性能优化目标是减少资源消耗(如CPU、内存、
GPU
)、提高响应速度和流畅度。Qt应用程序的性能瓶颈可能出现在:GUI渲染:复杂界面或频繁重绘。内存管理:对象分配过多或内存泄漏。
lianghu666
·
2025-04-18 21:57
Qt
qt
性能优化
查看
GPU
与 NUMA 节点的绑定关系
目录一、通过nvidia-smi直接查看(NVIDIA专属)1.命令与输出解读2.原理二、通过PCIe设备路径关联NUMA节点(通用方法)1.步骤1:找到
GPU
的PCIe地址2.步骤2:读取PCIe设备的
清风 001
·
2025-04-18 16:56
AI大模型底层建设
前端
linux
人工智能
4090租用,各云
GPU
平台价格对比清单及建议
根据各平台的价格和型号配置,以下是通过DeepSeek-R1进行分析后,给出的建议。一、按显存需求推荐1.24G显存需求(适合常规AI训练/推理、中小模型)性价比首选:智星云(1.35元/小时),价格最低,比第二名BuluAI(1.93元)便宜约30%,适合预算敏感型用户。备选方案:BuluAI(1.93元)或丹摩DAMODEL(2.18元),价格适中,可尝试作为智星云的替代选项。避坑提醒:aut
智星云算力
·
2025-04-18 15:16
人工智能
智星云
GPU租用
边缘计算硬件架构介绍
某个用例可能需要高功率
GPU
来实现人工智能(AI),而另一个用例则可能需要低功耗来延长电池寿命。设备的位置,例如微型边缘数据中心或壁挂式工业机柜,对硬件施加了不同的限制。
公众号:肉眼品世界
·
2025-04-18 12:26
网络
大数据
人工智能
java
物联网
深入浅出谈cuda
CUDA深入浅出谈“CUDA是NVIDIA的GP
GPU
模型,它使用C语言为基础,可以直接以大多数人熟悉的C语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。”
向前一一步走
·
2025-04-18 11:49
cuda
cuda
gpu
YOLOV8 OBB 海思3516训练流程
YOLOV8OBB海思3516训练流程1、下载带
GPU
版本的torch(可选)32、安装ultralytics33、下载pycharm社区版44、安装pycharm55、新建pycharm工程56、添加
绕灵儿
·
2025-04-18 10:43
YOLO
pytorch-lightning使用笔记
(howtodownload(),tokenize,etc…)在这个方法中处理需要写入磁盘或者需要单进程完成的任务setup(howtosplit,etc…)一些dataoperations希望在每块
GPU
真炎破天
·
2025-04-18 09:09
深度学习基础知识
nlp
pytorch
深度学习
多网卡场景智能路由新思路:批量自动配置?
Linux多网卡场景的路由当传统路由设置方法在智算环境下失效,一个可行的应对方式是提前规划
GPU
服务器内的路由,借助Linux的多路由表和策略机制实现更加灵活、精细的流量控制和路由管理功能,但也伴随着一定的复杂性和潜在风险
星融元asterfusion
·
2025-04-18 06:44
网络
linux
运维
开源项目faster-whisper和whisper是啥关系
它在准确率方面表现出色,但同时其参数众多、计算资源占用较大,常常需要
GPU
才能较快运行;如果直接在CPU上使用,则运行速度较慢,并且在处理长音频时容易出现“幻听”问题(模型生成冗余或不恰当的转写)。
@程序员小袁
·
2025-04-17 21:22
开源项目
AI
大模型
whisper
英伟达CUDA原生Python支持革命:手把手教你用Python直接操控
GPU
加速计算
英伟达CUDA原生Python支持革命:手把手教你用Python直接操控
GPU
加速计算重磅消息!2025年GTC大会宣布:CUDA现在原生支持Python了!这意味着什么?
emmm形成中
·
2025-04-17 19:08
python应用实操
python
人工智能
开发语言
GPU
算力:驱动数字时代的核心引擎(下篇)
接上篇,
GPU
算力正以破竹之势渗透更多关键领域,成为产业升级的核心驱动力。本文将继续解析其在金融科技、智能制造等领域的深度应用,并揭秘劲速云如何构建"触手可及"的顶尖算力生态。
·
2025-04-17 12:54
GPU
算力:驱动数字时代的核心引擎(上篇)
当传统CPU面对大规模并行计算力不从心时,
GPU
算力以其独特优势,成为推动各行业突破的关键力量。本文将解析
GPU
算力本质,揭秘其核心应用。
·
2025-04-17 11:51
3DGS之渲染管线
渲染管线(RenderingPipeline)是计算机图形学中将三维场景转换为二维屏幕图像的核心流程,涉及CPU与
GPU
的分工协作。
whuzhang16
·
2025-04-17 09:02
自动驾驶
3d
手机性能全解析:从CPU到屏幕分辨率的选购指南
CPU与
GPU
:处理器背后的故事在日常接触手机时,我们常常听到诸如MTK、高通、海思等处理器品牌,以及HelioP10、骁龙820、麒麟960等处理器
2501_91510632
·
2025-04-17 07:44
https
网络安全
网络协议
tcp/ip
OBS 中不同编码器的预设作用与设置方法详解
更快的预设(如ultrafast):占用更少CPU/
GPU
,速度更快,但压缩率较低、画质较差。更慢的
吃面不喝汤66
·
2025-04-17 05:33
OBS二次开发
ffmpeg
PyTorch的benchmark模块
•Timer类:精确测量代码运行时间,支持CPU/
GPU
时间统计,并自动处理CUDA异步执行的同步问题。fromtorch.u
小小毛桃
·
2025-04-17 01:40
实用教程
pytorch
人工智能
python
Gpu
Geek:重构AI算力基础设施,赋能产业智能升级
Gpu
Geek凭借创新的技术架构和运营模式,重新定义了AI算力服务的价值边界,为算法工程师和企业用户构建了集弹性算力、开发工具和模型生态于一体的新一代AI基础设施平台。
Newfocus!
·
2025-04-17 01:10
emacs
人工智能
云原生周刊:K8s 中的
GPU
共享
开源项目推荐A2AGoogle的Agent2Agent(A2A)协议是一个开源标准,旨在促进不同框架和供应商构建的AI代理之间的互操作性。它允许代理通过统一的协议安全地交换信息、协同执行任务,并在多种企业平台和云环境中无缝协作。A2A的设计遵循五大原则:支持代理的自然协作方式、构建于现有标准之上、默认安全、支持长时间任务以及支持多种交互方式(如文本、音频、视频)。该协议通过“AgentCard”机
KubeSphere 云原生
·
2025-04-16 21:40
云原生
kubernetes
容器
在ARM架构Mac上部署Python 3.12与Conda环境的全链路指南!!!
环境的全链路指南(M1/M2芯片实测|含性能调优+避坑手册)核心价值点•原生ARM支持:突破Rosetta转译的性能损耗•环境隔离:Conda虚拟环境管理+多版本Python共存方案•工业级优化:Metal
GPU
小丁学Java
·
2025-04-16 20:36
python
arm开发
架构
macos
大模型训练显存压缩实战:ZeRO-3 vs 梯度累积 vs 量化混合策略
一、显存瓶颈的本质与挑战大模型训练面临的核心矛盾是模型参数量指数级增长与
GPU
显存容量线性提升之间的鸿沟。
学术猿之吻
·
2025-04-16 10:02
高校
GPU
人工智能
深度学习
人工智能
架构
数据结构
ai
gpu算力
【收藏】KVM
GPU
虚拟化技术
一、基础概念与实现方式
GPU
虚拟化是指将物理
GPU
资源分配给虚拟机,以提高图形处理性能和计算能力。KVM支持多种
GPU
虚拟化方式,包括直通模式、SR-IOV和半虚拟化。
玄学魔术师
·
2025-04-16 09:27
人工智能
操作系统
gpu算力
服务器
人工智能
ai
DeepSeek-R1 私有化部署 ubuntu22.04 3060显卡
减少
GPU
依赖:DeepSeek有效降低了大规模训练对
GPU
资源的依赖,推动了AI产业链的重塑。国际
第十人i
·
2025-04-16 09:26
deepseek
deepseek
ubuntu
deepseek
私有化部署
利用多
GPU
计算探索量子无序及AI拓展
量子无序系统的领域是凝聚态物理学中一个引人入胜的前沿。与它们完全有序的对应物不同,这些材料表现出量子力学和内在随机性的复杂相互作用,导致了许多令人着迷且常常难以理解的行为。量子自旋玻璃就是一个典型的例子,在这种系统中,磁矩(自旋)随机耦合,导致了一个“受挫”的能量landscape和许多竞争的基态。理解这些系统的临界性质不仅具有基础科学意义上的重要性,而且对于新兴的量子计算领域,特别是在量子退火解
亚图跨际
·
2025-04-16 06:35
物理
数学
算法
人工智能
量子计算
性能优化实践
而现代API(如Web
GPU
)通过更底层的硬件控制和并行计算能力显著提升了性能与稳定性。以下从技术对比、优化策略和案例分析三个方面展开。技术对比:We
Eqwaak00
·
2025-04-16 06:33
分布式系统设计实战
量子计算
python
开发语言
人工智能
分布式
GPU
服务器声音很响可以怎么处理
当
GPU
服务器运行时噪音过大,通常是由于高负载下散热风扇高速运转所致。
会飞的土拨鼠呀
·
2025-04-15 22:11
运维学习笔记
服务器
运维
cv::cuda::
Gpu
Mat 中的 flags、data、refcount、datastart、dataend 和 allocator 含义
在OpenCV的cv::cuda::
Gpu
Mat类中,成员变量flags、data、refcount、datastart、dataend和allocator分别承担不同的角色,以下是对它们的详细解析:1
Ring__Rain
·
2025-04-15 21:36
c++
Opencv
【架构解析】深入浅析DeepSeek-V3的技术架构_deepseek 参数
运行这个DeepSeek-V3需要的显存资源,我先去找更大的
GPU
VM去了…一、DeepSeek-V3的架构详解1.模型总体概述DeepSeek-V3是一款采用Mixture-of-Experts(MoE
程序员一粟
·
2025-04-15 21:06
架构
数据库
人工智能
ssh
运维
重构
AIGC
云原生周刊:K8s 中的
GPU
共享
开源项目推荐A2AGoogle的Agent2Agent(A2A)协议是一个开源标准,旨在促进不同框架和供应商构建的AI代理之间的互操作性。它允许代理通过统一的协议安全地交换信息、协同执行任务,并在多种企业平台和云环境中无缝协作。A2A的设计遵循五大原则:支持代理的自然协作方式、构建于现有标准之上、默认安全、支持长时间任务以及支持多种交互方式(如文本、音频、视频)。该协议通过“AgentCard”机
·
2025-04-15 17:14
云计算
云算力:重塑各行业数字化转型的核心引擎(上篇)
当摩尔定律逼近物理极限,
GPU
并行计算与云服务的融合催生算力革命。云算力以按需付费、弹性扩展的模式打破物理边界,让顶尖算力触达全行业。
·
2025-04-15 13:40
一文剖析AI大模型技术架构的全景视图:从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层
一、基础设施层AI大模型技术发展离不开坚实的基础设施支持,涵盖了
GPU
、CPU、RAM、HDD、Network等关键硬件
程序猿李巡天
·
2025-04-15 11:34
人工智能
架构
云原生
设计模式
react.js
语言模型
自然语言处理
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他