E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU基础算法
如何在DigitalOcean的H100
GPU
服务器上运行DeepSeek R1 模型
在DigitalOcean,我们一直在关注开源大语言模型(LLMs)和商业封闭模型之间差距的不断缩小。其中一个最关键的能力就是“推理”,也就是用合乎逻辑、讲得通的方式思考问题。以前,大语言模型的表现比较单一。只要给它们一个提示,它们就会直接给出答案,根本没有什么“二次思考”的过程,也没有什么机制能让模型在出错时自己纠正。这就让它们在遇到那些指令本身就可能有问题的情况时,很难进行深入推理、提出疑问或
DO_Community
·
2025-03-11 10:44
教程
DeepSeek
GPU
ai
大语言模型
人工智能
基于llama_cpp 调用本地模型(llama)实现基本推理
背景llama_cpp是一个基于C++的高性能库(llama.cpp)的Python绑定,支持在CPU或
GPU
上高效运行LLaMA及其衍生模型(如LLaMA2),并通过量化技术(如GGUF格式)优化内存使用
月光技术杂谈
·
2025-03-11 10:40
大模型初探
llama
llama.cpp
python
LLM
集成显卡
本地模型
AI
C# Winform做动画卡顿怎么办?
Winform用的GDI+,像全屏动画这种卡的稀巴烂,任务管理器看进程如果
GPU
没动静那就是渣,没加速。可以使用OpenGL或者DirectX这样有
GPU
加速就不卡了。
肖无疾
·
2025-03-11 02:05
游戏
gdi/gdi+
opengl
directx
c#
Windows 图形显示驱动开发-WDDM 3.2-用户模式工作提交(一)
UM工作提交使应用程序能够直接从用户模式将工作提交到
GPU
,且延迟非常低。目标是提高经常向
GPU
提交小工作负载的应用程序的性能。
程序员王马
·
2025-03-10 20:52
windows图形显示驱动开发
驱动开发
Windows 图形显示驱动开发-WDDM 3.2-自动显示切换(九)
由于EDID保持不变,当任何一个
GPU
控制内部面板时,都会加载面板驱动程序。这两个驱动程序将显示相同的亮度功能。因此,加载应该不会造成任何问题,面板驱动程序也不需要知道哪个
GPU
在控制多路复用器。
程序员王马
·
2025-03-10 20:22
windows
驱动开发
Windows 图形显示驱动开发-WDDM 3.2-自动显示切换(十)
系统配置为连接d
GPU
的多路复用器。系统进入休眠状态。i
GPU
和d
GPU
都切换到了D3电源状态。系统关闭电源。用户开启系统电源。固件配置i
GPU
的多路复用器和i
GPU
在内部面板上的显示启动序列。
程序员王马
·
2025-03-10 20:22
驱动开发
windows
解密DeepSeek-R1模型微调实战:VIP专属技巧助你轻松掌握行业核心技术
但90%的学习者卡在以下痛点:❌开源数据集质量参差不齐❌实验环境搭建耗时易出错❌行业级调优方案闭源难获取CSDN大模型VIP专项计划针对上述问题,提供:✅金融/医疗/法律三大领域高质量微调数据集✅云端
GPU
竹木有心
·
2025-03-10 19:16
人工智能
基础算法
:归并排序
归并排序C++模板:注意:需要用到辅助数组,帮助两个部分进行合并时的结果保存intq[N],tmp[N];voidmerge_sort(intq[],intl,intr){if(l>=r)return;intmid=l+r>>1;merge_sort(q,l,mid);merge_sort(q,mid+1,r);inti=l,j=mid+1,k=0;while(iusingnamespacestd
奋斗吧!骚年!
·
2025-03-10 17:04
#
基础算法
C++
归并排序
递归
【大模型】DeepSeek-R1-Distill-Qwen部署及API调用
当前模型开源后,我们可以将其部署,使用API方式进行本地调用1.部署环境本文中的部署基础环境如下所示:PyTorch2.5.1Python3.12(ubuntu22.04)Cuda12.4
GPU
RTX3090
油泼辣子多加
·
2025-03-10 17:29
大模型实战
算法
gpt
langchain
人工智能
opencv cuda例程 OpenCV和Cuda结合编程
本文转载自:https://www.fuwuqizhijia.com/linux/201704/70863.html此网页,仅保存下来供随时查看一、利用OpenCV中提供的
GPU
模块目前,OpenCV中已提供了许多
weixin_44602056
·
2025-03-10 16:27
opencv
C++
利用CUDA与OpenCV实现高效图像处理:全面指南
本篇文章将详细介绍如何结合CUDA与OpenCV,利用
GPU
的强大计算能
快撑死的鱼
·
2025-03-10 16:25
C++(C语言)
算法大揭秘
opencv
图像处理
人工智能
linux 下 CUDA + Opencv 编程 之 CMakeLists.txt
CMAKE_MINIMUM_REQUIRED(VERSION2.8)PROJECT(medianFilter
GPU
)#CUDApackageFIND_PACKAGE(CUDAREQUIRED)INCLUDE
maxruan
·
2025-03-10 16:23
编程
图像处理
CUDA
opencv
linux
c++
cuda
UE发生
GPU
崩溃D3D丢失,真的跟硬件有关系。
===但是BUT===UE5每天
GPU
崩溃几十次,UE4比较少见。按说我这配置还可以吧,鲁大师全国排名六百多(4月8日),二百三十多万分,也算够用。但我没说运行哪个UE程序导致的
GPU
崩溃。
虚幻叫兽
·
2025-03-10 11:20
UE虚幻引擎MetaHuman
ue5
GPU崩溃
ue5.5崩溃报
gpu
错误快速修复注册表命令方法
网上已经有很多方法了,自己写了个regedit比处理dos批处理命令,启动时需要win管理员身份拷贝后,将以下代码,保存为run.bat格式批处理文件,右键鼠标,在弹出菜单中,选择用管理员身份运行。即可。南无阿弥陀佛。命令如下:::如果存在先删除原来变量,如下:regdeleteHKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Graphics
Maya和blender动画技术
·
2025-03-10 11:19
ue5
ue5.5崩溃报gpu错误
数据结构(蓝桥杯常考点)
数据结构前言:这个是针对于蓝桥杯竞赛常考的数据结构内容,
基础算法
比如高精度这些会在下期给大家总结数据结构竞赛中,时间复杂度不能超过10的7次方(1秒)到10的8次方(2秒)空间限制:int类型数组总大小不能超过
刃神太酷啦
·
2025-03-10 10:14
蓝桥杯C++组
C++
数据结构
AWS AppStream 2.0:开启云端应用交付新范式(实战解决方案剖析)
1.1技术架构革命(对比传统VDI)去终端化部署:3D渲染/CAD等
GPU
应用在
AWS官方合作商
·
2025-03-10 09:06
aws
云计算
系统架构
python 程序一次启动有两个进程的问题(flask)
此外,这个程序占用了
GPU
资源,我发现有两个python进程,分别占用了完全相同的
GPU
显存1.原因问题出在flask的启动方式上,我启动的时候,是这样启动的app.run(debug=True,host
小郎碎碎念
·
2025-03-10 08:25
我恨BUG
python
flask
开发语言
家庭组装台式电脑配置推荐(2024版)
2、显卡(
GPU
):RTX4060Ti是推荐的选择,其性能略高于RTX3070,但功耗更低,适合预算在6000元左右的配置。3、内存(RAM):16GB内存是推荐的配置,能够提供足够的多任务处理能力。
encoding-console
·
2025-03-10 07:19
配置
组装
台式机
家用
Spring Event实例
privateStringequipmentId;privateStringfailureDescription;privateFailureLevellevel;//枚举:CRITICAL,WARNIN
Gpu
blicEq
五块钱三个
·
2025-03-10 04:59
java
jvm
开发语言
【NPU 系列专栏 2.7 -- - NVIDIA
GPU
架构介绍】
请阅读【嵌入式及芯片开发学必备专栏】文章目录NVIDIA
GPU
架构介绍Tesla架构简介Tesla架构主要特点Tesla架构应用场景Fermi架构简介Fermi架构主要特点Fermi架构应用场景Kepler
主公讲 ARM
·
2025-03-10 03:52
#
【NPU
学习专栏】
英伟达GPU架构
io.net 是什么,DePIN(去中心化物理基础设施网络)
去中心化物理基础设施网络)1.资源整合与去中心化2.区块链技术与智能合约3.弹性伸缩与负载均衡4.安全性与隐私保护5.用户体验与易用性io.net是什么io.net是一个基于Solana网络的去中心化
GPU
ZhangJiQun&MXP
·
2025-03-10 02:44
2021
AI
python
教学
2021数字交易数字资产
区块链
io.net
jupyter notebook参数化运行python
Updates(2019.8.1419:53)吃饭前用这个方法实战了一下,吃完回来一看好像不太行:跑完一组参数之后,到跑下一组参数时好像没有释放之占用的
GPU
,于是notebook上的结果,后面好几条都报错说
HackerTom
·
2025-03-10 02:11
乱搞
python
jupyter
notebook
云原生边缘智能:构建分布式IoT设备的自主决策引擎
/bin/bashcheck_
gpu
_utilization(){util=$(nvidia-smi--query-
gpu
=utilization.
gpu
--format=csv,nohea
桂月二二
·
2025-03-09 23:47
云原生
分布式
物联网
分布式计算入门(PySpark处理NASA服务器日志)
PySpark3.NASA服务器日志数据集介绍3.1数据背景3.2数据格式与挑战4.PySpark基础与分布式日志处理4.1PySpark基本架构4.2日志数据加载与解析4.3数据清洗与内存优化4.4
GPU
闲人编程
·
2025-03-09 19:16
Python数据分析实战精要
服务器
运维
统计分析
日志
NASA服务器
分布式计算
PySpark
POJ-2227 The Wedding Juicer(NYOJ-547 Interesting Punch-Bowl)
65536KTotalSubmissions:2803Accepted:1225DescriptionFarmerJohn'scowshavetakenasidejobdesigninginterestin
gpu
nch-bowldesigns.Thedesignsarecreatedasfollows
weixin_30802171
·
2025-03-09 18:37
GPU
编程实战指南03:CUDA开发快速上手示例,
GPU
性能碾压实测
上一节《
GPU
编程指南02:CUDA开发快速上手示例》中我们完成了一个使用
GPU
进行加减乘除四则运算的例子。
anda0109
·
2025-03-09 15:34
CUDA并行编程
linux
运维
服务器
【深度学习】PyTorch v2.6 Overview
PyTorchv2.6OverviewPythonAPILibrariesPyTorch是一个优化的张量库,用于使用
GPU
和CPU进行深度学习。
OpenSeek
·
2025-03-09 11:37
人工智能
#
机器学习
#
深度学习
python
pytorch
人工智能
PyTorch 显存分配不均匀
在使用PyTorch进行深度学习训练时,可能会遇到
GPU
0的显存占用明显高于其他
GPU
的情况。这可能导致显存不足,影响训练效率。
LutingWang
·
2025-03-09 11:36
debug
pytorch
人工智能
python
GPU
编程实战指南01:CUDA编程极简手册
目录1.CUDA基础概念1.1线程层次结构1.2内存层次结构2.CUDA编程核心要素2.1核函数2.2内存管理2.3同步机制3.CUDA优化技巧3.1内存访问优化3.2共享内存使用3.3线程分配优化4.常见问题和解决方案5.实际案例分析1.CUDA基础概念1.1线程层次结构CUDA采用层次化的线程组织结构,从小到大依次为:线程(Thread):最基本的执行单元每个线程执行相同的核函数代码通过thr
anda0109
·
2025-03-09 09:20
CUDA并行编程
算法
\torch\lib\caffe2_detectron_ops_
gpu
.dll“
目录报错原因解决方法报错原因这个是conda环境里面的包出问题了,必须对相关依赖包进行更新解决方法使用win+R启动命令行或者终端,输入condaactivateenv_name(环境名称)进入环境后,再输入以下命令condaupdate-nbaseconda对环境下的所有包进行更新后就不会再报错
研志必有功
·
2025-03-09 06:27
人工智能
pytorch
深度学习
AI芯片概述-分类、应用、技术(APU、CPU、DPU、
GPU
、NPU和TPU)及厂家
写这篇文章的起因是老板想了解下AI芯片(NPU/
GPU
区别等),他不是搞技术那一挂的,所以就简单整理下,留作记录,顺便分享给各位。文章目录一、AI芯片是什么?
一码当前
·
2025-03-09 00:27
AI基础
人工智能
分类
数据挖掘
Windows 图形显示驱动开发-WDDM 3.2-本机
GPU
围栏对象(七)
围栏排队操作的CPU时间戳鉴于以下情况,让UMD记录这些CPU时间戳没有什么好处:可以在
GPU
执行包括命令列表的命令缓冲区之前几分钟记录命令列表。这几分钟可能与同一命令缓冲区中的其他同步对象不同步。
程序员王马
·
2025-03-08 23:22
windows图形显示驱动开发
驱动开发
windows
可视化学习:如何使用后期处理通道增强图像效果
因为
GPU
是并行渲染的,每个像素的着色器程序是并行执行的,这样的渲染很高效。但是在实际需求中,有时我们计算片元色值时,需要依赖周围像素点或者
·
2025-03-08 19:12
【深度学习模型高效部署】tensorRT_Pro深度解读:部署深度学习模型的高效方案
以下内容将对tensorRT_Pro项目做一个系统的介绍,包括其核心价值、主要功能、应用案例以及关键的示例代码(附详细解释),帮助你快速了解并上手如何基于TensorRT在NVIDIA
GPU
上实现高性能推理
云博士的AI课堂
·
2025-03-08 18:50
深度学习
哈佛博后带你玩转机器学习
深度学习
人工智能
tensorRT_Pro
TensorRT
高性能推理
机器学习
模型部署
【PerfDog】性能测试工具【功能模块一览表】
简要介绍官网是一款全平台性能测试工具性能狗一、常规测试无需修改硬件:例如设备ROOT/越狱等无需代码嵌入:可结合分析竞争对手表现极简化使用,在任意场景上测试开发和生成精准捕获系统级专业数据:如FPS、功耗\
GPU
Counter
行者无疆xcc
·
2025-03-08 18:19
性能测试
性能优化
测试工具
Ollama在AutoDL部署,CPU服务器做代理,实践中
##我有两台服务器,一台是
GPU
服务器,另一台是CPU服务器;##我在
GPU
服务器上安装了Ollama,然后通过命令映射端口到CPU服务器:ssh-CNg-L0.0.0.0:11434:127.0.0.1
张3蜂
·
2025-03-08 14:29
#
搜索引擎ES-Solr
人工智能
【TVM 教程】使用元组输入(Tuple Inputs)进行计算和归约
ApacheTVM是一个端到端的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
·
2025-03-08 06:21
编译器编程后端人工智能深度学习
【AI】YOLOv7部署在NVIDIA Jetson Nano上
烧写SD卡镜像【AI】YOLOv7部署在NVIDIAJetsonTX2上2、下载编译2.1源码下载https://github.com/AlexeyAB/darknet2.2编译1)修改Makefile
GPU
郭老二
·
2025-03-08 00:26
AI
人工智能
YOLO
【硬核拆解】DeepSeek开源周五连击:中国AI底层技术的“破壁之战”
从
GPU
计算内核到分布式训练框架,用五大开源项目,在硬件适配、算力优化、通信调度等“卡脖子”领域打
shelly聊AI
·
2025-03-07 18:50
AI核心技术
AI应用工具
开源
人工智能
deepseek
深度学习
弹性算力革命:企业级
GPU
云服务如何重构AI与图形处理的效能边界
企业级
GPU
云服务是一种面向企业用户,基于云计算技术,将强大的图形处理器(
GPU
)资源以服务的形式提供给企业的创新模式。
·
2025-03-07 17:21
弹性算力革命:企业级
GPU
云服务如何重构AI与图形处理的效能边界
企业级
GPU
云服务是一种面向企业用户,基于云计算技术,将强大的图形处理器(
GPU
)资源以服务的形式提供给企业的创新模式。
·
2025-03-07 17:21
工业级Pandas性能优化:Dask/Modin实战教程
目录工业级Pandas性能优化:Dask/Modin实战教程1.引言与背景1.1Pandas的局限性1.2分布式计算与
GPU
加速的需求1.3Dask与Modin简介2.数据集介绍3.工业级数据处理理论基础
闲人编程
·
2025-03-07 17:06
Python数据分析实战精要
pandas
性能优化
分布式
GPU加速
Dask
Modin
数据分析
esrgan_在 colab 上体验 ESRGAN(低清转高清)
设置笔记本为Python3、
GPU
模式,并保存。2.建立colab和googledrive的连接先获取授权,将下面代码贴进去运行。运行过程会要求填写
weixin_39713763
·
2025-03-07 15:20
esrgan
美国AI圈破防了。。。
微软、Meta和谷歌等巨头正在将资源投入到庞大的10万
GPU
集群中进行人
强化学习曾小健
·
2025-03-07 13:43
LLM大语言模型
人工智能
Windows 图形显示驱动开发-WDDM 3.2-本机
GPU
围栏对象(四)
用于创建、打开和销毁本机围栏的D3DKMT内核API引入了以下D3DKMT内核模式API来创建和打开本机围栏对象。D3DKMTCreateNativeFence/D3DKMT_CREATENATIVEFENCED3DKMTOpenNativeFenceFromNTHandle/D3DKMT_OPENNATIVEFENCEFROMNTHANDLEDxgkrnl调用现有的D3DKMTDestroySy
程序员王马
·
2025-03-07 10:53
windows图形显示驱动开发
驱动开发
单片机
stm32
Docker中
GPU
的使用指南
在当今的计算领域,
GPU
(图形处理单元)已经成为了加速各种计算密集型任务的关键硬件,特别是在深度学习、科学模拟和高性能计算等领域。
俞兆鹏
·
2025-03-07 10:22
云原生实践
docker
容器
运维
LLMs之Llama-3:基于Colab平台(免费T4-
GPU
)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3
LLMs之Llama-3:基于Colab平台(免费T4-
GPU
)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3-
一个处女座的程序猿
·
2025-03-07 09:41
NLP/LLMs
成长书屋
大语言模型
unsloth
LLaMA-3
LoRA
DeepSeek开源技术全景解析:从硬件榨取到AI民主化革命
从硬件榨取到AI民主化革命一、开源周核心成果概览2025年2月24日启动的"开源周"计划,DeepSeek团队连续发布三项底层技术突破:FlashMLA(2.24):动态资源调度算法,Hopper架构
GPU
大刘讲IT
·
2025-03-07 09:09
开源
人工智能
【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系
一、cuda和cudnnNVIDIACUDAToolkit(CUDA)为创建高性能
GPU
加速应用程序提供了一个开发环境。
longii11
·
2025-03-07 08:56
linux
pytorch
运维
【Qt】Qt Widgets和QML(Qt Quick)开发界面的区别
QtWidgetsvs.QML总体对比对比项QtWidgetsQML(QtQuick)语言C++(带QtUI库)QML+JavaScript(底层C++)渲染方式传统窗口系统控件(原生或模拟)基于OpenGL,使用
GPU
£އއ昔年
·
2025-03-07 08:52
qt
开发语言
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他