E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU并行计算-CUDA编程
前端项目:获取本地计算机(局域网、公网)真实IP。
response.json()).then(data=>console.log('PublicIP:',data.ip)).catch(error=>console.error('Errorfetchin
gpu
blicIP
Smile_Gently
·
2025-02-21 13:14
vue.js
javascript
nginx
autok3s搭建k3s ha集群并支持
gpu
调度
本文描述了如何利用autok3s搭建k3s集群,同时支持对
gpu
的调用和切分。
StevenforAI
·
2025-02-21 12:34
容器
kubernetes
GPU
kubernetes
gpu算力
容器
探索流体模拟新境界:Unity中的基于位置的动力学(PBD)在
GPU
上的壮丽实践
探索流体模拟新境界:Unity中的基于位置的动力学(PBD)在
GPU
上的壮丽实践PBD-Fluid-in-UnityAPBDfluidinunityrunningonthe
GPU
项目地址:https:/
仲玫千Samson
·
2025-02-21 11:02
深入理解DAG任务调度系统:核心原理与实现
1.1背景介绍1.1.1任务调度系统简介任务调度系统是计算机科学中一个重要的研究领域,它主要关注于在
并行计算
系统
AI天才研究院
·
2025-02-20 18:25
计算
Python实战
编程实践
python
算法
dag
本地搭建小型 DeepSeek 并进行微调
1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选,用于
GPU
加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/
非著名架构师
·
2025-02-20 15:55
大模型
知识文档
智能硬件
人工智能
大数据
大模型
deepseek
Java平台上的多线程与多核处理研究
Java作为一种广泛使用的编程语言,提供了多线程编程的强大支持,使得开发者能够在多核环境下实现
并行计算
。
向哆哆
·
2025-02-20 14:47
Java入门到精通
java
python
开发语言
马斯克的Grok-3:技术突破与行业冲击的深度解析
一、技术架构与核心突破超大规模算力集群Grok-3基于xAI自研的Colossus超级计算机训练完成,搭载20万块英伟达H100
GPU
,累计消耗2亿
GPU
小时,算力投入是前代Grok-2的10倍48。
♢.*
·
2025-02-20 14:15
马斯克
人工智能
大模型
xAI
Grok
3
AI服务器散热黑科技:让芯片“冷静”提速
以GPT-4的训练为例,它需要大量的
GPU
小深ai硬件分享
·
2025-02-20 09:29
人工智能
深度学习
服务器
FastGPT接入向量模型 M3E 和 重排模型 bge-reranker-large
一、FastGPT接入向量模型M3E1.拉取m3e镜像#
GPU
模式启动,并把m3e加载到fastgpt同一个网络dockerpullregistry.cn-hangzhou.aliyuncs.com/fastgpt_docker
福葫芦
·
2025-02-20 08:58
M3E
M3E
FASTGPT
卷积神经网络之AlexNet经典神经网络,实现手写数字0~9识别
深度学习中较为常见的神经网络模型AlexNet,AlexNet是一个采用
GPU
训练的深层CNN,本质是种LeNet变体。由特征提取层的5个卷积层两个下采样层和分类器中的三个全连接层构成。
知识鱼丸
·
2025-02-20 08:24
深度学习
神经网络
cnn
人工智能
深度学习
AlexNet
经典神经网络
KTransformers如何通过内核级优化、多
GPU
并行策略和稀疏注意力等技术显著加速大语言模型的推理速度?
KTransformers通过内核级优化、多
GPU
并行策略和稀疏注意力等技术显著加速大语言模型的推理速度,具体体现在以下几个方面:内核级优化:KTransformers采用了高效的内核级优化技术,包括对
魔王阿卡纳兹
·
2025-02-20 04:53
大模型知识札记
语言模型
人工智能
自然语言处理
Vulkan
片上系统生产商(SoCs)比如
GPU
独立硬件供应商(IHVs)可以为Android编写Vulkan驱动;OEMs简单地需要为特定的硬件集成
hanpfei
·
2025-02-20 03:14
Android
图形系统
深入浅出:CUDA是什么,如何利用它进行高效
并行计算
为了满足这些需求,NVIDIA推出了CUDA(ComputeUnifiedDeviceArchitecture),这是一种
并行计算
平台和编程模型。
码上飞扬
·
2025-02-20 03:38
CUDA
【深度学习pytorch-93】Transformer 相比 RNN 的优势
以下是Transformer相比RNN的主要优势:1.
并行计算
能力RNN的局限性RNN是按顺序处理输入的,即每个时间步的输出都依赖于前一个时间步的输出。这意味着,在训练
华东算法王
·
2025-02-20 02:04
DL-pytorch
深度学习
pytorch
transformer
百度百舸 DeepSeek 一体机发布,支持昆仑芯 P800 单机 8 卡满血版开箱即用
选择合适的
GPU
配置、安装相应的环境、成功部署上线业务、加速推理任务加速、支撑多用户并发……完成业务测试,成功融入生产业务中。
百度智能云技术站
·
2025-02-20 01:55
deepseek
百度百舸
专有云
函数式编程倡导的「不可变数据结构」如何保证性能
这一特点使得函数式编程能够简化
并行计算
、避免副作用,进而提高程序的可靠性和可维护性。然而,不可变数据结构可能带来的性能问题,例如内存的使用、数据复制的成本等
·
2025-02-20 00:53
编程
GPU
通信革命:跨平面网络效率提升300%的秘密武器
CPU中转,多平面网络RDMA通信时延降低50%」——Deepseek专利CN118612157A一、技术解析:突破AI算力瓶颈的底层创新1.技术背景:终结多平面网络CPU中转困境传统多平面网络中,跨平面
GPU
CodePatentMaster
·
2025-02-19 22:27
人工智能
深度学习
机器学习
自然语言处理
微服务
服务器
AIGC
常用的高性能计算工具有哪些
它通过
并行计算
和优化算法,
这题有点难度
·
2025-02-19 21:24
人工智能
学习
【TVM教程】为 x86 CPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
·
2025-02-19 20:45
QT+FFmpeg如何使用
GPU
加速解码?
本文收录于《全栈Bug调优(实战版)》专栏,主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!全文目录:问题描述解决方案1.确保FFmpeg和CUDA的支持2.正确选择硬件解码器设置硬件解码器3.初始化CUDA硬件设备4.硬件解码流程解码帧并处理硬件帧5.检查FF
bug菌¹
·
2025-02-19 17:22
全栈Bug调优(实战版)
qt
ffmpeg
开发语言
c++
x86平台基于Qt+opengl优化ffmpeg软解码1080P视频渲染效率
优化的思路一共有以下几个方面,1.软解码变成硬解码2.将YUV转QImage的操作转移到
GPU
3.QWidget渲染QImage变成opengGL渲染AVFrame这三点优化来说2与3是优化的效率是非常显著的
zanglengyu
·
2025-02-19 16:14
Qt上位机开发
qt
ffmpeg
音视频
Houdini:Houdini光照与渲染基础_2024-07-16_02-34-24.Tex
Mantra的设计理念是灵活性和可扩展性,它支持多种渲染模式,包括CPU渲染和
GPU
渲染,以及分布式渲染。Mantra的渲染质量高,特别适合于处理大规模的场景和复杂的视觉效果。Mantra渲染器的特点
chenjj4003
·
2025-02-19 14:21
游戏开发
houdini
android
cinema4d
blender
游戏
3dsmax
国内支持 Maya 渲染的云渲染平台汇总
以下为大家介绍一些国内支持Maya渲染的云渲染平台:渲染101价格优势:该平台在价格方面表现出色,CPU渲染最低仅0.6元/小时,
GPU
3090起步价为4元/小时。
渲染101专业云渲染
·
2025-02-19 13:49
maya
houdini
云计算
动画
3dsmax
图形渲染(一)——Skia、OpenGL、Mesa 和 Vulkan简介
Skia本身不直接管理
GPU
或进行底层的渲染工作,而是通过底层图形API(如OpenGL或Vulkan)来实现硬件加速的渲染。-Skia的角色:提供高层的2D渲染API,抽象掉底层的硬件细节。
阳光开朗_大男孩儿
·
2025-02-19 09:44
图形渲染
OpenGL
图形渲染
c++
初识Vulkan渲染管线
上面中文管线结构图中有两个应用程序入口,左侧为简单示例入口,右侧为使用
GPU
进行高性能通用计算时的计算管线。1.绘制:命令进入Vulkan图形
超级无敌小小顺利
·
2025-02-19 09:12
Vulkan
Vulkan
渲染管线
GPU
Pipeline
Unity中,每一帧的渲染CPU和
GPU
都做了些什么
在Unity中,每一帧的渲染过程涉及到CPU和
GPU
的协同工作。CPU和
GPU
各自承担不同的任务,以实现高效的图形渲染。
你一身傲骨怎能输
·
2025-02-19 09:42
商业化游戏开发技术专栏
unity
游戏引擎
虚幻UE4/UE5程序性能分析及优化
渲染线程,处理场景中模型/灯光的渲染操作,从游戏线程获取渲染信息,将其转化为与平台无关的绘图指令(跨平台)3/RHITThread-解析DrawThread绘图指令,具体是:RHIT调用各平台的API,向
GPU
余额多多多
·
2025-02-19 08:03
虚幻
ue4
ue5
cuda编程
入门——并行归约(五)
CUDA编程
入门—并行归约(数组求和为例)在
并行计算
中,归约(Reduction)是一种将多个数据通过特定操作(如求和、求最大值等)合并为单一结果的并行算法。
我不会打代码啊啊
·
2025-02-19 07:02
cuda编程
算法
c++
gpu算力
cuda编程
入门——并行性与异构性概念
CUDA编程
入门一基于cuda的异构
并行计算
并行性一、并行性的概念与分类概念并行性旨在通过同时处理多个任务或数据元素来提高计算速度和效率。
我不会打代码啊啊
·
2025-02-19 07:32
cuda编程
gpu算力
c++
Unity UI优化总结
常见的四大UI优化问题:1、片段着色器利用率过高(或者说
GPU
fill-rate填充率过高),即每个片段处理的
Don里个冬
·
2025-02-19 05:17
Unity3D技术分享
unity
unity3d
ugui
FunASR服务器部署(CPU+
GPU
)
自行下载funasr-cpu/
gpu
和asrmodel-deploy-cpu/
gpu
压缩包,官方都有cpu版运行:cd/home/user/data/AIModels/FunASR_docker/deploy_resourcessudodockerload-ifunasr-runtime-sdk-cpu
之群害马
·
2025-02-19 03:25
服务器
eureka
运维
联想E470 双
GPU
笔记本部署私有AI模型方案
一、硬件适配优化方案显存限制突破使用4-bit量化技术压缩模型,例如加载ChatGLM3-6B的INT4版本,显存需求可降至6GB310启用CPU-
GPU
混合推理(通过
月光技术杂谈
·
2025-02-19 02:18
大模型初探
人工智能
ChatGLM3
联想E470
Qwen-7B
Phi-3-mini
采用分布式部署deepseek
1.环境准备硬件需求:确保您的集群环境中有足够的
GPU
资源,并且所有机器之间可以通过高速网络互联。软件依赖:安装必要的库和工具,如PyTorch、Transformers等。
慧香一格
·
2025-02-19 02:14
AI
学习
分布式
deepseek
360智算中心:万卡
GPU
集群落地实践
360内部对于智算中心的核心诉求是性能和稳定性,本文将深入探讨360智算中心在万卡
GPU
集群中的落地实践过程,包括算力基础设施搭建、集群优
ZVAyIVqt0UFji
·
2025-02-18 23:47
大规模
GPU
集群的进阶之路
今天来聊聊
GPU
。
GPU
,全称GraphicProcessingUnit,即图形处理器。
卢旗
·
2025-02-18 23:47
人工智能
智能算力中心万卡
GPU
集群架构深度解析
智能算力中心万卡
GPU
集群架构深度分析 自ChatGPT发布,科技界大模型竞赛如火如荼。
科技互联人生
·
2025-02-18 23:13
科技
数码
人工智能
人工智能
gpu算力
硬件架构
2. 从HuggingFace下载千问模型、数据、微调并运行
525、弹幕量0、点赞数4、投硬币枚数2、收藏人数11、转发人数2,视频作者jiangliuer3264,作者简介,相关视频:3.从HuggingFace下载千问模型、数据、微调并运行(下),6.租赁
GPU
ApiChain
·
2025-02-18 20:45
gpt
大模型
语言模型
人工智能
python
Docker安装分布式vLLM
分布式安装方法https://docs.vllm.ai/en/latest/serving/distributed_serving.html2安装方法⚠️注意:前期一定要把docker环境、运行时和
GPU
MasonYyp
·
2025-02-18 13:49
docker
分布式
容器
Pytorch实现mnist手写数字识别
同学啊]**我的环境:语言环境:Python3.8编译器:JupyterLab深度学习环境:torch==1.12.1+cu113torchvision==0.13.1+cu113一、前期准备1.设置
GPU
Zn要学习
·
2025-02-18 04:49
python
模型
GPU
->NPU(Ascend)迁移训练简述
迁移训练流程图解二、详细流程步骤1.模型训练与日志记录2.跨平台精度对齐对比3.问题定位与修复4.迭代验证三、关键技术点四、常见问题与解决方案一、迁移训练流程图解通过华为云的modelart进行运行环境选型北京四使用
GPU
終不似少年遊*
·
2025-02-18 01:12
深度学习
人工智能
迁移学习
GPU
NPU
华为云
什么是重绘?什么是回流?如何减少回流?
适用css动画代替JavaScript动画css动画利用
GPU
加速,在性能方面通常比JavaScript动画更高效。使用css的transform和opaci
Ashy-
·
2025-02-17 20:52
前端面试题
前端笔记
css3
人工智能的发展领域之
GPU
加速计算的应用概述、架构介绍与教学过程
文章目录一、架构介绍
GPU
算力平台概述优势与特点二、注册与登录账号注册流程
GPU
服务器类型配置选择指南内存和存储容量网络带宽CPU配置三、创建实例实例创建步骤镜像选择与设置四、连接实例SSH连接方法远程桌面配置一
m0_74824592
·
2025-02-17 15:00
面试
学习路线
阿里巴巴
人工智能
架构
DeepSeek大模型本地化部署与实践指南
部署准备硬件要求配置项推荐规格最低要求
GPU
NVIDIAA10080Gx4RTX309024GCPUIntelXeonSilver4314i7-12700K内存512GBDDR464GBDDR4存储2TBNVMeSSD512
星辰@Sea
·
2025-02-17 11:31
人工智能
人工智能
DeepSeek
AI
nlp
国产
GPU
算力公司及产品
目前,中国有多家从事国产算力
GPU
研发与生产的企业,以下是一些代表性的公司及其相关产品概述:景嘉微:近期,景嘉微宣布成功研发了“景宏系列”AI算力产品,该系列面向AI训练、AI推理、科学计算等领域,支持
算力资源比较多
·
2025-02-17 10:22
智算
算力
昇腾910
gpu算力
语言模型
人工智能
大数据
推荐算法
AI大模型的技术突破与传媒行业变革
这一突破的核心在于三大技术创新:MoE架构升级:通过部署256个细粒度专家网络,减少知识冗余,提升模型效率;MLA注意力机制:动态压缩推理过程中的缓存需求,降低
GPU
内存
AIQL
·
2025-02-17 07:52
行业分析
人工智能
传媒
hunyuan-DiT模型部署指南
二、部署流程环境要求:所需的最小
GPU
内存为11GB,建议使用具有32GB内存的
GPU
,以获得更好的生成质量。
算家云
·
2025-02-17 05:12
模型构建
ComfyUI
图片生成
大模型
人工智能
pytorch
AIGC
controller入参异常 No primary or default constructor found for class
java.lang.IllegalStateException:Noprimaryordefaultconstructorfoundforclassjava.time.LocalDateTime错误写法:@GetMappin
gpu
blicStringquery
Lin_Miao_09
·
2025-02-17 04:30
java优秀例子
java
显卡性能对比:P100、RTX3090、A40、A100、A800、H100
32GBRTX3080RTX2080TiRTXA4000RTXA5000A100-SXM4-80GBA100-PCIE-40GBTITANXpRTX3060RTX3080TiV100-32GBTeslaT4A800H100世上最全NVDIA
GPU
u013250861
·
2025-02-17 03:27
LLM
显卡
【Stable Diffusion部署至GNU/Linux】安装流程
显卡与计算架构介绍CUDA是NVIDIA
GPU
的专用
并行计算
架构技术层级说明CUDAToolkit提供
GPU
编译器(nvcc)、数学库(cuBLAS)等开发工具cuDNN深度神经网络加速库(需单独下载)
星星点点洲
·
2025-02-17 00:34
stable
diffusion
KTransformers:告别天价显卡!国产框架让单卡24G显存跑DeepSeek-R1 671B大模型:推理速度飙升28倍
清华团队用CPU/
GPU
协同计算,让4090跑起671B参数全量模型!”大家好,我是蚝油菜花。如果你也经历过——看着API调用账单瑟瑟发抖,微调一次模型吃掉半月算力预算️盯着OOM报错抓狂,为了
蚝油菜花
·
2025-02-17 00:32
每日
AI
项目与应用实例
人工智能
开源
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他