E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
gpu利用率
本地搭建小型 DeepSeek 并进行微调
1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选,用于
GPU
加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/
非著名架构师
·
2025-02-20 15:55
大模型
知识文档
智能硬件
人工智能
大数据
大模型
deepseek
马斯克的Grok-3:技术突破与行业冲击的深度解析
一、技术架构与核心突破超大规模算力集群Grok-3基于xAI自研的Colossus超级计算机训练完成,搭载20万块英伟达H100
GPU
,累计消耗2亿
GPU
小时,算力投入是前代Grok-2的10倍48。
♢.*
·
2025-02-20 14:15
马斯克
人工智能
大模型
xAI
Grok
3
【k8s应用管理】kubernetes HPA+rancher
管理Kubernetes集群指南实验环境安装及配置RancherKubernetesHPA部署指南概述KubernetesHPA(HorizontalPodAutoscaling)可以根据Pod的CPU
利用率
自动调整
Karoku066
·
2025-02-20 12:22
kubernetes
rancher
容器
运维
云原生
AI服务器散热黑科技:让芯片“冷静”提速
以GPT-4的训练为例,它需要大量的
GPU
小深ai硬件分享
·
2025-02-20 09:29
人工智能
深度学习
服务器
FastGPT接入向量模型 M3E 和 重排模型 bge-reranker-large
一、FastGPT接入向量模型M3E1.拉取m3e镜像#
GPU
模式启动,并把m3e加载到fastgpt同一个网络dockerpullregistry.cn-hangzhou.aliyuncs.com/fastgpt_docker
福葫芦
·
2025-02-20 08:58
M3E
M3E
FASTGPT
卷积神经网络之AlexNet经典神经网络,实现手写数字0~9识别
深度学习中较为常见的神经网络模型AlexNet,AlexNet是一个采用
GPU
训练的深层CNN,本质是种LeNet变体。由特征提取层的5个卷积层两个下采样层和分类器中的三个全连接层构成。
知识鱼丸
·
2025-02-20 08:24
深度学习
神经网络
cnn
人工智能
深度学习
AlexNet
经典神经网络
KTransformers如何通过内核级优化、多
GPU
并行策略和稀疏注意力等技术显著加速大语言模型的推理速度?
KTransformers通过内核级优化、多
GPU
并行策略和稀疏注意力等技术显著加速大语言模型的推理速度,具体体现在以下几个方面:内核级优化:KTransformers采用了高效的内核级优化技术,包括对
魔王阿卡纳兹
·
2025-02-20 04:53
大模型知识札记
语言模型
人工智能
自然语言处理
Vulkan
片上系统生产商(SoCs)比如
GPU
独立硬件供应商(IHVs)可以为Android编写Vulkan驱动;OEMs简单地需要为特定的硬件集成
hanpfei
·
2025-02-20 03:14
Android
图形系统
百度百舸 DeepSeek 一体机发布,支持昆仑芯 P800 单机 8 卡满血版开箱即用
选择合适的
GPU
配置、安装相应的环境、成功部署上线业务、加速推理任务加速、支撑多用户并发……完成业务测试,成功融入生产业务中。
百度智能云技术站
·
2025-02-20 01:55
deepseek
百度百舸
专有云
深入了解多线程编程:从并发到并行的转变
多线程不仅能够让程序在执行多个任务时显得更加流畅,还能提升CPU的
利用率
,尤其是在处理计算密集型或IO密集型任务时。然而,多线程编程看似简单,但其中涉及的概念、技术和陷阱却层出不穷。
大梦百万秋
·
2025-02-19 23:33
知识学爆
java
数据库
开发语言
GPU
通信革命:跨平面网络效率提升300%的秘密武器
CPU中转,多平面网络RDMA通信时延降低50%」——Deepseek专利CN118612157A一、技术解析:突破AI算力瓶颈的底层创新1.技术背景:终结多平面网络CPU中转困境传统多平面网络中,跨平面
GPU
CodePatentMaster
·
2025-02-19 22:27
人工智能
深度学习
机器学习
自然语言处理
微服务
服务器
AIGC
【TVM教程】为 x86 CPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
·
2025-02-19 20:45
QT+FFmpeg如何使用
GPU
加速解码?
本文收录于《全栈Bug调优(实战版)》专栏,主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!全文目录:问题描述解决方案1.确保FFmpeg和CUDA的支持2.正确选择硬件解码器设置硬件解码器3.初始化CUDA硬件设备4.硬件解码流程解码帧并处理硬件帧5.检查FF
bug菌¹
·
2025-02-19 17:22
全栈Bug调优(实战版)
qt
ffmpeg
开发语言
c++
x86平台基于Qt+opengl优化ffmpeg软解码1080P视频渲染效率
优化的思路一共有以下几个方面,1.软解码变成硬解码2.将YUV转QImage的操作转移到
GPU
3.QWidget渲染QImage变成opengGL渲染AVFrame这三点优化来说2与3是优化的效率是非常显著的
zanglengyu
·
2025-02-19 16:14
Qt上位机开发
qt
ffmpeg
音视频
Houdini:Houdini光照与渲染基础_2024-07-16_02-34-24.Tex
Mantra的设计理念是灵活性和可扩展性,它支持多种渲染模式,包括CPU渲染和
GPU
渲染,以及分布式渲染。Mantra的渲染质量高,特别适合于处理大规模的场景和复杂的视觉效果。Mantra渲染器的特点
chenjj4003
·
2025-02-19 14:21
游戏开发
houdini
android
cinema4d
blender
游戏
3dsmax
国内支持 Maya 渲染的云渲染平台汇总
以下为大家介绍一些国内支持Maya渲染的云渲染平台:渲染101价格优势:该平台在价格方面表现出色,CPU渲染最低仅0.6元/小时,
GPU
3090起步价为4元/小时。
渲染101专业云渲染
·
2025-02-19 13:49
maya
houdini
云计算
动画
3dsmax
图形渲染(一)——Skia、OpenGL、Mesa 和 Vulkan简介
Skia本身不直接管理
GPU
或进行底层的渲染工作,而是通过底层图形API(如OpenGL或Vulkan)来实现硬件加速的渲染。-Skia的角色:提供高层的2D渲染API,抽象掉底层的硬件细节。
阳光开朗_大男孩儿
·
2025-02-19 09:44
图形渲染
OpenGL
图形渲染
c++
初识Vulkan渲染管线
上面中文管线结构图中有两个应用程序入口,左侧为简单示例入口,右侧为使用
GPU
进行高性能通用计算时的计算管线。1.绘制:命令进入Vulkan图形
超级无敌小小顺利
·
2025-02-19 09:12
Vulkan
Vulkan
渲染管线
GPU
Pipeline
Unity中,每一帧的渲染CPU和
GPU
都做了些什么
在Unity中,每一帧的渲染过程涉及到CPU和
GPU
的协同工作。CPU和
GPU
各自承担不同的任务,以实现高效的图形渲染。
你一身傲骨怎能输
·
2025-02-19 09:42
商业化游戏开发技术专栏
unity
游戏引擎
虚幻UE4/UE5程序性能分析及优化
渲染线程,处理场景中模型/灯光的渲染操作,从游戏线程获取渲染信息,将其转化为与平台无关的绘图指令(跨平台)3/RHITThread-解析DrawThread绘图指令,具体是:RHIT调用各平台的API,向
GPU
余额多多多
·
2025-02-19 08:03
虚幻
ue4
ue5
Unity UI优化总结
常见的四大UI优化问题:1、片段着色器
利用率
过高(或者说
GPU
fill-rate填充率过高),即每个片段处理的
Don里个冬
·
2025-02-19 05:17
Unity3D技术分享
unity
unity3d
ugui
FunASR服务器部署(CPU+
GPU
)
自行下载funasr-cpu/
gpu
和asrmodel-deploy-cpu/
gpu
压缩包,官方都有cpu版运行:cd/home/user/data/AIModels/FunASR_docker/deploy_resourcessudodockerload-ifunasr-runtime-sdk-cpu
之群害马
·
2025-02-19 03:25
服务器
eureka
运维
联想E470 双
GPU
笔记本部署私有AI模型方案
一、硬件适配优化方案显存限制突破使用4-bit量化技术压缩模型,例如加载ChatGLM3-6B的INT4版本,显存需求可降至6GB310启用CPU-
GPU
混合推理(通过
月光技术杂谈
·
2025-02-19 02:18
大模型初探
人工智能
ChatGLM3
联想E470
Qwen-7B
Phi-3-mini
采用分布式部署deepseek
1.环境准备硬件需求:确保您的集群环境中有足够的
GPU
资源,并且所有机器之间可以通过高速网络互联。软件依赖:安装必要的库和工具,如PyTorch、Transformers等。
慧香一格
·
2025-02-19 02:14
AI
学习
分布式
deepseek
云计算——AWS Solutions Architect – Associate(saa)6.CloudWatch
CloudWatch为我们提供相关数据和切实见解,以监控应用程序、响应系统范围的性能变化、优化资源
利用率
,并在统一视图中查看运营状况。
F——
·
2025-02-19 00:00
云计算
云计算
aws
学习
服务器
360智算中心:万卡
GPU
集群落地实践
360内部对于智算中心的核心诉求是性能和稳定性,本文将深入探讨360智算中心在万卡
GPU
集群中的落地实践过程,包括算力基础设施搭建、集群优
ZVAyIVqt0UFji
·
2025-02-18 23:47
大规模
GPU
集群的进阶之路
今天来聊聊
GPU
。
GPU
,全称GraphicProcessingUnit,即图形处理器。
卢旗
·
2025-02-18 23:47
人工智能
智能算力中心万卡
GPU
集群架构深度解析
智能算力中心万卡
GPU
集群架构深度分析 自ChatGPT发布,科技界大模型竞赛如火如荼。
科技互联人生
·
2025-02-18 23:13
科技
数码
人工智能
人工智能
gpu算力
硬件架构
2. 从HuggingFace下载千问模型、数据、微调并运行
525、弹幕量0、点赞数4、投硬币枚数2、收藏人数11、转发人数2,视频作者jiangliuer3264,作者简介,相关视频:3.从HuggingFace下载千问模型、数据、微调并运行(下),6.租赁
GPU
ApiChain
·
2025-02-18 20:45
gpt
大模型
语言模型
人工智能
python
Docker安装分布式vLLM
分布式安装方法https://docs.vllm.ai/en/latest/serving/distributed_serving.html2安装方法⚠️注意:前期一定要把docker环境、运行时和
GPU
MasonYyp
·
2025-02-18 13:49
docker
分布式
容器
基于Knative的无服务器引擎重构:实现毫秒级冷启动的云原生应用浪潮
IDC最新报告指出,采用该架构的企业资源
利用率
平均提升至78%,年度计算成本直降320万美元。一、传统FaaS模型的性能桎梏1.
桂月二二
·
2025-02-18 09:37
云原生
knative
serverless
Pytorch实现mnist手写数字识别
同学啊]**我的环境:语言环境:Python3.8编译器:JupyterLab深度学习环境:torch==1.12.1+cu113torchvision==0.13.1+cu113一、前期准备1.设置
GPU
Zn要学习
·
2025-02-18 04:49
python
模型
GPU
->NPU(Ascend)迁移训练简述
迁移训练流程图解二、详细流程步骤1.模型训练与日志记录2.跨平台精度对齐对比3.问题定位与修复4.迭代验证三、关键技术点四、常见问题与解决方案一、迁移训练流程图解通过华为云的modelart进行运行环境选型北京四使用
GPU
終不似少年遊*
·
2025-02-18 01:12
深度学习
人工智能
迁移学习
GPU
NPU
华为云
软考高级《系统架构设计师》知识点(五)
网络性能指标:速率、带宽(频带宽度或传送线路速率)、吞吐量、时延、往返时间、
利用率
。网络非性能指标:费用、质量、标准化、可靠性、可扩展性、可升级性、易管理性和可维护性。
Ritchie里其
·
2025-02-17 23:23
系统架构
什么是重绘?什么是回流?如何减少回流?
适用css动画代替JavaScript动画css动画利用
GPU
加速,在性能方面通常比JavaScript动画更高效。使用css的transform和opaci
Ashy-
·
2025-02-17 20:52
前端面试题
前端笔记
css3
人工智能的发展领域之
GPU
加速计算的应用概述、架构介绍与教学过程
文章目录一、架构介绍
GPU
算力平台概述优势与特点二、注册与登录账号注册流程
GPU
服务器类型配置选择指南内存和存储容量网络带宽CPU配置三、创建实例实例创建步骤镜像选择与设置四、连接实例SSH连接方法远程桌面配置一
m0_74824592
·
2025-02-17 15:00
面试
学习路线
阿里巴巴
人工智能
架构
DeepSeek大模型本地化部署与实践指南
部署准备硬件要求配置项推荐规格最低要求
GPU
NVIDIAA10080Gx4RTX309024GCPUIntelXeonSilver4314i7-12700K内存512GBDDR464GBDDR4存储2TBNVMeSSD512
星辰@Sea
·
2025-02-17 11:31
人工智能
人工智能
DeepSeek
AI
nlp
国产
GPU
算力公司及产品
目前,中国有多家从事国产算力
GPU
研发与生产的企业,以下是一些代表性的公司及其相关产品概述:景嘉微:近期,景嘉微宣布成功研发了“景宏系列”AI算力产品,该系列面向AI训练、AI推理、科学计算等领域,支持
算力资源比较多
·
2025-02-17 10:22
智算
算力
昇腾910
gpu算力
语言模型
人工智能
大数据
推荐算法
煤矸石无线测温系统项目背景
目前,随着综采机械化的提高及煤炭资源的大量利用,使得煤矸石的产生量逐年增加,为了节约土地
利用率
一般都是将煤矸石山堆积成山,但是长期
德明电子
·
2025-02-17 07:26
无线测温
AI大模型的技术突破与传媒行业变革
这一突破的核心在于三大技术创新:MoE架构升级:通过部署256个细粒度专家网络,减少知识冗余,提升模型效率;MLA注意力机制:动态压缩推理过程中的缓存需求,降低
GPU
内存
AIQL
·
2025-02-17 07:52
行业分析
人工智能
传媒
hunyuan-DiT模型部署指南
二、部署流程环境要求:所需的最小
GPU
内存为11GB,建议使用具有32GB内存的
GPU
,以获得更好的生成质量。
算家云
·
2025-02-17 05:12
模型构建
ComfyUI
图片生成
大模型
人工智能
pytorch
AIGC
controller入参异常 No primary or default constructor found for class
java.lang.IllegalStateException:Noprimaryordefaultconstructorfoundforclassjava.time.LocalDateTime错误写法:@GetMappin
gpu
blicStringquery
Lin_Miao_09
·
2025-02-17 04:30
java优秀例子
java
显卡性能对比:P100、RTX3090、A40、A100、A800、H100
32GBRTX3080RTX2080TiRTXA4000RTXA5000A100-SXM4-80GBA100-PCIE-40GBTITANXpRTX3060RTX3080TiV100-32GBTeslaT4A800H100世上最全NVDIA
GPU
u013250861
·
2025-02-17 03:27
LLM
显卡
【Stable Diffusion部署至GNU/Linux】安装流程
显卡与计算架构介绍CUDA是NVIDIA
GPU
的专用并行计算架构技术层级说明CUDAToolkit提供
GPU
编译器(nvcc)、数学库(cuBLAS)等开发工具cuDNN深度神经网络加速库(需单独下载)
星星点点洲
·
2025-02-17 00:34
stable
diffusion
KTransformers:告别天价显卡!国产框架让单卡24G显存跑DeepSeek-R1 671B大模型:推理速度飙升28倍
清华团队用CPU/
GPU
协同计算,让4090跑起671B参数全量模型!”大家好,我是蚝油菜花。如果你也经历过——看着API调用账单瑟瑟发抖,微调一次模型吃掉半月算力预算️盯着OOM报错抓狂,为了
蚝油菜花
·
2025-02-17 00:32
每日
AI
项目与应用实例
人工智能
开源
高效高并发调度架构
以下是从架构层面为你提供的适合多核CPU、多
GPU
环境下API客户端、服务端高级调度,以实现高效并发大规模与用户交互的技术栈:通信协议gRPC:基于HTTP/2协议,具有高性能、低延迟的特点,支持二进制序列化
之群害马
·
2025-02-16 23:59
架构
【vLLM 学习】安装
依赖环境操作系统:LinuxPython:3.8-3.12
GPU
:计算能力7.0或更高(例如V100、T4、RTX20xx、A100、L
·
2025-02-16 23:25
三种方式实现人车流统计(yolov5+opencv+deepsort+bytetrack+iou)
一、运行环境1、项目运行环境如下2、CPU配置3、
GPU
配置如果没有
GPU
yolov5目标检测时间会比较久二、编程语言与使用库版本项目编程语言使用c++,使用的第三方库,onnxruntime-linux-x64
Jayson God
·
2025-02-16 23:24
人工智能
c++
yolov5
opencv
算法
人工智能
【Stable Diffusion部署至Google Colab】
GoogleColab中快速搭建带
GPU
加速的StableDiffusionWebUIfromgoogle.colabimportdrivedrive.mount('/content/drive')!
星星点点洲
·
2025-02-16 21:40
stable
diffusion
麒麟SoC的详细架构组成介绍
目录麒麟SoC的主要组成部分1.应用处理器(ApplicationProcessor,AP)2.图形处理单元(
GPU
)3.神经网络处理单元(NPU)4.图像信号处理器(ISP)5.调制解调器(Modem
小蘑菇二号
·
2025-02-16 16:33
麒麟
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他