显卡GPU

android 卡顿和丢帧区别

本质差异维度卡顿（Jank）丢帧（FrameDrop）定义界面长时间无响应（如点击延迟>200ms）动画/滚动不连贯（如帧率从60fps突降至40fps）触发根源主线程阻塞（耗时计算、I/O、锁竞争）GPU

summerkissyou1987·2025-07-04 02:46

Android Profiler 丢帧分析教程及案例

summerkissyou1987·2025-07-04 02:46

Android Profiler 卡顿分析教程及案例

以下是AndroidProfiler卡顿分析的完整教程及实战案例，结合最新工具操作流程与优化策略：一、卡顿分析操作教程1.环境配置开启GPU调试：设备设置→开发者选项→启用GPU渲染分析和GPUProfiler

summerkissyou1987·2025-07-04 02:46

android-性能分析

实时监测CPU/内存/网络/能耗火焰图分析、内存泄漏检测（支持Activity/Fragment自动检测）AndroidStudio3.6+Perfetto系统级追踪（替代Systrace）线程调度、GPU

·2025-07-04 02:15

【AI Infra】基础学习汇总篇

，后续继续完善和扩充(●’◡’●)文章目录一、分布式与并行基础分布式计算高性能并行GPU硬

逆羽飘扬·2025-07-04 01:41

【Python基础】13 知识拓展：CPU、GPU与NPU的区别和联系

引言：处理器大战背后的技术革命在人工智能蓬勃发展的今天，我们经常听到CPU、GPU、NPU这些术语，但你是否真正理解它们之间的区别和联系？

智算菩萨·2025-07-04 01:11

RTX50系显卡+CUDA+torch+python对应关系

前言本人的显卡是RTX5070，使用时发现它对CUDA、torch和python版本有要求，试图按照老项目的依赖文件进行安装发现安不了，因此记录一下（截至2025年6月）。

·2025-07-04 01:37

PCIe Crosslink

这种技术主要用于高性能计算（HPC）、FPGA加速、GPU直连等场景，以降低延迟并提高带宽利用率。1.PCIeCrossl

zly8865372·2025-07-04 00:31

Skia图形库：绘制2D世界的核心组件

支持CPU/GPU/PDF/SVG多种渲染后端，广泛应用于Chrome、Flutter等项目中，提供从基础绘图到高级特效

·2025-07-03 23:57

Web3.0时代的安全悖论：去中心化如何反被中心化攻击？

详细内容扩展：技术解析：Solana链上RugPull攻击手法复盘（3亿美元被盗）中心化交易所安全措施对比（CoinbasevsBinance安全预算）合规框架：SEC监管动态：Howey测试最新应用案例税务合规工具

5GOrDiejfgf·2025-07-03 14:51

pytorch官方文档60分钟入门笔记

/blog.csdn.net/u014630987/article/details/786690511.张量（Tensors）tensors和numpy的ndarray类似,但是tensors可以使用GPU

xiaodidadada·2025-07-03 08:41

零基础起步：基于GpuGeek的文本生成模型实战

本文将带领读者使用GpuGeek平台，从注册、上传数据到实例部署与训练，完整构建一个基于GPT2模型的文本生成系统，实战掌握AI模型的云端开发流程。

昊昊该干饭了·2025-07-03 06:54

使用GPU进行机器学习训练时，如果GPU-Util计算核心满载工作但是显存占用较少，应该如何优化？

如果任务运行正常：无需干预（GPU设计本就是优先榨干计算性能）。如果出现卡顿或效率低下：增大batch_size：提升显存占用，减少数据搬运次数（但需避免OOM）。

十子木·2025-07-03 01:11

【jetson】Linux下nvidia Jetson烤机程序（CPU+GPU）

这里主要贴一下cpu和gpu的烤机程序。cpu为arm64，gpu是orinnano的模组。

·2025-07-03 01:40

机器学习中为什么要用混合精度训练

FP16与显存占用关系显存（VideoRAM，简称VRAM）是显卡（GPU）专用的内存。

十子木·2025-07-03 01:39

使用虚幻引擎5（UE5）开发游戏的最低配置推荐

组件要求说明来源操作系统Windows1064位（版本20H2或更高）处理器4核CPU（如Inteli5-4590或AMDRyzen51600），主频≥3.0GHz内存8GBRAM（推荐32GB以上，复杂场景需64GB）显卡

知1而N·2025-07-03 01:09

【翻译】Part4: Texture samplers.

上一部分讲的是顶点着色器，还大致介绍了通用的GPU着色器单元。总的来说，它们只是向量处理器，但它们可以访问一种在其他向量处理架构中不存在的资源：纹理采样器。

·2025-07-02 22:52

无需多卡集群，单卡运行扩散模型的技术突破与实践

幸运的是，随着模型架构优化、量化技术、推理加速方案的发展，越来越多的开源扩散模型可以在单张消费级显卡（如RTX4090、T4、A6000）上运行，并且性能接近或超越原生大规模模型。本文整理了当前可在

源客z·2025-07-02 20:35

pytorch底层原理学习--PyTorch 架构梳理

完整架构流程图关键组件详解完整执行流程示例PyTorch架构梳理PyTorch完整架构流程图硬件层后端层C++部署层核心引擎(libtorchC++)绑定层Python层加载调用训练模式编译模式推理模式生成CPUGPUCPUKernelsCUDAKernelsC

xinxiangwangzhi_·2025-07-02 14:21

onnx模型部署 python_深度学习模型转换与部署那些事(含ONNX格式详细分析)

毕竟训练出来的模型不能只接受一些公开数据集和榜单的检验，还需要在真正的业务场景下创造价值，不能只是为了PR而躺在实验机器上在现有条件下，一般涉及到模型的部署就要涉及到模型的转换，而转换的过程也是随着对应平台的不同而不同，一般工程师接触到的平台分为GPU

weixin_39759270·2025-07-02 11:02

OpenCV CUDA模块设备层-----双曲正切函数tanh()

操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述OpenCV的CUDA模块（cudev）中的一个设备函数，用于在GPU

村北头的码农·2025-07-02 11:26

OpenCV CUDA模块设备层-----二值化阈值操作函数thresh_binary_func()

这个函数返回一个仿函数（functor），用于在GPU上执行二值化阈值处理（ThresholdBin

·2025-07-02 10:22

从源码编译 ONNX Runtime GPU 1.18.2 并验证 CUDA 推理成功

文章目录从源码编译ONNXRuntimeGPU1.18.2并验证CUDA推理成功【实测环境+完整步骤】✅环境信息（实测成功）第一步：获取源码️第二步：编译命令参数说明（重点）第三步：安装构建好的`.whl

草莓奶忻·2025-07-02 09:41

Ubuntu 22.04 庙算平台训练环境搭建指南

本文记录了基于Ubuntu22.04.3LTS的训练环境搭建过程，适用于需要部署庙算推演离线平台的用户，支持GPU（可选）。

笑衬人心。·2025-07-02 03:00

Mac mini 跑 DeepSeek R1 及 QwQ-32B模型实测报告

32B（原版/量化版）测试目标：硬件性能适配性、推理速度、内存占用及优化方案一、Macmini硬件配置概览配置项M4基础款（16GB）M4Pro高配（32GB/64GB）芯片M4（10核CPU/10核GPU

强哥之神·2025-07-01 21:16

口扫系统软件的架构设计流程

[结构光图像流]↓解码结构光图案↓三角测量计算深度↓点云生成并去噪滤波↓实时配准/拼接(可选ICP/Odometry)↓网格重建（如MarchingCubes或BallPivoting）↓GPU显示（OpenGL

老猿的春天·2025-07-01 16:41

GPU 分布式通信加速黑马！DeepEP 的实战与深度剖析

DeepSeek.ai推出的DeepEP，专为MoE/EP通信优化，实现了GPU原生高吞吐、低延迟通信，极大释放了底层硬件潜力。

DeepLink_01·2025-07-01 10:33

告别GPU焦虑：如何在纯CPU服务器上，打造高性能Embedding服务？

兄弟们都懂，GPU它香啊，但它也贵啊！很多时候，咱只能在有限的资源里想办法。

ezl1fe·2025-07-01 10:02

本地部署Qwen3小参数版本实测：并非鸡肋

另一方面，大模型对硬件要求较高，尤其是对GPU的性能和显存容量有一定要求。如果硬件不达标，模型运行起来可能会很慢，甚至根本无法运行。而且，

程序员寒山·2025-07-01 09:56

高性能AI核心板Z3588CV1：基于瑞芯微RK3588的旗舰级解决方案——8K视觉处理 · 6TOPS NPU算力 · 多场景边缘计算

RK3588处理器技术细节计算单元CPU：4×[email protected]（大核集群）4×[email protected]（能效集群）支持ARMDynamIQ混合架构，可实现任务智能调度GPU：

九鼎创展科技·2025-07-01 07:18

如何搭建基于RK3588的边缘服务器集群？支持12个RK3588云手机

软件部署及优化要点：️‌一、硬件集群架构设计‌‌节点基础配置‌‌核心单元‌：单节点采用RK3588核心板（4×[email protected]+4×[email protected]），集成6TOPSNPU及Mali-G610GPU

XMAIPC_Robot·2025-07-01 07:17

商品类目一览

请求地址productCategory传入product_id，得到结果交流：5b6u5L+hIGpudG9vbA=={"data":{"alternative_categories":[{"category_id

乱乱乱乱·2025-07-01 06:37

信创背景下应用软件迁移解析：从政策解读到落地实践方案

信创（信息技术应用创新）是指用我国自主研发的基础软硬件产品实现对国外产品的替代，特别是在CPU、GPU及操作系统等关键领域。其核心目标是解决核心技术"卡脖子"问题，构建安全可控的IT底层架构和标准。

tianzhiyi1989sq·2025-07-01 00:06

什么是Alpha测试和Beta测试？

Beta测试≈真实世界的"路测实验"交给真实用户在实际环境中使用，比如某知名手游的Beta测试期间，我们发现了iOS14.3特定版本下的GPU内存泄漏问题，这种问题在模拟器上根本无法复现。2.

海姐软件测试·2025-07-01 00:32

CARLsim开源程序是一个高效、易用、GPU 加速的软件框架，用于模拟具有高度生物细节的大规模脉冲神经网络（SNN）模型。

一、软件介绍文末提供程序和源码下载CARLsim是一个高效、易用的GPU加速库，用于模拟具有高度生物学细节的大规模脉冲神经网络（SNN）模型。

struggle2025·2025-06-30 16:06

【TVM 教程】PAPI 入门

ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。

·2025-06-30 12:30

NVAPI 获取同步卡信息

<GPUNvPhysicalGpuHandlegpuHandles[NVAPI_MAX_PHYSICAL

xhh-cy·2025-06-30 10:24

【Python】科研代码学习：十三 Accelerate

torch.nn)更简单的使用Accelerate【HF官网-Doc-Accelerate：API】HFAccelerate是一个库，能够让PyTorch代码添加几行代码之后，就能在分布式配置中运行（比如多Gpus

溢流眼泪·2025-06-30 05:21

使用 Xinference 命令行工具（xinference launch）部署 Nanonets-OCR-s

二、部署步骤：从命令行启动模型1.确认环境与依赖已安装Xinference：pipinstall"xinference[all]"GPU显存≥9GB（

没刮胡子·2025-06-30 01:32

Unity纹理的性能优化

https://developer.unity.cn/projects/6482ba86edbc2a116e4f27c1在Unity的储存方式大部分的纹理，Unity都会保存两份像素数据的副本：GPU内存

东邪丶·2025-06-29 23:20

计算机基础和Java编程的练习题

显卡（GPU）：负责图形渲染，将数字信号转换为图像显示在屏幕上。电源：为计

柳依依@·2025-06-29 23:16

Python助力自动驾驶：深度学习模型优化全攻略

可是，跑在车上的这些模型不仅要精准，还得轻量、实时、稳定，这可不是简单的“丢GPU就能解决”的问题。今天，咱们就从Python开发者的视角，聊聊自动驾驶里深度学习模型的优化

Echo_Wish·2025-06-29 22:11

tensorRT 与 torchserve-GPU性能对比

实验对比前端时间搭建了TensorRT、Torchserve-GPU，最近抽时间将这两种方案做一个简单的实验对比。

joker-G·2025-06-29 22:40

随机存储器有哪些，只读存储器又有哪些

VRAM：显卡专用显存，支持高速图像

我推是大富翁·2025-06-29 16:58

AI算力综述和资料整理

目录总体介绍计算精度传输协议GPU池化资源调度CUDA技术GPU硬件参考链接总体介绍AI算力是人工智能系统的核心基础设施，涵盖了从计算精度、传输协议到硬件架构的完整技术栈。

木鱼时刻·2025-06-29 15:48

【PyTorch】2024保姆级安装教程-Python-（CPU+GPU详细完整版）

【PyTorch】2024保姆级安装教程（CPU+GPU详细完整版）PyTorch是当前最受欢迎的深度学习框架之一。

金枝玉叶9·2025-06-29 15:48

YOLOv8模型在RDK5开发板上的部署指南：.pt到.bin转换与优化实践

到.bin转换与优化实践——基于TensorRT的高性能嵌入式部署方案第一章：技术背景与核心概念1.1RDK5开发板硬件架构NVIDIAJetsonOrinNX核心参数：1024-coreAmpereGPU

pk_xz123456·2025-06-29 13:35

分布式训练架构解析

分布式训练的问题根源与需求驱动在深度学习领域，模型与数据规模呈指数级增长趋势，传统单机训练模式已难以满足日益复杂的业务需求，分布式训练技术应运而生，其核心驱动力源于以下三大关键困境：1.1算力瓶颈与训练效率危机单GPU

·2025-06-29 11:55

鸿蒙应用动画优化：流畅交互的实现方法

鸿蒙应用动画优化：流畅交互的实现方法关键词：鸿蒙应用开发、动画优化、流畅交互、图形渲染、性能分析、VSYNC、GPU加速摘要：本文深入解析鸿蒙系统动画优化的核心技术，从动画渲染原理、性能瓶颈分析到具体优化策略

操作系统内核探秘·2025-06-29 11:24

恐怖黎明决定版中文免安离线运行版

*:WindowsXP/WindowsVista/Windows7/Windows8/Windows10处理器:x86兼容2.3GHz或更快的处理器（英特尔第2代酷睿i系列或同等产品）内存:2GB内存显卡

与凌风000·2025-06-29 10:44

推荐频道

显卡GPU

android 卡顿和丢帧区别

Android Profiler 丢帧分析教程及案例

Android Profiler 卡顿分析教程及案例

android-性能分析

【AI Infra】基础学习汇总篇

【Python基础】13 知识拓展：CPU、GPU与NPU的区别和联系

RTX50系显卡+CUDA+torch+python对应关系

PCIe Crosslink

Skia图形库：绘制2D世界的核心组件

Web3.0时代的安全悖论：去中心化如何反被中心化攻击？

pytorch官方文档60分钟入门笔记

零基础起步：基于GpuGeek的文本生成模型实战

使用GPU进行机器学习训练时，如果GPU-Util计算核心满载工作但是显存占用较少，应该如何优化？

【jetson】Linux下nvidia Jetson烤机程序（CPU+GPU）

机器学习中为什么要用混合精度训练

使用虚幻引擎5（UE5）开发游戏的最低配置推荐

【翻译】Part4: Texture samplers.

无需多卡集群，单卡运行扩散模型的技术突破与实践

pytorch底层原理学习--PyTorch 架构梳理

onnx模型部署 python_深度学习模型转换与部署那些事(含ONNX格式详细分析)

OpenCV CUDA模块设备层-----双曲正切函数tanh()

OpenCV CUDA模块设备层-----二值化阈值操作函数thresh_binary_func()

从源码编译 ONNX Runtime GPU 1.18.2 并验证 CUDA 推理成功

Ubuntu 22.04 庙算平台训练环境搭建指南

Mac mini 跑 DeepSeek R1 及 QwQ-32B模型实测报告

口扫系统软件的架构设计流程

GPU 分布式通信加速黑马！DeepEP 的实战与深度剖析

告别GPU焦虑：如何在纯CPU服务器上，打造高性能Embedding服务？

本地部署Qwen3小参数版本实测：并非鸡肋

高性能AI核心板Z3588CV1：基于瑞芯微RK3588的旗舰级解决方案——8K视觉处理 · 6TOPS NPU算力 · 多场景边缘计算

如何搭建基于RK3588的边缘服务器集群？支持12个RK3588云手机

商品类目一览

信创背景下应用软件迁移解析：从政策解读到落地实践方案

什么是Alpha测试和Beta测试？

CARLsim开源程序 是一个高效、易用、GPU 加速的软件框架，用于模拟具有高度生物细节的大规模脉冲神经网络 （SNN） 模型。

【TVM 教程】PAPI 入门

NVAPI 获取同步卡信息

【Python】科研代码学习：十三 Accelerate

使用 Xinference 命令行工具（xinference launch）部署 Nanonets-OCR-s

Unity纹理的性能优化

计算机基础和Java编程的练习题

Python助力自动驾驶：深度学习模型优化全攻略

tensorRT 与 torchserve-GPU性能对比

随机存储器有哪些，只读存储器又有哪些

AI算力综述和资料整理

【PyTorch】2024保姆级安装教程-Python-（CPU+GPU详细完整版）

YOLOv8模型在RDK5开发板上的部署指南：.pt到.bin转换与优化实践

分布式训练架构解析

鸿蒙应用动画优化：流畅交互的实现方法

恐怖黎明 决定版 中文 免安 离线运行版

CARLsim开源程序是一个高效、易用、GPU 加速的软件框架，用于模拟具有高度生物细节的大规模脉冲神经网络（SNN）模型。

恐怖黎明决定版中文免安离线运行版