GPU；FFT

如何在 Linux 上安装 RTX 5090 / 5080 /5070 Ti / 5070 驱动程序 — 详细指南

简介为了获得最佳性能，您需要在Linux上运行5090/5080/5070Ti/5070或其他50系列GPU（或Windows上的WSL）。这篇文章将包含有关如何操作的详细指南。

知识大胖·2025-07-12 11:21

24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化

简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策

知识大胖·2025-07-12 11:21

在 Obsidian 中本地使用 DeepSeek — 无需互联网！

知识大胖·2025-07-12 11:21

什么是热力学计算？它如何帮助人工智能发展？

现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。

知识大胖·2025-07-12 11:19

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战

LLM大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战1.环境准备GPU设备:A10,3090,V100,A100均可.

汀、人工智能·2025-07-12 10:09

8卡RTX 5090D服务器部署Qwen3-32B-AWQ模型执行性能测试

GPU拓扑情况如下(test)root@ubuntu:/opt/models#nvidia-smitopo-mGPU0GPU1GPU2GPU3GPU4GPU5GPU6GPU7CPUAffinityNUMAAffinityGPUNUMAIDGPU0XNODENODENODESYSSYSSYSSYS0

·2025-07-12 01:37

YOLO11 目标检测从安装到实战

一、环境准备1.系统要求操作系统：Windows10/11、Ubuntu20.04+、欧拉系统等硬件：CPU可运行，GPU（NVIDIA）可加速（推荐，需支持CU

·2025-07-12 01:34

怎么强制macOS上的某个应用不使用独立显卡

背景之前碰到过企业微信更新之后强制使用独立GPU，后面找到了快捷指令的方式禁止企业微信使用独立GPU启动，后面某个版本更新好了。

·2025-07-12 00:31

第35周—————糖尿病预测模型优化探索

目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision

·2025-07-11 22:49

数据不Ready，一切AI Ready都是伪命题

是买了GPU服务器，就能跑出结果？显然不是。在袋鼠云看来，AIReady不等于模型Ready，而是数据Ready。没有可用、可控、可理解的数据，AI只能是空中楼阁。

·2025-07-11 21:13

显卡GPU的架构和工作原理

显卡GPU（图形处理单元）是专为并行计算和图形处理设计的芯片，广泛应用于游戏、科学计算、人工智能和数据中心等领域。以下详细介绍GPU的架构和工作原理，涵盖核心组件、计算流程和关键技术，尽量简洁清晰。

InnoLink_1024·2025-07-11 18:50

【零基础学AI】第36讲：GPT模型原理

模型的基本原理掌握Transformer解码器的工作机制实现一个简单的文本生成应用开始之前环境要求Python3.8+安装包：pipinstalltransformerstorch硬件：CPU即可运行（GPU

1989·2025-07-11 13:48

【零基础学AI】第31讲：目标检测 - YOLO算法

算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU

1989·2025-07-11 13:18

【亲测免费】 CatBoost 教程项目使用指南

CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模

·2025-07-11 11:33

英伟达 Isaac ROS产品体验

这里写自定义目录标题英伟达IsaacROS产品体验运行的商品名称运行过程记录GPU加速仿真总结英伟达IsaacROS产品体验NVIDIAIsaacROS是一套为自主移动机器人（AMR）开发的硬件加速软件包

芝麻香儿·2025-07-11 10:26

双轮驱动：政策激励与外部制约下的国产服务器市场演进

2022年10月，美国首次将A100和H100等高端GPU列入对华出口管制清单，标志着对中国服务器芯片的针对性限制正式拉开序幕。与此同时，国内相关支持政策持续落地，从“国产替代”专项资金到鼓励核心

科智咨询·2025-07-11 09:44

RapidRAW RAW 图像编辑器

一款美观、无损且GPU加速的RAW图像编辑器，在构建时充分考虑了性能。主要特点核心编辑引擎GPU加速处理：所有图像调整均使用自定义WGSL着色器在GPU上处理，以获得快速反馈。

罗光记·2025-07-11 08:43

Chromium 引擎启用 Skia Graphite后性能飙升

Ganesh是Skia的传统渲染后端，而Graphite是为现代GPU和图形API（如Vulkan和Metal）

罗光记·2025-07-11 08:39

在Ubuntu系统下使用Docker部署ollama并使用英伟达gpu加速

下载安装英伟达Nvidiacontainertoolkit：curl-fsSLhttps://nvidia.github.io/libnvidia-container/gpgkey|sudogpg--dearmor-o/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg\&&curl-s-Lhttps://nvidia.github.io

longze_7·2025-07-11 04:15

多租户场景下的资源配额管理，如何实现公平分配与优先级调度？

当前主流技术体系包含以下核心组件：1.分层配额模型物理层配额：基于硬件资源的绝对限制（如CPU核数、内存容量、GPU算力），通过Linuxcgroups或WindowsJobObjects实现资源硬性隔离

百态老人·2025-07-11 02:02

异构推理系统动态负载调度与资源分配实战：多节点协同、任务绑定与智能分发策略全解析

异构推理系统动态负载调度与资源分配实战：多节点协同、任务绑定与智能分发策略全解析关键词异构调度、Kubernetes调度器、GPU任务绑定、MIG分配、推理流量调度、服务亲和性、任务隔离、资源优先级、边缘协同

观熵·2025-07-11 02:32

跨集群异构推理系统协同调度实战：边缘-中心联合部署与多租户算力调度架构解析

跨集群异构推理系统协同调度实战：边缘-中心联合部署与多租户算力调度架构解析关键词跨集群调度、边缘推理、GPU-NPU协同、KubeFed、资源分域、任务下发、多租户隔离、MLOps联邦调度、推理闭环、负载均衡摘要在

观熵·2025-07-11 02:32

冷冻电镜重构的GPU加速破局：从Relion到CryoSPARC的并行重构算法

本文重点分析Relion和CryoSPARC两大主流软件在GPU并行化方面的技术

九章云极AladdinEdu·2025-07-10 22:33

jetson orin nano安装GPU版本的pytorch过程

一、安装jetpack组件和安装CUDA/cuDNN可以参考下面这个博客「解析」JetsonOrinNX安装CUDA/cuDNN_jetsoncuda-CSDN博客二、安装Pytorch和torchaudio可以直接看官方给的步骤https://pytorch.org/audio/main/build.jetson.html

小鲈鱼-·2025-07-10 21:58

TensorBase开发者快速入门指南

TensorBase开发者快速入门指南tensorbasetensorbase/tensorbase:是一个现代的GPU加速的张量数据库。适合用于大规模数据分析和机器学习。

宗隆裙·2025-07-10 20:22

鸿蒙next开发：性能测试工具SmartPerf Editor

SmartPerfEditor是一款PC端桌面应用，通过监测、采集应用运行时FPS、CPU、GPU、Memory、Battery、Network等性能数据，帮助开发者了解应用的性能状况。

代码与思维·2025-07-10 15:18

开源人工神经网络库（OpenANN）

支持GPU加速

deepdata_cn·2025-07-10 08:33

基于FPGA的二维FFT实现

基于FPGA的二维FFT实现【下载地址】基于FPGA的二维FFT实现本项目提供了一种基于FPGA的高效二维FFT实现方案，专为数字信号处理和图像处理领域设计。

廉连曼·2025-07-10 05:47

【FFT】基于FPGA的FFT傅里叶变换和相位计算系统设计

1.软件版本ISE14.7，modeslimSE，10.1c2.系统仿真与分析第1步：信号源的产生主要通过rom将产生的数据保存到rom中，然后，我们再仿真的时候调用即可。这个部分仿真效果如下所示，你给的程序中，这个部分主要有两个数据源，一个是1025，一个是N为1024，我们这里分别将这两个数据量化之后保存到rom中，仿真如下所示：

fpga和matlab·2025-07-10 05:47

基于FPGA的快速傅里叶变换（FFT）设计在嵌入式系统中的应用

基于FPGA的快速傅里叶变换（FFT）设计在嵌入式系统中的应用快速傅里叶变换（FastFourierTransform，FFT）是一种重要的信号处理算法，在许多领域中都得到广泛的应用，例如通信系统、雷达技术

风吹麦很·2025-07-10 05:17

NCCL 核心集体通信操作深度解析：从原理到优化实践

目录引言：NCCL——分布式训练的通信引擎一、NCCL基础：GPU通信的“加速器”1.1NCCL与MPI的协同1.2集体通信的价值二、NCCL核心操作深度解析2.1AllGather：全局数据聚合2.1.1

清风 001·2025-07-10 00:13

【零基础学AI】第30讲：生成对抗网络(GAN)实战 - 手写数字生成

PyTorch构建生成器和判别器DCGAN架构实现技巧训练GAN模型的实用技巧开始之前环境要求Python3.8+需要安装的包：pipinstalltorchtorchvisionmatplotlibnumpyGPU

1989·2025-07-10 00:41

Windows Subsystem for Linux (WSL)：现代开发的终极跨平台方案

本文将从架构原理、实操指南到高阶应用进行全面剖析，您将掌握：WSL1与WSL2的架构差异与性能对比文件系统互通与跨平台开发的最佳实践GPU加速支持与容器化集成

止观止·2025-07-09 23:40

【MobileNet v3 可视化界面】在电脑上实现可视化界面

【MobileNetv3可视化界面】在电脑上实现可视化界面一、PyQt5库安装PyQt5库的安装，可以查看这篇文章：完全弄懂如何用pycharm安装pyqt5及其相关配置二、界面设置三、功能链接GPUorCPU

·2025-07-09 23:36

【华为昇腾|CUDA】服务器A6000显卡部署LLM实战记录

安装驱动https://www.nvidia.cn/drivers/lookup/搜索对应gpu的kylin版本即可先使用wget下载rpm包rpm-i安装最后使用dnfinstallnvidia-driver

刘阿宾·2025-07-09 22:59

huggingface笔记：文本生成Text generation

AutoModelForCausalLMimporttorchimportosmodel=AutoModelForCausalLM.from_pretrained("gpt2",device_map="auto",#自动分配到所有可用设备（优先GPU

UQI-LIUWJ·2025-07-09 21:23

区块链技术促进算力生态发展的具体案例

以下是一些区块链技术促进算力生态发展的具体案例：-Origins公链整合GPU资源：Origins公链构建于以太坊之上，致力于连接全球的GPU资源。

VV- Wxiaoxwen·2025-07-09 19:44

【NVIDIA-H100】基于 nvidia-smi 数据H100 GPU 功耗异常深度分析与解决方案

目录一、引言二、GPU功耗与温度管理基础逻辑（一）GPU温度调控机制（二）功耗与温度的关联逻辑三、3号H100GPU异常数据深度拆解（一）正常卡与异常卡数据对比（核心指标）（二）异常指标的物理意义四、功耗低的根源分析

清风 001·2025-07-09 17:01

如何在 Android Framework层面控制高通（Qualcomm）芯片的 CPU 和 GPU。

如何在AndroidFramework层面控制高通（Qualcomm）芯片的CPU和GPU。

YoungHong1992·2025-07-09 12:24

Tesla的FSD 架构设计

数据处理和安全机制五个维度展开分析：一、硬件架构：从HW3.0到AI5的算力跃迁HW3.0基础设计采用三星14nm工艺的定制SoC，包含12个Cortex-A72CPU核心、2个NPU（合计73.7TOPS算力）和Mali-G71GPU

WSSWWWSSW·2025-07-09 04:30

「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践

ERNIE-4.5模型权重2.1安装HuggingFaceCLI工具2.2设置国内镜像加速（可选）2.3下载模型文件3安装FastDeploy与Paddle推理引擎3.1安装PaddlePaddle-GPU

cooldream2009·2025-07-09 02:17

深度学习-Tensor

Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。

·2025-07-09 02:15

AI初学者如何对大模型进行微调？——零基础保姆级实战指南

仅需8GB显存，三步完成个人专属大模型训练四步实战：从环境配置到模型发布步骤1：云端环境搭建（10分钟）推荐使用阿里魔塔ModelScope免费GPU资源：#注册后执行环境初始化pip3install-

·2025-07-09 02:15

服务器无对应cuda版本安装pytorch-gpu[自用]

服务器无对应cuda版本安装pytorch-gpu服务器无对应cuda版本安装pytorch-gpu网址下载非root用户安装tmux查看服务器ubuntu版本conda安装tensorflow-gpu

片月斜生梦泽南·2025-07-09 00:02

「论文导读」LLM高效推理与模型量化

论文探讨如何通过优化训练数据、模型架构和推理技术，在有限硬体资源（如单一GPU或CPU）上实现高效推理。学术背景：随着大型语言模型（LLM）如GPT-3的

雷羿 LexChien·2025-07-09 00:01

华为OD机试 - GPU 调度（Python/JS/C/C++ 2025 A卷 100分）

华为OD机试2025A卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。一、题目描述任务编排服务负责对任务进行组合调度。参与编排的任务有两种类型，其

哪吒·2025-07-08 21:15

【TTS】2024-2025年主流开源TTS模型的综合对比分析

一、开源TTS模型对比（2024-2025年主流方案）模型名称开源/厂商克隆支持中文支持部署要求更新状态开源地址/时间核心优势Dia-1.6BNariLabs(开源)✅零样本声纹克隆❌仅英语GPU(A4000,40tokens

·2025-07-08 18:23

DeepSeek 部署中的常见问题及解决方案

环境配置问题硬件兼容性问题：GPU型号、驱动版本不匹配的解决方案。依赖库冲突：Python版本、CUDA/cuDNN不兼容的排查方法。虚拟环境配置：Anaconda或Docker环境的最佳实践。

tonngw·2025-07-08 16:42

ubuntu22.04从新系统到tensorflow GPU支持

ubuntu22.04CUDA从驱动到tensorflow安装0系统常规设置和软件安装0.1挂载第二硬盘默认Home0.2软件安装0.3安装指定版本的python0.4python虚拟环境设置1直接安装1.1配置信息1.2驱动安装1.3集显显示，独显运算（其它debug用）1.4卸载驱动(备用，未试)日常使用ssh后台运行（断联不中断）0系统常规设置和软件安装0.1挂载第二硬盘默认Homesudo

澍龑·2025-07-08 11:40

基于 STM32+FPGA 的快速傅里叶频域图像在 TFT 中显示的设计与实现(项目资料)（ID:8）

国内外研究现状1.3研究内容与目标2系统方案设计2.1总体架构设计2.2硬件方案设计2.2.1主控模块选型2.2.2FPGA模块选型2.2.3TFT显示模块选型2.2.4通信方案设计2.3软件方案设计2.3.1FFT

嵌入式资料库·2025-07-08 08:44

推荐频道

GPU；FFT

如何在 Linux 上安装 RTX 5090 / 5080 /5070 Ti / 5070 驱动程序 — 详细指南

24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化

在 Obsidian 中本地使用 DeepSeek — 无需互联网！

什么是热力学计算？它如何帮助人工智能发展？

LLM 大模型学习必知必会系列(十三)：基于SWIFT的VLLM推理加速与部署实战

8卡RTX 5090D服务器部署Qwen3-32B-AWQ模型执行性能测试

YOLO11 目标检测从安装到实战

怎么强制macOS上的某个应用不使用独立显卡

第35周—————糖尿病预测模型优化探索

数据不Ready，一切AI Ready都是伪命题

显卡GPU的架构和工作原理

【零基础学AI】第36讲：GPT模型原理

【零基础学AI】第31讲：目标检测 - YOLO算法

【亲测免费】 CatBoost 教程项目使用指南

英伟达 Isaac ROS产品体验

双轮驱动：政策激励与外部制约下的国产服务器市场演进

RapidRAW RAW 图像编辑器

Chromium 引擎启用 Skia Graphite后性能飙升

在Ubuntu系统下使用Docker部署ollama并使用英伟达gpu加速

多租户场景下的资源配额管理，如何实现公平分配与优先级调度？

异构推理系统动态负载调度与资源分配实战：多节点协同、任务绑定与智能分发策略全解析

跨集群异构推理系统协同调度实战：边缘-中心联合部署与多租户算力调度架构解析

冷冻电镜重构的GPU加速破局：从Relion到CryoSPARC的并行重构算法

jetson orin nano安装GPU版本的pytorch过程

TensorBase开发者快速入门指南

鸿蒙next开发：性能测试工具SmartPerf Editor

开源人工神经网络库（OpenANN）

基于FPGA的二维FFT实现

【FFT】基于FPGA的FFT傅里叶变换和相位计算系统设计

基于FPGA的快速傅里叶变换（FFT）设计在嵌入式系统中的应用

NCCL 核心集体通信操作深度解析：从原理到优化实践

【零基础学AI】第30讲：生成对抗网络(GAN)实战 - 手写数字生成

Windows Subsystem for Linux (WSL)：现代开发的终极跨平台方案

【MobileNet v3 可视化界面】在电脑上实现可视化界面

【华为昇腾|CUDA】服务器A6000显卡部署LLM实战记录

huggingface笔记：文本生成Text generation

区块链技术促进算力生态发展的具体案例

【NVIDIA-H100】基于 nvidia-smi 数据H100 GPU 功耗异常深度分析与解决方案

如何在 Android Framework层面控制高通（Qualcomm）芯片的 CPU 和 GPU。

Tesla的FSD 架构设计

「源力觉醒 创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践

深度学习-Tensor

AI初学者如何对大模型进行微调？——零基础保姆级实战指南

服务器无对应cuda版本安装pytorch-gpu[自用]

「论文导读」LLM高效推理与模型量化

华为OD机试 - GPU 调度（Python/JS/C/C++ 2025 A卷 100分）

【TTS】2024-2025年主流开源TTS模型的综合对比分析

DeepSeek 部署中的常见问题及解决方案

ubuntu22.04从新系统到tensorflow GPU支持

基于 STM32+FPGA 的快速傅里叶频域图像在 TFT 中显示的设计与实现(项目资料)（ID:8）

「源力觉醒创作者计划」_以FastDeploy为例部署ERNIE-4.5-21B大模型全流程实践