AllyLi0224

windows下搭建CUDA开发环境——GPU编程

引自：http://www.makaidong.com/yaoyuanzhi/archive/2010/11/13/1876215.html

本文我们以visual studio 2005 为例演示cuda的安装以及软件开发环境搭建，以及cuda与mfc联调的实现。

1．cuda安装包

cuda是免费使用的，各种操作系统下的cuda安装包均可以在http://www.nvidia.cn/object/cuda_get_cn.html上免费下载。cuda提供3个安装包，分别是： driver, toolkit和sdk。sdk包括许多例子程序和函数库。toolkit包括cuda的基本工具。安装时按照顺序，先安装driver，再toolkit，最后sdk。

cuda toolkit

安装后在nvidia_cuda_toolkit安装目录下出现6个文件夹，分别是：

bin ：工具程序和动态链接库

doc ：相关文档

include ： header头文件包

lib ：程序库

open64 ：基于open64的cuda compiler

src ：部分原始代码

安装过程中toolkit自动设定了3个环境变量：cuda_bin_path、cuda_inc_path和cuda_lib_path分别对应工具程序库、头文件库和程序库，预设路径为当前安装文件夹下的bin、include 和lib三个文件夹。

cuda sdk

sdk可以根据需要选择安装(推荐安装，因为sdk中的许多例子程序和函数库非常有用。

cuda display

对于没有安装nv显卡的计算机，不需要安装display安装包，程序也可以在模拟模式下运行。

2．在visual studio2005中使用cuda

cuda的主要工具是nvcc，它会执行所需要的程序，将cuda程序编译并执行。本文将介绍在windows环境下，基于vs 2005ide环境下的几种配置cuda nvcc的方法。

2.1 nv自带的修改模板方法

在cuda sdk安装目录下的project目录下新建文件夹，命名为想要建立的工程名字，比如test1。并在project文件夹下找到sdk自带的template文件夹，将template文件夹下所有的文件copy到test1下。

将copy到test1文件夹下的所有文件文件名中的template改为test（也即是自己的工程文件名字）。test.sln与test.vcproj是vs 8系列的工程文件，test_vc7.sln与test_vc7.vcproj是vs 7系列的工程文件，可以根据自己visual studio的版本选择要更改的工程文件，其它两个可以删除。在visual studio c++ 2005 express中，删除test_vc7.sln与test_vc7.vcproj即可。

将*.cu、*.sln和*.vcproj用记事本等文字编辑软件其他打开，使用查找替换功能将以上文件中所有的template改为test。

使用*.sln文件打开整个工程，可以任意更改代码，编译运行。

修改输出文件路径（可选，如不改变，可执行文件输出到上两级目录下的bin目录中），如使用了cuda sdk中的动态链接库，将相应的动态链接库拷贝到可执行文件的同一目录下。

总结：这种方法是nv公司为windows下使用vs编译cuda提供的标准方法（参见\sdk\doc\cuda_sdk_release_notes_windows.txt），使用公司提供的模板更改为自己想要建立的工

此文来自: 马开东博客转载请注明出处网址： http://www.makaidong.com

程，也可以参照以上方法，在sdk project库中的找到与自己想建立工程相近的其它工程做更改。

2.2 在win32项目中建立.cu文件

首先建立一个c++的win32的控制台应用程序empty project，并添加一个新的源文件，此处以main.cu为例。

p1.建立一个win32 project

设定为empty project

p3.建立一个cuda程序专用的main.cu文件

在solution explorer 中main.cu上右键单击，选择property。在打开的对话框中选择general，确定tool的选项是custom build tool。

确认tool选项为custom build tool。

选择custom bulid step，在command line中分别设定模式参数。这里要分几种编译方式来设定命令行参数。

(1)、release 模式："$(cuda_bin_path)\nvcc.exe" -ccbin "$(vcinstalldir)bin" -c -dwin32 -d_console -d_mbcs -xcompiler /ehsc,/w3,/nologo,/wp64,/o2,/zi,/mt -i"$(cuda_inc_path)" -o $(configurationname)\$(inputname).obj $(inputfilename)

(2)、debug 模式："$(cuda_bin_path)\nvcc.exe" -ccbin "$(vcinstalldir)bin" -c -d_debug -dwin32 -d_console -d_mbcs -xcompiler /ehsc,/w3,/nologo,/wp64,/od,/zi,/rtc1,/mtd -i"$(cuda_inc_path)" -o $(configurationname)\$(inputname).obj $(inputfilename)

如果计算机中没有安装nv显卡，使用模拟模式，需增加两个额外的设定。新建两个模式emurelease和emudebug。

p6.新建模式（1）

p6.新建模式（2）

对新建立的emurelease和emudebug的command line分别设定为：

(1)、emurelease 模式："$(cuda_bin_path)\nvcc.exe" -ccbin "$(vcinstalldir)bin" -deviceemu -c -dwin32 -d_console -d_mbcs -xcompiler /ehsc,/w3,/nologo,/wp64,/o2,/zi,/mt -i"$(cuda_inc_path)" -o $(configurationname)\$(inputname).obj $(inputfilename)

(2)、emudebug 模式："$(cuda_bin_path)\nvcc.exe" -ccbin "$(vcinstalldir)bin" -deviceemu -c -d_debug -dwin32 -d_console -d_mbcs -xcompiler /ehsc,/w3,/nologo,/wp64,/od,/zi,/rtc1,/mtd -i"$(cuda_inc_path)" -o $(configurationname)\$(inputname).obj $(inputfilename)

3.1.4、对所有的设定模式，均在 custom build step 的 outputs 中加入 $(configurationname)\$(inputname).obj。

p7.设定outputs

右键单击project，选择property，再选择linker，对所有模式修改以下设定：

(1)、general/enable incremental linking：no

(2)、general/additional library directories：$(cuda_lib_path)

(3)、input/additional dependencies：cudart.lib

p8.设定linker参数（1）

p9.设定linker参数（2）

设置头文件路径tools -> options，弹出以下对话框

将右边的下拉框选择include files，点击添加按钮，将c:\program files\nvidia corporation\nvidia cuda sdk\common\inc选入到头文件搜索路径中。

选择链接库文件路径

同上库头文件路径选择，将右边下拉框选择library file，选择路径c:\program files\nvidia corporation\nvidia cuda sdk\common\lib。

完成，可以编写cuda程序，并直接编译执行了（编译方式于c++相同）

总结：这种方法既不需要借助模板，也不需要使用第三方的软件其他。但是操作相当复杂，而且仅对配置的单个project有效。如果重新建立一个project又要重新配置一遍。

需要注意的是，当需要使用cuda sdk中的动态链接库（以dll为后缀）时，将动态链接库和生成的可执行文件放在同一个路径下。

如果是driver api，需要添加”cuda.lib cudart.lib”，头文件#include ,#include。

2.3 使用cuda_vs_wizard插件

下载cuda_vs_wizard插件并安装。

将cuda安装目录下的bin和cuda sdk安装目录下的bin\win32文件夹下的四个文件夹（debug, emudebug, release, emurelease）的路径全部加入环境变量中的path变量中。

使用vc直接建立工程。在工程选项里选择cudawinapp。

如果是在模拟模式下运行，需要在解决方案中右键属性，在configuration properities 中将configuration 设置为emu模式。

模拟模式设置（1）

模拟模式设置（2）。

总结：这种方法虽然使用了第三方的工具，但只需要配置一

您在找热搜关键词：

此文来自: 马开东博客转载请注明出处网址： http://www.makaidong.com

次即可，而且配置简单，以后每次建立cuda程序都可以直接生成。如果是建立预定义头文件的工程，则建立的cuda程序，会自带一个sample.cu，可以选择在sample.cu的基础上更改或删除sample.cu重新建立.cu文件。如果是建立空工程则没有。建立方法.cu文件的方法是建立.cpp文件或.txt文件改名为.cu文件即可。推荐使用。

2.4 语法高亮设置。

找到cuda sdk安装目录下doc\syntax_highlighting\自带的文件usertypt.dat，将其copy到microsoft visual studio 安装目录的\common7\ide下。

在visual studio中做以下设置：在tools-> options ->text editor-> file extension中添加cu。编辑方式microsoft visual c++。

p16.设置高亮

重新启动visual studio，完成高亮设置。

？？

3.配置生成规则。将sdk目录下c/common目录下的cuda,rules拷贝到vs安装目录下的vc\vcprojectdefaults子目录下。建立一个 win32工程，并在项目上右击，选择custombuildrules,在cuda build rule前打勾。在工程中新建一个.cu文件，右击属性后查看自定义生成规则是否已经是cuda build rule。

3. cuda在mfc中的联调方法实例

3.1 sdk中程序的编译

例如我们的sdk安装路径“c:\program files\nvidia corporation\nvidia cuda sdk\projects\devicequery”中可以找到devicequery的工程文件。

当我们把这个文件夹拷贝到其他目录下时，会出现找不到头文件的错误，如“找不到cutil.h”。为什么会出现这种情况呢？我们注意到在devicequery中对其的引用#include ，是在系统目录下的。这个系统目录在c:\program files\nvidia corporation\nvidia cuda sdk\common\inc中可以找到cutil.h头文件。

通过查看devicequery.cu的属性，通过观察“命令行”：

"$(cuda_bin_path)\nvcc.exe" -ccbin "$(vcinstalldir)bin" -c -d_debug -dwin32 -d_console -d_mbcs -xcompiler /ehsc,/w3,/nologo,/wp64,/od,/zi,/rtc1,/mtd -i"$(cuda_inc_path)" -i./ -ihttp://www.makaidong.com/common/inc -o $(configurationname)\devicequery.obj devicequery.cu

注意红色下划线部分，带便往上退两个文件夹，然后进入commom文件夹中的inc文件夹。再比较之前的两个路径，这正好是decicequery.sin文件到cutil.h的一个访问的过程。

当我们将工程文件拷贝到新的目录下时，这样的一个访问方式必然会失效。于是我们需要做如下的一些设置。

1．首先我们需要将c:\program files\nvidia corporation\nvidia cuda sdk\bin\win32文件目录下的四个文件夹分别添加到环境变量里。

具体的操作方法是：”我的电脑” ->属性->高级->环境变量path，注意路径都是全路径，每个变量间用“;”分隔。

2．注意到这里面的系统变量nvsdkcuda_root为c:\program files\nvidia corporation\nvidia cuda sdk。

我们在转移了工程文件目录后，只需要将命令行进行修改。即将之前的红线部分作如下修改：

"$(cuda_bin_path)\nvcc.exe" -ccbin "$(vcinstalldir)bin" -c -d_debug -dwin32 -d_console -d_mbcs -xcompiler /ehsc,/w3,/nologo,/wp64,/od,/zi,/rtc1,/mtd -i"$(cuda_inc_path)" -i./ -i"$(nvsdkcuda_root)/common/inc" -o $(configurationname)\devicequery.obj devicequery.cu

3．此外我们还需要将“项目属性”的“链接器”做对应的修改。然后该程序即可正常编译运行。

3.2 mfc中应用cuda程序

本章建立一个mfc工程，然后在该工程中添加对cu文件中cuda程序的调用。本章还可参考sdk中的程序示例cppintegration。

3.2.1 配置visualstudio环境配置准备工作

语法高亮：将d:\programming\cuda\sdk\doc\syntax_highlighting\visual_studio_8里面的usertype.dat文件copy到microsoft visual studio 8\common7\ide目录下面（如果已经存在，就追加到原来的后面）。

设置vs2005环境（因为本程序将不仅仅是在cu文件中使用cuda函数了，其中还包括在cpp文件中使用，所以需要包括这些库）：

进入tools|options|projects and solutions|vc++directories 添加:

include files:

d:\programming\cuda\toolkit\include

d:\programming\cuda\sdk\common\inc

library files：

d:\programming\cuda\toolkit\lib

d:\programming\cuda\sdk\common\lib

source files：d:\programming\cuda\sdk\common\src 　　

文本编辑器设置：进入vc++ project settings：c/c++ file extensions：添加*.cu,在text editor-file extension：添加cu 对应editor到microsoft vc++ editor。　　

visual assist x设置（如果需要安装的话）：关闭已经所有打开的visual studio，安装va，之后进入注册表编辑器：hkey_current_user\software\whole tomato\vanet8 找到右边的extsource项，将其值添加.cu;.cuh;之后关闭，再次打开vs2005即可。）

3.2.2 创建全局函数和头文件

首先我们在头文件和资源文件中建立全局函数以供调用：

这里的testcuda函数采用extern关键字声明c语言扩展。

我们在查看类视图的时候就可以看到该全局函数：

3.2.3 创建cuda代码

为了标示清楚，我们首先创建了一个名为cuda的筛选器，然后在该筛选器中分别创建名为first.cu和first_kernel.cu的两个源代码文件。然后其中添加代码如下：

#include "stdio.h"

#include "cutil.h"

#include "first_kernel.cu"

extern "c" void runtest(float *source,int datalen,float *result)

{

int count;

cudagetdevicecount(&count);

if(count == 0) {

fprintf(stderr, "there is no device.\n");

*result=-1;

}

int i;

for(i = 0; i < count; i++) {

cudadeviceprop prop;

if(cudagetdeviceproperties(&prop, i) == cudasuccess) {

if(prop.major >= 1) {

break;

}

if(i == count) {

fprintf(stderr, "there is no device supporting cuda 1.x.\n");

*result=-1;

}

float * d_source,*d_result;

cudamalloc((void**)&d_source,datalen*sizeof(float));

cudamalloc((void**)&d_result,sizeof(float));

cudamemcpy(d_source,source,datalen*sizeof(float),cudamemcpyhosttodevice);

kernel<<<1,256,0>>>(d_source,datalen,d_result);

cudamemcpy(result,d_result,sizeof(float),cudamemcpydevicetohost);

cudafree(d_source);

cudafree(d_result);

}

以及在first_kernel.cu中添加的内核函数（即并行部分）：

#ifndef _first_kernel_h_

#define _first_kernel_h_

__global__ void kernel(float *source,int len,float *result)

{

int i;

float sum;

sum=0;

for(i=0;i

sum+=*(source+i);

*result=sum;

}

#endif

3.2.3 修改链接器设置

首先是first.cu的属性设置：

将“常规”中的工具一项设为“自定义生成工具”。

然后在命令行中参考3.1中的设置方式。这里需要注意的是“附加依赖项”为first_kernel.cu.

而在first_kernel.cu中的属性设置，我们需要将这个存放内核函数的文件“从生成中排除”。

最后是设置项目的属性，仍旧参照3.1在“项目属性”的“链接器”的属性中作一些改动。

&nb

搜索此文相关文章： CUDA 在 Windows 下的软件开发环境搭建

此文链接：http://www.makaidong.com/%E5%8D%9A%E5%AE%A2%E5%9B%AD%E6%B1%87/38217.shtml

原文链接：地址

cuda编程python接口_使用Python写CUDA程序的方法 weixin_39822184 cuda编程python接口
使用Python写CUDA程序有两种方式：*Numba*PyCUDAnumbapro现在已经不推荐使用了，功能被拆分并分别被集成到accelerate和Numba了。例子numbaNumba通过及时编译机制(JIT)优化Python代码，Numba可以针对本机的硬件环境进行优化，同时支持CPU和GPU的优化，并且可以和Numpy集成，使Python代码可以在GPU上运行，只需在函数上方加上相关的指
Python成第四个支持CUDA的编程语言
Python成第四个支持CUDA的编程语言3月19日NVIDIA的GTC2013图形技术大会将开幕，在此之前会有很多宣传造势内容，其中最重大也是最主要的就是NVIDIA老总黄仁勋的开幕词了，其他合作伙伴也会发布各自的演讲。ContinuumAnalytics联合NVIDIA宣布将会引入新的PythonCUDA编译器——NumbaPro，Python也成为继C、C++以及Fortan之后的第四个支持
从 0 到 1 搞定nvidia 独显推流：硬件视频编码环境安装完整学习笔记 lxmyzzs 图像算法之音视频编解码音视频学习笔记
笔记用于安装和配置一套完整的媒体处理工具链，包括NVIDIA编码头文件、带CUDA加速的FFmpeg以及ZLMediaKit流媒体服务框架，适用于需要进行视频编解码、流媒体推流/拉流等场景的开发与部署。标题核心组件及版本说明nv-codec-headers来源：Gitee仓库jario-jin/nv-codec-headers版本：n11.1.5.0（对应NVIDIAVideoCodecSDK接口
AI周报：技术面试卷出新高度，Agent落地开启“工具觉醒”时代哪小吒圈子人工智能语言模型
一句话暴论：当面试官要求手搓FP16精度时，真正的考题是“你能否在硅基文明觉醒前跟上进化速度”。一、面试地狱难度实录（开发者生存指南）百度二面手搓FP16精度：考的不是浮点数，而是对硬件底层的敬畏（原文）腾讯夺命11连问：混元大模型面试暴露行业真相——懂原理已不够，得会调参、训推、修故障的“全栈炼丹师”（解析)NVIDIA四轮拷打实录：GPU厂面试竟考Attention优化！LightingAtt
EP 设备间P2P 与基于pcie switch 的p2p区别 zly8865372 p2p 网络协议网络
在PCIe（PeripheralComponentInterconnectExpress）系统中，Endpoint(EP)设备之间的P2P通信和通过PCIeSwitch的P2P通信是两种不同的直接数据传输方式，它们在路径、性能、配置和适用场景上存在显著差异。以下是详细对比分析：1.基本概念(1)EP设备直接P2P定义：两个PCIeEndpoint（如GPU、NVMeSSD、网卡）不经过Switch
基于国产手机 SoC 的多模态模型推理加速实战：GPU × NPU 协同优化全流程解析观熵智能终端Ai探索与创新实践人工智能 android NPU GPU
基于国产手机SoC的多模态模型推理加速实战：GPU×NPU协同优化全流程解析关键词多模态模型推理、NPU硬件加速、GPU并行计算、国产手机SoC、端侧部署优化、华为昇腾NPU、小米Surge芯片、高通AIEngine、异构计算加速、TFLiteNNAPI、ONNXRuntimeEP摘要随着国产智能手机SoC（如华为昇腾、vivoV系列、小米Surge、紫光展锐、联发科Dimensity）的异构计算
精通 triton 使用 MLIR 的源码逻辑 - 第001节：triton 的应用简介
项目使用到MLIR，通过了解triton对MLIR的使用，体会到MLIR在较大项目中的使用方式，汇总一下。1.Triton概述OpenAITriton是一个开源的编程语言和编译器，旨在简化GPU高性能计算（HPC）的开发，特别是针对深度学习、科学计算等需要高效并行计算的领域。既允许开发者编写高度优化的代码，又不必过度关注底层硬件细节。这样，通过简化高性能计算，可以加速新算法的实现和实验。传统GPU
【Python 语法】Python 神经网络项目常用语法一杯水果茶！人生苦短我用 Python python
基础1.导入模块和包2.修改系统路径(sys.path.append)3.命令行参数解析(argparse模块)4.assert确保正确性5.main()脚本入口点6.辅助函数生成器函数`cycle(dl)`一、常用函数1.`.cuda()`/`.cpu()`和`torch.device`2.`torch.zeros`、`torch.randn`、`torch.arrange`、`torch.po
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
数字图像处理与Python语言实现-Box模糊CUDA实现视觉与物联智能数字图像处理与Python实现 python 深度学习计算机视觉图像处理 CUDA
Box模糊CUDA实现文章目录Box模糊CUDA实现1、Box模糊的基本原理2、算法优化：滑动窗口技术3、参数对模糊效果的影响4、Box模糊的优缺点5、与高斯模糊的对比6、实际应用场景7、算法实现7.1PyCUDA实现7.2CuPy实现7.3C++与CUDA实现8、总结在图像处理领域，**Box模糊（方框模糊或均值模糊）**是一种基础且高效的模糊算法，其核心思想是通过对像素邻域内的颜色值取平均值来
2018 MacBook Pro 安装cuda+cuDNN+pytorch
2018MacBookPro安装cuda+cuDNN+pytorch根据CSDN上的两篇文章和知乎上的一篇文章，前前后后折腾了好几天，在一个小姐姐的帮助下终于装上了。我的环境系统版本：macOS10.13.6(17G10021)GPUDriverVersion:387.10.10.10.40.133CUDADriverVersion:410.130CUDA：cuda_10.0.130cuDNN：c
mac的m芯片上跑cuda程序 xinxuann macos
config里parser.add_argument('--device',type=str,default='mps')main里device=torch.device(cfg['device'])train里x_batch=x_batch.astype('float32')y_batch=y_batch.astype('float32')aux_batch=aux_batch.astype('
CUDA在不受支持的macOS系统上使用（BigSur） ilovefifa2020 macos github 经验分享大数据功能测试 python c++
CUDA与WebDriver在macOS系统上不是同一个东西，CUDA是一个图形库，用于使用GPU在某些软件中进行计算或渲染，只安装CUDA不能使Maxwell和Pascal核心显卡工作，必须同时安装WebDriver，其他核心（如Fermi、kepler)等可以在不安装WebDriver的情况下让CUDA工作。果粉众所周知，CUDA与WebDriver只能在支持的macOS系统HighSierr
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
buntu 22.04 上离线安装Docker 25.0.5（二）努力一点948 底层ubuntu系统入门 docker 容器运维人工智能 linux 服务器 gpu算力
以下有免费的4090云主机提供ubuntu22.04系统的其他入门实践操作地址：星宇科技|GPU服务器高性能云主机云服务器-登录相关兑换码星宇社区---4090算力卡免费体验、共享开发社区-CSDN博客兑换码要是过期了，可以私信我获取最新兑换码！！！之所以推荐给大家使用，是因为上面的云主机目前是免费使用的，不需要大家再去安装虚拟机，部署虚拟机，环境都搭配好了，非常适合新手入门，减少搭建的时间，把时
autodl云计算平台使用ollama 部署lightrag 加入streamlit界面 42fourtytoo 云计算深度学习 pytorch 学习
1到autodl的算力市场里开一台机器镜像选择：PyTorch2.3.0、Python3.12(ubuntu22.04)、Cuda12.1我本来选择的Cuda12.4，但版本过高疑似会使ollama不使用GPU而只用CPU，后来换个镜像就好了2下载lightrag从lightrag的GitHub界面下载zip开机，上传zip，解压到autodl-tmp/lightrag下安装依赖，在文件夹下：pi
大模型部署的整体架构 flyair_China 人工智能云计算架构
一、大模型部署架构1.1部署架构大模型部署的整体架构是一个多层次、软硬件协同的系统工程，旨在解决模型规模庞大、计算资源密集、延迟敏感等挑战。1.1.1、基础架构层：硬件资源与网络算力集群GPU/NPU阵列：如NVIDIAA100/H100/H200/H800、华为昇腾、昆仑芯等，支持FP16/INT8量化计算，显存带宽需达TB级（如HBM3e显存带宽达3.35TB/s）。异构计算：CPU+GPU/
高通手机跑AI系列之——人像与背景分割伊利丹~怒风 Qualcomm 人工智能智能手机 python arm AI编程
环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能越好的手机运行速度越快软件APP：AidLux2.0系统环境：Ubunt
英伟达：要取代我？其实CUDA也支持RISC-V EEPW电子产品世界 risc-v
第五届RISC-V中国峰会于2025年7月16至19日在上海张江科学会堂隆重举办，在峰会的圆桌讨论中，主持人曾经提出这样一个问题：你认为RISC-V未来会取代GPU吗？在现场观众投票中，支持会取代的现场观众占据将近半数。不过在随后的主题演讲中，英伟达副总裁FransSijstermanns特别提到了英伟达在自家的计算平台实现了RISC-V应用处理器部署。在做这次演讲准备的时候，FransSijst
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
Blender 云渲染高效流程：渲染 101 集群加速实战渲染101专业云渲染 blender houdini 分布式服务器 maya
一、核心优势：适配Blender全场景需求✅全渲染器深度兼容Cycles（CPU/GPU模式）：云端4090显卡渲染速度比本地快12倍，支持8K分辨率+16K纹理无压力Eevee实时渲染：集群同步输出预览动画，帧间延迟控制在0.5秒内，迭代效率提升300%插件无缝衔接：自动适配GeoNodes节点树、Hair粒子系统，流体模拟缓存文件完整同步✅效率与成本双突破二、5步上云流程（新手友好版）文件预处
【科研绘图系列】R语言绘制配对散点图连线柱状图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制配对散点图连线柱状图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(ggpubr)library(patchwork)library(ggprism
【科研绘图系列】R语言绘制柱状散点连线图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制柱状散点连线图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(ggpubr)library(patchwork)library(ggprism
PyTorch的基础概念和复杂模型的基本使用香蕉可乐荷包蛋 AI大模型项目中的使用 pytorch 人工智能 python
文章目录一、PyTorch基础概念二、复杂模型的学习使用一、PyTorch基础概念张量（Tensor）操作：张量是PyTorch中的基本数据结构，类似于NumPy的数组，但支持GPU加速常见操作包括创建张量、张量运算、索引、切片等importtorch#创建张量x=torch.randn(3,4)y=torch.zeros(3,4)#张量运算z=x+y自动求导（Autograd）：PyTorch的
python3.9安装tensorflow-gpu 2.6.0和torch-gpu版本各依赖包的版本对应关系
首先使用的cuDNN（8.1）、CUDA（11.2）、tensorflow-gpu（2.6.0）、python（3.9）之间对应版本Window环境下安装pytorch下载地址tensorflow官网CUDA下载官网cuDNN下载官网注意：cuDNN需要注册absl-py0.15.0astunparse1.6.3cachetools5.3.2certifi2023.7.22charset-norm
TensorFlow GPU 2.10.1 for Python 3.9快速安装指南疑样
本文还有配套的精品资源，点击获取简介：TensorFlowGPU2.10.1是专为Windowsx64和Python3.9设计的TensorFlow版本，它集成了GPU支持以加快深度学习模型的训练。本指南提供了该版本的概述、安装步骤及注意事项，旨在帮助开发者利用其性能优势提升机器学习项目的效率。1.TensorFlowGPU介绍1.1TensorFlow的起源与功能TensorFlow是由Goog
深度学习方法生成抓取位姿与6D姿态估计的完整实现 ZPC8210 ROS 深度学习人工智能
如何将GraspNet等深度学习模型与6D姿态估计集成到ROS2和MoveIt中，实现高精度的机器人抓取系统。1.系统架构text[RGB-D传感器]→[物体检测与6D姿态估计]→[GraspNet抓取位姿生成]→[MoveIt运动规划]→[执行抓取]2.环境配置2.1安装依赖bash#安装PyTorch(根据CUDA版本选择)pip3installtorchtorchvisiontorchaud
Docker build ollama longze_7 ollama docker
dockerrun-d--gpus=all-vollama:/root/.ollama-p11434:11434--networkbridge--nameollamaollama/ollama
pytorch的学习笔记 wyn20001128 算法
一cuda 2006年，NVIDIA公司发布了CUDA(ComputeUnifiedDeviceArchitecture)，是一种新的操作GPU计算的硬件和软件架构，是建立在NVIDIA的GPUs上的一个通用并行计算平台和编程模型，它提供了GPU编程的简易接口，基于CUDA编程可以构建基于GPU计算的应用程序。 CPU是用于负责逻辑性比较强的计算，GPU专注于执行高度线程化的并行处理任务。所以
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l