E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Cuda编程
CUDA编程
指南阅读笔记(五)
4. CUDAC语言编程接口 接上篇文章继续写。4.3CUDACRuntime CUDACRuntime使用cudart动态链接库实现(cudart.dll或者cudart.so),运行时中所有的入口函数都以cuda为前缀。4.3.1初始化 CUDACRuntime函数库没有明确的初始化函数,在程序第一次调用Runtime库函数时它会自动初始化。因此,在记录Runtime函数调用
csgxy123
·
2013-08-16 10:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(四)
4.CUDAC语言编程接口接上篇文章继续写。4.2兼容性1、二进制兼容性二进制代码是设备相关的,使用NVCC编译器编译时,若指定-code选项,则会编译产生目标设备的二进制cubin对象。例如,编译时使用-code=sm_13会产生适用于计算能力1.3的二进制代码。二进制代码在CUDA计算设备上具有小版本的向前兼容性,但是在大版本上不具备兼容性。也就是说,对于计算能力X.y的硬件,使用-code=
绕梁九日
·
2013-08-15 22:24
CUDA
CUDA编程
指南阅读笔记(四)
4.CUDAC语言编程接口 接上篇文章继续写。4.2兼容性 1、二进制兼容性 二进制代码是设备相关的,使用NVCC编译器编译时,若指定-code选项,则会编译产生目标设备的二进制cubin对象。例如,编译时使用-code=sm_13会产生适用于计算能力1.3的二进制代码。二进制代码在CUDA计算设备上具有小版本的向前兼容性,但是在大版本上不具备兼容性。也就是说,对于计算能力X.y的硬件
csgxy123
·
2013-08-15 22:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(三)
4.CUDAC语言编程接口 异构程序设计跟传统的串行程序设计差别是很大的,学习起来也是非常不容易的。NVIDIA非常够意思,为了简化CUDA的学习曲线,它采用了绝大多数程序员都熟悉的C语言作为其根基,CUDAC是NVIDIA为程序员提供的一类编程接口,它实际上是一个C语言的扩展,在C的基础上增加了一些新的语法和变量,并且提供了功能丰富的库函数,方便程序员使用GPU进行异构计算。 除了前面
csgxy123
·
2013-08-15 18:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(二)
3.CUDA基本概念(下)3.3内存层次(MemoryHierarchy) 在GPU上CUDA线程可以访问到的存储资源有很多,每个CUDA线程拥有独立的本地内存(localMemory);每一个线程块(block)都有其独立的共享内存(sharedmemory),共享内存对于线程块中的每个线程都是可见的,它与线程块具有相同的生存时间;同时,还有一片称为全局内存(globalmemory)的区域
csgxy123
·
2013-08-15 13:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(一)
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
csgxy123
·
2013-08-01 20:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(一)
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
绕梁九日
·
2013-08-01 20:00
CUDA
CUDA最佳实践(二)
5.得到正解得到正确的计算结果是我们的最初目的,但是使用CUDA这种并行编程模型是很容易出错的,这时我们就需要一些方法和工具来帮助我们验证计算结果的正确性,同时,在
CUDA编程
中也有一些值得我们注意的问题
绕梁九日
·
2013-07-30 10:33
CUDA
CUDA最佳实践(二)
5.得到正解 得到正确的计算结果是我们的最初目的,但是使用CUDA这种并行编程模型是很容易出错的,这时我们就需要一些方法和工具来帮助我们验证计算结果的正确性,同时,在
CUDA编程
中也有一些值得我们注意的问题
csgxy123
·
2013-07-30 10:00
CUDA
性能优化
GPU
异构计算
CUDA最佳实践(一)
近期开始学习
CUDA编程
,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。
绕梁九日
·
2013-07-29 09:26
CUDA
CUDA最佳实践(一)
近期开始学习
CUDA编程
,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。
csgxy123
·
2013-07-29 09:00
CUDA
性能优化
GPU
异构计算
CUDA从入门到精通(零):写在前面
在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA编程
,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。
kkk584520
·
2013-07-22 21:00
CUDA
GPU
Ubuntu 9.04下
CUDA编程
起步
前一阵子把蚁群算法和改进的K-Means算法都搞定了,然后一直在看
CUDA编程
,前面看CUDA的介绍,一直认为会C之后CUDA就很容易上手,其实不然,还需要了解一些GPU的体系结构相关的知识才能写出好的程序来
caiye917015406
·
2013-07-09 22:00
OpenCV环境下
CUDA编程
示例
在CUDA平台上对图像算法进行并行加速是目前并行计算方面比较简单易行的一种方式,而同时利用OpenCV提供的一些库函数的话,那么事情将会变得更加easy。以下是我个人采用的一种模板,这个模板是从OpenCV里的算法CUDA源码挖掘出来的,我感觉这个用起来比较傲方便,所以经常采用。首先大牛们写的源码都很鲁棒,考虑的比较全面(如大部分算法将1,3,4通道的图像同时搞定),感觉还有一个比较神奇的地方在于
小牛蛋
·
2013-06-21 09:25
CUDA学习
OpenCV环境下
CUDA编程
示例
在CUDA平台上对图像算法进行并行加速是目前并行计算方面比较简单易行的一种方式,而同时利用OpenCV提供的一些库函数的话,那么事情将会变得更加easy。以下是我个人采用的一种模板,这个模板是从OpenCV里的算法CUDA源码挖掘出来的,我感觉这个用起来比较傲方便,所以经常采用。首先大牛们写的源码都很鲁棒,考虑的比较全面(如大部分算法将1,3,4通道的图像同时搞定),感觉还有一个比较神奇的地方在于
lucky_greenegg
·
2013-06-21 09:00
CUDA
opencv
GPU
cuda编程
之数据更新小技巧
不知道大家有没有遇到这样的情况:在某个迭代计算过程中,数组new的计算需要old的值,当计算完成后,需要把new的值写入old再下一次迭代?如果这里使用memcpy的方式,当数据量较大的时候会很耗时的!解决方法:交换指针也就是把指向设备内存new和old的指针进行交换,这样就避免了memcpy的时间消耗~当然用过的人无视以上内容~交换方法:定义一个函数voidpointerExch(void**p
zhuxianjianqi
·
2013-05-09 23:00
CUDA编程
疑问答疑
子说18:57:32 我有一个问题子说18:58:50 比如有几个int型的常数,需要在gpu显存里传入一份嘛子说18:59:04 还是在函数调用的时候传入子说18:59:09 哪一种更好19:14:27 作为函数的参数即可19:14:50 你要copy到globalmemory里面再用也可以19:15:02 作为参数可能更好一点子说19:16:07 我也是这么觉得子说19:16:40 那比如我
zhuxianjianqi
·
2013-05-08 19:00
CUDA编程
模型
阅读更多
CUDA编程
模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。
2012到2014
·
2013-04-18 16:00
线程
模型
CUDA编程
模型
CUDA编程
模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。
2012到2014
·
2013-04-18 16:00
线程
模型
CUDA编程
模型
阅读更多
CUDA编程
模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。
2012到2014
·
2013-04-18 16:00
线程
模型
cuda编程
基础学习初探
我的显卡配置�� 显卡类型:独立显�� 显卡芯片:NVIDIAGeForceGT520M 显存容量��1GB 显存类型:DDR3纠错 显存位宽��64bit 流处理器数量��48 DirectX��11如果显卡槽可以插多个显卡,那么为了提高效率,可以多插几个显卡。在�€个新的环境中编程�€发,必须先了解这个环境的配置,包括处理器、存储等信息,这样编写出来的程序才能具备�€优秀的效率�€�所以本文
huangfengxiao
·
2013-03-28 17:00
CUDA编程
简介
如今最为成熟的,还是Nvidia公司退推出的
CUDA编程
环境。
CUDA编程
环境使得基于GPU的通用计算编程变得越来越简单。 所以,我想对CUDA进行学习,以期能入GPU编程的门!
zhongjling
·
2013-03-04 22:00
CUDA编程
入门资源
开发环境配置CUDA开发环境配置: http://cuda.itpub.net/thread-1292849-1-1.htmlCUDAwin32XPSDK&ToolKit2.3配置说明: http://cuda.itpub.net/thread-1265732-1-3.html在windows下安装cuda: http://cuda.itpub.net/thread-1240059-1-4.htm
cc198877
·
2013-01-05 10:00
GPU
Cuda编程
学习过程中遇到的几个重要概念
转自:http://blog.csdn.net/pizi0475/article/details/7630248今天说说GPU的硬件结构中与CUDA相关的几个概念:thread block grid warp sp smsp:最基本的处理单元,streaming processor 最后具体的指令和任务都是在sp上处理的。GPU进行并行计算,也就是很多个sp同时做处理sm:多个sp加上其他
abaloon
·
2012-11-11 10:00
CUDA编程
常见问题
最近初试
cuda编程
,作为一个新手,遇到了各种各样的问题,然后花费了大量时间解决这些匪夷所思的问题。为了避免后来人重蹈覆辙,现把自己遇到的问题总结如下。
yutianzuijin
·
2012-11-05 10:07
编程语言
CUDA编程
CUDA编程
常见问题
最近初试
cuda编程
,作为一个新手,遇到了各种各样的问题,然后花费了大量时间解决这些匪夷所思的问题。为了避免后来人重蹈覆辙,现把自己遇到的问题总结如下。
yutianzuijin
·
2012-11-05 10:00
CUDA
GPU
分布式计算、并行计算及集群、网格、云计算的区别
例如基于
CUDA编程
。并行计算的目的就是提供单处理器无法提供的性能(处理器能力或存储器),
cuidiwhere
·
2012-08-19 23:42
大数据
分布式计算、并行计算及集群、网格、云计算的区别
例如基于
CUDA编程
。并行计算的目的就是提供单处理器无法提供的性能(处理器能力或存储器)
cuidiwhere
·
2012-08-19 23:00
集群
负载均衡
服务器
云计算
分布式计算
网格
(CUDA 编程9).CUDA shared memory使用------GPU的革命
(
CUDA编程
9).CUDAsharedmemory使用------GPU的革命作者:赵开勇来源:http://www.hpctech.com/2009/0818/207.html这一章节准备写一下sharedmemory
dmjlzygx
·
2012-07-29 09:48
C/C++
5月24日 – 6月11日
CUDA编程
学习笔记
1、下载CUDA工具包、驱动和SDK,依次安装,编译SDK里的工程文件,具体配置方法可谷歌百度,基本步骤就是先编译sdk里面的几个库,然后设置代码相应库函数关键字高亮。2、下载CUDA调试工具Nsight,可以实现单卡双机调试或双卡单机调试,虽然听说2.2可以单卡单机,但还没找到方法。具体调试可参考Nsight的help文档和cudabbs.it168.com上的别人笔记(CUDA双机Nsight
left_la
·
2012-06-12 21:00
编程
CUDA
include
generation
profiler
Linux下安装使用CUDA(ubuntu)
原文地址:ubuntu下OPTIMUS显卡
CUDA编程
bumblebee解决方法http://hpcbbs.it168.com/forum.php?
bendanban
·
2012-05-26 09:00
linux
CUDA
ubuntu
Path
library
tools
CUDA编程
时使用device全局变量遇到的错误
改写SDK时候,看到SDK在.cu中用了全局变量,我也顺手写了个__device__的全局指针用于存储数据,并且用cudamalloc分配,结果死活kernel无法启动,发现应该是给全局指针的分配不成功。上网看了资料,发了帖子http://topic.csdn.net/u/20120406/11/96e76e5d-0923-444e-9b62-abaeac28e676.html,都没找到解决办法。
lc19890326
·
2012-04-06 16:00
编程
CUDA
存储
CUDA编程
——纹理内存
【IT168文档】 (一)纹理属性(二)纹理拾取函数(三)拾取纹理内存与读取全局或常量内存相比的优点(一)纹理属性纹理可以在线性内存或是CUDA数组(纹理内存)的任何区域。所以纹理拾取也就对存在与线性内存或CUDA数组中的纹理读取数据。共用运行组件(既可以运行在host又可以运行在设备)中给出了纹理类型texture。纹理拾取的第一个参数就是纹理参考,纹理参考定义要拾取哪部分纹理内存,它必须
freeboy1015
·
2012-03-05 21:00
编程
CUDA
存储
文档
float
CUDA编程
接口:使用nvcc编译器的兼容性
相关阅读:
CUDA编程
接口:如何用nvcc编译CUDA程序
CUDA编程
模型:存储器层次和异构编程
CUDA编程
模型:内核与线程层次概述CUDA初探:从图形处理到通用并行计算CUDA初探:通用并行
wws5201985
·
2011-12-09 10:16
编程
二进制
兼容性
编译器
模型
CUDA编程
接口:使用nvcc编译器的兼容性
相关阅读:
CUDA编程
接口:如何用nvcc编译CUDA程序
CUDA编程
模型:存储器层次和异构编程
CUDA编程
模型:内核与线程层次概述CUDA初探:从图形处理到通用并行计算CUDA初探:通用并行
wws5201985
·
2011-12-07 08:46
编程
二进制
兼容性
编译器
模型
在ubuntu中更改默认的gcc和g++
最近在学习
CUDA编程
,搭建CUDA环境。
jubincn
·
2011-07-28 13:00
编程
gcc
ubuntu
CUDA
在ubuntu中更改默认的gcc和g++
最近在学习
CUDA编程
,搭建CUDA环境。
jubincn
·
2011-07-28 13:00
ubuntu
CUDA安装全过程
Windows7集成开发环境(IDE): MicrosoftVisualStudio2008SP1CUDA版本(CUDAVersion): 3.0进行
CUDA
linyunzju
·
2011-07-11 22:00
Microsoft
CUDA
ide
工具
文本编辑
wizard
CUDA学习(二)
今天我就来讲讲有关于CUDA的编程模型: 1.主机和设备
CUDA编程
模型将CPU作为主机(Host),GPU作为协处理器或者设备(Device),在一个系统中可以存在一个主机和若干个设备
smsmn
·
2011-04-12 16:00
多线程
数据结构
编程
CUDA
float
网格
cuda编程
-block和thread数量的确定
第一,thread 和block数量的受到gpu本身hard limit的限制第二,取决于目前shared memory and rigisters大小的限制,不能发布太多,否则系统会自动调用local memory,这样存取速度会下降,影响性能第三,取决具体的应用,比如:你的矩阵有1000* 1000,如果你设计的kenel 每个线程处理一行的话,你发布1000现在就够了,或者其他的方法来确定。
redline2005
·
2011-04-11 11:00
thread
编程
CUDA
基于Windows的CUDA安装 (Setup CUDA on Windows)
操作系统(OS): Windows7集成开发环境(IDE): MicrosoftVisualStudio2008SP1CUDA版本(CUDAVersion): 3.0 进行
CUDA
flyingworm_eley
·
2011-01-22 19:00
windows
CUDA
Microsoft
编译器
文本编辑
wizard
Cuda3.2+VS2010的环境配置
(一)开发硬件
Cuda编程
需要nVidia的显卡,太老的也不支持Cuda。可以在这里(http://www.nvidia.cn/object/cu
DayDreamingBoy
·
2011-01-09 16:00
windows
CUDA
Microsoft
开发工具
文本编辑
2010
深入浅出
CUDA编程
CUDA是NVIDIA的GPGPU模型,它使用C语言为基础,可以直接以大多数人熟悉的C语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。”编者注:NVIDIA的GeFoce8800GTX发布后,它的通用计算架构CUDA经过一年多的推广后,现在已经在有相当多的论文发表,在商业应用软件等方面也初步出现了视频编解码、金融、地质勘探、科学计算等领域的产品,是时候让我们对其
yanghangjun
·
2010-12-10 13:00
thread
编程
CUDA
express
float
conflict
基于Windows的CUDA安装 (Setup CUDA on Windows)
操作系统(OS): Windows7集成开发环境(IDE): MicrosoftVisualStudio2008SP1CUDA版本(CUDAVersion): 3.0进行
CUDA
pretend_b
·
2010-12-09 09:00
windows
CUDA
Microsoft
编译器
文本编辑
wizard
解决“两个CU文件冲突”expected an expression
最近在学习
cuda编程
,刚刚起步,未免有很多困难,也想把自己的每一步的历程记录下来,将每一个所犯的错误记下来,以便将来不会犯同一个错误。
linxue968
·
2010-12-02 10:00
CUDA
Build
float
编译器
Matrix
compilation
cuda的dll开发流程
前言:很久没写CUDA相关的文章了,其实也不是忙,只是零碎的事情比较多,不能抽出完整的时间写一些东西,在http://blog.csdn.net/openhero上写本来想写一些列
CUDA编程
的文章,不过现在看来
vbskj
·
2010-10-24 12:00
编程
timer
测试
CUDA
dll
wizard
常见的cuda出错及解决方法
记录一下最近在
CUDA编程
上遇到的错误,觉得有必要写一写,这里也不是一点技术含量也没有的...CUDA上获取错误信息是通过函数cudaGetErrorString()实现的,具体怎么用自己去查手册吧..
chengman2009
·
2010-04-11 23:00
cuda
windows
linux
编程
CUDA
常见的cuda出错及解决方法
记录一下最近在
CUDA编程
上遇到的错误,觉得有必要写一写,这里也不是一点技术含量也没有的...
chengman2009
·
2010-04-11 23:00
编程
windows
linux
CUDA
使用cufft库函数时产生链接错误问题的解决
最近学习
CUDA编程
,做一个基于cufft的GPUfft运算加速的实验,使用了cufft库中的一些函数,编译无措,连接报错,错误如下:1>sample.obj:errorLNK2019:unresolvedexternalsymbol_cufftDestroy
hadise
·
2010-02-01 16:00
VC/MFC
Windows
CUDA编程
环境搭建
1.CUDAtoolkit和sdk・CUDAToolkitversion1.1forWinXP・CUDASDKversion1.1forWinXPps: ・NVIDIADriverforMicrosoftWindowsXPwithCUDASupport(169.21)在开发的时候,这个可以不用安装,如果是有支持CUDA的显卡的时候,安装这个才有效)在安装过程中,会提醒你是否把sdk和toolkit
general195
·
2009-12-08 13:12
windows
CUDA
职场
休闲
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他