E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【CUDA编程】
CUDA编程
总结
Cuda编程
总结2013-10-120:32:46--------余家奎 参加书籍:NVIDIACUDACProgrammingGuideOpenGL编程指南 学习cuda例子中的总结1、__constant
Augusdi
·
2013-10-08 14:00
CUDA编程
基本概念与矩阵运算
1、并行计算1)单核指令级并行ILP---让单个处理器的执行单元可以同时执行多条指令2)多核并行TLP---在一个芯片上集成多个处理器核心,实现线程级并行3)多处理器并行---在一块电路板上安装多个处理器,并实现进程和线程级并行4)可借助网络实现大规模的集群或者分布式并行,每个节点就是一台独立的计算机,实现更大规模的并行计算。多线程编程既可以在多个CPU核心间实现线程级并行,也可以通过超线程等技术
Augusdi
·
2013-09-30 20:02
CUDA
CUDA编程
基本概念与矩阵运算
1、并行计算1)单核指令级并行ILP---让单个处理器的执行单元可以同时执行多条指令2)多核并行TLP---在一个芯片上集成多个处理器核心,实现线程级并行3)多处理器并行---在一块电路板上安装多个处理器,并实现进程和线程级并行4)可借助网络实现大规模的集群或者分布式并行,每个节点就是一台独立的计算机,实现更大规模的并行计算。多线程编程既可以在多个CPU核心间实现线程级并行,也可以通过超线程等技术
Augusdi
·
2013-09-30 20:00
CUDA在VS2010下5.5设置
在看了一些个
CUDA编程
相关的教材之后,我向大家推荐的一本教材叫做《GPU高性能编程CUDA实战》。本教材相比其他的教材而言,它讲得比较细,对于一些我们可能不太明白的知识点做了详细的说明。
Augusdi
·
2013-09-30 19:46
CUDA
CUDA在VS2010下5.5设置
在看了一些个
CUDA编程
相关的教材之后,我向大家推荐的一本教材叫做《GPU高性能编程CUDA实战》。本教材相比其他的教材而言,它讲得比较细,对于一些我们可能不太明白的知识点做了详细的说明。
Augusdi
·
2013-09-30 19:00
CUDA之Hello World
Cuda编程
环境的搭建: 网上针对不同的操作系统和cuda版本有很多详细的安装说明,推荐使用安装CudaVSWizard,下载地址http://sourceforge.net/projects/cudavswizard
Augusdi
·
2013-09-30 19:00
CUDA编程
基础
CUDA编程
模型
CUDA编程
模型将CPU作为主机,GPU作为协处理器(co-processor)或设备。在这个模型中,CPU负责逻辑性强的事务处理和串行计算,GPU则专注于高度线程化的并行处理任务。
Augusdi
·
2013-09-30 11:00
CUDA编程
www.cnblogs.com/stewart/archive/2013/01/05/2846860.html目录:1.什么是CUDA2.为什么要用到CUDA3.CUDA环境搭建4.第一个CUDA程序5.
CUDA
Augusdi
·
2013-09-30 10:22
CUDA
CUDA编程
www.cnblogs.com/stewart/archive/2013/01/05/2846860.html目录:1.什么是CUDA2.为什么要用到CUDA3.CUDA环境搭建4.第一个CUDA程序5.
CUDA
Augusdi
·
2013-09-30 10:00
CUDA编程
札记
constintN=33*1024; constintthreadsPerBlock=256; constintblocksPerGrid= imin(32,(N+threadsPerBlock-1)/threadsPerBlock); __global__voiddot(float*a,float*b,float*c){ __shared__floatcache[threadsPerBloc
celerychen2009
·
2013-09-07 14:00
CUDA编程
指南阅读笔记(七)
为方便起见后面的内容将按照话题来分类~异步并行执行主机和设备间并行执行为了支持主机和设备的并行执行,CUDA提供了一些异步函数。异步是指设备在完成功能执行之前就将控制权交还给主机线程,以便主机线程继续执行。这些函数有:1、内涵启动(KernelLaunches);2、同一设备内存中两个地址块之间的数据传输;3、从主机到设备的小于或等于64KB的一次数据块传输;4、使用Async前缀函数进行的数据传
绕梁九日
·
2013-09-03 17:09
CUDA
CUDA编程
指南阅读笔记(七)
为方便起见后面的内容将按照话题来分类~异步并行执行主机和设备间并行执行 为了支持主机和设备的并行执行,CUDA提供了一些异步函数。异步是指设备在完成功能执行之前就将控制权交还给主机线程,以便主机线程继续执行。这些函数有: 1、内涵启动(KernelLaunches); 2、同一设备内存中两个地址块之间的数据传输; 3、从主机到设备的小于或等于64KB的一次数据块传输;
csgxy123
·
2013-09-03 17:00
CUDA
性能优化
GPU
异构计算
[CUDA学习笔记]从Hello Cuda开始
Cuda编程
环境的搭建: 网上针对不同的操作系统和cuda版本有很多详细的安装说明,推荐使用安装CudaVSWizard,下载地址http://sourceforge.net/projects/cudavswizard
jonny_super
·
2013-09-02 11:00
HelloCuda
CUDA编程
指南阅读笔记(六)
4.CUDAC语言编程接口接上文。4.3CUDACRuntime4.3.3共享内存(SharedMemory)共享内存是CUDA设备中非常重要的一个存储区域,有效地使用共享内存可以充分利用CUDA设备的潜能,极大提升程序性能。那么,共享内存有哪些特点呢?1、共享内存(sharedMemory)是集成在GPU处理器芯片上的(on-chip),因此相比于存在于显存颗粒中的全局内存(globalMemo
绕梁九日
·
2013-08-17 12:53
CUDA
CUDA编程
指南阅读笔记(六)
4. CUDAC语言编程接口 接上文。4.3CUDACRuntime4.3.3共享内存(SharedMemory) 共享内存是CUDA设备中非常重要的一个存储区域,有效地使用共享内存可以充分利用CUDA设备的潜能,极大提升程序性能。那么,共享内存有哪些特点呢? 1、共享内存(sharedMemory)是集成在GPU处理器芯片上的(on-chip),因此相比于存在于显存颗粒中的全局
csgxy123
·
2013-08-17 12:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(五)
4. CUDAC语言编程接口 接上篇文章继续写。4.3CUDACRuntime CUDACRuntime使用cudart动态链接库实现(cudart.dll或者cudart.so),运行时中所有的入口函数都以cuda为前缀。4.3.1初始化 CUDACRuntime函数库没有明确的初始化函数,在程序第一次调用Runtime库函数时它会自动初始化。因此,在记录Runtime函数调用
csgxy123
·
2013-08-16 10:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(四)
4.CUDAC语言编程接口接上篇文章继续写。4.2兼容性1、二进制兼容性二进制代码是设备相关的,使用NVCC编译器编译时,若指定-code选项,则会编译产生目标设备的二进制cubin对象。例如,编译时使用-code=sm_13会产生适用于计算能力1.3的二进制代码。二进制代码在CUDA计算设备上具有小版本的向前兼容性,但是在大版本上不具备兼容性。也就是说,对于计算能力X.y的硬件,使用-code=
绕梁九日
·
2013-08-15 22:24
CUDA
CUDA编程
指南阅读笔记(四)
4.CUDAC语言编程接口 接上篇文章继续写。4.2兼容性 1、二进制兼容性 二进制代码是设备相关的,使用NVCC编译器编译时,若指定-code选项,则会编译产生目标设备的二进制cubin对象。例如,编译时使用-code=sm_13会产生适用于计算能力1.3的二进制代码。二进制代码在CUDA计算设备上具有小版本的向前兼容性,但是在大版本上不具备兼容性。也就是说,对于计算能力X.y的硬件
csgxy123
·
2013-08-15 22:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(三)
4.CUDAC语言编程接口 异构程序设计跟传统的串行程序设计差别是很大的,学习起来也是非常不容易的。NVIDIA非常够意思,为了简化CUDA的学习曲线,它采用了绝大多数程序员都熟悉的C语言作为其根基,CUDAC是NVIDIA为程序员提供的一类编程接口,它实际上是一个C语言的扩展,在C的基础上增加了一些新的语法和变量,并且提供了功能丰富的库函数,方便程序员使用GPU进行异构计算。 除了前面
csgxy123
·
2013-08-15 18:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(二)
3.CUDA基本概念(下)3.3内存层次(MemoryHierarchy) 在GPU上CUDA线程可以访问到的存储资源有很多,每个CUDA线程拥有独立的本地内存(localMemory);每一个线程块(block)都有其独立的共享内存(sharedmemory),共享内存对于线程块中的每个线程都是可见的,它与线程块具有相同的生存时间;同时,还有一片称为全局内存(globalmemory)的区域
csgxy123
·
2013-08-15 13:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(一)
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
csgxy123
·
2013-08-01 20:00
CUDA
性能优化
GPU
异构计算
CUDA编程
指南阅读笔记(一)
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
绕梁九日
·
2013-08-01 20:00
CUDA
CUDA最佳实践(二)
5.得到正解得到正确的计算结果是我们的最初目的,但是使用CUDA这种并行编程模型是很容易出错的,这时我们就需要一些方法和工具来帮助我们验证计算结果的正确性,同时,在
CUDA编程
中也有一些值得我们注意的问题
绕梁九日
·
2013-07-30 10:33
CUDA
CUDA最佳实践(二)
5.得到正解 得到正确的计算结果是我们的最初目的,但是使用CUDA这种并行编程模型是很容易出错的,这时我们就需要一些方法和工具来帮助我们验证计算结果的正确性,同时,在
CUDA编程
中也有一些值得我们注意的问题
csgxy123
·
2013-07-30 10:00
CUDA
性能优化
GPU
异构计算
CUDA最佳实践(一)
近期开始学习
CUDA编程
,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。
绕梁九日
·
2013-07-29 09:26
CUDA
CUDA最佳实践(一)
近期开始学习
CUDA编程
,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。
csgxy123
·
2013-07-29 09:00
CUDA
性能优化
GPU
异构计算
CUDA从入门到精通(零):写在前面
在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA编程
,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。
kkk584520
·
2013-07-22 21:00
CUDA
GPU
Ubuntu 9.04下
CUDA编程
起步
前一阵子把蚁群算法和改进的K-Means算法都搞定了,然后一直在看
CUDA编程
,前面看CUDA的介绍,一直认为会C之后CUDA就很容易上手,其实不然,还需要了解一些GPU的体系结构相关的知识才能写出好的程序来
caiye917015406
·
2013-07-09 22:00
OpenCV环境下
CUDA编程
示例
在CUDA平台上对图像算法进行并行加速是目前并行计算方面比较简单易行的一种方式,而同时利用OpenCV提供的一些库函数的话,那么事情将会变得更加easy。以下是我个人采用的一种模板,这个模板是从OpenCV里的算法CUDA源码挖掘出来的,我感觉这个用起来比较傲方便,所以经常采用。首先大牛们写的源码都很鲁棒,考虑的比较全面(如大部分算法将1,3,4通道的图像同时搞定),感觉还有一个比较神奇的地方在于
小牛蛋
·
2013-06-21 09:25
CUDA学习
OpenCV环境下
CUDA编程
示例
在CUDA平台上对图像算法进行并行加速是目前并行计算方面比较简单易行的一种方式,而同时利用OpenCV提供的一些库函数的话,那么事情将会变得更加easy。以下是我个人采用的一种模板,这个模板是从OpenCV里的算法CUDA源码挖掘出来的,我感觉这个用起来比较傲方便,所以经常采用。首先大牛们写的源码都很鲁棒,考虑的比较全面(如大部分算法将1,3,4通道的图像同时搞定),感觉还有一个比较神奇的地方在于
lucky_greenegg
·
2013-06-21 09:00
CUDA
opencv
GPU
cuda编程
之数据更新小技巧
不知道大家有没有遇到这样的情况:在某个迭代计算过程中,数组new的计算需要old的值,当计算完成后,需要把new的值写入old再下一次迭代?如果这里使用memcpy的方式,当数据量较大的时候会很耗时的!解决方法:交换指针也就是把指向设备内存new和old的指针进行交换,这样就避免了memcpy的时间消耗~当然用过的人无视以上内容~交换方法:定义一个函数voidpointerExch(void**p
zhuxianjianqi
·
2013-05-09 23:00
CUDA编程
疑问答疑
子说18:57:32 我有一个问题子说18:58:50 比如有几个int型的常数,需要在gpu显存里传入一份嘛子说18:59:04 还是在函数调用的时候传入子说18:59:09 哪一种更好19:14:27 作为函数的参数即可19:14:50 你要copy到globalmemory里面再用也可以19:15:02 作为参数可能更好一点子说19:16:07 我也是这么觉得子说19:16:40 那比如我
zhuxianjianqi
·
2013-05-08 19:00
CUDA编程
模型
阅读更多
CUDA编程
模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。
2012到2014
·
2013-04-18 16:00
线程
模型
CUDA编程
模型
CUDA编程
模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。
2012到2014
·
2013-04-18 16:00
线程
模型
CUDA编程
模型
阅读更多
CUDA编程
模型CUDA将CPU作为主机(Host),GPU作为设备(Device)。一个系统中可以有一个主机和多个设备。
2012到2014
·
2013-04-18 16:00
线程
模型
cuda编程
基础学习初探
我的显卡配置�� 显卡类型:独立显�� 显卡芯片:NVIDIAGeForceGT520M 显存容量��1GB 显存类型:DDR3纠错 显存位宽��64bit 流处理器数量��48 DirectX��11如果显卡槽可以插多个显卡,那么为了提高效率,可以多插几个显卡。在�€个新的环境中编程�€发,必须先了解这个环境的配置,包括处理器、存储等信息,这样编写出来的程序才能具备�€优秀的效率�€�所以本文
huangfengxiao
·
2013-03-28 17:00
CUDA编程
简介
如今最为成熟的,还是Nvidia公司退推出的
CUDA编程
环境。
CUDA编程
环境使得基于GPU的通用计算编程变得越来越简单。 所以,我想对CUDA进行学习,以期能入GPU编程的门!
zhongjling
·
2013-03-04 22:00
CUDA编程
入门资源
开发环境配置CUDA开发环境配置: http://cuda.itpub.net/thread-1292849-1-1.htmlCUDAwin32XPSDK&ToolKit2.3配置说明: http://cuda.itpub.net/thread-1265732-1-3.html在windows下安装cuda: http://cuda.itpub.net/thread-1240059-1-4.htm
cc198877
·
2013-01-05 10:00
GPU
Cuda编程
学习过程中遇到的几个重要概念
转自:http://blog.csdn.net/pizi0475/article/details/7630248今天说说GPU的硬件结构中与CUDA相关的几个概念:thread block grid warp sp smsp:最基本的处理单元,streaming processor 最后具体的指令和任务都是在sp上处理的。GPU进行并行计算,也就是很多个sp同时做处理sm:多个sp加上其他
abaloon
·
2012-11-11 10:00
CUDA编程
常见问题
最近初试
cuda编程
,作为一个新手,遇到了各种各样的问题,然后花费了大量时间解决这些匪夷所思的问题。为了避免后来人重蹈覆辙,现把自己遇到的问题总结如下。
yutianzuijin
·
2012-11-05 10:07
编程语言
CUDA编程
CUDA编程
常见问题
最近初试
cuda编程
,作为一个新手,遇到了各种各样的问题,然后花费了大量时间解决这些匪夷所思的问题。为了避免后来人重蹈覆辙,现把自己遇到的问题总结如下。
yutianzuijin
·
2012-11-05 10:00
CUDA
GPU
分布式计算、并行计算及集群、网格、云计算的区别
例如基于
CUDA编程
。并行计算的目的就是提供单处理器无法提供的性能(处理器能力或存储器),
cuidiwhere
·
2012-08-19 23:42
大数据
分布式计算、并行计算及集群、网格、云计算的区别
例如基于
CUDA编程
。并行计算的目的就是提供单处理器无法提供的性能(处理器能力或存储器)
cuidiwhere
·
2012-08-19 23:00
集群
负载均衡
服务器
云计算
分布式计算
网格
(CUDA 编程9).CUDA shared memory使用------GPU的革命
(
CUDA编程
9).CUDAsharedmemory使用------GPU的革命作者:赵开勇来源:http://www.hpctech.com/2009/0818/207.html这一章节准备写一下sharedmemory
dmjlzygx
·
2012-07-29 09:48
C/C++
5月24日 – 6月11日
CUDA编程
学习笔记
1、下载CUDA工具包、驱动和SDK,依次安装,编译SDK里的工程文件,具体配置方法可谷歌百度,基本步骤就是先编译sdk里面的几个库,然后设置代码相应库函数关键字高亮。2、下载CUDA调试工具Nsight,可以实现单卡双机调试或双卡单机调试,虽然听说2.2可以单卡单机,但还没找到方法。具体调试可参考Nsight的help文档和cudabbs.it168.com上的别人笔记(CUDA双机Nsight
left_la
·
2012-06-12 21:00
编程
CUDA
include
generation
profiler
Linux下安装使用CUDA(ubuntu)
原文地址:ubuntu下OPTIMUS显卡
CUDA编程
bumblebee解决方法http://hpcbbs.it168.com/forum.php?
bendanban
·
2012-05-26 09:00
linux
CUDA
ubuntu
Path
library
tools
CUDA编程
时使用device全局变量遇到的错误
改写SDK时候,看到SDK在.cu中用了全局变量,我也顺手写了个__device__的全局指针用于存储数据,并且用cudamalloc分配,结果死活kernel无法启动,发现应该是给全局指针的分配不成功。上网看了资料,发了帖子http://topic.csdn.net/u/20120406/11/96e76e5d-0923-444e-9b62-abaeac28e676.html,都没找到解决办法。
lc19890326
·
2012-04-06 16:00
编程
CUDA
存储
CUDA编程
——纹理内存
【IT168文档】 (一)纹理属性(二)纹理拾取函数(三)拾取纹理内存与读取全局或常量内存相比的优点(一)纹理属性纹理可以在线性内存或是CUDA数组(纹理内存)的任何区域。所以纹理拾取也就对存在与线性内存或CUDA数组中的纹理读取数据。共用运行组件(既可以运行在host又可以运行在设备)中给出了纹理类型texture。纹理拾取的第一个参数就是纹理参考,纹理参考定义要拾取哪部分纹理内存,它必须
freeboy1015
·
2012-03-05 21:00
编程
CUDA
存储
文档
float
CUDA编程
接口:使用nvcc编译器的兼容性
相关阅读:
CUDA编程
接口:如何用nvcc编译CUDA程序
CUDA编程
模型:存储器层次和异构编程
CUDA编程
模型:内核与线程层次概述CUDA初探:从图形处理到通用并行计算CUDA初探:通用并行
wws5201985
·
2011-12-09 10:16
编程
二进制
兼容性
编译器
模型
CUDA编程
接口:使用nvcc编译器的兼容性
相关阅读:
CUDA编程
接口:如何用nvcc编译CUDA程序
CUDA编程
模型:存储器层次和异构编程
CUDA编程
模型:内核与线程层次概述CUDA初探:从图形处理到通用并行计算CUDA初探:通用并行
wws5201985
·
2011-12-07 08:46
编程
二进制
兼容性
编译器
模型
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他