E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【CUDA编程】
看cuda初级教程视频笔记(周斌讲的)--
CUDA编程
1
01年开始,研究人员把GPU当做数据并行协处理器(GPGPU)07年,英伟达发布CUDA(ComputeUniformDeviceArchitecture)统一计算设备架构08年,OpenCL规范,使得并行计算可以扩展到更多设备平台上去CUDA的一些信息(线程嘛)层次化线程集合Ahierarchyofthreadgroups,共享储存Sharedmemories,同步BarrierSynchron
ElegantIce
·
2015-03-17 19:19
cuda
6.1 CUDA: pinned memory固定存储
CPU和GPU内存交互在
CUDA编程
中,内存拷贝是非常费时的一个动作.从上图我们可以看出:1.CPU和GPU之间的总线bus是PCIe,是双向传输的.2.CPU和GPU之间的数据拷贝使用DMA机制来实现
Magnum Programm Life
·
2015-02-28 11:00
CUDA C 编程指导(二):
CUDA编程
模型详解
CUDA编程
模型详解本文以vectorAdd为例,通过描述C在CUDA中的使用(vectorAdd这个例子可以在CUDAsample中找到。)来介绍
CUDA编程
模型的主要概念。
FRD2009041510
·
2015-01-29 20:00
CUDA
编程模型
核函数
线程结构
异构结构
名词解释——分布式计算、并行计算及集群、网格、云计算的区别
例如基于
CUDA编程
。并行计算的目的就是提供单处理器无法提供的性能(处理器能力或存储器),使用多处理器求解单个问题。总结:并行的主体 -- 处理器;进程/线程级并行。
SprintfWater
·
2015-01-14 15:00
【CUDA并行编程之四】矩阵相乘
前面介绍了基本的
Cuda编程
的相关知识,那么这一篇在此基础之上来看看GPU在处理数据计算上的高效能,我们拿矩阵相乘来作为例子。1.CPU上执行矩阵相乘以及性能。
lavorange
·
2014-12-12 23:00
CUDA
并行计算
矩阵相乘
CUDA编程
入门指南
www.cnblogs.com/stewart/archive/2013/01/05/2846860.html目录:1.什么是CUDA2.为什么要用到CUDA3.CUDA环境搭建4.第一个CUDA程序5.
CUDA
lushuner
·
2014-11-16 11:00
CUDA编程
指南阅读笔记
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
zhuanshenweiliu
·
2014-11-11 09:00
CUDA
并行计算
高性能
并行编程
CUDA编程
->CUDA入门了解(一)
安装好CUDA6.5+VS2012,操作系统为Win8.1版本,首先下个GPU-Z检测了一下: 看出本显卡属于中低端配置,关键看两个: Shaders=384,也称作SM,或者说core/流处理器数量,数量越大,执行并行线程越多,单位时间计算量也就越大。 BusWidth=64Bit,这个越大,数据的处理速度也就越快 接下来看看CUDA的布局: 看到这个布
sunboyiris
·
2014-09-18 21:00
cuda总结(转)
基础扫盲
CUDA编程
技术扫盲贴http://cudabbs.it168.com/forum.php?
AmelieLiu
·
2014-08-21 16:52
cuda
常见的 CUDA 出错及解决方法
本文转载自: http://blog.csdn.net/chengman2009/article/details/5474141 记录一下最近在
CUDA编程
上遇到的错误,觉得有必要写一写,这里也不是一点技术含量也没有的
lzhlzz
·
2014-08-08 11:00
CUDA
显卡
错误
空间
CUDA编程
指南阅读笔记(六)
4. CUDAC语言编程接口 接上文。4.3CUDACRuntime4.3.3共享内存(SharedMemory) 共享内存是CUDA设备中非常重要的一个存储区域,有效地使用共享内存可以充分利用CUDA设备的潜能,极大提升程序性能。那么,共享内存有哪些特点呢? 1、共享内存(sharedMemory)是集成在GPU处理器芯片上的(on-chip),因此相比于存在于显存颗粒中的全局
sunmenggmail
·
2014-07-28 16:00
cuda编程
:关于共享内存(shared memory)和存储体(bank)的事实和疑惑
关于共享内存(sharedmemory)和存储体(bank)的事实和疑惑主要是在研究访问共享内存会产生bankconflict时,自己产生的疑惑。对于这点疑惑,网上都没有相关描述,不管是国内还是国外的网上资料。貌似大家都是当作一个事实,一个公理,而没有对其仔细研究。还是我自己才学疏浅,不知道某些知识。比如下面这篇讲解bankconflict的文章。http://cuda-programming.b
linger2012liu
·
2014-06-20 20:00
CUDA
memory
共享内存
deep
learning
conflict
bank
bank
云计算、分布式计算、并行计算、网格计算、集群
例如基于
CUDA编程
。并行计算的目的就是提供单处理器无法提供的性能(处理器能力或存储器),使用多处理器求解单个问题。总结:并行的主
andywuchuanlong
·
2014-05-17 22:00
CUDA学习,第一个kernel函数及代码讲解
前一篇CUDA学习,我们已经完成了编程环境的配置,现在我们继续深入去了解
CUDA编程
。
helei001
·
2014-05-13 22:00
cuda编程
:不要在一个cpp文件中声明__device__和__global__函数
比如一下代码是正常的:kernel.hextern__global__voidkernel();kernel.cu#include#include"kernel.h"__global__voidkernel(){printf("helloworld!");}test.cu#include"kernel.h"intmain(void){kernel>>();cudaDeviceSynchronize
lingerlanlan
·
2014-05-08 22:26
cuda(GPU
programming)
cuda编程
:不要在一个cpp文件中声明__device__和__global__函数
比如一下代码是正常的:kernel.hextern__global__voidkernel();kernel.cu#include #include"kernel.h" __global__voidkernel() { printf("helloworld!"); }test.cu#include"kernel.h" intmain(void) { kernel>>(); cudaDeviceSy
linger2012liu
·
2014-05-08 22:00
CUDA
核函数
CUDA学习,环境配置和简单例子
本博文主要介绍
CUDA编程
,分为两部分来阐释,第一部分简单配置一下编程环境,第二部分编写一
何雷
·
2014-04-07 22:28
C/C++
CUDA
CUDA学习,环境配置和简单例子
本博文主要介绍
CUDA编程
,分为两部分来阐释,第一部分简单配置一下编程环境,第二部分编写一
helei001
·
2014-04-07 22:00
C++
CUDA
VS2010
用cuda实现图像缩放(从中领悟到了学习
cuda编程
的方法)
最近在cuda实现HOG特征抽取。感觉算法中有不少地方可以并行化,但是怎么并行化才会优化性能,自己还没有找到很明确的方法。 HOG特征抽取有一个步骤是图像缩放,我也将图像缩放实现了cuda并行化操作。下面以这个简单的例子谈谈cuda并行化编程的感受。 首先肯定是要了解图像缩放的算法,我参考了下面的资料,了解了双线性插值算法。双线性插值实现的缩放http://blog.csd
linger2012liu
·
2014-03-21 11:00
c
性能
CUDA
并行计算
GPU
cuda编程
环境搭建
docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html我的安装环境:ubuntu12.04安装前准备:1验证你的GPU是否支持
cuda
linger2012liu
·
2014-03-10 11:00
CUDA
显卡
GPU
Udacity cs344-Introduction to Parallel Programming学习笔记-第一单元
开始学习
CUDA编程
,跟的是UDACITY的课程,这是他们的课程链接点击打开链接,这里把一些笔记心得记录下来,以作保存。
suda072605
·
2014-02-22 22:00
CUDA
programming
GPU
parallel
MOOC
Udacity
cuda入门之资料推荐
而且这本教材以层层深入的方式向我们展示了GPU的世界,从而引领我们进入
CUDA编程
的大门。首推。2.《高性能CUDA应用设计与开发》(美)robfarber著,于玉龙,唐堃译,郭禾,王宇新审校
充充
·
2014-02-21 19:57
GPU
Visual
Studio2010
CUDA内存使用
此外还有两个能被所有线程都访问的只读内存:constant和texture内存,如下图所示:
CUDA编程
模型假设系统由一个主机(CPU)和一个设备(GPU)
taigw
·
2014-02-19 16:00
CUDA5.5入门文章:VS10设置
在看了一些个
CUDA编程
相关的教材之后,我向大家推荐
wishchin
·
2013-12-31 09:00
CUDA从入门到精通
CUDA从入门到精通(零):写在前面在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA编程
,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择
Augusdi
·
2013-10-17 11:30
CUDA
CUDA从入门到精通
CUDA从入门到精通(零):写在前面在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA编程
,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择
Augusdi
·
2013-10-17 11:00
CUDA: 共享存储器实现矩阵相乘
相关阅读:
CUDA编程
接口:运行初始化与设备存储器
CUDA编程
接口:使用nvcc编译器的兼容性
CUDA编程
接口:如何用nvcc编译CUDA程序
CUDA编程
模型:存储器层次和异构编程
CUDA编程
模型:内核与线程层次概述正如在前面的文章提到的
Augusdi
·
2013-10-13 00:47
CUDA
CUDA: 共享存储器实现矩阵相乘
相关阅读:
CUDA编程
接口:运行初始化与设备存储器
CUDA编程
接口:使用nvcc编译器的兼容性
CUDA编程
接口:如何用nvcc编译CUDA程序
CUDA编程
模型:存储器层次和异构编程
CUDA
Augusdi
·
2013-10-13 00:00
cuda 初学大全
cuda初学大全原文:http://hi.baidu.com/coolrainbow/item/de05efc83151671a505058781硬件架构
CUDA编程
中,习惯称CPU为Host,GPU为
Augusdi
·
2013-10-09 23:29
CUDA
cuda 初学大全
cuda初学大全原文:http://hi.baidu.com/coolrainbow/item/de05efc83151671a50505878 1硬件架构
CUDA编程
中,习惯称CPU为Host,GPU
Augusdi
·
2013-10-09 23:00
cuda编程
基础
CUDA编程
模型
CUDA编程
模型将CPU作为主机,GPU作为协处理器(co-processor)或设备。在这个模型中,CPU负责逻辑性强的事务处理和串行计算,GPU则专注于高度线程化的并行处理任务。
Augusdi
·
2013-10-09 23:00
CUDA编程
指南阅读笔记
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
Augusdi
·
2013-10-09 16:00
CUDA最佳实践
近期开始学习
CUDA编程
,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。
Augusdi
·
2013-10-09 16:33
CUDA
CUDA最佳实践
近期开始学习
CUDA编程
,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。
Augusdi
·
2013-10-09 16:00
CUDA编程
札记
[cpp] viewplaincopyconst int N = 33 * 1024; const int threadsPerBlock = 256; const int blocksPerGrid = imin( 32, (N+threadsPerBlock-1) / threadsPerBlock ); __global__ void dot( flo
Augusdi
·
2013-10-08 14:00
CUDA编程
总结
Cuda编程
总结2013-10-120:32:46--------余家奎 参加书籍:NVIDIACUDACProgrammingGuideOpenGL编程指南 学习cuda例子中的总结1、__constant
Augusdi
·
2013-10-08 14:00
CUDA编程
基本概念与矩阵运算
1、并行计算1)单核指令级并行ILP---让单个处理器的执行单元可以同时执行多条指令2)多核并行TLP---在一个芯片上集成多个处理器核心,实现线程级并行3)多处理器并行---在一块电路板上安装多个处理器,并实现进程和线程级并行4)可借助网络实现大规模的集群或者分布式并行,每个节点就是一台独立的计算机,实现更大规模的并行计算。多线程编程既可以在多个CPU核心间实现线程级并行,也可以通过超线程等技术
Augusdi
·
2013-09-30 20:02
CUDA
CUDA编程
基本概念与矩阵运算
1、并行计算1)单核指令级并行ILP---让单个处理器的执行单元可以同时执行多条指令2)多核并行TLP---在一个芯片上集成多个处理器核心,实现线程级并行3)多处理器并行---在一块电路板上安装多个处理器,并实现进程和线程级并行4)可借助网络实现大规模的集群或者分布式并行,每个节点就是一台独立的计算机,实现更大规模的并行计算。多线程编程既可以在多个CPU核心间实现线程级并行,也可以通过超线程等技术
Augusdi
·
2013-09-30 20:00
CUDA在VS2010下5.5设置
在看了一些个
CUDA编程
相关的教材之后,我向大家推荐的一本教材叫做《GPU高性能编程CUDA实战》。本教材相比其他的教材而言,它讲得比较细,对于一些我们可能不太明白的知识点做了详细的说明。
Augusdi
·
2013-09-30 19:46
CUDA
CUDA在VS2010下5.5设置
在看了一些个
CUDA编程
相关的教材之后,我向大家推荐的一本教材叫做《GPU高性能编程CUDA实战》。本教材相比其他的教材而言,它讲得比较细,对于一些我们可能不太明白的知识点做了详细的说明。
Augusdi
·
2013-09-30 19:00
CUDA之Hello World
Cuda编程
环境的搭建: 网上针对不同的操作系统和cuda版本有很多详细的安装说明,推荐使用安装CudaVSWizard,下载地址http://sourceforge.net/projects/cudavswizard
Augusdi
·
2013-09-30 19:00
CUDA编程
基础
CUDA编程
模型
CUDA编程
模型将CPU作为主机,GPU作为协处理器(co-processor)或设备。在这个模型中,CPU负责逻辑性强的事务处理和串行计算,GPU则专注于高度线程化的并行处理任务。
Augusdi
·
2013-09-30 11:00
CUDA编程
www.cnblogs.com/stewart/archive/2013/01/05/2846860.html目录:1.什么是CUDA2.为什么要用到CUDA3.CUDA环境搭建4.第一个CUDA程序5.
CUDA
Augusdi
·
2013-09-30 10:22
CUDA
CUDA编程
www.cnblogs.com/stewart/archive/2013/01/05/2846860.html目录:1.什么是CUDA2.为什么要用到CUDA3.CUDA环境搭建4.第一个CUDA程序5.
CUDA
Augusdi
·
2013-09-30 10:00
CUDA编程
札记
constintN=33*1024; constintthreadsPerBlock=256; constintblocksPerGrid= imin(32,(N+threadsPerBlock-1)/threadsPerBlock); __global__voiddot(float*a,float*b,float*c){ __shared__floatcache[threadsPerBloc
celerychen2009
·
2013-09-07 14:00
CUDA编程
指南阅读笔记(七)
为方便起见后面的内容将按照话题来分类~异步并行执行主机和设备间并行执行为了支持主机和设备的并行执行,CUDA提供了一些异步函数。异步是指设备在完成功能执行之前就将控制权交还给主机线程,以便主机线程继续执行。这些函数有:1、内涵启动(KernelLaunches);2、同一设备内存中两个地址块之间的数据传输;3、从主机到设备的小于或等于64KB的一次数据块传输;4、使用Async前缀函数进行的数据传
绕梁九日
·
2013-09-03 17:09
CUDA
CUDA编程
指南阅读笔记(七)
为方便起见后面的内容将按照话题来分类~异步并行执行主机和设备间并行执行 为了支持主机和设备的并行执行,CUDA提供了一些异步函数。异步是指设备在完成功能执行之前就将控制权交还给主机线程,以便主机线程继续执行。这些函数有: 1、内涵启动(KernelLaunches); 2、同一设备内存中两个地址块之间的数据传输; 3、从主机到设备的小于或等于64KB的一次数据块传输;
csgxy123
·
2013-09-03 17:00
CUDA
性能优化
GPU
异构计算
[CUDA学习笔记]从Hello Cuda开始
Cuda编程
环境的搭建: 网上针对不同的操作系统和cuda版本有很多详细的安装说明,推荐使用安装CudaVSWizard,下载地址http://sourceforge.net/projects/cudavswizard
jonny_super
·
2013-09-02 11:00
HelloCuda
CUDA编程
指南阅读笔记(六)
4.CUDAC语言编程接口接上文。4.3CUDACRuntime4.3.3共享内存(SharedMemory)共享内存是CUDA设备中非常重要的一个存储区域,有效地使用共享内存可以充分利用CUDA设备的潜能,极大提升程序性能。那么,共享内存有哪些特点呢?1、共享内存(sharedMemory)是集成在GPU处理器芯片上的(on-chip),因此相比于存在于显存颗粒中的全局内存(globalMemo
绕梁九日
·
2013-08-17 12:53
CUDA
CUDA编程
指南阅读笔记(六)
4. CUDAC语言编程接口 接上文。4.3CUDACRuntime4.3.3共享内存(SharedMemory) 共享内存是CUDA设备中非常重要的一个存储区域,有效地使用共享内存可以充分利用CUDA设备的潜能,极大提升程序性能。那么,共享内存有哪些特点呢? 1、共享内存(sharedMemory)是集成在GPU处理器芯片上的(on-chip),因此相比于存在于显存颗粒中的全局
csgxy123
·
2013-08-17 12:00
CUDA
性能优化
GPU
异构计算
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他