E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Cuda编程
deep learning GPU如何选型号
本文首先根据显卡一些参数来推荐何种情况下选择何种gpu显卡,然后谈谈跟
cuda编程
比较相关的硬件架构。1.选择怎样的GPU型号这几年主要有AMD和NVIDIA在做显卡,
baobei0112
·
2016-03-21 17:00
CUDA范例精解通用GPU架构-(1)Tesla服务器Kepler架构和万年的HelloWorld
如果想通过本书进行
CUDA编程
,又不太懂CUDA和GPU的架构,可以将这个博客作为入门博客(但是希望你能有些基础,因为我介绍的并不是特别全面,只是捡了一些我困惑很久后来明白的知识点,如果完全不懂GPU的话
Mereyct
·
2016-03-21 10:00
闵大荒之旅(五) ----- OpenCV与
CUDA编程
的结合
参考http://www.cnblogs.com/dwdxdy/p/3528711.html博客,加之以实践环节,我们可以知道有几种使用到GPU运算的方法: 1.利用OpenCV中提供的GPU模块 2.单独使用CudaAPI编程 3.利用OpenCV中提供接口,并结合CudaAPI编程如果仅仅使用Open
lps_683
·
2016-03-12 19:34
闵大荒之旅(四) ---- CUDA预热
但是直接使用OpenCV中的函数,显得过于呆板,灵活性较差,于是,为了将gpu运算牢牢掌握在自己手里,我选择
CUDA编程
,接下来,我简单的介绍一下gpu、cuda的一部分内容。
lps_683
·
2016-03-12 19:33
从深度学习gpu选择来谈谈gpu的硬件架构
本文首先根据显卡一些参数来推荐何种情况下选择何种gpu显卡,然后谈谈跟
cuda编程
比较相关的
maxime2046
·
2016-02-17 16:08
DL
从深度学习gpu选择来谈谈gpu的硬件架构
本文首先根据显卡一些参数来推荐何种情况下选择何种gpu显卡,然后谈谈跟
cuda编程
比较相关的
liuyue2046
·
2016-02-17 16:00
硬件
GPU
深度学习
CUDA编程
——zero copy
零复制zerocopy(零复制)是一种特殊形式的内存映射,它允许你将host内存直接映射到设备内存空间上。其实就是设备可以通过直接内存访问(directmemoryaccess,DMA)方式来访问主机的锁页内存。锁页主机内存现代操作系统都支持虚拟内存,操作系统实现虚拟内存的主要方法就是通过分页机制。操作系统将内存中暂时不使用的内容换出到外存(硬盘等大容量存储)上,从而腾出空间存放将要调入内存的信息
junparadox
·
2016-02-04 13:00
编程
CUDA
操作系统
CUDA编程
——Mars:MapReduce on GPU
CUDA编程
——Mars:MapReduceonGPU1GPU加速机器学习GPU是一种SIMT(单指令多线程)体系结构,即多个线程执行同一个指令,而每个线程操作的数据不同。
ZhangJunior
·
2016-01-19 11:21
CUDA编程
CUDA编程
——Mars:MapReduce on GPU
CUDA编程
——Mars:MapReduceonGPU1GPU加速机器学习GPU是一种SIMT(单指令多线程)体系结构,即多个线程执行同一个指令,而每个线程操作的数据不同。
junparadox
·
2016-01-19 11:00
CUDA编程
——GPU架构,由sp,sm,thread,block,grid,warp说起
掌握部分硬件知识,有助于程序员编写更好的CUDA程序,提升CUDA程序性能,本文目的是理清sp,sm,thread,block,grid,warp之间的关系。由于作者能力有限,难免有疏漏,肯定读者批评指正。首先得明确SP(StreamingProcess),SM(Streamingmultiprocessor)是硬件(GPUhardware)概念。而thread,block,grid,warp是软
junparadox
·
2016-01-19 10:00
编程
CUDA
GPU
CUDA编程
——简介
CUDA编程
——简介参考了很多大神的内容,并非完全原创,只是为了查漏补缺,记录自己的学习过程。个人水平有限,错误难免,欢迎讨论。
ZhangJunior
·
2016-01-18 18:52
CUDA编程
CUDA编程
——简介
CUDA编程
——简介参考了很多大神的内容,并非完全原创,只是为了查漏补缺,记录自己的学习过程。个人水平有限,错误难免,欢迎讨论。
junparadox
·
2016-01-18 18:00
CUDA
并行计算
GPU
CUDA编程
——Memory Coalescing
CUDA编程
——MemoryCoalescing1GPU总线寻址介绍假定X是一个指向整数(32位整数)数组的指针,数组的首地址为0x00001232。
junparadox
·
2016-01-18 18:00
编程
CUDA
GPU
CUDA编程
指南阅读笔记
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
flyingleo1981
·
2016-01-13 09:56
cuda编程
知识普及
本帖经过多方整理,大多来自各路书籍《GPGPU编程技术》《cuda高性能》 1grid和block都可以用三元向量来表示: grid的数组元素是blockblock的数组元素是grid但是1.x计算能力的核心,grid的第三元必须为1.block的X和Y索引最大尺寸为512 2通过__launch_bounds__(maxBlockSize,minBlocksPerMp)来限制每个block中最大
凡尘网络
·
2015-12-15 16:00
[cuda]常量内存
我们在
cuda编程
中定义变量的时候,可以用__constant__来修饰定义,代表着定义了一个常量内存。
暴风雪
·
2015-12-14 20:00
[开源与项目]JWFD科技树分支网络-GPU编程研究课题
作为整理科技树的一个成果,我们提出这样一个建议 在未来可能完成的矩阵数据结构分支路径上,可能会有另外一个小的分支网络,这个网络和GPU和
CUDA编程
有些关系 如果以后我们不得不运行独立的矩阵数据库
comsci
·
2015-12-09 11:00
CUDA编程
札记
http://blog.csdn.net/Augusdi/article/details/12451627[cpp] viewplaincopyconst int N = 33 * 1024; const int threadsPerBlock = 256; const int blocksPerGrid = imin( 32, (N+threadsPerBlock-
mydear_11000
·
2015-11-30 10:00
Cuda编程
总结2013-10-120:32:46
学习cuda例子中的总结1、__constant__和__device__,__shared__的使用说明...22、分配二位数组实现两个二位数组相加...23、用cudaMemcpyPitch和cudaMemcpy2D实现二位数组的分配和拷贝...54、cudaMalloc3D()和cudaMemcpy3D()函数的用法...75、不带共享存储器的矩阵的相乘...96、带sharedmemory
mydear_11000
·
2015-11-30 10:00
cuda编程
基础学习初探
我的显卡配置�� 显卡类型:独立显�� 显卡芯片:NVIDIA GeForce GT 520M 显存容量��1GB 显存类型:DDR3 纠错 显存位宽��64bit 流处理器数量��48 DirectX��11如果显卡槽可以插多个显卡,那么为了提高效率,可以多插几个显卡。在�€个新的环境中编程�€发,必须先了解这个环
·
2015-11-13 14:39
编程
CUDA编程
札记
const int N = 33 * 1024; const int threadsPerBlock = 256; const int blocksPerGrid = imin( 32, (N+threadsPerBlock-1) / threadsPerBlock ); __global__ void dot( float *a, f
·
2015-11-13 05:21
编程
CUDA编程
中内存管理机制
GPU设备端存储器的主要分类和特点: 大小: 全局(Global)和纹理(Texture)内存:大小受RAM大小的限制。 本地(local)内存:每个线程限制在16KB 共享内存:最大16kB 常量内存:总共64KB
·
2015-11-12 21:18
内存管理
6.1 CUDA: pinned memory固定存储
CPU和GPU内存交互 在
CUDA编程
中,内存拷贝是非常费时的一个动作. 从上图我们可以看出:1. CPU和GPU之间的总线bus是PCIe,是双向传输的. 2.
·
2015-11-11 18:27
memory
CUDA编程
入门
原文地址:http://www.isnowfy.com/introduction-to-cuda/ CUDA的全称是Compute Unified Device Architecture, 是NVIDIA® 公司的并行计算架构,主要是要来利用GPU的计算能力,来提高计算性能。进一步的说是在GPU上提供标准C编程语言,为在支持CUDA的NVIDIA GPU上进行并行计算而提供了统一的软
·
2015-11-06 07:51
编程
CUDA C编程入门-编程模型
这章节介绍
CUDA编程
模型的主要的概念。 2.1.kernels(核函数) CUDA C扩展了C语言,允许程序员定义C函数,称为kernels(核函数)。
·
2015-11-02 15:07
编程
cuda编程
知识普及
本帖经过多方整理,大多来自各路书籍《GPGPU编程技术》《cuda高性能》 1 grid 和 block都可以用三元向量来表示: grid的数组元素是block block的数组元素是grid 但是1.x计算能力的核心,grid的第三元必须为1.block的X和Y索引最大尺寸为512 2 通过 __launch_
·
2015-11-01 13:03
编程
CUDA C编程入门
由于刚刚接触
CUDA编程
,对此领域不是很熟悉,肯定会有些错误,如果读者发现哪里有误,欢迎指正。 CUDA C编程入门文档结构: 第一章:介绍-关于CUDA的总体介绍。
·
2015-10-31 15:41
编程
CUDA ---- 简介
CUDA编程
CUDA编程
允许你的程序执行在异构系统上,即CUP和GPU,二者有各自的存储空间,并由PCI-Express 总线区分开。因此,我们应该先注
·
2015-10-28 08:23
简介
CUDA编程
学习(四)
利用Block和Thread进行并行加速 _global_ void add(int *a, int *b, int *c) { int index = threadIdx.x + blockIdx.x * blockDim.x; c[index] = a[index] + b[index]; } #define N (2048*2048) #define THREAD_PER_BLOCK
·
2015-10-27 16:04
编程
CUDA编程
学习(二)
将数据加载到GPU后,如何在grid下的block进行并行计算(一个grid包含多个block) /****How do we run code in parallel on the device****/ /****Use block****/ _global_ void add(int *a, int *b, int *c) { c[blockIdx.x] = a[blockId
·
2015-10-27 16:03
编程
CUDA编程
学习(三)
我们知道一个grid包含多个block,而一个block又包含多个thread,下面将是如何进行下thread中的并行。 /**** Splot a block into parallel threads****/ _global_ void add(int *a, int *b, int *c) { c[threadIdx.x] = a[threadIdx.x] + b[threadIdx.
·
2015-10-27 16:03
编程
CUDA编程
学习(一)
/****c code****/ #include<stdio.h> int main() { printf("Hello world!\n); return 0; } /****CUDA code****/ _global_ void mykernel(void) { } int main() { mykernel<<<1,1>>
·
2015-10-27 16:03
编程
OpenCV环境下
CUDA编程
示例
在CUDA平台上对图像算法进行并行加速是目前并行计算方面比较简单易行的一种方式,而同时利用OpenCV提供的一些库函数的话,那么事情将会变得更加easy。以下是我个人采用的一种模板,这个模板是从OpenCV里的算法CUDA源码挖掘出来的,我感觉这个用起来比较傲方便,所以经常采用。首先大牛们写的源码都很鲁棒,考虑的比较全面(如大部分算法将1,3,4通道的图像同时搞定),感觉还有一个比较神奇的地方在于
mydear_11000
·
2015-10-24 10:00
CUDA相关概念
使用
CUDA编程
,需要了解CUDA的体系和相关概念。
Kelvin_Yan
·
2015-10-09 11:00
CUDA
CUDA多线程
这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
CUDA编程
最基本最核心的概念,是学习CUDA必不可少的阅读材料。
Virtual_Func
·
2015-09-16 14:35
三维重建知识点
CUDA 计时器
在进行
CUDA编程
时,需要利用计时方法查看程序运行速度。
gaussic
·
2015-09-15 15:00
CUDA
深入理解CUDA点积运算
重要声明本博客已迁移至segmentfault-
CUDA编程
学习专栏共享内存之bank冲突。
退休码农
·
2015-09-03 19:45
CUDA并行计算
cuda 初学大全
1硬件架构
CUDA编程
中,习惯称CPU为Host,GPU为Device。 2并行模型Thread:并行基本单位Block:相互合作的一组线程。
qq632544991p
·
2015-08-20 10:00
初入CUDA: VS2010+cuda6.0工程的建立
本文的例程是基于教材《GPU高性能编程
CUDA编程
实战》,这是一本很经典的一步
Always_TDX
·
2015-08-06 21:37
【CUDA编程】
经典CUDA教程
CUDA从入门到精通(零):写在前面在老板的要求下,本博主从2012年上高性能计算课程开始接触
CUDA编程
,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择
Scythe666
·
2015-07-15 16:00
【CUDA并行编程之四】矩阵相乘
前面介绍了基本的
Cuda编程
的相关知识,那么这一篇在此基础之上来看看GPU在处理数据计算上的高效能,我们拿矩阵相乘来作为例子。1.CPU上执行矩阵相乘以及性能。
u014568921
·
2015-06-24 09:00
CUDA
CUDA编程
接口:共享存储器实现矩阵相乘
转自http://cuda.it168.com/a2011/1207/1285/000001285186.shtml正如在前面的文章提到的,共享存储器应当比全局存储器更快,详细内容将在后续文章中介绍。任何用访问共享存储器取代访问全局存储器的机会应当被发掘,如下面的矩阵相乘例子展示的那样。下面的代码是矩阵相乘的一个直接的实现,没有利用到共享存储器。每个线程读入A的一行和B的一列,然后计算C中对应的元
u014568921
·
2015-06-23 23:00
CUDA
CUDA编程
指南阅读笔记
转自http://blog.csdn.net/csgxy123/article/category/1500471随着多核CPU和众核GPU的到来,并行编程已经得到了业界越来越多的重视,CPU-GPU异构程序能够极大提高现有计算机系统的运算性能,对于科学计算等运算密集型程序有着非常重要的意义。这一系列文章是根据《CUDAC语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了
u014568921
·
2015-06-23 17:00
CUDA
CUDA最佳实践
转自:http://blog.csdn.net/csgxy123/article/details/9569201近期开始学习
CUDA编程
,需要阅读很多资料,为了便于整理复习,特将阅读笔记记录,以备后用。
u014568921
·
2015-06-23 17:00
CUDA
GPU
CUDA ---- 简介
CUDA编程
CUDA编程
允许你的程序执行在异构系统上,即CUP
weixin_30345577
·
2015-05-28 22:00
GPU & CPU编程
CUDA编程
: CUD
gggg_ggg
·
2015-05-27 09:00
线程
cpu
并行计算
高性能
GPU
cuda编程
遇到的. 错误记录
1. cudaMemcpyinvalidargument cudaError_t 返回值为11我的错误原因是数组越界。
ChangHongJian
·
2015-04-14 16:00
CUDA
opencv+
CUDA编程
的一些问题
使用opencv的gpu模块,仅仅写:#include"opencv2/opencv.hpp"是不够的,要在开头包含#include"opencv2/gpu/gpu.hpp"不然的话,gpu模块中的好多函数,数据结构什么的都用不了!使用gpu::HOGDescriptor中的成员函数detectMultiScale进行多尺度目标检测时,第三个参数必须为Size(8,8)的整数倍,且第一个参数传入的
jiyangsb
·
2015-04-01 21:00
编程
CUDA
opencv
java 机器深度学习网站
deeplearning4j.org/它是第一个商业应用级的开元,分布式深度学习框架,最主要的是java写的,并且也可以用scala.它和hadoop,spark都能整合,DL4J是为商业环境而设计的东东,也支持
CUDA
rodneyzhaonet
·
2015-03-30 01:00
编程
hadoop
设计
看cuda初级教程视频笔记(周斌讲的)--
CUDA编程
1
01年开始,研究人员把GPU当做数据并行协处理器(GPGPU)07年,英伟达发布CUDA(ComputeUniformDeviceArchitecture)统一计算设备架构08年,OpenCL规范,使得并行计算可以扩展到更多设备平台上去CUDA的一些信息(线程嘛)层次化线程集合Ahierarchyofthreadgroups,共享储存Sharedmemories,同步BarrierSynchron
ElegantIce
·
2015-03-17 19:19
cuda
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他