E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPGPU
深入浅出谈CUDA-CUDA详解
“CUDA 是NVIDIA的
GPGPU
模型,它使用C语言为基础,可以直接以大多数人熟悉的C语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。” CUDA是什么?
·
2015-11-02 15:24
详解
cuda编程知识普及
本帖经过多方整理,大多来自各路书籍《
GPGPU
编程技术》《cuda高性能》 1 grid 和 block都可以用三元向量来表示: grid的数组元素是
·
2015-11-01 13:03
编程
GPU求解粘性不可压流体
一些的研究者把非图形领域的计算从CPU 转移到GPU上,称为图形处理器的通用计算即
GPGPU
(General Purpose Computation on GPUs) 图-9 GPU和CPU浮点运算性能比较
·
2015-11-01 10:47
流
GPU深度发掘(一)::
GPGPU
数学基础教程
作者:Dominik Göddeke 译者:华文广 Contents 介绍 准备条件 硬件设备要求 软件设备要求 两者选择
·
2015-10-31 15:09
gpg
cell VS
gpgpu
记得一年多年前曾经和一个研究人员在google论坛上争论CELL 和 GPU 谁更合适做ray-casting 的问题。该人声称他已经用CELL板卡实现实时的1k*1k*1k体单位phone shading,而当时的GPU无法做到。我坚持GPU更适合做这些东西,因为当时已经看出GPU做这个方面的潜力,一旦有市场上有需求,GPU体系结构设计者会关注这个领域。 上次我们的首席架构师过来的时候,
·
2015-10-30 13:02
cell
CUDA入门
CUDA API包括三个,从低到高等级分别为 Thrust API Runtime API Driver API 用于CUDA的GPU是安装于主机系统中的独立设备
GPGPU
·
2015-10-30 13:04
入门
面向程序员的
GPGPU
技术系列(1) 为什么要理解GPU体系结构?
本文的目的不在于介绍GPU的发展史和其在上述领域的应用,而是侧重于如何在通用计算领域发挥GPU强大的计算能力,即
GPGPU
(General-Purpose-GPU)技术 。
·
2015-10-30 13:57
体系结构
GPGPU
实时光线刻蚀模拟
前言:Caustics光线刻蚀效果极大的影响着存在透明光学物体场景的真实性。光线在透明物体里发生衰减与二次折射,最终汇聚在一个小区域内,导致这个区域的能量比周围的光子密度高的多。比如一把放大镜将太阳光聚焦成一个光斑就体现了这种现象,在水底也会发生大面积的刻蚀亮斑。人们已经可以使用光线跟踪技术模拟这种效果,尤其是Maxwell Render甚至可以模拟三棱镜折射的效果。随着GPU计算能力的发展,在实
·
2015-10-30 11:42
gpg
Realtime Ray Tracing RenderMan Point Cloud
外部数据的填充与准备延迟依旧是
GPGPU
应用的一个巨大门槛。白色是命中的包围盒,绿色的就是射线了,在用于录制动画的7300go T2250上为大约15fps。
·
2015-10-28 08:22
cloud
GPGPU
OpenCL/CUDA 高性能编程的10大注意事项
1.展开循环 如果提前知道了循环的次数,可以进行循环展开,这样省去了循环条件的比较次数。但是同时也不能使得kernel代码太大。 循环展开代码例子: 1 #include<iostream> 2 using namespace std; 3 4 int main(){ 5 int sum=0; 6 for(int i=1;i
·
2015-10-28 07:57
open
GPGPU
OpenCL 精确字符串查找
字符串查找是信息安全、信息过滤领域的重要操作,尤其是对大文本的实时处理。这篇作为实例,使用GPU OpenCL进行精确模式串查找。 1.加速方法 (1)将少量常量数据,如模式串长度、文本长度等,保存在线程的private memory中。 (2)将模式串保存在GPU的local memory中,加速线程对模式串的访问。 (3)将待查找的文本保存在global memory中,使
·
2015-10-28 07:56
open
GPGPU
OpenCL Reduction操作与group同步
Reduction操作:规约操作就是由多个数生成一个数,如求最大值、最小值、向量点积、求和等操作,都属于这一类操作。 有大量数据的情况下,使用GPU进行任务并行与数据并行,可以收到可好的效果。 group同步:OpenCL只提供了工作组内的各线程之间的同步机制,并没有提供所有线程的同步。提供组内item-work同步的方法: void barrier (cl_mem_fence_flag
·
2015-10-28 07:55
group
GPGPU
OpenCL使用结构体数据
OpenCL编程中可以使用结构体,只需要在核函数kernel中提供同样的结构体申明就可以啦。 如果在主函数中定义了结构体: 1 typedef struct studentNode{ 2 int age; 3 float height; 4 }student; 主函数中定义数据,并传输给OpenCL kernel: 1 stud
·
2015-10-28 07:55
open
GPGPU
OpenCL 获取设备信息
在使用OpenCL编程中,需要对GPU设备的底层理解,这样才能更好的进行代码优化。 比如计算单元CU数量,每个CU的执行单元PE数量,每个CU中的共享内存大小等等。只有了解了这些才能更好的使用共享内存,设计核函数的运行参数等。 本文:http://www.cnblogs.com/xudong-bupt/p/3586050.html 1.clGetDeviceInfo Ope
·
2015-10-28 07:54
open
GPGPU
OpenCL编程步骤与简单实例
http://www.cnblogs.com/xudong-bupt/p/3582780.html 1.OpenCL概念 OpenCL是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU或其他类型的处理器组成。OpenCL由一门用于编写kernels (在OpenCL设备上运行的函数)的语言(基于C99)和一组用于定义并控制平台的API组成。 OpenCL提供了两
·
2015-10-28 07:54
open
CUDA使用Event进行程序计时
GPGPU
是众核设备,包含大量的计算单元,实现超高速的并行。 使用CUDA在nvidia显卡上面编程时,可以使用CUDA提供的Event进行程序计时。
·
2015-10-28 07:51
event
并行计算Brahma :LINQ-to-GPU
也就是说Brahma是一个并行计算(重点放在
GPGPU
)的框架,使用LINQ进行流转换工作(LINQ-to-streaming computation 或者 LINQ-to
·
2015-10-23 09:15
LINQ
关于CUDA的一些学习资料
前言最近看了一些关于CUDA方面的资料,并粗略地浏览了两本关于CUDA和
GPGPU
的书(《
GPGPU
编程技术:从GLSL、CUDA到OpenCL》和《CUDA并行程序设计:GPU编程指南》),对于CUDA
张行之
·
2015-10-15 19:00
全球第一款开源GPU诞生!要感谢AMD
开源硬件已经在CPU上得到了很好的实现,而现在,威斯康辛-麦迪逊大学的垂直研发组又宣布了世界上第一款开源的
GPGPU
——“MIAOW”。
Foundation
·
2015-09-06 15:00
GPU基本介绍
转自http://blog.csdn.net/carson2005/article/details/7636136基本概念:GPU: Graphic Processing Unit;图形处理单元;
GPGPU
u014568921
·
2015-06-22 22:00
GPU
GPGPU
-SIM Code Study
原文地址http://people.cs.pitt.edu/~yongli/notes/
gpgpu
/GPGPUSIMNotes.htmlGPGPU-SIMCodeStudy(version:3.1.2)
bit262426738
·
2015-06-12 16:20
GPU
GPU & CPU编程
GPU除了用处图形渲染领域外,还可以用来做大规模的并行运算,这里我们称其为
GPGPU
(GeneralPurposeGPU);
GPGPU
计算通常采用CPU+GPU异构模式,由CPU负责执行复杂逻辑处理和事务管理等不适合数据并行的计算
gggg_ggg
·
2015-05-27 09:00
线程
cpu
并行计算
高性能
GPU
NVIDIA
GPGPU
vs AMD Radeon HD Graphics执行模式对比
原文:http://www.cnblogs.com/zenny-chen/p/4229377.html大家做高性能计算的朋友,想必对CPU的执行模式已经非常熟悉了吧。当代高级些的CPU一般采用超标量流水线,使得毗邻几条相互独立的指令能够并行执行——这称为指令集并行(ILP,Instruction-LevelParallelism);而像x86引入的SSE(StreamingSIMDExtensio
wolf96
·
2015-04-29 09:00
amd
图形
GPU
GPGPU
nVidia
移动GPU通用计算现状与展望
将GPU用于图形渲染以外领域的计算称为
GPGPU
(General-Purpose computing on Graphics Proc
fire_fighter
·
2015-03-29 21:00
并行计算
GPGPU
GPU
移动设备
趋势
看cuda初级教程视频笔记(周斌讲的)--CUDA编程1
01年开始,研究人员把GPU当做数据并行协处理器(
GPGPU
)07年,英伟达发布CUDA(ComputeUniformDeviceArchitecture)统一计算设备架构08年,OpenCL规范,使得并行计算可以扩展到更多设备平台上去
ElegantIce
·
2015-03-17 19:19
cuda
看cuda初级教程视频笔记(周斌讲的)--CUDA编程1
01年开始,研究人员把GPU当做数据并行协处理器(
GPGPU
)07年,英伟达发布CUDA(ComputeUniformDeviceArchitecture)统一计算设备架构08年,OpenCL规范,使得并行计算可以扩展到更多设备平台上去
ElegantIce
·
2015-03-17 19:19
cuda
从零开始学习OpenCL开发(一)架构
1异构计算、
GPGPU
与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多CPU\GPU\其他芯片异构计算(heterogeneous)的标准,它是跨平台的。
lien0906
·
2015-03-10 09:00
OPENCV与OPENCL
OpenCL可以实现
GPGPU
(Genera
lien0906
·
2015-03-10 09:00
简介Intel MIC上的分布式开发以及Offload模式下的各种限制
最近要在MIC机群上做分布式开发,发现有两种模式可以用:1)offload模式:该模式和
GPGPU
编程思想类似,把并行度高的代码转移到local的MIC处理器上执行,其它代码仍然在CPU上执行。
SciPioneer
·
2015-03-07 03:16
High
Performance
Computing
简介Intel MIC上的分布式开发以及Offload模式下的各种限制
最近要在MIC机群上做分布式开发,发现有两种模式可以用:1)offload模式:该模式和
GPGPU
编程思想类似,把并行度高的代码转移到local的MIC处理器上执行,其它代码仍然在CPU上执行。
bhwolf1987
·
2015-03-07 03:00
分布式开发
Symmetric
MIC
offload
nVidia
GPGPU
vs AMD Radeon HD Graphics执行模式对比
大家做高性能计算的朋友,想必对CPU的执行模式已经非常熟悉了吧。当代高级些的CPU一般采用超标量流水线,使得毗邻几条相互独立的指令能够并行执行——这称为指令集并行(ILP,Instruction-Level Parallelism);而像x86引入的SSE(Streaming SIMD Extension)、AVX(Advanced Vector Extension),以及ARM的NEON技术都属
·
2015-01-16 17:00
graphics
矩阵乘法——CUDA 优化记录
CUDA是NVIDIA的
GPGPU
模型,它使用C语言为基础,可以直接以大多数人熟悉的C语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。”
Openking
·
2015-01-09 10:02
CUDA
opencl基础知识
本文转自:http://blog.csdn.net/leonwei/article/details/88800121异构计算、
GPGPU
与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多
zhuangxiaobin
·
2015-01-07 12:00
超基础的用Python处理文本实例
一、需求是这样的:得到的
GPGPU
-Sim运行的程序文本文档。那么我现在需要提取目标对应的键值。
忆之独秀
·
2014-12-01 16:15
python
文本处理
getip
Python
超基础的用Python处理文本实例
一、需求是这样的:得到的
GPGPU
-Sim运行的程序文本文档。那么我现在需要提取目标对应的键值。
lavorange
·
2014-12-01 16:00
python
文本处理
getip
Intel MIC架构下COI框架介绍
现有的并行计算架构主要有两个:
GPGPU
(通用GPU)以及Intel的MIC(ManyIntegratedCore)架构。
李牙刷儿_
·
2014-09-04 17:49
Intel MIC架构下COI框架介绍
现有的并行计算架构主要有两个:
GPGPU
(通用GPU)以及Intel的MIC(ManyIntegratedCore)架构。通用GPU加速主要是利用GPU本身具有多线程的特性,将计算密集型任务迁移到GP
asiaLIYAZHOU
·
2014-09-04 17:00
并行计算
Intel
MIC
GPU编程之CUDA(一)——入门知识
CUDA(ComputerUnifiedDeviceArchitecture):计算机统一设备架构NVIDIA在2007年推向市场的并行计算架构严格来说,CUDA不知是一种编程语言,它包括了NVIDIA对于
GPGPU
Sun7_She
·
2014-08-16 10:23
GPU编程
GPU编程之CUDA(一)——入门知识
NVIDIA在2007年推向市场的并行计算架构严格来说,CUDA不知是一种编程语言,它包括了NVIDIA对于
GPGPU
Sun7_She
·
2014-08-16 10:00
编程
C++
CUDA
GPU
从零开始学习OpenCL开发(一)架构
1异构计算、
GPGPU
与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多CPU\GPU\其他芯片异构计算(heterogeneous)的标准,它是跨平台的。
Kaitiren
·
2014-08-12 14:00
GPU基本介绍
基本概念:GPU: Graphic Processing Unit;图形处理单元;
GPGPU
: General Purpose computations on GPU;通用计算图形处理单元;CPU与GPU
tiandijun
·
2014-06-17 19:00
GPU深度发掘(一)::
GPGPU
数学基础教程
GPU深度发掘(一)::
GPGPU
数学基础教程作者:DominikGöddeke 译者:华文广Contents介绍准备条件硬件设备要求软件设备要求两者选择初始化OpenGLGLUTOpenGL
山庄来客
·
2014-05-12 21:00
编程
buffer
扩展
语言
float
GPGPU
OpenCL 介绍
目前,最為常見的就是所謂的
GPGPU
應用,也就是利用一般的顯示晶片(即GPU)進行3D
xiaojidan2011
·
2014-02-20 15:00
利用
GPGPU
方法将大量数据通过纹理传输至GPU进行计算
利用
GPGPU
方法将大量数据通过纹理传输至GPU进行计算 在显卡并行计算起源的领域,比如说游戏开发领域,GPU的发展使得其迈向了新的纪元,画面愈加精致,效果愈加震撼,同时并行计算框架CUDA
jiangcaiyang123
·
2014-02-19 22:00
qt
OpenGL
CUDA程序优化小记(九)
最近我通过学习《
GPGPU
编程技术》这本书,深刻地体会到了这一点,并且用CUDARuntim
jiangcaiyang123
·
2014-01-29 21:00
CUDA
CUDA程序优化小记(八)
最近我通过学习《
GPGPU
编程技术》这本书,深刻地体会到了这一点,并且用CUDARuntime
jiangcaiyang123
·
2014-01-29 21:00
CUDA
CUDA程序优化小记(七)
最近我通过学习《
GPGPU
编程技术》这本书,深刻地体会到了这一点,并且用CUDARuntime
jiangcaiyang123
·
2014-01-26 20:00
CUDA
CUDA程序优化小记(六)
最近我通过学习《
GPGPU
编程技术》这本书,深刻地体会到了这一点,并且用CUDARuntime
jiangcaiyang123
·
2014-01-26 20:00
CUDA
Code Pilot开源,探讨
GPGPU
于iOS上的效能分析 - 移动开发技术周报
本周移动开发技术周报的推荐资料包括:CodePilot的开发故事,深入iOS7AppSwitcher,raywenderlich的Objective-C编码风格,设计iOS7的StatusBar。工具:CodePilot的开发故事:CodePilot是一个Xcode的扩充套件,可以让开发者更快的找到之前曾写过的代码,并拿出来重复使用。在之前,CodePilot是一套价值14.95美元的产品。最近C
邱彦铭
·
2014-01-20 00:00
CUDA程序优化小记(五)
最近我通过学习《
GPGPU
编程技术》这本书,深刻地体会到了这一点,并且用CUDARuntim
jiangcaiyang123
·
2014-01-11 15:00
CUDA
上一页
1
2
3
4
5
6
7
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他