NVIDIA CUDA初级教程视频 - 学习笔记(二)并行程序设计概述

一句话:并行计算是同时应用多个计算资源解决一个计算问题
 

并行处理:

搬砖模型

串行计算模式:

常规软件是串行的,设计运行于一个中央处理器上 (CPU),通过离散的指令序列完成一个问题的解决,一条一条指令的执行,同时只有一条指令在执行

并行计算模式:

并行计算是同时应用多个计算资源解决一个计算问题,涉及多个计算资源或处理器,问题被分解为多个离散的部分,可以同时处理(并行),每个部分可以由一系列指令完成,每个部分的指令在不同的处理器上执行

Flynn 矩阵:

SISD:Single Instruction,Single Data 单指令单数据

SIMD:Single Instruction,Multiple Data 单指令多数据

MISD:Multiple Instruction,Single Data 多指令单数据

MIMD:Multiple Instruction,Multiple Data 多指令多数据

常见名词:

 Task(任务)
 Parallel Task (并行任务)
 Serial Execution (串行执行)
 Parallel Execution (并行执行)
 Shared Memory (共享存储)
 Distributed Memory (分布式存储)
 Communications (通信)
 Synchronization (同步)—— 破坏并行性,但必不可少
 Granularity (粒度)—— 任务划分时每个任务大小
 Observed Speedup (加速比)—— 比较时要控制变量
 Parallel Overhead (并行开销)—— 进程通信、同步
 Scalability (可扩展性)

存储器架构:

 Shared Memory
 Distributed Memory
 Hybrid Distributed-Shared Memory

并行编程模型

 共享存储模型Shared Memory Model
 线程模型Threads Model
 消息传递模型Message Passing Model
 数据并行模型Data Parallel Model

具体实例

 OpenMP
 MPI
 Single Program Multiple Data (SPMD)
 Multiple Program Multiple Data (MPMD)

设计并行处理程序和系统

 自动和手动并行
 理解问题和程序
 分块分割
 通信
 同步
 数据依赖
• 负载均衡 —— 不患寡而患不均
• 粒度
• I/O
• 成本
• 性能分析和优化

通信和同步

NVIDIA CUDA初级教程视频 - 学习笔记(二)并行程序设计概述_第1张图片

Amdahl's Law

程序可能的加速比取决于可以被并行化的部分。
NVIDIA CUDA初级教程视频 - 学习笔记(二)并行程序设计概述_第2张图片NVIDIA CUDA初级教程视频 - 学习笔记(二)并行程序设计概述_第3张图片

和维基定义不一样:维基百科:Amdahl's law

NVIDIA CUDA初级教程视频 - 学习笔记(二)并行程序设计概述_第4张图片

你可能感兴趣的:(CUDA)