GPU硬件結構--CUDA

原創

2020-02-20 21:59

thread block grid warp sp sm

sp:

最基本的處理單元，streaming processor 最後具體的指令和任務都是在sp上處理的。GPU進行並行計算，也就是很多個sp同時做處理

sm:

多個sp加上其他的一些資源組成一個sm, streaming multiprocessor. 其他資源也就是存儲資源，共享內存，寄儲器等。

warp:

GPU執行程序時的調度單位，目前cuda的warp的大小爲32，同在一個warp的線程，以不同數據資源執行相同的指令。

grid、block、thread：

在利用cuda進行編程時，一個grid分爲多個block，而一個block分爲多個thread.其中任務劃分到是否影響最後的執行效果。劃分的依據是任務特性和GPU本身的硬件特性。

下面幾張硬件結構簡圖便於理解(圖片來源於網上）

以上兩圖可以清晰地表示出sm與sp的關係。

此圖反應了warp作爲調度單位的作用，每次GPU調度一個warp裏的32個線程執行同一條指令，其中各個線程對應的數據資源不同。

此圖是一個warp排程的例子。

一個sm只會執行一個block裏的warp，當該block裏warp執行完纔會執行其他block裏的warp。進行劃分時，最好保證每個block裏的warp比較合理，那樣可以一個sm可以交替執行裏面的warp，從而提高效率，此外，在分配block時，要根據GPU的sm個數，分配出合理的block數，讓GPU的sm都利用起來，提利用率。分配時，也要考慮到同一個線程block的資源問題，不要出現對應的資源不夠。

轉載自:http://hi.baidu.com/dwdxdy/item/497ea936a2f9031e9cc65ef5

發佈了9 篇原創文章 · 獲贊 8 · 訪問量 14萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

openmp學習筆記(二)梯形積分

梯形積分 #include <stdio.h> #include<stdlib.h> #include<math.h> #include<omp.h> double f(double a) { return sin(a);

2020-06-28 21:21:09

MPI梯形積分

#include <stdio.h> #include<math.h> #include<mpi.h> //需積分的函數 double f(double x) { return sin(x); } //積分 double

2020-06-28 21:21:07

mpich3.0.4安裝

下載鏈接: https://pan.baidu.com/s/1ujlY1VNT2wZySLPiTgH7CA 密碼：tnny 安裝 tar zxvf mpich-3.0.4.tar.gz mkdir mpi-install

2020-06-28 21:21:07

高性能計算複習

第一二章高性能計算概念高性能計算(High performance computing，縮寫HPC) 指通常使用很多處理器（作爲單個機器的一部分）或者某一集羣中組織的幾臺計算機（作爲單個計算資源操作）的計算系統和環境性

2020-06-28 21:21:07

Gromacs-Rocm

前言：AMD目前也在努力改進自己的生態吧，推出了自有ROCm平臺（對比CUDA），目前說是說在深度學習方面可以支持caffe、tensorflow以及Pytorch吧，但對於我個人嘗試ROCm-Pytorch的感受來說，唉，安裝

2020-06-22 04:51:16

超算競賽導引

本文旨在記錄閱讀《超算競賽導引》一書中的重點知識和心得體會~ 目前國際上把亞洲ASC、美國SC、德國ISC並稱爲三大國際超算競賽，全球Top500，中國HPC Top100和Green 500爲高性能計算機排行榜。第一章：超算的發展與

2020-06-21 20:06:52

Gustafson 定律

文章目錄OverviewIntroductionSummaryReference Overview Gustafson 定律(Gustafson’s law)闡述了數據並行帶來的影響。Gustafson 定律是由 John L.

2020-06-20 14:41:20

高性能計算（HPC）與雲計算（Cloud）的異同

亚历山大的陀螺

2020-05-26 18:23:51

併發編程的三大核心

2020-05-24 01:08:33

OpenSubdiv：大規模並行CPU和GPU架構上實現高性能細分表面

2020-05-24 01:08:33

OpenVDB：夢工廠的有效存儲和處理離散在三維網格上的稀疏體積數據C++庫

2020-05-24 01:08:33

「首度揭祕」大規模HPC生產環境 IO 特徵

YAN_RONG_TECHNOLOGY

2020-05-22 17:27:12

RenderMan：渲染技術

2020-05-18 23:56:55

CUDA(.cu)程序與C(.c)源程序混合編譯

2020-05-17 13:44:23

openmp非迭代結構並行

2020-04-24 03:58:44

24小時熱門文章

最新文章

最新評論文章