cuda編程(2):軟硬件編程模型以及高效策略

原視頻

一、相關概念

多個線程組成線程塊,多個線程塊組成網格,網絡約等於kernel。而kernel是GPU處理的最小單元,可以理解成是一個函數。如下圖:

CPU和GPU硬件對比:

CPU和GPU編程:

二、高效策略

根據公式,有以下五種方式:

高效策略-合併全局內存

其他方式-避免線程發散:

其他方式-避免循環長度不一樣

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章