測試雙層loop

原創

2018-08-30 23:20

test1：

compiler directive in outer layer

#include <stdio.h>  
#include <omp.h>  
  
int main(){  
  
int i,j,k, tid;  


#pragma omp parallel for private(j,k,tid)   

for(i = 0; i < 300; i++){  
  
  for(j = 0; j< 200; j++){  

     
     tid = omp_get_thread_num();  
      printf("i is %d, j = %d, tid = %d\n", i, j,  tid);  
        
   
  
}  

}  

  
return 0;  
}

results:

real	0m3.153s
user	0m0.827s
sys	0m1.033s

compiler directives in inner loop:

#include <stdio.h>  
#include <omp.h>  
  
int main(){  
  
int i,j,k, tid;  

 

for(i = 0; i < 300; i++){  

#pragma omp parallel for private(k,tid)  
  
  for(j = 0; j< 200; j++){  

     
     tid = omp_get_thread_num();  
      printf("i is %d, j = %d, tid = %d\n", i, j,  tid);  
        
   
  
}  

}  

  
return 0;  
}

results:

real	0m4.313s
user	0m10.508s
sys	0m0.496s

結論：

在外層平行計算要比內層快如果循環次數很多的時候

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Lustre 組件

Lustre 組件文章目錄Lustre 組件管理服務器（MGS）Lustre 文件系統組件Lustre 網絡 (LNet)Lustre 集羣Lustre 客戶端請求文件數據Lustre 條帶 Luster軟件的安裝包括管理服務器

杨京辉

2020-07-02 13:32:21

Intel MIC學習資料

a) Intel MIC官網 http://software.intel.com/mic-developer b) MIC體系結構 http://software.intel.com/en-us/article

天山

2020-06-30 15:02:45

Intel MIC開發環境安裝

1） MIC卡圖解 2） MIC對硬件的要求 a) 主板目前，並不是所有的主板都支持MIC環境，有些主板升級BOIS後可以支持MIC環境。MIC需要在主板BOIS中啓用大型基本地址寄存器 (BAR) 支持，MMIO大於4

天山

2020-06-30 15:02:44

基於MIC平臺的向量加示例

基於MIC平臺的向量加示例，包括：OpenMP版本，MIC offload版本，MIC native版本，CPU+MIC offload版本，CPU+MIC對等版本，以及MIC網絡配置方法，希望對想學習MIC的網友有些幫助。 1.

天山

2020-06-30 15:02:42

openmp學習筆記(二)梯形積分

梯形積分 #include <stdio.h> #include<stdlib.h> #include<math.h> #include<omp.h> double f(double a) { return sin(a);

WEI_69

2020-06-28 21:21:09

MPI梯形積分

#include <stdio.h> #include<math.h> #include<mpi.h> //需積分的函數 double f(double x) { return sin(x); } //積分 double

WEI_69

2020-06-28 21:21:07

mpich3.0.4安裝

下載鏈接: https://pan.baidu.com/s/1ujlY1VNT2wZySLPiTgH7CA 密碼：tnny 安裝 tar zxvf mpich-3.0.4.tar.gz mkdir mpi-install

WEI_69

2020-06-28 21:21:07

高性能計算複習

第一二章高性能計算概念高性能計算(High performance computing，縮寫HPC) 指通常使用很多處理器（作爲單個機器的一部分）或者某一集羣中組織的幾臺計算機（作爲單個計算資源操作）的計算系統和環境性

WEI_69

2020-06-28 21:21:07

Gromacs-Rocm

前言：AMD目前也在努力改進自己的生態吧，推出了自有ROCm平臺（對比CUDA），目前說是說在深度學習方面可以支持caffe、tensorflow以及Pytorch吧，但對於我個人嘗試ROCm-Pytorch的感受來說，唉，安裝

ACE小海豚

2020-06-22 04:51:16

超算競賽導引

本文旨在記錄閱讀《超算競賽導引》一書中的重點知識和心得體會~ 目前國際上把亞洲ASC、美國SC、德國ISC並稱爲三大國際超算競賽，全球Top500，中國HPC Top100和Green 500爲高性能計算機排行榜。第一章：超算的發展與

ABadCandy

2020-06-21 20:06:52

Gustafson 定律

文章目錄OverviewIntroductionSummaryReference Overview Gustafson 定律(Gustafson’s law)闡述了數據並行帶來的影響。Gustafson 定律是由 John L.

runzhliu

2020-06-20 14:41:20

2011年中國高性能計算機性能TOP100排行榜

2011年中國高性能計算機性能TOP100排行榜張雲泉孫家昶袁國興張林波中國軟件行業協會數學軟件分會國家863高性能計算機評測中心中國計算機學會高性能計算專業委員會（http://www.samss.org.cn）（

天山

2020-06-09 12:25:07

高性能計算（HPC）與雲計算（Cloud）的異同

亚历山大的陀螺

2020-05-26 18:23:51

併發編程的三大核心

Koma_Wong

2020-05-24 01:08:33

OpenSubdiv：大規模並行CPU和GPU架構上實現高性能細分表面

Koma_Wong

2020-05-24 01:08:33

24小時熱門文章

測試雙層loop

centos 雜記

測試reduction

互斥鎖條件變量信號燈 --我看過最好的一篇

first latex document

c 語言內存 bug

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結