openmp:簡介,基本使用,相關信息,

OpenMP是由OpenMP Architecture Review Board牽頭提出的，並已被廣泛接受，用於共享記憶體並行系統的多處理器程式設計的一套指導性編譯處理方案(Compiler Directive)。OpenMP支持的程式語言包括C、C++和Fortran；而支持OpenMp的編譯器包括Sun Compiler，GNU Compiler和Intel Compiler等。OpenMp提供了對並行算法的高層的抽象描述，程式設計師通過在原始碼中加入專用的pragma來指明自己的意圖，由此編譯器可以自動將程式進行並行化，並在必要之處加入同步互斥以及通信。當選擇忽略這些pragma，或者編譯器不支持OpenMp時，程式又可退化為通常的程式(一般為串列)，代碼仍然可以正常運作，只是不能利用多執行緒來加速程式執行。

基本介紹

中文名：共享存儲並行編程
外文名：Open Multi-Processing
提出人：OpenMP Architecture
類型：程式設計
支持：C語言、C++和Fortran

簡介,基本使用,相關信息,

簡介

OpenMP提供的這種對於並行描述的高層抽象降低了並行編程的難度和複雜度，這樣程式設計師可以把更多的精力投入到並行算法本身，而非其具體實現細節。對基於數據分集的多執行緒程式設計，OpenMP是一個很好的選擇。同時，使用OpenMP也提供了更強的靈活性，可以較容易的適應不同的並行系統配置。執行緒粒度和負載平衡等是傳統多執行緒程式設計中的難題，但在OpenMP中，OpenMP庫從程式設計師手中接管了部分這兩方面的工作。

但是，作為高層抽象，OpenMP並不適合需要複雜的執行緒間同步和互斥的場合。OpenMp的另一個缺點是不能在非共享記憶體系統(如計算機集群)上使用。在這樣的系統上，MPI使用較多。

基本使用

要在Visual C++2005 中使用OpenMP其實不難，只要將 Project 的Properties中C/C++里Language的OpenMP Support開啟（參數為 /openmp），就可以讓VC++2005 在編譯時支持OpenMP 的語法了；而在編寫使用OpenMP 的程式時，則需要先include OpenMP的頭檔案：omp.h。

而要將 for 循環並行化處理，該怎么做呢？非常簡單，只要在前面加上一行

#pragma omp parallel for

就夠了！

也可以實際用一段簡單的程式，來弄清楚它的運作方式。

#include <STDIO.H>

#include <STDLIB.H>

void Test(int n) {

for(int i = 0; i < 10000; ++i) {

//do nothing, just waste time

}

printf("%d, ", n);

}

int main(int argc,char* argv[]) {

for(int i = 0; i < 10; ++i)

Test(i);

system("pause");

}

上面的程式，在 main() 是一個很簡單的迴圈，跑十次，每次都會調用Test()這個函式，並把是迴圈的執行次數(i)傳進Test() 並列印出來。想當然，它的結果會是：

0, 1, 2, 3, 4, 5, 6, 7, 8, 9,

而如果想利用 OpenMP把 main() 裡面的迴圈平行化處理呢？只需要修改成下面的樣子：

#include <omp.h>

#include <stdio.h>

#include <stdlib.h>

void Test (int n) {

for(int i = 0; i < 10000; ++i) {

//do nothing, just waste time

}

printf("%d, ", n);

}

int main(int argc,char* argv[]) {

#pragma omp parallel for

for(int i = 0; i < 10; ++i)

Test( i );

system("pause");

}

夠簡單吧？從頭到尾，只加了兩行！而執行後，可以發現結果也變了！

0, 5, 1, 6, 2, 7, 3, 8, 4, 9,

可以從結果很明顯的發現，他沒有照著0到9的順序跑了！而上面的順序怎么來的？其實很簡單，OpenMP只是把迴圈 0 - 9 共十個步驟，拆成 0 - 4, 5 - 9 兩部份，丟給不同的執行緒去跑，所以數字才會出現這樣交錯性的輸出～

而要怎么確定真的有跑多執行緒呢？如果本來有多處理器、多核心處理器或有 Hyper Thread 的話，一個單執行緒程式，最多只會把一顆核心的使用量吃完；像比如說在 Pentium 4 HT 上跑，單一執行緒的程式，在工作管理員中看到的 CPU使用率最多就是 50%。而利用 OpenMP 把迴圈進行平行化處理後，就可以在執行迴圈時，把兩顆核心的 CPU 都榨光了！也就是CPU使用率是100%。

openmp

基本介紹

簡介

基本使用

相關信息

相關詞條

熱門詞條