Fork/Join框架

轉自併發編程網:http://ifeve.com/talk-concurrency-forkjoin/

1. 什麼是Fork/Join框架

Fork/Join框架是Java7提供了的一個用於並行執行任務的框架, 是一個把大任務分割成若干個小任務,最終彙總每個小任務結果後得到大任務結果的框架。

我們再通過Fork和Join這兩個單詞來理解下Fork/Join框架,Fork就是把一個大任務切分爲若干子任務並行的執行,Join就是合併這些子任務的執行結果,最後得到這個大任務的結果。比如計算1+2+。。+10000,可以分割成10個子任務,每個子任務分別對1000個數進行求和,最終彙總這10個子任務的結果。Fork/Join的運行流程圖如下:


2. 工作竊取算法

工作竊取(work-stealing)算法是指某個線程從其他隊列裏竊取任務來執行。工作竊取的運行流程圖如下:

fj

那麼爲什麼需要使用工作竊取算法呢?假如我們需要做一個比較大的任務,我們可以把這個任務分割爲若干互不依賴的子任務,爲了減少線程間的競爭,於是把這些子任務分別放到不同的隊列裏,併爲每個隊列創建一個單獨的線程來執行隊列裏的任務,線程和隊列一一對應,比如A線程負責處理A隊列裏的任務。但是有的線程會先把自己隊列裏的任務幹完,而其他線程對應的隊列裏還有任務等待處理。幹完活的線程與其等着,不如去幫其他線程幹活,於是它就去其他線程的隊列裏竊取一個任務來執行。而在這時它們會訪問同一個隊列,所以爲了減少竊取任務線程和被竊取任務線程之間的競爭,通常會使用雙端隊列,被竊取任務線程永遠從雙端隊列的頭部拿任務執行,而竊取任務的線程永遠從雙端隊列的尾部拿任務執行。

工作竊取算法的優點是充分利用線程進行並行計算,並減少了線程間的競爭,其缺點是在某些情況下還是存在競爭,比如雙端隊列裏只有一個任務時。並且消耗了更多的系統資源,比如創建多個線程和多個雙端隊列。

3. Fork/Join框架的介紹

我們已經很清楚Fork/Join框架的需求了,那麼我們可以思考一下,如果讓我們來設計一個Fork/Join框架,該如何設計?這個思考有助於你理解Fork/Join框架的設計。

第一步分割任務。首先我們需要有一個fork類來把大任務分割成子任務,有可能子任務還是很大,所以還需要不停的分割,直到分割出的子任務足夠小。

第二步執行任務併合並結果。分割的子任務分別放在雙端隊列裏,然後幾個啓動線程分別從雙端隊列裏獲取任務執行。子任務執行完的結果都統一放在一個隊列裏,啓動一個線程從隊列裏拿數據,然後合併這些數據。

Fork/Join使用兩個類來完成以上兩件事情:

  • ForkJoinTask:我們要使用ForkJoin框架,必須首先創建一個ForkJoin任務。它提供在任務中執行fork()和join()操作的機制,通常情況下我們不需要直接繼承ForkJoinTask類,而只需要繼承它的子類,Fork/Join框架提供了以下兩個子類:
    • RecursiveAction:用於沒有返回結果的任務。
    • RecursiveTask :用於有返回結果的任務。
  • ForkJoinPool :ForkJoinTask需要通過ForkJoinPool來執行,任務分割出的子任務會添加到當前工作線程所維護的雙端隊列中,進入隊列的頭部。當一個工作線程的隊列裏暫時沒有任務時,它會隨機從其他工作線程的隊列的尾部獲取一個任務。

4. 使用Fork/Join框架

讓我們通過一個簡單的需求來使用下Fork/Join框架,需求是:計算1+2+3+4的結果。

使用Fork/Join框架首先要考慮到的是如何分割任務,如果我們希望每個子任務最多執行兩個數的相加,那麼我們設置分割的閾值是2,由於是4個數字相加,所以Fork/Join框架會把這個任務fork成兩個子任務,子任務一負責計算1+2,子任務二負責計算3+4,然後再join兩個子任務的結果。

因爲是有結果的任務,所以必須繼承RecursiveTask,實現代碼如下:

001 packagefj;
002  
003 importjava.util.concurrent.ExecutionException;
004  
005 importjava.util.concurrent.ForkJoinPool;
006  
007 importjava.util.concurrent.Future;
008  
009 importjava.util.concurrent.RecursiveTask;
010  
011 publicclassCountTaskextendsRecursiveTask {
012  
013        privatestaticfinalintTHRESHOLD= 2;//閾值
014  
015        privateintstart;
016  
017        privateintend;
018  
019        publicCountTask(intstart,intend) {
020  
021                    this.start= start;
022  
023                    this.end= end;
024  
025         }
026  
027        @Override
028  
029        protectedInteger compute() {
030  
031                    intsum = 0;
032  
033                    //如果任務足夠小就計算任務
034  
035                    booleancanCompute = (end-start) <=THRESHOLD;
036  
037                    if(canCompute) {
038  
039                               for(inti =start; i <=end; i++) {
040  
041                                            sum += i;
042  
043                                }
044  
045                     }else{
046  
047                               //如果任務大於閥值,就分裂成兩個子任務計算
048  
049                               intmiddle = (start+end) / 2;
050  
051                                CountTask leftTask =newCountTask(start, middle);
052  
053                                CountTask rightTask =newCountTask(middle +1,end);
054  
055                               //執行子任務
056  
057                                leftTask.fork();
058  
059                                rightTask.fork();
060  
061                               //等待子任務執行完,並得到其結果
062  
063                               intleftResult=leftTask.join();
064  
065                               intrightResult=rightTask.join();
066  
067                               //合併子任務
068  
069                                sum = leftResult  + rightResult;
070  
071                     }
072  
073                    returnsum;
074  
075         }
076  
077        publicstaticvoidmain(String[] args) {
078  
079                     ForkJoinPool forkJoinPool =newForkJoinPool();
080  
081                    //生成一個計算任務,負責計算1+2+3+4
082  
083                     CountTask task =newCountTask(14);
084  
085                    //執行一個任務
086  
087                     Future result = forkJoinPool.submit(task);
088  
089                    try{
090  
091                                System.out.println(result.get());
092  
093                     }catch(InterruptedException e) {
094  
095                     }catch(ExecutionException e) {
096  
097                     }
098  
099         }
100  
101 }

通過這個例子讓我們再來進一步瞭解ForkJoinTask,ForkJoinTask與一般的任務的主要區別在於它需要實現compute方法,在這個方法裏,首先需要判斷任務是否足夠小,如果足夠小就直接執行任務。如果不足夠小,就必須分割成兩個子任務,每個子任務在調用fork方法時,又會進入compute方法,看看當前子任務是否需要繼續分割成孫任務,如果不需要繼續分割,則執行當前子任務並返回結果。使用join方法會等待子任務執行完並得到其結果。

5. Fork/Join框架的異常處理

ForkJoinTask在執行的時候可能會拋出異常,但是我們沒辦法在主線程裏直接捕獲異常,所以ForkJoinTask提供了isCompletedAbnormally()方法來檢查任務是否已經拋出異常或已經被取消了,並且可以通過ForkJoinTask的getException方法獲取異常。使用如下代碼:

if(task.isCompletedAbnormally())
{
    System.out.println(task.getException());
}

getException方法返回Throwable對象,如果任務被取消了則返回CancellationException。如果任務沒有完成或者沒有拋出異常則返回null。

6. Fork/Join框架的實現原理

ForkJoinPool由ForkJoinTask數組和ForkJoinWorkerThread數組組成,ForkJoinTask數組負責存放程序提交給ForkJoinPool的任務,而ForkJoinWorkerThread數組負責執行這些任務。

ForkJoinTask的fork方法實現原理。當我們調用ForkJoinTask的fork方法時,程序會調用ForkJoinWorkerThread的pushTask方法異步的執行這個任務,然後立即返回結果。代碼如下:

1 public final ForkJoinTask fork() {
2         ((ForkJoinWorkerThread) Thread.currentThread())
3             .pushTask(this);
4         return this;
5 }

pushTask方法把當前任務存放在ForkJoinTask 數組queue裏。然後再調用ForkJoinPool的signalWork()方法喚醒或創建一個工作線程來執行任務。代碼如下:

01 final void pushTask(ForkJoinTask t) {
02         ForkJoinTask[] q; int s, m;
03         if ((q = queue) != null) {    // ignore if queue removed
04             long u = (((s = queueTop) & (m = q.length - 1)) << ASHIFT) + ABASE;
05             UNSAFE.putOrderedObject(q, u, t);
06             queueTop = s + 1;         // or use putOrderedInt
07             if ((s -= queueBase) <= 2)
08                 pool.signalWork();
09     else if (s == m)
10                 growQueue();
11         }
12     }

ForkJoinTask的join方法實現原理。Join方法的主要作用是阻塞當前線程並等待獲取結果。讓我們一起看看ForkJoinTask的join方法的實現,代碼如下:

01 public final V join() {
02         if (doJoin() != NORMAL)
03             return reportResult();
04         else
05             return getRawResult();
06 }
07 private V reportResult() {
08         int s; Throwable ex;
09         if ((s = status) == CANCELLED)
10             throw new CancellationException();
11 if (s == EXCEPTIONAL && (ex = getThrowableException()) != null)
12             UNSAFE.throwException(ex);
13         return getRawResult();
14 }

首先,它調用了doJoin()方法,通過doJoin()方法得到當前任務的狀態來判斷返回什麼結果,任務狀態有四種:已完成(NORMAL),被取消(CANCELLED),信號(SIGNAL)和出現異常(EXCEPTIONAL)。

  • 如果任務狀態是已完成,則直接返回任務結果。
  • 如果任務狀態是被取消,則直接拋出CancellationException。
  • 如果任務狀態是拋出異常,則直接拋出對應的異常。

讓我們再來分析下doJoin()方法的實現代碼:

01 private int doJoin() {
02         Thread t; ForkJoinWorkerThread w; int s; boolean completed;
03         if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) {
04             if ((s = status) < 0)
05  return s;
06             if ((w = (ForkJoinWorkerThread)t).unpushTask(this)) {
07                 try {
08                     completed = exec();
09                 catch (Throwable rex) {
10                     return setExceptionalCompletion(rex);
11                 }
12                 if (completed)
13                     return setCompletion(NORMAL);
14             }
15             return w.joinTask(this);
16         }
17         else
18             return externalAwaitDone();
19     }

在doJoin()方法裏,首先通過查看任務的狀態,看任務是否已經執行完了,如果執行完了,則直接返回任務狀態,如果沒有執行完,則從任務數組裏取出任務並執行。如果任務順利執行完成了,則設置任務狀態爲NORMAL,如果出現異常,則紀錄異常,並將任務狀態設置爲EXCEPTIONAL。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章