線程,筆記

線程創建

1.1 線程與進程

相對進程而言,線程是一個更加接近於執行體的概念,它可以與同進程中的其他線程共享數據,但擁有自己的棧空間,擁有獨立的執行序列。在串行程序基礎上引入線程和進程是爲了提高程序的併發度,從而提高程序運行效率和響應時間。

線程和進程在使用上各有優缺點:線程執行開銷小,但不利於資源的管理和保護;而進程正相反。同時,線程適合於在SMP機器上運行,而進程則可以跨機器遷移。

1.2 創建線程

POSIX通過pthread_create()函數創建線程,API定義如下:

int  pthread_create(pthread_t  *  thread, pthread_attr_t * attr, 
void * (*start_routine)(void *), void * arg)


與fork()調用創建一個進程的方法不同,pthread_create()創建的線程並不具備與主線程(即調用pthread_create()的線 程)同樣的執行序列,而是使其運行start_routine(arg)函數。thread返回創建的線程ID,而attr是創建線程時設置的線程屬性 (見下)。pthread_create()的返回值表示線程創建是否成功。儘管arg是void *類型的變量,但它同樣可以作爲任意類型的參數傳給start_routine()函數;同時,start_routine()可以返回一個void *類型的返回值,而這個返回值也可以是其他類型,並由pthread_join()獲取.


1.3 線程創建屬性

pthread_create()中的attr參數是一個結構指針,結構中的元素分別對應着新線程的運行屬性,主要包括以下幾項:

__detachstate,表示新線程是否與進程中其他線程脫離同步,如果置位則新線程不能用pthread_join()來同步,且在退出時自行釋放 所佔用的資源。缺省爲PTHREAD_CREATE_JOINABLE狀態。這個屬性也可以在線程創建並運行以後用pthread_detach()來設 置,而一旦設置爲PTHREAD_CREATE_DETACH狀態(不論是創建時設置還是運行時設置)則不能再恢復到 PTHREAD_CREATE_JOINABLE狀態。

__schedpolicy,表示新線程的調度策略,主要包括SCHED_OTHER(正常、非實時)、SCHED_RR(實時、輪轉法)和 SCHED_FIFO(實時、先入先出)三種,缺省爲SCHED_OTHER,後兩種調度策略僅對超級用戶有效。運行時可以用過 pthread_setschedparam()來改變。

__schedparam, 一個struct sched_param結構,目前僅有一個sched_priority整型變量表示線程的運行優先級。這個參數僅當調度策略爲實時(即SCHED_RR 或SCHED_FIFO)時纔有效,並可以在運行時通過pthread_setschedparam()函數來改變,缺省爲0。

__inheritsched,有兩種值可供選擇:PTHREAD_EXPLICIT_SCHED和PTHREAD_INHERIT_SCHED,前者表 示新線程使用顯式指定調度策略和調度參數(即attr中的值),而後者表示繼承調用者線程的值。缺省爲PTHREAD_EXPLICIT_SCHED。

__scope,表示線程間競爭CPU的範圍,也就是說線程優先級的有效範圍。POSIX的標準中定義了兩個 值:PTHREAD_SCOPE_SYSTEM和PTHREAD_SCOPE_PROCESS,前者表示與系統中所有線程一起競爭CPU時間,後者表示僅 與同進程中的線程競爭CPU。目前LinuxThreads僅實現了PTHREAD_SCOPE_SYSTEM一值。

pthread_attr_t結構中還有一些值,但不使用pthread_create()來設置。

爲了設置這些屬性,POSIX定義了一系列屬性設置函數,包括pthread_attr_init()、pthread_attr_destroy()和與各個屬性相關的pthread_attr_get---/pthread_attr_set---函數。

1.4 線程創建的Linux實現

我 們知道,Linux的線程實現是在覈外進行的,核內提供的是創建進程的接口do_fork()。內核提供了兩個系統調用__clone()和 fork(),最終都用不同的參數調用do_fork()核內API。當然,要想實現線程,沒有核心對多進程(其實是輕量級進程)共享數據段的支持是不行 的,因此,do_fork()提供了很多參數,包括CLONE_VM(共享內存空間)、CLONE_FS(共享文件系統信息)、 CLONE_FILES(共享文件描述符表)、CLONE_SIGHAND(共享信號句柄表)和CLONE_PID(共享進程ID,僅對核內進程,即0號 進程有效)。當使用fork系統調用時,內核調用do_fork()不使用任何共享屬性,進程擁有獨立的運行環境,而使用 pthread_create()來創建線程時,則最終設置了所有這些屬性來調用__clone(),而這些參數又全部傳給核內的do_fork(),從 而創建的"進程"擁有共享的運行環境,只有棧是獨立的,由__clone()傳入。

Linux線程在覈內是以輕量級進程的形式存在的,擁有獨立的進程表項,而所有的創建、同步、刪除等操作都在覈外pthread庫中進行。pthread 庫使用一個管理線程(__pthread_manager(),每個進程獨立且唯一)來管理線程的創建和終止,爲線程分配線程ID,發送線程相關的信號 (比如Cancel),而主線程(pthread_create())的調用者則通過管道將請求信息傳給管理線程。

線程取消

2.1 線程取消的定義

一般情況下,線程在其主體函數退出的時候會自動終止,但同時也可以因爲接收到另一個線程發來的終止(取消)請求而強制終止。

2.2 線程取消的語義

線程取消的方法是向目標線程發Cancel信號,但如何處理Cancel信號則由目標線程自己決定,或者忽略、或者立即終止、或者繼續運行至Cancelation-point(取消點),由不同的Cancelation狀態決定。

線程接收到CANCEL信號的缺省處理(即pthread_create()創建線程的缺省狀態)是繼續運行至取消點,也就是說設置一個CANCELED狀態,線程繼續運行,只有運行至Cancelation-point的時候纔會退出。

2.3 取消點

根 據POSIX標準,pthread_join()、pthread_testcancel()、pthread_cond_wait()、 pthread_cond_timedwait()、sem_wait()、sigwait()等函數以及read()、write()等會引起阻塞的系 統調用都是Cancelation-point,而其他pthread函數都不會引起Cancelation動作。但是pthread_cancel的手 冊頁聲稱,由於LinuxThread庫與C庫結合得不好,因而目前C庫函數都不是Cancelation-point;但CANCEL信號會使線程從阻 塞的系統調用中退出,並置EINTR錯誤碼,因此可以在需要作爲Cancelation-point的系統調用前後調用 pthread_testcancel(),從而達到POSIX標準所要求的目標,即如下代碼段:

pthread_testcancel();
    retcode = read(fd, buffer, length);
    pthread_testcancel();


2.4 程序設計方面的考慮

如果線程處於無限循環中,且循環體內沒有執行至取消點的必然路徑,則線程無法由外部其他線程的取消請求而終止。因此在這樣的循環體的必經路徑上應該加入pthread_testcancel()調用。

2.5 與線程取消相關的pthread函數

int pthread_cancel(pthread_t thread)
發送終止信號給thread線程,如果成功則返回0,否則爲非0值。發送成功並不意味着thread會終止。

int pthread_setcancelstate(int state, int *oldstate)
設置本線程對Cancel信號的反應,state有兩種值:PTHREAD_CANCEL_ENABLE(缺省)和 PTHREAD_CANCEL_DISABLE,分別表示收到信號後設爲CANCLED狀態和忽略CANCEL信號繼續運行;old_state如果不爲 NULL則存入原來的Cancel狀態以便恢復。

int pthread_setcanceltype(int type, int *oldtype)
設置本線程取消動作的執行時機,type由兩種取值:PTHREAD_CANCEL_DEFFERED和 PTHREAD_CANCEL_ASYCHRONOUS,僅當Cancel狀態爲Enable時有效,分別表示收到信號後繼續運行至下一個取消點再退出和 立即執行取消動作(退出);oldtype如果不爲NULL則存入運來的取消動作類型值。

void pthread_testcancel(void)
檢查本線程是否處於Canceld狀態,如果是,則進行取消動作,否則直接返回。

   一個實例的分析:

#include<iostream>
#include<
unistd.h>
#include<
pthread.h>
using namespace std;

pthread_t
pid[3];

void*
thread_run_1(void* arg){
    cout<<"Now in the thread 1"<<endl;

    int
sum = 0;

    int
state, oldstate;

    state = PTHREAD_CANCEL_DEFERRED;
    pthread_setcancelstate(
state, &oldstate);

    cout<<"oldstate is "<<(
state == oldstate? "Deferred":"Async")<<endl;

    //耗時間的循環
    for (int
i = 1; i<=INT_MAX; ++i);
  
    cout<<"before testcancel"<<endl;
    pthread_testcancel();

    cout<<"after testcancel"<<endl;

    cout<<"thread 1 done!"<<endl;

}

void*
thread_run_2(void* arg){
    cout<<"Now in the thread 2"<<endl;
    pthread_cancel(
pid[1]);
    sleep(
2);
    cout<<"thread 2 done!"<<endl;
}

int
main(){
    pid[0] = pthread_self();
    if (pthread_create(&
pid[1],NULL,thread_run_1,NULL) != 0){
        cout<<"error create thread 1"<<endl;
        return -
1;
    }
    if (pthread_create(&
pid[2],NULL,thread_run_2,NULL) != 0){
        cout<<"error create thread 2"<<endl;
        return -
1;
    }

    sleep(
5);

    cout<<"Main thread done!"<<endl;
}


在這個程序中,我們在main線程中生成兩個線程:thread1和thread2,並使用一個全局數組pid來保存線程的id。在這個程序中,我們在thread2中執行取消其他線程的操作。

運行結果如下:
[antony@localhost src]$ g++ cancel_thread.cpp -lpthread
[antony@localhost src]$ ./a.out
Now in the thread 1
oldstate is Deferred
Now in the thread 2
thread 2 done!
Main thread done!
[antony@localhost src]$

thread1後面幾個輸出都沒有進行,可以看到是確實的被thread2取消了。

下面進行進一步的討論:
1、很明顯,thread1並沒有運行到pthread_testcancel所指示的地方,我估計上是在cout函數中存在取消點。可以增加thread1的循環次數,例如:



cout<<"before testcancel"<<endl;

for (int i = 0; i<INT_MAX;++i)
    for(int
j = 0; j<INT_MAX; ++j);


運 行結果並沒有什麼不同,經測試pthread_cancel()函數也沒有返回出錯值。因此上,我們可以知道,pthread_cancel函數是非阻塞 函數,這個程序運行的過程中應該發生了這樣的事情:thread2提請內核cancel掉thread1,然後thread2自己結束返回,之後經過一段 時間的調度,main thread得到了運行機會,輸出Main thread done!後main thread結束,然後整個進程結束,thread1隨着整個進程被殺掉。

實際上,我們在這個測試中並沒有測試到 pthread_testcancel函數,如果我們把main thread中sleep的時間增加,就可以使得程序運行到thread1的pthread_testcancel()處。如果thread1確實被取消 了,則“after testcancel”不會被輸出。

爲了在main thread中確保thread1返回,我們使用pthread_join函數來阻塞整個程序直到thread1返回,這個函數的用法稍後繼續說明。

在main函數中修改下列語句:

pthread_join(pid[1],NULL);


這樣,main函數的結束標誌着thread1必然已經結束。爲了使得等待的時間不要太長(循環INT_MAX次足夠你睡一個午覺了)建議把thread1中的循環次數改小一點,具體的根據你的機器而定,只要運行時間超過2-3秒就足夠了,我把它設置成大約1e9。

編譯運行結果:

[antony@localhost src]$ g++ cancel_thread.cpp -lpthread
[antony@localhost src]$ ./a.out
Now in the thread 1
oldstate is Deferred
before testcancel
Now in the thread 2
thread 2 done!
Main thread done!
[antony@localhost src]$

這樣的結果,我們可以看到,thread1運行到pthread_testcancel處被取消而返回main線程,從而後面的輸出都沒有完成。

2、可能有人奇怪爲什麼main函數中要有sleep(5),不妨去掉這行代碼運行一下:

編譯運行結果:

[antony@localhost src]$ g++ cancel_thread.cpp -lpthread
[antony@localhost src]$ ./a.out
Main thread done!
[antony@localhost src]$

其他線程還沒有得到運行機會就終止了,因爲main thread結束之後,整個進程也就結束了,並不等待所有線程都完成。

3、如果我們取消main線程,會發生什麼事情呢?
把thread2中的pthread_cancel函數的參數稍微改一下,改成pid[0],編譯運行的結果如下:

[antony@localhost src]$ g++ cancel_thread.cpp -lpthread
[antony@localhost src]$ ./a.out
Now in the thread 1
oldstate is Deferred
before testcancel
Now in the thread 2
thread 2 done!
after testcancel
thread 1 done!
[antony@localhost src]$


main線程被我們順利取消了!在thread1運行結束之後,整個進程結束。
如果我們在取消main線程之前,取消掉thread1,也就是:



pthread_cancel(pid[1]);
pthread_cancel(
pid[0]);


編譯運行結果如下:

[antony@localhost src]$ g++ cancel_thread.cpp -lpthread
[antony@localhost src]$ ./a.out
Now in the thread 1
oldstate is Deferred
before testcancel
Now in the thread 2
thread 2 done!
[antony@localhost src]$

需要說明的是,在thread2結束之後,整個進程並沒有馬上結束,而是等到thread1運行到pthread_cancel之後才結束的。取消thread1的命令並沒有隨着main線程的結束而結束。

總結一下這個對這個實例的研究:

pthread_cancel()函數並不阻塞,在向內核發出取消某個線程的信號之後立刻返回調用線程。

pthread_cancel()的信號並不會隨着main線程狀態的改變而改變,這個信號是直接與內核相連的。

對於一個多線程程序而言,以下兩種情況都會導致其終止:
    a) main線程正常結束,則進程不管其他線程的情況,馬上結束(也有可能是給其他線程發了終止信號,這個問題留待我研究信號的時候進一步討論)
    b) main線程被其他線程取消,則等待所有線程結束(關於“所有”,我增加了一個thread3測試過了。)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章