linux--posix多線程編程----第一篇

一   線程創建

1.1 線程與進程

相對進程而言,線程是一個更加接近於執行體的概念,它可以與同進程中的其他線程共享數據,但擁有自己的棧空間,擁有獨立的執行序列。在串行程序基礎上引入線程和進程是爲了提高程序的併發度,從而提高程序運行效率和響應時間。

線程和進程在使用上各有優缺點:線程執行開銷小,但不利於資源的管理和保護;而進程正相反。同時,線程適合於在SMP機器上運行,而進程則可以跨機器遷移。

1.2 創建線程

POSIX通過pthread_create()函數創建線程,API定義如下:

int  pthread_create(pthread_t  *  thread, pthread_attr_t * attr, 
void * (*start_routine)(void *), void * arg)

與fork()調用創建一個進程的方法不同,pthread_create()創建的線程並不具備與主線程(即調用pthread_create()的線程)同樣的執行序列,而是使其運行start_routine(arg)函數。thread返回創建的線程ID,而attr是創建線程時設置的線程屬性(見下)。pthread_create()的返回值表示線程創建是否成功。儘管arg是void *類型的變量,但它同樣可以作爲任意類型的參數傳給start_routine()函數;同時,start_routine()可以返回一個void *類型的返回值,而這個返回值也可以是其他類型,並由pthread_join()獲取。

1.3 線程創建屬性

pthread_create()中的attr參數是一個結構指針,結構中的元素分別對應着新線程的運行屬性,主要包括以下幾項:

__detachstate,表示新線程是否與進程中其他線程脫離同步,如果置位則新線程不能用pthread_join()來同步,且在退出時自行釋放所佔用的資源。缺省爲PTHREAD_CREATE_JOINABLE狀態。這個屬性也可以在線程創建並運行以後用pthread_detach()來設置,而一旦設置爲PTHREAD_CREATE_DETACH狀態(不論是創建時設置還是運行時設置)則不能再恢復到PTHREAD_CREATE_JOINABLE狀態。

__schedpolicy,表示新線程的調度策略,主要包括SCHED_OTHER(正常、非實時)、SCHED_RR(實時、輪轉法)和SCHED_FIFO(實時、先入先出)三種,缺省爲SCHED_OTHER,後兩種調度策略僅對超級用戶有效。運行時可以用過pthread_setschedparam()來改變。

__schedparam,一個structsched_param結構,目前僅有一個sched_priority整型變量表示線程的運行優先級。這個參數僅當調度策略爲實時(即SCHED_RR或SCHED_FIFO)時纔有效,並可以在運行時通過pthread_setschedparam()函數來改變,缺省爲0。

__inheritsched,有兩種值可供選擇:PTHREAD_EXPLICIT_SCHED和PTHREAD_INHERIT_SCHED,前者表示新線程使用顯式指定調度策略和調度參數(即attr中的值),而後者表示繼承調用者線程的值。缺省爲PTHREAD_EXPLICIT_SCHED。

__scope,表示線程間競爭CPU的範圍,也就是說線程優先級的有效範圍。POSIX的標準中定義了兩個值:PTHREAD_SCOPE_SYSTEM和PTHREAD_SCOPE_PROCESS,前者表示與系統中所有線程一起競爭CPU時間,後者表示僅與同進程中的線程競爭CPU。目前LinuxThreads僅實現了PTHREAD_SCOPE_SYSTEM一值。

pthread_attr_t結構中還有一些值,但不使用pthread_create()來設置。

爲了設置這些屬性,POSIX定義了一系列屬性設置函數,包括pthread_attr_init()、pthread_attr_destroy()和與各個屬性相關的pthread_attr_get---/pthread_attr_set---函數。

1.4 線程創建的Linux實現

我們知道,Linux的線程實現是在覈外進行的,核內提供的是創建進程的接口do_fork()。內核提供了兩個系統調用__clone()和fork(),最終都用不同的參數調用do_fork()核內API。當然,要想實現線程,沒有核心對多進程(其實是輕量級進程)共享數據段的支持是不行的,因此,do_fork()提供了很多參數,包括CLONE_VM(共享內存空間)、CLONE_FS(共享文件系統信息)、CLONE_FILES(共享文件描述符表)、CLONE_SIGHAND(共享信號句柄表)和CLONE_PID(共享進程ID,僅對核內進程,即0號進程有效)。當使用fork系統調用時,內核調用do_fork()不使用任何共享屬性,進程擁有獨立的運行環境,而使用pthread_create()來創建線程時,則最終設置了所有這些屬性來調用__clone(),而這些參數又全部傳給核內的do_fork(),從而創建的"進程"擁有共享的運行環境,只有棧是獨立的,由__clone()傳入。

Linux線程在覈內是以輕量級進程的形式存在的,擁有獨立的進程表項,而所有的創建、同步、刪除等操作都在覈外pthread庫中進行。pthread庫使用一個管理線程(__pthread_manager(),每個進程獨立且唯一)來管理線程的創建和終止,爲線程分配線程ID,發送線程相關的信號(比如Cancel),而主線程(pthread_create())的調用者則通過管道將請求信息傳給管理線程。

線程取消

2.1 線程取消的定義

一般情況下,線程在其主體函數退出的時候會自動終止,但同時也可以因爲接收到另一個線程發來的終止(取消)請求而強制終止。

2.2 線程取消的語義

線程取消的方法是向目標線程發Cancel信號,但如何處理Cancel信號則由目標線程自己決定,或者忽略、或者立即終止、或者繼續運行至Cancelation-point(取消點),由不同的Cancelation狀態決定。

線程接收到CANCEL信號的缺省處理(即pthread_create()創建線程的缺省狀態)是繼續運行至取消點,也就是說設置一個CANCELED狀態,線程繼續運行,只有運行至Cancelation-point的時候纔會退出。

2.3 取消點

根據POSIX標準,pthread_join()、pthread_testcancel()、pthread_cond_wait()、pthread_cond_timedwait()、sem_wait()、sigwait()等函數以及read()、write()等會引起阻塞的系統調用都是Cancelation-point,而其他pthread函數都不會引起Cancelation動作。但是pthread_cancel的手冊頁聲稱,由於LinuxThread庫與C庫結合得不好,因而目前C庫函數都不是Cancelation-point;但CANCEL信號會使線程從阻塞的系統調用中退出,並置EINTR錯誤碼,因此可以在需要作爲Cancelation-point的系統調用前後調用pthread_testcancel(),從而達到POSIX標準所要求的目標,即如下代碼段:

pthread_testcancel();
    retcode = read(fd, buffer, length);
    pthread_testcancel();

2.4 程序設計方面的考慮

如果線程處於無限循環中,且循環體內沒有執行至取消點的必然路徑,則線程無法由外部其他線程的取消請求而終止。因此在這樣的循環體的必經路徑上應該加入pthread_testcancel()調用。

2.5與線程取消相關的pthread函數

int pthread_cancel(pthread_t thread) 
發送終止信號給thread線程,如果成功則返回0,否則爲非0值。發送成功並不意味着thread會終止。

int pthread_setcancelstate(int state, int *oldstate) 
設置本線程對Cancel信號的反應,state有兩種值:PTHREAD_CANCEL_ENABLE(缺省)和PTHREAD_CANCEL_DISABLE,分別表示收到信號後設爲CANCLED狀態和忽略CANCEL信號繼續運行;old_state如果不爲NULL則存入原來的Cancel狀態以便恢復。

int pthread_setcanceltype(int type, int *oldtype) 
設置本線程取消動作的執行時機,type由兩種取值:PTHREAD_CANCEL_DEFFERED和PTHREAD_CANCEL_ASYCHRONOUS,僅當Cancel狀態爲Enable時有效,分別表示收到信號後繼續運行至下一個取消點再退出和立即執行取消動作(退出);oldtype如果不爲NULL則存入運來的取消動作類型值。

void pthread_testcancel(void) 
檢查本線程是否處於Canceld狀態,如果是,則進行取消動作,否則直接返回。

二  線程私有數據

概念及作用


爲什麼需要私有數據:http://www.cppblog.com/prayer/archive/2009/07/05/89286.html

linux下的線程真是很有趣,各種在windows編程裏看不到的技巧在這裏盡顯無餘。在一個進程裏有許多的線程,這些線程共享進程裏的所有資源。包括數據空間,所以全局變量是爲所有的線程所共享的。但如果線程裏的全局變量爲所有的線程所共享會出現一些問題。比如如果代碼量很大的話那麼名字的命名都是一個問題。如果兩個線程有相同的全局erron變量那麼線程2可以會用到線程1的出錯提示。(兩個線程用到同樣的名字)

這個問題可以通過創建線程的私有數據來解決(thread-specific Data,TSD)。一個線程裏的TSD只有這個線程可以訪問。

TSD採用了一種稱之爲私有數據的技術,即一個鍵對應多個數據值。意思就好比用一個數據結構,這個結構的結構名就是鍵值,在這個結構裏有許多的數據,這些數據封閉在這個結構裏。線程可以通過這個結構名即鍵值來訪問其所屬的數據結構。


概念

在單線程程序中,我們經常要用到"全局變量"以實現多個函數間共享數據。在多線程環境下,由於數據空間是共享的,因此全局變量也爲所有線程所共有。但有時應用程序設計中有必要提供線程私有的全局變量,僅在某個線程中有效,但卻可以跨多個函數訪問,比如程序可能需要每個線程維護一個鏈表,而使用相同的函數操作,最簡單的辦法就是使用同名而不同變量地址的線程相關數據結構。這樣的數據結構可以由Posix線程庫維護,稱爲線程私有數據(Thread-specificData,或TSD)。

創建和註銷

Posix定義了兩個API分別用來創建和註銷TSD:

int pthread_key_create(pthread_key_t *key, void (*destr_function) (void *))

該函數從TSD池中分配一項,將其值賦給key供以後訪問使用。如果destr_function不爲空,在線程退出(pthread_exit())時將以key所關聯的數據爲參數調用destr_function(),以釋放分配的緩衝區。

不論哪個線程調用pthread_key_create(),所創建的key都是所有線程可訪問的,但各個線程可根據自己的需要往key中填入不同的值,這就相當於提供了一個同名而不同值的全局變量。在LinuxThreads的實現中,TSD池用一個結構數組表示:

static struct pthread_key_struct pthread_keys[PTHREAD_KEYS_MAX] = { { 0, NULL } };

創建一個TSD就相當於將結構數組中的某一項設置爲"in_use",並將其索引返回給*key,然後設置destructor函數爲destr_function。

註銷一個TSD採用如下API:

int pthread_key_delete(pthread_key_t key)

這個函數並不檢查當前是否有線程正使用該TSD,也不會調用清理函數(destr_function),而只是將TSD釋放以供下一次調用pthread_key_create()使用。在LinuxThreads中,它還會將與之相關的線程數據項設爲NULL(見"訪問")。

訪問

TSD的讀寫都通過專門的Posix Thread函數進行,其API定義如下:

int  pthread_setspecific(pthread_key_t  key,  const   void  *pointer)
void * pthread_getspecific(pthread_key_t key)

寫入(pthread_setspecific())時,將pointer的值(不是所指的內容)與key相關聯,而相應的讀出函數則將與key相關聯的數據讀出來。數據類型都設爲void*,因此可以指向任何類型的數據。

在LinuxThreads中,使用了一個位於線程描述結構(_pthread_descr_struct)中的二維void*指針數組來存放與key關聯的數據,數組大小由以下幾個宏來說明:

#define PTHREAD_KEY_2NDLEVEL_SIZE       32
#define PTHREAD_KEY_1STLEVEL_SIZE   \
((PTHREAD_KEYS_MAX + PTHREAD_KEY_2NDLEVEL_SIZE - 1)
/ PTHREAD_KEY_2NDLEVEL_SIZE)
    其中在/usr/include/bits/local_lim.h中定義了PTHREAD_KEYS_MAX爲1024,
    因此一維數組大小爲32。而具體存放的位置由key值經過以下計算得到:
idx1st = key / PTHREAD_KEY_2NDLEVEL_SIZE
idx2nd = key % PTHREAD_KEY_2NDLEVEL_SIZE

也就是說,數據存放與一個32×32的稀疏矩陣中。同樣,訪問的時候也由key值經過類似計算得到數據所在位置索引,再取出其中內容返回。

三 一個簡單的例子

使用範例

以下這個例子沒有什麼實際意義,只是說明如何使用,以及能夠使用這一機制達到存儲線程私有數據的目的。

#include <stdio.h>
#include <pthread.h>
pthread_key_t   key;
void echomsg(int t)
{
        printf("destructor excuted in thread %d,param=%d\n",pthread_self(),t);
}
void * child1(void *arg)
{
        int tid=pthread_self();
        printf("thread %d enter\n",tid);
        pthread_setspecific(key,(void *)tid);//變量私有化
        sleep(2);
        printf("thread %d returns %d\n",tid,pthread_getspecific(key));
        sleep(5);
}
void * child2(void *arg)
{
        int tid=pthread_self();
        printf("thread %d enter\n",tid);
        pthread_setspecific(key,(void *)tid);//變量私有化
        sleep(1);
        printf("thread %d returns %d\n",tid,pthread_getspecific(key));
        sleep(5);
}
int main(void)
{
        int tid1,tid2;
        printf("hello\n");
        pthread_key_create(&key,echomsg);//設置私有變量標誌
        pthread_create(&tid1,NULL,child1,NULL);
        pthread_create(&tid2,NULL,child2,NULL);
        sleep(10);
        pthread_key_delete(key);
        printf("main thread exit\n");
        return 0;
}

給例程創建兩個線程分別設置同一個線程私有數據爲自己的線程ID,爲了檢驗其私有性,程序錯開了兩個線程私有數據的寫入和讀出的時間,從程序運行結果可以看出,兩個線程對TSD的修改互不干擾。同時,當線程退出時,清理函數會自動執行,參數爲tid。



c++版本的例子--crazyhacking

#include<iostream>
#include<pthread.h>
using namespace std;

pthread_key_t key;
void destefunc(void *t)
{
pthread_t *s=(pthread_t *)t;
cout<<"this thread exit:"<<pthread_self()<<" "<<t<<" "<<s[0]<<endl;
}
void* func1(void *arg)
{
pthread_t tid=pthread_self();
pthread_setspecific(key,(void *)tid);
sleep(2);
cout<<"func1:"<<tid<<endl;
cout<<(pthread_t)pthread_getspecific(key)<<endl;
}

void* func2(void *arg)
{
//int test1= 2;
//cout<<"func2:"<<test1<<endl;
pthread_t tid=pthread_self();
pthread_setspecific(key,(void *)tid);
cout<<"func2:"<<tid<<endl;
}

int main()
{
pthread_t tid1,tid2;
pthread_key_create(&key,destefunc);//設置私有變量標誌
pthread_create(&tid1,NULL,func1,NULL);
//cout<<tid1<<endl;
pthread_create(&tid2,NULL,func2,NULL);
//cout<<tid2<<endl;
sleep(10);//爲了使得子進程先結束
pthread_key_delete(key);
cout<<"ok,main thread exit"<<endl;
return 0;
}


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章