Linux多線程學習(一)pthread_create

Linux系統下的多線程遵循POSIX線程接口,稱爲pthread。

#include <pthread.h>

int pthread_create(pthread_t *restrict tidp,
const pthread_attr_t *restrict attr,
void *(*start_rtn)(void), 
void *restrict arg);

Returns: 0 if OK, error number on failure

下面這個程序中,我們的函數thr_fn不需要參數,所以最後一個參數設爲空指針。第二個參數我們也設爲空指針,這樣將生成默認屬性的線程。當創建線程成功時,函數返回0,若不爲0則說明創建線程失敗,常見的錯誤返回代碼爲EAGAIN和EINVAL。前者表示系統限制創建新的線程,例如線程數目過多了;後者表示第二個參數代表的線程屬性值非法。創建線程成功後,新創建的線程則運行參數三和參數四確定的函數,原來的線程則繼續運行下一行代碼。

#include<stdio.h>
#include<pthread.h>
#include<string.h>
#include<sys/types.h>
#include<unistd.h>


pthread_t ntid;

void printids(const char *s){
pid_t pid;
pthread_t tid;

pid = getpid();
tid = pthread_self();
printf("%s pid %u tid %u (0x%x)\n",s,(unsigned int)pid,(unsigned int)tid,(unsigned 
int)tid);
}

void *thr_fn(void *arg){
printids("new thread:");
return ((void *)0);
}

int main(){
int err;

err = pthread_create(&ntid,NULL,thr_fn,NULL);
if(err != 0){
printf("can't create thread: %s\n",strerror(err));
return 1;
}

printids("main thread:");
sleep(1);
return 0;
}

由於pthread庫不是Linux系統默認的庫,連接時需要使用庫libpthread.a,所以在使用pthread_create創建線程時,在編譯中要加-lpthread參數:
gcc -o pthread -lpthread pthread.c

運行結果如下:

main thread:  pid 30345 tid 3086157488 (0xb7f306b0)
new thread:  pid 30345 tid 3086154656 (0xb7f2fba0)

可以看到進程號pid是一樣的,而線程號tid不一樣

本文是第一篇將向您講述線程的創建

線程與進程
相對進程而言,線程是一個更加接近於執行體的概念,它可以與同進程中的其他線程共享數據,但擁有自己的棧空間,擁有獨立的執行序列。在串行程序基礎上引入線程和進程是爲了提高程序的併發度,從而提高程序運行效率和響應時間。


線程和進程在使用上各有優缺點:線程執行開銷小,但不利於資源的管理和保護;而進程正相反。同時,線程適合於在SMP機器上運行,而進程則可以跨機器遷移。


 創建線程

POSIX通過pthread_create()函數創建線程,API定義如下:


int   pthread_create(pthread_t   *   thread, pthread_attr_t * attr, 
void * (*start_routine)(void *), void * arg)
與fork()調用創建一個進程的方法不同,pthread_create()創建的線程並不具備與主線程(即調用pthread_create()的線程)同樣的執行序列,而是使其運行start_routine(arg)函數。thread返回創建的線程ID,而attr是創建線程時設置的線程屬性(見下)。pthread_create()的返回值表示線程創建是否成功。儘管arg是void *類型的變量,但它同樣可以作爲任意類型的參數傳給start_routine()函數;同時,start_routine()可以返回一個void *類型的返回值,而這個返回值也可以是其他類型,並由pthread_join()獲取。

 線程創建屬性
pthread_create()中的attr參數是一個結構指針,結構中的元素分別對應着新線程的運行屬性,主要包括以下幾項:


__detachstate,表示新線程是否與進程中其他線程脫離同步,如果置位則新線程不能用pthread_join()來同步,且在退出時自行釋放所佔用的資源。缺省爲PTHREAD_CREATE_JOINABLE狀態。這個屬性也可以在線程創建並運行以後用pthread_detach()來設置,而一旦設置爲PTHREAD_CREATE_DETACH狀態(不論是創建時設置還是運行時設置)則不能再恢復到 PTHREAD_CREATE_JOINABLE狀態。


__schedpolicy,表示新線程的調度策略,主要包括SCHED_OTHER(正常、非實時)、SCHED_RR(實時、輪轉法)和 SCHED_FIFO(實時、先入先出)三種,缺省爲SCHED_OTHER,後兩種調度策略僅對超級用戶有效。運行時可以用過 pthread_setschedparam()來改變。


__schedparam,一個struct sched_param結構,目前僅有一個sched_priority整型變量表示線程的運行優先級。這個參數僅當調度策略爲實時(即SCHED_RR 或SCHED_FIFO)時纔有效,並可以在運行時通過pthread_setschedparam()函數來改變,缺省爲0。


__inheritsched,有兩種值可供選擇:PTHREAD_EXPLICIT_SCHED和PTHREAD_INHERIT_SCHED,前者表示新線程使用顯式指定調度策略和調度參數(即attr中的值),而後者表示繼承調用者線程的值。缺省爲PTHREAD_EXPLICIT_SCHED。


__scope,表示線程間競爭CPU的範圍,也就是說線程優先級的有效範圍。POSIX的標準中定義了兩個值: PTHREAD_SCOPE_SYSTEM和PTHREAD_SCOPE_PROCESS,前者表示與系統中所有線程一起競爭CPU時間,後者表示僅與同進程中的線程競爭CPU。目前LinuxThreads僅實現了PTHREAD_SCOPE_SYSTEM一值。


pthread_attr_t結構中還有一些值,但不使用pthread_create()來設置。


爲了設置這些屬性,POSIX定義了一系列屬性設置函數,包括pthread_attr_init()、pthread_attr_destroy()和與各個屬性相關的pthread_attr_get---/pthread_attr_set---函數。


 線程創建的Linux實現
我們知道,Linux的線程實現是在覈外進行的,核內提供的是創建進程的接口do_fork()。內核提供了兩個系統調用__clone()和fork (),最終都用不同的參數調用do_fork()核內API。當然,要想實現線程,沒有核心對多進程(其實是輕量級進程)共享數據段的支持是不行的,因此,do_fork()提供了很多參數,包括CLONE_VM(共享內存空間)、CLONE_FS(共享文件系統信息)、CLONE_FILES(共享文件描述符表)、CLONE_SIGHAND(共享信號句柄表)和CLONE_PID(共享進程ID,僅對核內進程,即0號進程有效)。當使用fork系統調用時,內核調用do_fork()不使用任何共享屬性,進程擁有獨立的運行環境,而使用pthread_create()來創建線程時,則最終設置了所有這些屬性來調用__clone(),而這些參數又全部傳給核內的do_fork(),從而創建的"進程"擁有共享的運行環境,只有棧是獨立的,由 __clone()傳入。


Linux線程在覈內是以輕量級進程的形式存在的,擁有獨立的進程表項,而所有的創建、同步、刪除等操作都在覈外pthread庫中進行。pthread 庫使用一個管理線程(__pthread_manager(),每個進程獨立且唯一)來管理線程的創建和終止,爲線程分配線程ID,發送線程相關的信號(比如Cancel),而主線程(pthread_create())的調用者則通過管道將請求信息傳給管理線程。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章