dup()和dup2()

聲明:本文文字較多,比較枯燥,請耐下性子來看,收穫會有的微笑

1、函數dup()和dup2()

(1)#include <unistd.h>


int dup(int oldfd);
int dup2(int oldfd, int newfd);

(2)功能: 複製文件句柄

(3)用法: int dup2(int oldfd,int newfd);

(4)如果調用成功,這兩個函數都返回新分配或指定的文件描述符,如果出錯則返回-1。dup返回的新文件描述符一定該進程未使用的最小文件描述符,這一點和open類似。dup2可以用newfd參數指定新描述符的數值。如果newfd當前已經打開,則先將其關閉再做dup2操作,如果oldfd等於newfd,則dup2直接返回newfd而不用先關閉newfd再複製。

(5)在unix高級編程中有介紹dup和dup2,但是沒有實例說明, 筆者自己結合實例進行了測試瞭解。
在linux下,通過open打開以文件後,會返回一個文件描述符,文件描述符會指向一個文件表,文件表中的節點指針會指向節點表。看下圖:


打開文件的內核數據結構


dup和dup2兩個函數都可以用來複制打開的文件描述符,複製成功後和複製源共享同一個文件表。看下圖:

執行dup後的內核數據結構


dup函數:dup(現存的文件描述符)
dup返回的新文件描述符一定是當前可以用描述符中的最小值。下面先打開一個文件來看下文件描述符,爲保證測試成功,創建一個測試文件log.txt。

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd;
    fd = open("./log.txt", O_RDWR);
 
    printf("%d\n", fd);
 
    return 0;
}</span>

上面的代碼用讀寫打開了log.txt這個文件,編譯上面的代碼然後執行,執行成功的話,應當是輸出3,因爲0,1,2分別被標準輸入,標準輸出,標準錯誤輸出佔用了。使用dup複製這個文件描述符,並嘗試移動fd偏移量:

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd, copyfd;
 
    fd = open("./log.txt", O_RDWR);
    //複製fd
    copyfd = dup(fd);
 
    //輸出copyfd,應當爲4
    printf("%d\n", copyfd);
 
    //打印出fd和copyfd的偏移量,都爲0
    printf("%d\n", (int)lseek(fd, 0, SEEK_CUR));
    printf("%d\n", (int)lseek(copyfd, 0, SEEK_CUR));
 
    //將fd的偏移量+3
    lseek(fd, 3, SEEK_SET);
 
    //打印出fd和copyfd的偏移量,都爲3
    printf("%d\n", (int)lseek(fd, 0, SEEK_CUR));
    printf("%d\n", (int)lseek(copyfd, 0, SEEK_CUR));
 
    return 0;
}</span>

編譯執行上例代碼可以發現當移動fd的偏移量時,copyfd的偏移量也發生了變化。往文件裏寫入內容試試,先把log.txt內容清空。

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd, copyfd;
 
    fd = open("./log.txt", O_RDWR);
    //複製fd
    copyfd = dup(fd);
 
    char buf1[] = "hello ";
    char buf2[] = "world!";
 
    //往fd文件寫入內容
    if (write(fd, buf1, 6) != 6) {
        printf("write error!");
    }
 
    //打印出fd和copyfd的偏移量,經過上面的寫操作,都變成6了
    printf("%d\n", (int)lseek(fd, 0, SEEK_CUR));
    printf("%d\n", (int)lseek(copyfd, 0, SEEK_CUR));
 
    //往copyfd寫入內容
    if (write(copyfd, buf2, 6) != 6) {
        printf("write error!");
    }
 
    return 0;
}</span>


編譯執行程序,log.txt的就有hello world!字符串了。


dup2函數:dup2(現存的文件描述符,可用的文件描述符)


dup2和dup函數一樣,只是返回的文件描述符可以通過第二個參數”可用的文件描述符“指定。如果“可用的文件描述符“是打開狀態,則會被關閉;如果”現存的文件描述符“和”可用的文件描述符“一樣,則不會關閉,筆者認爲這兩個參數值一樣的話,代碼是沒有任何意義的。

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd, copyfd;
 
    fd = open("./log.txt", O_RDWR);
    //指定文件描述符號爲1000
    copyfd = dup2(fd, 1000);
    //打印fd和copyfd,應當輸出3 1000
    printf("%d %d\n", fd, copyfd);
 
    return 0;
}</span>

上面程序就是指定返回的文件描述爲1000,再來看下指定的文件描述符是打開的情況,修改上例代碼,將文件描述符指定爲1:

<span style="font-family:Microsoft YaHei;font-size:14px;">copyfd = dup2(fd, 1);</span>

編譯執行程序將看不到任何輸出,因爲1是終端標準輸出的標識符,經過這樣一複製後,標準輸出就被關閉了,使用printf自然看不到輸出信息了。

2、下面內容選自《UNⅨ環境高級編程》
Stevens said:
⑴ 每個進程在進程表中都有一個記錄項,每個記錄項中有一張打開文件描述符表,可將視爲一個矢量,每個描述符佔用一項。與每個文件描述符相關聯的是:
(a) 文件描述符標誌。
(b) 指向一個文件表項的指針。
⑵ 內核爲所有打開文件維持一張文件表。每個文件表項包含:
(a) 文件狀態標誌(讀、寫、增寫、同步、非阻塞等)。
(b) 當前文件位移量。
(c) 指向該文件v節點表項的指針。
圖示:
文件描述符表
------------
fd0 0 | p0 -------------> 文件表0 ---------> vnode0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------
fd2 2 | p2
------------
fd3 3 | p3
------------
... ...
... ...
------------
(1)單個進程內的dup和dup2
假設進程A擁有一個已打開的文件描述符fd3,它的狀態如下:
進程A的文件描述符表(before dup2)
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------
fd2 2 | p2
------------
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
... ...
... ...
------------
經下面調用:
n_fd = dup2(fd3,STDOUT_FILENO);後進程狀態如下:
進程A的文件描述符表(after dup2)
------------
fd0 0 | p0
------------
n_fd 1 | p1 ------------
------------ \
fd2 2 | p2 \
------------ _\|
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
... ...
... ...
------------
解釋如下:
n_fd = dup2(fd3,STDOUT_FILENO)表示n_fd與fd3共享一個文件表項(它們的文件表指針指向同一個文件表項),n_fd在文件描述符表中的位置爲 STDOUT_FILENO的位置,而原先的STDOUT_FILENO所指向的文件表項被關閉,我覺得上圖應該很清晰的反映出這點。按照上面的解釋我們就可以解釋CU中提出的一些問題:
⑴ "dup2的第一個參數是不是必須爲已打開的合法filedes?" -- 答案:必須。
⑵ "dup2的第二個參數可以是任意合法範圍的filedes值麼?" -- 答案:可以,在Unix其取值區間爲[0,255]。

另外感覺理解dup2的一個好方法就是把fd看成一個結構體類型,就如上面圖形中畫的那樣,我們不妨把之定義爲:
struct fd_t {
int index;
filelistitem *ptr;
};
然後dup2匹配index,修改ptr,完成dup2操作。


在學習dup2時總是碰到“重定向”一詞,上圖完成的就是一個“從標準輸出到文件的重定向”,經過dup2後進程A的任何目標爲STDOUT_FILENO的I/O操作如printf等,其數據都將流入fd3所對應的文件中。下面是一個例子程序:
#define TESTSTR "Hello dup2\n"
int main() {
int fd3;
fd3 = open("testdup2.dat",0666);
if (fd3 < 0) {
printf("open error\n");
exit(-1);
}
if (dup2(fd3,STDOUT_FILENO) < 0) {
printf("err in dup2\n");
}
printf(TESTSTR);
return 0;
}
其結果就是你在testdup2.dat中看到"Hello dup2"。
(2)重定向後恢復
CU上有這樣一個帖子,就是如何在重定向後再恢復原來的狀態?首先大家都能想到要保存重定向前的文件描述符。那麼如何來保存呢,象下面這樣行麼?
int s_fd = STDOUT_FILENO;
int n_fd = dup2(fd3,STDOUT_FILENO);
還是這樣可以呢?
int s_fd = dup(STDOUT_FILENO);
int n_fd = dup2(fd3,STDOUT_FILENO);
這兩種方法的區別到底在哪呢?答案是第二種方案纔是正確的,分析如下:按照第一種方法,我們僅僅在"表面上"保存了相當於fd_t(按照我前面說的理解方法)中的index,而在調用dup2之後,ptr所指向的文件表項由於計數值已爲零而被關閉了,我們如果再調用dup2(s_fd,fd3)就會出錯(出錯原因上面有解釋)。而第二種方法我們首先做一下複製,複製後的狀態如下圖所示:
進程A的文件描述符表(after dup)
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------ /|
fd2 2 | p2 /
------------ /
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------ /
s_fd 4 | p4 ------/
------------
... ...
... ...
------------
調用dup2後狀態爲:
進程A的文件描述符表(after dup2)
------------
fd0 0 | p0
------------
n_fd 1 | p1 ------------
------------ \
fd2 2 | p2 \
------------ _\|
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
s_fd 4 | p4 ------------->;文件表1 ---------> vnode1
------------
... ...
... ...
------------
dup(fd)的語意是返回的新的文件描述符與fd共享一個文件表項。就如after dup圖中的s_fd和fd1共享文件表1一樣。
確定第二個方案後重定向後的恢復就很容易了,只需調用dup2(s_fd,n_fd);即可。下面是一個完整的例子程序:
#define TESTSTR "Hello dup2\n"
#define SIZEOFTESTSTR 11
int main() {
int fd3;
int s_fd;
int n_fd;
fd3 = open("testdup2.dat",0666);
if (fd3 < 0) {
printf("open error\n");
exit(-1);
}
/* 複製標準輸出描述符 */
s_fd = dup(STDOUT_FILENO);
if (s_fd < 0) {
printf("err in dup\n");
}
/* 重定向標準輸出到文件 */
n_fd = dup2(fd3,STDOUT_FILENO);
if (n_fd < 0) {
printf("err in dup2\n");
}
write(STDOUT_FILENO,TESTSTR,SIZEOFTESTSTR); /* 寫入testdup2.dat中 */
/* 重定向恢復標準輸出 */
if (dup2(s_fd,n_fd) < 0) {
printf("err in dup2\n");
}
write(STDOUT_FILENO,TESTSTR,SIZEOFTESTSTR); /* 輸出到屏幕上 */
return 0;
}
注意這裏我在輸出數據的時候我是用了不帶緩衝的write庫函數,如果使用帶緩衝區的printf,則最終結果爲屏幕上輸出兩行"Hello dup2",而文件testdup2.dat中爲空,原因就是緩衝區作怪,由於最終的目標是屏幕,所以程序最後將緩衝區的內容都輸出到屏幕。
(3)父子進程間的dup/dup2
由fork調用得到的子進程和父進程的相同文件描述符共享同一文件表項,如下圖所示:
父進程A的文件描述符表
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------ /|\
fd2 2 | p2 |
------------ |
|
子進程B的文件描述符表 |
------------ |
fd0 0 | p0 |
------------ |
fd1 1 | p1 ---------------------|
------------
fd2 2 | p2
------------
所以恰當的利用dup2和dup可以在父子進程之間建立一條“溝通的橋樑”。這裏不詳述。
小結
靈活的利用dup/dup2可以給你帶來很多強大的功能,花了一些時間總結出上面那麼多,不知道自己理解的是否透徹,只能在以後的實踐中慢慢探索了。另外,對於dup和dup2總結起來就是“複製,共享

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章