dup()和dup2()

聲明：本文文字較多，比較枯燥，請耐下性子來看，收穫會有的

1、函數dup()和dup2()

(1)#include <unistd.h>

int dup(int oldfd);
int dup2(int oldfd, int newfd);

(2)功能：複製文件句柄

(3)用法： int dup2(int oldfd,int newfd);

(4)如果調用成功，這兩個函數都返回新分配或指定的文件描述符，如果出錯則返回-1。dup返回的新文件描述符一定該進程未使用的最小文件描述符，這一點和open類似。dup2可以用newfd參數指定新描述符的數值。如果newfd當前已經打開，則先將其關閉再做dup2操作，如果oldfd等於newfd，則dup2直接返回newfd而不用先關閉newfd再複製。

(5)在unix高級編程中有介紹dup和dup2，但是沒有實例說明，筆者自己結合實例進行了測試瞭解。
在linux下，通過open打開以文件後，會返回一個文件描述符，文件描述符會指向一個文件表，文件表中的節點指針會指向節點表。看下圖：

打開文件的內核數據結構

dup和dup2兩個函數都可以用來複制打開的文件描述符，複製成功後和複製源共享同一個文件表。看下圖：

執行dup後的內核數據結構

dup函數:dup(現存的文件描述符)
dup返回的新文件描述符一定是當前可以用描述符中的最小值。下面先打開一個文件來看下文件描述符，爲保證測試成功，創建一個測試文件log.txt。

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd;
    fd = open("./log.txt", O_RDWR);
 
    printf("%d\n", fd);
 
    return 0;
}</span>

上面的代碼用讀寫打開了log.txt這個文件，編譯上面的代碼然後執行，執行成功的話，應當是輸出3，因爲0，1，2分別被標準輸入，標準輸出，標準錯誤輸出佔用了。使用dup複製這個文件描述符，並嘗試移動fd偏移量：

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd, copyfd;
 
    fd = open("./log.txt", O_RDWR);
    //複製fd
    copyfd = dup(fd);
 
    //輸出copyfd，應當爲4
    printf("%d\n", copyfd);
 
    //打印出fd和copyfd的偏移量，都爲0
    printf("%d\n", (int)lseek(fd, 0, SEEK_CUR));
    printf("%d\n", (int)lseek(copyfd, 0, SEEK_CUR));
 
    //將fd的偏移量+3
    lseek(fd, 3, SEEK_SET);
 
    //打印出fd和copyfd的偏移量，都爲3
    printf("%d\n", (int)lseek(fd, 0, SEEK_CUR));
    printf("%d\n", (int)lseek(copyfd, 0, SEEK_CUR));
 
    return 0;
}</span>

編譯執行上例代碼可以發現當移動fd的偏移量時，copyfd的偏移量也發生了變化。往文件裏寫入內容試試，先把log.txt內容清空。

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd, copyfd;
 
    fd = open("./log.txt", O_RDWR);
    //複製fd
    copyfd = dup(fd);
 
    char buf1[] = "hello ";
    char buf2[] = "world!";
 
    //往fd文件寫入內容
    if (write(fd, buf1, 6) != 6) {
        printf("write error!");
    }
 
    //打印出fd和copyfd的偏移量，經過上面的寫操作，都變成6了
    printf("%d\n", (int)lseek(fd, 0, SEEK_CUR));
    printf("%d\n", (int)lseek(copyfd, 0, SEEK_CUR));
 
    //往copyfd寫入內容
    if (write(copyfd, buf2, 6) != 6) {
        printf("write error!");
    }
 
    return 0;
}</span>

編譯執行程序，log.txt的就有hello world!字符串了。

dup2函數:dup2(現存的文件描述符，可用的文件描述符)

dup2和dup函數一樣，只是返回的文件描述符可以通過第二個參數”可用的文件描述符“指定。如果“可用的文件描述符“是打開狀態，則會被關閉；如果”現存的文件描述符“和”可用的文件描述符“一樣，則不會關閉，筆者認爲這兩個參數值一樣的話，代碼是沒有任何意義的。

<span style="font-family:Microsoft YaHei;font-size:14px;">#include <unistd.h>
#include <fcntl.h>
#include <stdio.h>
 
int main(int argc, char *argv[])
{
    int fd, copyfd;
 
    fd = open("./log.txt", O_RDWR);
    //指定文件描述符號爲1000
    copyfd = dup2(fd, 1000);
    //打印fd和copyfd，應當輸出3 1000
    printf("%d %d\n", fd, copyfd);
 
    return 0;
}</span>

上面程序就是指定返回的文件描述爲1000，再來看下指定的文件描述符是打開的情況，修改上例代碼，將文件描述符指定爲1：

<span style="font-family:Microsoft YaHei;font-size:14px;">copyfd = dup2(fd, 1);</span>

編譯執行程序將看不到任何輸出，因爲1是終端標準輸出的標識符，經過這樣一複製後，標準輸出就被關閉了，使用printf自然看不到輸出信息了。

2、下面內容選自《UNⅨ環境高級編程》
Stevens said:
⑴ 每個進程在進程表中都有一個記錄項，每個記錄項中有一張打開文件描述符表，可將視爲一個矢量，每個描述符佔用一項。與每個文件描述符相關聯的是：
（a) 文件描述符標誌。
（b) 指向一個文件表項的指針。
⑵ 內核爲所有打開文件維持一張文件表。每個文件表項包含：
（a) 文件狀態標誌（讀、寫、增寫、同步、非阻塞等）。
（b) 當前文件位移量。
（c) 指向該文件v節點表項的指針。
圖示：
文件描述符表
------------
fd0 0 | p0 -------------> 文件表0 ---------> vnode0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------
fd2 2 | p2
------------
fd3 3 | p3
------------
... ...
... ...
------------
(1)單個進程內的dup和dup2
假設進程A擁有一個已打開的文件描述符fd3，它的狀態如下：
進程A的文件描述符表（before dup2）
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------
fd2 2 | p2
------------
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
... ...
... ...
------------
經下面調用：
n_fd = dup2(fd3,STDOUT_FILENO）；後進程狀態如下：
進程A的文件描述符表（after dup2）
------------
fd0 0 | p0
------------
n_fd 1 | p1 ------------
------------ \
fd2 2 | p2 \
------------ _\|
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
... ...
... ...
------------
解釋如下：
n_fd = dup2(fd3,STDOUT_FILENO）表示n_fd與fd3共享一個文件表項（它們的文件表指針指向同一個文件表項），n_fd在文件描述符表中的位置爲 STDOUT_FILENO的位置，而原先的STDOUT_FILENO所指向的文件表項被關閉，我覺得上圖應該很清晰的反映出這點。按照上面的解釋我們就可以解釋CU中提出的一些問題：
⑴ "dup2的第一個參數是不是必須爲已打開的合法filedes？" -- 答案：必須。
⑵ "dup2的第二個參數可以是任意合法範圍的filedes值麼？" -- 答案：可以，在Unix其取值區間爲[0,255]。
另外感覺理解dup2的一個好方法就是把fd看成一個結構體類型，就如上面圖形中畫的那樣，我們不妨把之定義爲：
struct fd_t {
int index;
filelistitem *ptr;
};
然後dup2匹配index，修改ptr，完成dup2操作。

在學習dup2時總是碰到“重定向”一詞，上圖完成的就是一個“從標準輸出到文件的重定向”，經過dup2後進程A的任何目標爲STDOUT_FILENO的I/O操作如printf等，其數據都將流入fd3所對應的文件中。下面是一個例子程序：
#define TESTSTR "Hello dup2\n"
int main() {
int fd3;
fd3 = open("testdup2.dat",0666）；
if (fd3 < 0) {
printf("open error\n");
exit(-1）；
}
if (dup2(fd3,STDOUT_FILENO) < 0) {
printf("err in dup2\n");
}
printf(TESTSTR);
return 0;
}
其結果就是你在testdup2.dat中看到"Hello dup2"。
(2)重定向後恢復
CU上有這樣一個帖子，就是如何在重定向後再恢復原來的狀態？首先大家都能想到要保存重定向前的文件描述符。那麼如何來保存呢，象下面這樣行麼？
int s_fd = STDOUT_FILENO;
int n_fd = dup2(fd3,STDOUT_FILENO);
還是這樣可以呢？
int s_fd = dup(STDOUT_FILENO);
int n_fd = dup2(fd3,STDOUT_FILENO);
這兩種方法的區別到底在哪呢？答案是第二種方案纔是正確的，分析如下：按照第一種方法，我們僅僅在"表面上"保存了相當於fd_t（按照我前面說的理解方法）中的index，而在調用dup2之後，ptr所指向的文件表項由於計數值已爲零而被關閉了，我們如果再調用dup2(s_fd,fd3）就會出錯（出錯原因上面有解釋）。而第二種方法我們首先做一下複製，複製後的狀態如下圖所示：
進程A的文件描述符表（after dup)
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------ /|
fd2 2 | p2 /
------------ /
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------ /
s_fd 4 | p4 ------/
------------
... ...
... ...
------------
調用dup2後狀態爲：
進程A的文件描述符表（after dup2）
------------
fd0 0 | p0
------------
n_fd 1 | p1 ------------
------------ \
fd2 2 | p2 \
------------ _\|
fd3 3 | p3 -------------> 文件表2 ---------> vnode2
------------
s_fd 4 | p4 ------------->；文件表1 ---------> vnode1
------------
... ...
... ...
------------
dup(fd）的語意是返回的新的文件描述符與fd共享一個文件表項。就如after dup圖中的s_fd和fd1共享文件表1一樣。
確定第二個方案後重定向後的恢復就很容易了，只需調用dup2(s_fd,n_fd）；即可。下面是一個完整的例子程序：
#define TESTSTR "Hello dup2\n"
#define SIZEOFTESTSTR 11
int main() {
int fd3;
int s_fd;
int n_fd;
fd3 = open("testdup2.dat",0666）；
if (fd3 < 0) {
printf("open error\n");
exit(-1）；
}
/* 複製標準輸出描述符 */
s_fd = dup(STDOUT_FILENO);
if (s_fd < 0) {
printf("err in dup\n");
}
/* 重定向標準輸出到文件 */
n_fd = dup2(fd3,STDOUT_FILENO);
if (n_fd < 0) {
printf("err in dup2\n");
}
write(STDOUT_FILENO,TESTSTR,SIZEOFTESTSTR); /* 寫入testdup2.dat中 */
/* 重定向恢復標準輸出 */
if (dup2(s_fd,n_fd) < 0) {
printf("err in dup2\n");
}
write(STDOUT_FILENO,TESTSTR,SIZEOFTESTSTR); /* 輸出到屏幕上 */
return 0;
}
注意這裏我在輸出數據的時候我是用了不帶緩衝的write庫函數，如果使用帶緩衝區的printf，則最終結果爲屏幕上輸出兩行"Hello dup2"，而文件testdup2.dat中爲空，原因就是緩衝區作怪，由於最終的目標是屏幕，所以程序最後將緩衝區的內容都輸出到屏幕。
(3)父子進程間的dup/dup2
由fork調用得到的子進程和父進程的相同文件描述符共享同一文件表項，如下圖所示：
父進程A的文件描述符表
------------
fd0 0 | p0
------------
fd1 1 | p1 -------------> 文件表1 ---------> vnode1
------------ /|\
fd2 2 | p2 |
------------ |
|
子進程B的文件描述符表 |
------------ |
fd0 0 | p0 |
------------ |
fd1 1 | p1 ---------------------|
------------
fd2 2 | p2
------------
所以恰當的利用dup2和dup可以在父子進程之間建立一條“溝通的橋樑”。這裏不詳述。
小結
靈活的利用dup/dup2可以給你帶來很多強大的功能，花了一些時間總結出上面那麼多，不知道自己理解的是否透徹，只能在以後的實踐中慢慢探索了。另外，對於dup和dup2總結起來就是“複製，共享”

centos6.5 斷電重新啓動後的unexpected

高級I/O多路轉接之select poll epoll 區別

TCP--三次握手（建立連接）與四次揮手（關閉連接）（轉）

進程通信方法之一--管道（的容量與實現）

vim便捷命令：高亮搜索& 多行註釋和取消多行註釋

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結