原文作者:aircraft
原文鏈接:https://www.cnblogs.com/DOMLX/p/9622548.html
鍥子:關於併發服務器中的I/O複用實現方式,前面在網絡編程系列四還是五來着????我們講過select的方式,但select的性能比較低,當連接數量超過幾百個的時候就很慢了,並不適合以Web服務器端開發爲主流的現代開發環境。因此就有了Linux下的epoll,BSD的kqueue,Solaris的/dev/poll和Windows的IOCP等複用技術。本章就來講講Linux下的epoll技術和Windows下的IOCP模型。
一:IOCP和Epoll之間的異同。 異: 1:IOCP是WINDOWS系統下使用。Epoll是Linux系統下使用。 2:IOCP是IO操作完畢之後,通過Get函數獲得一個完成的事件通知。 Epoll是當你希望進行一個IO操作時,向Epoll查詢是否可讀或者可寫,若處於可讀或可寫狀態後,Epoll會通過epoll_wait進行通知。 3:IOCP封裝了異步的消息事件的通知機制,同時封裝了部分IO操作。但Epoll僅僅封裝了一個異步事件的通知機制,並不負責IO讀寫操作。Epoll保持了事件通知和IO操作間的獨立性,更加簡單靈活。 4:基於上面的描述,我們可以知道Epoll不負責IO操作,所以它只告訴你當前可讀可寫了,並且將協議讀寫緩衝填充,由用戶去讀寫控制,此時我們可以做出額外的許多操作。IOCP則直接將IO通道里的讀寫操作都做完了才通知用戶,當IO通道里發生了堵塞等狀況我們是無法控制的。
同: 1:它們都是異步的事件驅動的網絡模型。 2:它們都可以向底層進行指針數據傳遞,當返回事件時,除可通知事件類型外,還可以通知事件相關數據。
二:Epoll理解與應用。
1、epoll是什麼?
epoll是當前在Linux下開發大規模併發網絡程序的熱門人選,epoll 在Linux2.6內核中正式引入,和select相似,都是I/O多路複用(IO multiplexing)技術。
Linux下設計併發網絡程序,常用的模型有:
Apache模型(Process Per Connection,簡稱PPC)
TPC(Thread PerConnection)模型
select模型和poll模型。
epoll模型
2、epoll與select對比優化:
- 基於select的I/O複用技術速度慢的原因: 1,調用select函數後常見的針對所有文件描述符的循環語句。它每次事件發生需要遍歷所有文件描述符,找出發生變化的文件描述符。(以前寫的示例沒加循環) 2,每次調用select函數時都需要向該函數傳遞監視對象信息。即每次調用select函數時向操作系統傳遞監視對象信息,至於爲什麼要傳?是因爲我們監視的套接字變化的函數,而套接字是操作系統管理的。(這個纔是最耗效率的) 註釋:基於這樣的原因並不是說select就沒用了,在這樣的情況下就適合選用select:1,服務端接入者少 2,程序應具有兼容性。
- epoll是怎麼優化select問題的: 1,每次發生事件它不需要循環遍歷所有文件描述符,它把發生變化的文件描述符單獨集中到了一起。 2,僅向操作系統傳遞1次監視對象信息,監視範圍或內容發生變化時只通知發生變化的事項。
- 實現epoll時必要的函數和結構體 函數: epoll_create:創建保存epoll文件描述符的空間,該函數也會返回文件描述符,所以終止時,也要調用close函數。(創建內存空間) epoll_ctl:向空間註冊,添加或修改文件描述符。(註冊監聽事件) epoll_wait:與select函數類似,等待文件描述符發生變化。(監聽事件回調) 結構體: struct epoll_event { __uint32_t events; epoll_data_t data; } typedef union epoll_data { void *ptr; int fd; __uinit32_t u32; __uint64_t u64; } epoll_data_t;
epoll的幾個函數的介紹:
1、epoll_create函數:
/** * @brief 該函數生成一個epoll專用的文件描述符。它其實是在內核申請一空間,用來存放你想關注的socket fd上是否發生以及發生了什麼事件。 * * @param size size就是你在這個epoll fd上能關注的最大socket fd數 * * @return 生成的文件描述符 */ int epoll_create(int size);
2、epoll_ctl函數:
/** * @brief 該函數用於控制某個epoll文件描述符上的事件,可以註冊事件,修改事件,刪除事件。 * * @param epfd 由 epoll_create 生成的epoll專用的文件描述符 * @param op 要進行的操作例如註冊事件,可能的取值EPOLL_CTL_ADD 註冊、EPOLL_CTL_MOD 修 改、EPOLL_CTL_DEL 刪除 * @param fd 關聯的文件描述符 * @param event 指向epoll_event的指針 * * @return 0 succ * -1 fail */ int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
其中用到的數據結構結構如下: op值: EPOLL_CTL_ADD:註冊新的fd到epfd中;
EPOLL_CTL_MOD:修改已經註冊的fd的監聽事件;
EPOLL_CTL_DEL:從epfd中刪除一個fd;
typedef union epoll_data { void *ptr; int fd; __uint32_t u32; __uint64_t u64; } epoll_data_t; struct epoll_event { __uint32_t events; /* Epoll events */ epoll_data_t data; /* User data variable */ };
常用的事件類型: EPOLLIN :表示對應的文件描述符可以讀; EPOLLOUT:表示對應的文件描述符可以寫; EPOLLPRI:表示對應的文件描述符有緊急的數據可讀 EPOLLERR:表示對應的文件描述符發生錯誤; EPOLLHUP:表示對應的文件描述符被掛斷; EPOLLET: 表示對應的文件描述符有事件發生;
例:
<code class="language-cpp">struct epoll_event ev; //設置與要處理的事件相關的文件描述符 ev.data.fd=listenfd; //設置要處理的事件類型 ev.events=EPOLLIN|EPOLLET; //註冊epoll事件 epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev); </code>
3、epoll_wait函數:
/** * @brief 該函數用於輪詢I/O事件的發生 * * @param epfd 由epoll_create 生成的epoll專用的文件描述符 * @param events 用於回傳代處理事件的數組 * @param maxevents 每次能處理的事件數 * @param timeout 等待I/O事件發生的超時值;-1相當於阻塞,0相當於非阻塞。一般用-1即可 * * @return >=0 返回發生事件數 * -1 錯誤 */ int epoll_wait(int epfd,struct epoll_event * events,int maxevents,int timeout);
用改良的epoll實現回聲服務端代碼:
#include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h> #include <arpa/inet.h> #include <sys/socket.h> #include <sys/epoll.h> #define BUF_SIZE 100 #define EPOLL_SIZE 50 void error_handling(char *buf); int main(int argc, const char * argv[]) { int serv_sock, clnt_sock; struct sockaddr_in serv_adr, clnt_adr; socklen_t adr_sz; int str_len, i; char buf[BUF_SIZE]; //類似select的fd_set變量查看監視對象的狀態變化,epoll_event結構體將發生變化的文件描述符單獨集中到一起 struct epoll_event *ep_events; struct epoll_event event; int epfd, event_cnt; if(argc != 2) { printf("Usage: %s <port> \n", argv[0]); exit(1); } serv_sock = socket(PF_INET, SOCK_STREAM, 0); if(serv_sock == -1) error_handling("socket() error"); memset(&serv_adr, 0, sizeof(serv_adr)); serv_adr.sin_family = AF_INET; serv_adr.sin_addr.s_addr = htonl(INADDR_ANY); serv_adr.sin_port = htons(atoi(argv[1])); if(bind(serv_sock, (struct sockaddr *) &serv_adr, sizeof(serv_adr)) == -1) error_handling("bind() error"); if(listen(serv_sock, 5) == -1) error_handling("listen() error"); //創建文件描述符的保存空間稱爲“epoll例程” epfd = epoll_create(EPOLL_SIZE); ep_events = malloc(sizeof(struct epoll_event) *EPOLL_SIZE); //添加讀取事件的監視(註冊事件) event.events = EPOLLIN; //讀取數據事件 event.data.fd = serv_sock; epoll_ctl(epdf, EPOLL_CTL_ADD, serv_sock, &event); while (1) { //響應事件,返回發生事件的文件描述符數 event_cnt = epoll_wait(epfd, ep_events, EPOLL_SIZE, -1); //傳-1時,一直等待直到事件發生 if(event_cnt == -1) { puts("epoll_wait() error"); break; } //服務端套接字和客服端套接字 for (i = 0; i < event_cnt; i++) { if(ep_events[i].data.fd == serv_sock)//服務端與客服端建立連接 { adr_sz = sizeof(clnt_adr); clnt_sock = accept(serv_sock, (struct sockaddr *)&clnt_adr, &adr_sz); event.events = EPOLLIN; event.data.fd = clnt_sock; epoll_ctl(epfd, EPOLL_CTL_ADD, clnt_sock, &event); printf("connected client: %d \n", clnt_sock); } else //連接之後傳遞數據 { str_len = read(ep_events[i].data.fd, buf, BUF_SIZE); if(str_len == 0) { //刪除事件 epoll_ctl(epfd, EPOLL_CTL_DEL, ep_events[i].data.fd, NULL); close(ep_events[i].data.fd); printf("closed client: %d \n", ep_events[i].data.fd); } else { write(ep_events[i].data.fd, buf, str_len); } } } } close(serv_sock); close(epfd); return 0; } void error_handling(char *message) { fputs(message, stderr); fputc('\n', stderr); exit(1); }
epoll客戶端代碼:
#define _GNU_SOURCE #include "sysutil.h" #include "buffer.h" #include <sys/epoll.h> int main(int argc, char const *argv[]) { //創建client套接字 int sockfd = tcp_client(0); //調用非阻塞connect函數 int ret = nonblocking_connect(sockfd, "localhost", 9981, 5000); if(ret == -1) { perror("Connect Timeout ."); exit(EXIT_FAILURE); } //將三個fd設置爲Non-Blocking activate_nonblock(sockfd); activate_nonblock(STDIN_FILENO); activate_nonblock(STDOUT_FILENO); buffer_t recvbuf; //sockfd -> Buffer -> stdout buffer_t sendbuf; //stdin -> Buffer -> sockfd //初始化緩衝區 buffer_init(&recvbuf); buffer_init(&sendbuf); //創建epoll int epollfd = epoll_create1(0); if(epollfd == -1) ERR_EXIT("create epoll"); struct epoll_event events[1024]; uint32_t sockfd_event = 0; uint32_t stdin_event = 0; uint32_t stdout_event = 0; epoll_add_fd(epollfd, sockfd, sockfd_event); epoll_add_fd(epollfd, STDIN_FILENO, stdin_event); epoll_add_fd(epollfd, STDOUT_FILENO, stdout_event); while(1) { //重新裝填epoll事件 sockfd_event = 0; stdin_event = 0; stdout_event = 0; //epoll無法每次都重新裝填,所以給每個fd添加一個空事件 if(buffer_is_readable(&sendbuf)) { sockfd_event |= kWriteEvent; } if(buffer_is_writeable(&sendbuf)) { stdin_event |= kReadEvent; } if(buffer_is_readable(&recvbuf)) { stdout_event |= kWriteEvent; } if(buffer_is_writeable(&recvbuf)) { sockfd_event |= kReadEvent; } epoll_mod_fd(epollfd, sockfd, sockfd_event); epoll_mod_fd(epollfd, STDIN_FILENO, stdin_event); epoll_mod_fd(epollfd, STDOUT_FILENO, stdout_event); //監聽fd數組 int nready = epoll_wait(epollfd, events, 1024, 5000); if(nready == -1) ERR_EXIT("epoll wait"); else if(nready == 0) { printf("epoll timeout.\n"); continue; } else { int i; for(i = 0; i < nready; ++i) { int peerfd = events[i].data.fd; int revents = events[i].events; if(peerfd == sockfd && revents & kReadREvent) { //從sockfd接收數據到recvbuf if(buffer_read(&recvbuf, peerfd) == 0) { fprintf(stderr, "server close.\n"); exit(EXIT_SUCCESS); } } if(peerfd == sockfd && revents & kWriteREvent) { buffer_write(&sendbuf, peerfd); //將sendbuf中的數據寫入sockfd } if(peerfd == STDIN_FILENO && revents & kReadREvent) { //從stdin接收數據寫入sendbuf if(buffer_read(&sendbuf, peerfd) == 0) { fprintf(stderr, "exit.\n"); exit(EXIT_SUCCESS); } } if(peerfd == STDOUT_FILENO && revents & kWriteREvent) { buffer_write(&recvbuf, peerfd); //將recvbuf中的數據輸出至stdout } } } } }
條件觸發和邊緣觸發- 什麼是條件觸發和邊緣觸發?它們是指事件響應的方式,epoll默認是條件觸發的方式。條件觸發是指:只要輸入緩衝中有數據就會一直通知該事件,循環響應epoll_wait。而邊緣觸發是指:輸入緩衝收到數據時僅註冊1次該事件,即使輸入緩衝中還留有數據,也不會再進行註冊,只響應一次。
- 邊緣觸發相對條件觸發的優點:可以分離接收數據和處理數據的時間點,從實現模型的角度看,邊緣觸發更有可能帶來高性能。
- 將上面epoll實例改爲邊緣觸發:
1,首先改寫 event.events = EPOLLIN | EPOLLET; (EPOLLIN:讀取數據事件 EPOLLET:邊緣觸發方式)
2,邊緣觸發只響應一次接收數據事件,所以要一次性全部讀取輸入緩衝中的數據,那麼就需要判斷什麼時候數據讀取完了?Linux聲明瞭一個全局的變量:int errno; (error.h中),它能記錄發生錯誤時提供額外的信息。這裏就可以用它來判斷是否讀取完數據:
str_len = read(...); if(str_len < 0) { if(errno == EAGAIN) //讀取輸入緩衝中的全部數據的標誌 break; }
3,邊緣觸發方式下,以阻塞方式工作的read&write有可能會引起服務端的長時間停頓。所以邊緣觸發一定要採用非阻塞的套接字數據傳輸形式。那麼怎麼將套接字的read,write數據傳輸形式修改爲非阻塞模式呢?
//fd套接字文件描述符,將此套接字數據傳輸模式修改爲非阻塞 void setnonblockingmode(int fd) { int flag = fcntl(fd, F_GETFL,0); //得到套接字原來屬性 fcntl(fd, F_SETFL, flag | O_NONBLOCK);//在原有屬性基礎上設置添加非阻塞模式 }
三.IOCP理解與應用。
扯遠點。首先傳統服務器的網絡IO流程如下: 接到一個客戶端連接->創建一個線程負責這個連接的IO操作->持續對新線程進行數據處理->全部數據處理完畢->終止線程。 但是這樣的設計代價是:
- 1:每個連接創建一個線程,將導致過多的線程。
- 2:維護線程所消耗的堆棧內存過大。
- 3:操作系統創建和銷燬線程過大。
- 4:線程之間切換的上下文代價過大。
- 3:操作系統創建和銷燬線程過大。
- 2:維護線程所消耗的堆棧內存過大。
此時我們可以考慮使用線程池解決其中3和4的問題。這種傳統的服務器網絡結構稱之爲會話模型。 後來我們爲防止大量線程的維護,創建了I/O模型,它被希望要求可以: 1:允許一個線程在不同時刻給多個客戶端進行服務。 2:允許一個客戶端在不同時間被多個線程服務。
這樣做的話,我們的線程則會大幅度減少,這就要求以下兩點: 1:客戶端狀態的分離,之前會話模式我們可以通過線程狀態得知客戶端狀態,但現在客戶端狀態要通過其他方式獲取。 2:I/O請求的分離。一個線程不再服務於一個客戶端會話,則要求客戶端對這個線程提交I/O處理請求。
那麼就產生了這樣一個模式,分爲三部分:
- 1:會話狀態管理模塊。它負責接收到一個客戶端連接,就創建一個會話狀態。
- 2:當會話狀態發生改變,例如斷掉連接,接收到網絡消息,就發送一個I/O請求給 I/O工作模塊進行處理。
- 3:I/O工作模塊接收到一個I/O請求後,從線程池裏喚醒一個工作線程,讓該工作線程處理這個I/O請求,處理完畢後,該工作線程繼續掛起。
- 2:當會話狀態發生改變,例如斷掉連接,接收到網絡消息,就發送一個I/O請求給 I/O工作模塊進行處理。
上面的做法,則將網絡連接 和I/O工作線程分離爲三個部分,相互通訊僅依靠 I/O請求。此時可知有以下一些建議:
- 1:在進行I/O請求處理的工作線程是被喚醒的工作線程,一個CPU對應一個的話,可以最大化利用CPU。所以 活躍線程的個數 建議等於 硬件CPU個數。
- 2:工作線程我們開始創建了線程池,免除創建和銷燬線程的代價。因爲線程是對I/O進行操作的,且一一對應,那麼當I/O全部並行時,工作線程必須滿足I/O並行操作需求,所以 線程池內最大工作線程個數 建議大於或者等於 I/O並行個數。
- 3:但是我們可知CPU個數又限制了活躍的線程個數,那麼線程池過大意義很低,所以按常規建議 線程池大小 等於 CPU個數*2 左右爲佳。例如,8核服務器建議創建16個工作線程的線程池。 上面描述的依然是I/O模型並非IOCP,那麼IOCP是什麼呢,全稱 IO完成端口。
- 2:工作線程我們開始創建了線程池,免除創建和銷燬線程的代價。因爲線程是對I/O進行操作的,且一一對應,那麼當I/O全部並行時,工作線程必須滿足I/O並行操作需求,所以 線程池內最大工作線程個數 建議大於或者等於 I/O並行個數。
它是一種WIN32的網絡I/O模型,既包括了網絡連接部分,也負責了部分的I/O操作功能,用於方便我們控制有併發性的網絡I/O操作。它有如下特點:
- 1:它是一個WIN32內核對象,所以無法運行於Linux.
- 2:它自己負責維護了工作線程池,同時也負責了I/O通道的內存池。
- 3:它自己實現了線程的管理以及I/O請求通知,最小化的做到了線程的上下文切換。
- 4:它自己實現了線程的優化調度,提高了CPU和內存緩衝的使用率。
- 3:它自己實現了線程的管理以及I/O請求通知,最小化的做到了線程的上下文切換。
- 2:它自己負責維護了工作線程池,同時也負責了I/O通道的內存池。
使用IOCP的基本步驟很簡單:
- 1:創建IOCP對象,由它負責管理多個Socket和I/O請求。CreateIoCompletionPort需要將IOCP對象和IOCP句柄綁定。
- 2:創建一個工作線程池,以便Socket發送I/O請求給IOCP對象後,由這些工作線程進行I/O操作。注意,創建這些線程的時候,將這些線程綁定到IOCP上。
- 3:創建一個監聽的socket。
- 4:輪詢,當接收到了新的連接後,將socket和完成端口進行關聯並且投遞給IOCP一個I/O請求。注意:將Socket和IOCP進行關聯的函數和創建IOCP的函數一樣,都是CreateIoCompletionPort,不過注意傳參必然是不同的。
- 5:因爲是異步的,我們可以去做其他,等待IOCP將I/O操作完成會回饋我們一個消息,我們再進行處理。
- 其中需要知道的是:I/O請求被放在一個I/O請求隊列裏面,對,是隊列,LIFO機制。當一個設備處理完I/O請求後,將會將這個完成後的I/O請求丟回IOCP的I/O完成隊列。
- 我們應用程序則需要在GetQueuedCompletionStatus去詢問IOCP,該I/O請求是否完成。
- 其中有一些特殊的事情要說明一下,我們有時有需要人工的去投遞一些I/O請求,則需要使用PostQueuedCompletionStatus函數向IOCP投遞一個I/O請求到它的請求隊列中。
- 4:輪詢,當接收到了新的連接後,將socket和完成端口進行關聯並且投遞給IOCP一個I/O請求。注意:將Socket和IOCP進行關聯的函數和創建IOCP的函數一樣,都是CreateIoCompletionPort,不過注意傳參必然是不同的。
- 3:創建一個監聽的socket。
- 2:創建一個工作線程池,以便Socket發送I/O請求給IOCP對象後,由這些工作線程進行I/O操作。注意,創建這些線程的時候,將這些線程綁定到IOCP上。
最後說一句啦。本網絡編程入門系列博客是連載學習的,有興趣的可以看我博客其他篇。。。。
參考博客:http://blog.csdn.net/penzo/article/details/5986574
參考博客:https://blog.csdn.net/educast/article/details/15500349
參考博客:https://blog.csdn.net/u010223072/article/details/49276415
參考書籍:《TCP/IP網絡編程--尹聖雨》