epoll是多路複用IO(I/O Multiplexing)中的一種方式,但是僅用於linux2.6以上內核,在開始討論這個問題之前,先來解釋一下爲什麼需要多路複用IO.
以一個生活中的例子來解釋.
假設你在大學中讀書,要等待一個朋友來訪,而這個朋友只知道你在A號樓,但是不知道你具體住在哪裏,於是你們約好了在A號樓門口見面.
如果你使用的阻塞IO模型來處理這個問題,那麼你就只能一直守候在A號樓門口等待朋友的到來,在這段時間裏你不能做別的事情,不難知道,這種方式的效率是低下的.
現在時代變化了,開始使用多路複用IO模型來處理這個問題.你告訴你的朋友來了A號樓找樓管大媽,讓她告訴你該怎麼走.這裏的樓管大媽扮演的就是多路複用IO的角色.
進一步解釋select和epoll模型的差異.
select版大媽做的是如下的事情:比如同學甲的朋友來了,select版大媽比較笨,她帶着朋友挨個房間進行查詢誰是同學甲,你等的朋友來了,於是在實際的代碼中,select版大媽做的是以下的事情:
int n = select(&readset,NULL,NULL,100);
for (int i = 0; n > 0; ++i)
{
if (FD_ISSET(fdarray[i], &readset))
{
do_something(fdarray[i]);
--n;
}
}
epoll版大媽就比較先進了,她記下了同學甲的信息,比如說他的房間號,那麼等同學甲的朋友到來時,只需要告訴該朋友同學甲在哪個房間即可,不用自己親自帶着人滿大樓的找人了.於是epoll版大媽做的事情可以用如下的代碼表示:
for(i=0;i<n;++i)
在epoll中,關鍵的數據結構epoll_event定義如下:
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
} epoll_data_t;
struct epoll_event {
__uint32_t events;
epoll_data_t data;
};
可以看到,epoll_data是一個union結構體,它就是epoll版大媽用於保存同學信息的結構體,它可以保存很多類型的信息:fd,指針,等等.有了這個結構體,epoll大媽可以不用吹灰之力就可以定位到同學甲.
別小看了這些效率的提高,在一個大規模併發的服務器中,輪詢IO是最耗時間的操作之一.再回到那個例子中,如果每到來一個朋友樓管大媽都要全樓的查詢同學,那麼處理的效率必然就低下了,過不久樓底就有不少的人了.
對比最早給出的阻塞IO的處理模型, 可以看到採用了多路複用IO之後, 程序可以自由的進行自己除了IO操作之外的工作, 只有到IO狀態發生變化的時候由多路複用IO進行通知, 然後再採取相應的操作, 而不用一直阻塞等待IO狀態發生變化了.
從上面的分析也可以看出,epoll比select的提高實際上是一個用空間換時間思想的具體應用.
其實,一切的解釋都是多餘的,按照我目前的瞭解,EPOLL模型似乎只有一種格式,所以大家只要參考我下面的代碼,就能夠對EPOLL有所瞭解了,代碼的解釋都已經在註釋中:
while (TRUE)
{
int nfds = epoll_wait (m_epoll_fd, m_events, MAX_EVENTS, EPOLL_TIME_OUT);//等待EPOLL時間的發生,相當於監聽,至於相關的端口,需要在初始化EPOLL的時候綁定。
if (nfds <= 0)
continue;
m_bOnTimeChecking = FALSE;
G_CurTime = time(NULL);
for (int i=0; i<nfds; i++)
{
try
{
if (m_events[i].data.fd == m_listen_http_fd)//如果新監測到一個HTTP用戶連接到綁定的HTTP端口,建立新的連接。由於我們新採用了SOCKET連接,所以基本沒用。
{
OnAcceptHttpEpoll ();
}
else if (m_events[i].data.fd == m_listen_sock_fd)//如果新監測到一個SOCKET用戶連接到了綁定的SOCKET端口,建立新的連接。
{
OnAcceptSockEpoll ();
}
else if (m_events[i].events & EPOLLIN)//如果是已經連接的用戶,並且收到數據,那麼進行讀入。
{
OnReadEpoll (i);
}
OnWriteEpoll (i);//查看當前的活動連接是否有需要寫出的數據。
}
catch (int)
{
PRINTF ("CATCH捕獲錯誤/n");
continue;
}
}
m_bOnTimeChecking = TRUE;
OnTimer ();//進行一些定時的操作,主要就是刪除一些短線用戶等。
}
其實EPOLL的精華,按照我目前的理解,也就是上述的幾段短短的代碼,看來時代真的不同了,以前如何接受大量用戶連接的問題,現在卻被如此輕鬆的搞定,真是讓人不得不感嘆。
今天搞了一天的epoll,想做一個高併發的代理程序。剛開始真是鬱悶,一直搞不通,網上也有幾篇介紹epoll的文章。但都不深入,沒有將一些注意的地方講明。以至於走了很多彎路,現將自己的一些理解共享給大家,以少走彎路。
epoll用到的所有函數都是在頭文件sys/epoll.h中聲明,有什麼地方不明白或函數忘記了可以去看一下。
epoll和select相比,最大不同在於:
1epoll返回時已經明確的知道哪個sokcet fd發生了事件,不用再一個個比對。這樣就提高了效率。
2select的FD_SETSIZE是有限止的,而epoll是沒有限止的只與系統資源有關。
1、epoll_create函數
函數聲明:int epoll_create(int size)
該函數生成一個epoll專用的文件描述符。它其實是在內核申請一空間,用來存放你想關注的socket fd上是否發生以及發生了什麼事件。size就是你在這個epoll fd上能關注的最大socket fd數。隨你定好了。只要你有空間。可參見上面與select之不同2.
22、epoll_ctl函數
函數聲明:int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)
該函數用於控制某個epoll文件描述符上的事件,可以註冊事件,修改事件,刪除事件。
參數:
epfd:由 epoll_create 生成的epoll專用的文件描述符;
op:要進行的操作例如註冊事件,可能的取值EPOLL_CTL_ADD 註冊、EPOLL_CTL_MOD 修 改、EPOLL_CTL_DEL 刪除
fd:關聯的文件描述符;
event:指向epoll_event的指針;
如果調用成功返回0,不成功返回-1
用到的數據結構
typedef union epoll_data {
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
} epoll_data_t;
struct epoll_event {
__uint32_t events;
epoll_data_t data;
};
如:
struct epoll_event ev;
//設置與要處理的事件相關的文件描述符
ev.data.fd=listenfd;
//設置要處理的事件類型
ev.events=EPOLLIN|EPOLLET;
//註冊epoll事件
epoll_ctl(epfd,EPOLL_CTL_ADD,listenfd,&ev);
常用的事件類型:
EPOLLIN :表示對應的文件描述符可以讀;
EPOLLOUT:表示對應的文件描述符可以寫;
EPOLLPRI:表示對應的文件描述符有緊急的數據可讀
EPOLLERR:表示對應的文件描述符發生錯誤;
EPOLLHUP:表示對應的文件描述符被掛斷;
EPOLLET:表示對應的文件描述符有事件發生;
3、epoll_wait函數
函數聲明:int epoll_wait(int epfd,struct epoll_event * events,int maxevents,int timeout)
該函數用於輪詢I/O事件的發生;
參數:
epfd:由epoll_create 生成的epoll專用的文件描述符;
epoll_event:用於回傳代處理事件的數組;
maxevents:每次能處理的事件數;
timeout:等待I/O事件發生的超時值(單位我也不太清楚);-1相當於阻塞,0相當於非阻塞。一般用-1即可
返回發生事件數。
- #include <stdio.h>
- #include <stdlib.h>
- #include <errno.h>
- #include <string.h>
- #include <sys/types.h>
- #include <netinet/in.h>
- #include <sys/socket.h>
- #include <sys/wait.h>
- #include <unistd.h>
- #include <arpa/inet.h>
- #include <openssl/ssl.h>
- #include <openssl/err.h>
- #include <fcntl.h>
- #include <sys/epoll.h>
- #include <sys/time.h>
- #include <sys/resource.h>
- #define MAXBUF 1024
- #define MAXEPOLLSIZE 10000
- int setnonblocking(int sockfd)
- {
- if (fcntl(sockfd, F_SETFL, fcntl(sockfd, F_GETFD, 0)|O_NONBLOCK) == -1)
- {
- return -1;
- }
- return 0;
- }
- int handle_message(int new_fd)
- {
- char buf[MAXBUF + 1];
- int len;
- bzero(buf, MAXBUF + 1);
- len = recv(new_fd, buf, MAXBUF, 0);
- if (len > 0)
- {
- printf
- ("%d接收消息成功:'%s',共%d個字節的數據/n",
- new_fd, buf, len);
- }
- else
- {
- if (len < 0)
- printf
- ("消息接收失敗!錯誤代碼是%d,錯誤信息是'%s'/n",
- errno, strerror(errno));
- close(new_fd);
- return -1;
- }
- return len;
- }
- int main(int argc, char **argv)
- {
- int listener, new_fd, kdpfd, nfds, n, ret, curfds;
- socklen_t len;
- struct sockaddr_in my_addr, their_addr;
- unsigned int myport, lisnum;
- struct epoll_event ev;
- struct epoll_event events[MAXEPOLLSIZE];
- struct rlimit rt;
- myport = 5000;
- lisnum = 2;
- rt.rlim_max = rt.rlim_cur = MAXEPOLLSIZE;
- if (setrlimit(RLIMIT_NOFILE, &rt) == -1)
- {
- perror("setrlimit");
- exit(1);
- }
- else
- {
- printf("設置系統資源參數成功!/n");
- }
- if ((listener = socket(PF_INET, SOCK_STREAM, 0)) == -1)
- {
- perror("socket");
- exit(1);
- }
- else
- {
- printf("socket 創建成功!/n");
- }
- setnonblocking(listener);
- bzero(&my_addr, sizeof(my_addr));
- my_addr.sin_family = PF_INET;
- my_addr.sin_port = htons(myport);
- my_addr.sin_addr.s_addr = INADDR_ANY;
- if (bind(listener, (struct sockaddr *) &my_addr, sizeof(struct sockaddr)) == -1)
- {
- perror("bind");
- exit(1);
- }
- else
- {
- printf("IP 地址和端口綁定成功/n");
- }
- if (listen(listener, lisnum) == -1)
- {
- perror("listen");
- exit(1);
- }
- else
- {
- printf("開啓服務成功!/n");
- }
- kdpfd = epoll_create(MAXEPOLLSIZE);
- len = sizeof(struct sockaddr_in);
- ev.events = EPOLLIN | EPOLLET;
- ev.data.fd = listener;
- if (epoll_ctl(kdpfd, EPOLL_CTL_ADD, listener, &ev) < 0)
- {
- fprintf(stderr, "epoll set insertion error: fd=%d/n", listener);
- return -1;
- }
- else
- {
- printf("監聽 socket 加入 epoll 成功!/n");
- }
- curfds = 1;
- while (1)
- {
- nfds = epoll_wait(kdpfd, events, curfds, -1);
- if (nfds == -1)
- {
- perror("epoll_wait");
- break;
- }
- for (n = 0; n < nfds; ++n)
- {
- if (events[n].data.fd == listener)
- {
- new_fd = accept(listener, (struct sockaddr *) &their_addr,&len);
- if (new_fd < 0)
- {
- perror("accept");
- continue;
- }
- else
- {
- printf("有連接來自於: %d:%d,分配的 socket 爲:%d/n",
- inet_ntoa(their_addr.sin_addr), ntohs(their_addr.sin_port), new_fd);
- }
- setnonblocking(new_fd);
- ev.events = EPOLLIN | EPOLLET;
- ev.data.fd = new_fd;
- if (epoll_ctl(kdpfd, EPOLL_CTL_ADD, new_fd, &ev) < 0)
- {
- fprintf(stderr, "把 socket '%d' 加入 epoll 失敗!%s/n",
- new_fd, strerror(errno));
- return -1;
- }
- curfds++;
- }
- else
- {
- ret = handle_message(events[n].data.fd);
- if (ret < 1 && errno != 11)
- {
- epoll_ctl(kdpfd, EPOLL_CTL_DEL, events[n].data.fd,&ev);
- curfds--;
- }
- }
- }
- }
- close(listener);
- return 0;
- }
epoll_wait運行的原理是 等侍註冊在epfd上的socket fd的事件的發生,如果發生則將發生的sokct fd和事件類型放入到events數組中。 並且將註冊在epfd上的socket fd的事件類型給清空,所以如果下一個循環你還要關注這個socket fd的話,則需要用epoll_ctl(epfd,EPOLL_CTL_MOD,listenfd,&ev)來重新設置socket fd的事件類型。這時不用EPOLL_CTL_ADD,因爲socket fd並未清空,只是事件類型清空。這一步非常重要。