I/O複用可以使程序同時監聽多個文件描述符,對提高程序的性能很重要;
使用I/O複用技術的五種情況:
1、客戶端程序要同時處理多個socket;
2、客戶端程序要同時處理用戶輸入和網絡連接;
3、TCP服務器要同時處理監聽socket和連接socket;
4、服務器要同時處理TCP請求和UDP請求;
5、服務器要同時監聽多個端口、或者處理多種服務;
1、select()
select系統調用的用途:在指定的一段時間內,監聽用戶感興趣的文件描述符上的可讀、可寫和異常等事件。
select系統調用的原型:
#include <sys/select.h>
int select( int nfds, fd_ set* readfds, fd_ set* writefds, fd_ set* exceptfds,struct timeval* timeout ) ;
/*
(1) nfds參數指定被監聽的文件描述符的總數。它通常被設置爲select監聽的所有文件描述符中的最大值加1,因爲文件描述符是從0開始計數的。
(2) readfds、writefds 和 exceptfds 參數分別指向可讀、可寫和異常等事件對應的文件描述符集合。應用程序調用select函數時,通過這3個參數傳人自已感興趣的文件描述符。sclect調用返回時,內核將修改它們來通知應用程序哪些文件描述符已經就緒。這3個參數是fd_ set 結構指針類型。
fd set結構體的定義如下:
#include <typesizes.h>
#define __FD_SETSIZE 1024
#include <sys/select. h>
#define FD_SETSIZE __FD_SETSIZE
typedef long int __fd_mask;
#undef __NFDBITS
#define __NFDBITS ( 8* (int) sizeof (__ fd_ mask ) )
typedef struct
{
#ifdef __USE_XOPEN
__fd_mask fds_bits[ __FD_SETSIZE / __NFDBITS ];
#define __FDS_BITS(set) ((set)->fds_bits)
#else
__fd_mask __fds_bits[ __FD_SETSIZE / __NFDBITS ];
#define __FDS_BITS(set) ((set)->__fds_bits)
#endif
} fd_set;
由以上定義可見,fd_ set結構體僅包含一個整型數組,該數組的每個元素的每一位 (bit)標記一個文件描述符。fd_set能容納的文件描述符數量由__FD_SETSIZE指定,這就限制了select能同時處理的文件描述符的總量。
由於位操作過於煩瑣,我們應該使用下面的一系列宏來訪問fd set 結構體中的位:
#include <sys/select.h>
FD_ZERO( fd_ set *fdset ); //清除fdset的所有位
FD_SET( int fd, fd_ set *fdset ); //設置fdset的位fd
FD_CLR( int fd, fd_ set *fdset ); //清除fdset的位fd
int FD_ISSET(int fd, fd_ set *fdset) //測試fdset的位fd是否被設置
(3) timeout 參數用來設置select函數的超時時間。它是一個timeval結構類型的指針,採用指針參數是因爲內核將修改它以告訴應用程序select等待了多久。不過我們不能完全信任select調用返回後的timeout值,比如調用失敗時timeout值是不確定的。
timeval 結構體的定義如下:
struct timeval
{
long tv_sec; //秒數
long tv_usec; //微秒數
};
由以上定義可見,select給我們提供了一個微秒級的定時方式。如果給timeout變量的tv_sec成員和tv_usec成員都傳遞0,則select將立即返回。如果給timeout傳遞NULL,則select將一直阻塞, 直到某個文件描述符就緒。
*/
sclect成功時返回就緒(可讀、可寫和異常)文件描述符的總數。
如果在超時時間內沒有任何文件描述符就緒,select 將返回0;
select 失敗時返回-1,並設置erno;
如果在select等待期間,程序接收到信號,則select立即返回-1,並設置errno爲EINTR.
文件描述符就緒條件:
哪些情況下文件描述符可以被認爲是可讀、可寫或者出現異常,對於select的使用非常關鍵。
在網絡編程中,下列情況下socket 可讀:
(1).socket內核接收緩存區中的字節數大於或等於其低水位標記SO_ RCVLOWAT。此時我們可以無阻塞地讀該socket,並且讀操作返回的字節數大於0。
(2).socket通信的對方關閉連接。此時對該socket的讀操作將返回0。
(3).監聽socket.上有新的連接請求。
(4).socket上有未處理的錯誤。此時我們可以使用getsockopt來讀取和清除該錯誤。
下列情況下socket 可寫:
(1).socket內核發送緩存區中的可用字節數大於或等於其低水位標記SO_SNDLOWAT。此時我們可以無阻塞地寫該socket,並且寫操作返回的字節數大於0。
(2).socket的寫操作被關閉。對寫操作被關閉的socket執行寫操作將觸發一個 SIGPIPE信號。
(3).socket使用非阻塞connect連接成功或者失敗(超時)之後。
(4)socket上有未處理的錯誤。此時我們可以使用getsockopt來讀取和清除該錯誤。
網絡程序中,select 能處理的異常情況只有一種: socket 上接收到帶外數據。
select()在TCP通訊中的使用:
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <assert.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <sys/time.h>
#include <sys/socket.h>
#define MAXFD 10
void fds_init(int fds[])
{
int i = 0;
for( ; i< MAXFD; i++ )
{
fds[i] = -1;
}
}
void fds_add(int fds[], int fd)
{
int i = 0;
for( ;i < MAXFD; i++ )
{
if ( fds[i] == -1 )
{
fds[i] = fd;
break;
}
}
}
void fds_del(int fds[], int fd)
{
int i = 0;
for( ;i < MAXFD; i++ )
{
if ( fds[i] == fd )
{
fds[i] = -1;
break;
}
}
}
int main()
{
int sockfd = socket(AF_INET,SOCK_STREAM,0);
assert( sockfd != -1 );
struct sockaddr_in saddr,caddr;
memset(&saddr,0,sizeof(saddr));
saddr.sin_family = AF_INET;
saddr.sin_port = htons(6000);
saddr.sin_addr.s_addr = inet_addr("192.168.31.96");
int res = bind(sockfd,(struct sockaddr*)&saddr,sizeof(saddr));
assert( res != -1 );
listen(sockfd,5);
///////////////////////////////////////////////////////////////////////////
int fds[MAXFD];
fds_init(fds);
fds_add(fds,sockfd);
fd_set fdset; //文件描述符集合
while( 1 )
{
FD_ZERO(&fdset);
int maxfd = -1;
int i = 0;
for(; i < MAXFD; i++ )
{
if ( fds[i] == -1 )
{
continue;
}
FD_SET(fds[i],&fdset);
if ( maxfd < fds[i] )
{
maxfd = fds[i];
}
}
struct timeval tv = {5,0};
int n = select(maxfd + 1,&fdset,NULL,NULL,&tv);
if ( n == -1 )
{
perror("select error");
continue;
}
else if ( n == 0 )
{
printf("time out\n");
continue;
}
else
{
int i = 0;
for( ;i < MAXFD; i++ )
{
if ( fds[i] == -1 )
{
continue;
}
if ( FD_ISSET(fds[i],&fdset) )
{
if ( sockfd == fds[i] )
{
int len = sizeof(caddr);
int c = accept(sockfd,(struct sockaddr*)&caddr,&len);
if ( c < 0 )
{
continue;
}
fds_add(fds,c);
printf("accept c=%d\n",c);
}
else
{
char buff[128] = {0};
int num = recv(fds[i],buff,1,0);
if ( num <= 0 )
{
close(fds[i]);
fds_del(fds,fds[i]);
printf("one client over\n");
}
else
{
printf("recv(%d)=%s\n",fds[i],buff);
send(fds[i],"ok",2,0);
}
}
}
}
}
}
}
2.poll()
poll系統調用的用途:在指定時間內輪詢一定數量的文件描述符,以測試其中是否有就緒者。
poll 的原型如下:
#include <pol1.h>
int poll( struct pollfd* fds, nfds_ t nfds, int timeout );
/*
(1) fds 參數是一個pollfd結構類型的數組,它指定所有我們感興趣的文件描述符上發生的可讀、可寫和異常等事件。pollfd 結構體的定義如下:
struct pol1fd
{
int fd; //文件描述符
short events; //註冊的事件
short revents; //實際發生的事件,由內核填充
};
其中,fd 成員指定文件描述符: events 成員告訴poll監聽fd上的哪些事件,它是一系列事件的按位或: revents 成員則由內核修改,以通知應用程序fd上實際發生了哪些事件。
poll支持的事件類型如下表所示。
(2) nfds 參數指定被監聽事件集合fds的大小。
其類型nfds_t 的定義如下:
typedef unsigned long int nfds_t;
(3) timcout 參數指定poll的超時值,單位是毫秒。當timeout爲 -1 時, poll調用將永遠阻塞,直到某個事件發生:當timcout爲 0 時,poll 調用將立即返回。
poll系統調用的返回值的含義與select相同。
*/
表中,POLLRDNORM、POLLRDBAND、POLLWRNORM、 POLLWRBAND由XOPEN規範定義。它們實際上是將POLLIN事件和POLLouT事件分得更細緻,以區別對待普通數據和優先數據。但Linux並不完全支持它們。
通常,應用程序需要根據reev調用的返回值來區分socket上接收到的是有效數據還是對方關閉連接的請求,並做相應的處理。不過,自Linux內核2.6.17開始,GNU爲poll系統調用增加了-個POLLRDHUP事件,它在socket上接收到對方關閉連接的請求之後觸發。這爲我們區分上述兩種情況提供了一種更簡單的方式。但使用POLLRDHUP事件時,我們需要在代碼最開始處定義_ GNU_SOURCE。
poll()在TCP通訊中的使用:
//I/O複用:poll()
#define _GNU_SOURCE
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <pthread.h>
#include <poll.h>
#define MAXFD 10
int create_socket();
int fds_init(struct pollfd fds[]) //清空結構體數組
{
int i = 0;
for(;i<MAXFD;i++)
{
fds[i].fd = -1;
fds[i].events = 0;
fds[i].revents = 0;
}
}
void fds_add(struct pollfd fds[],int fd) //添加
{
int i = 0;
for(;i<MAXFD;i++)
{
if(fds[i].fd == -1)
{
fds[i].fd = fd;
fds[i].events = POLLIN | POLLRDHUP;
fds[i].revents = 0;
break;
}
}
}
void fds_del(struct pollfd fds[],int fd)
{
int i = 0;
for(;i<MAXFD;i++)
{
if(fds[i].fd == fd)
{
fds[i].fd = -1;
fds[i].events = 0;
fds[i].revents = 0;
break;
}
}
}
int main()
{
int sockfd = create_socket();
assert(sockfd != -1);
struct pollfd fds[MAXFD];
fds_init(fds);
fds_add(fds,sockfd);
while(1)
{
int n = poll(fds,MAXFD,5000);
if(n == -1)
{
perror("poll error");
}
else if(n == 0)
{
printf("time out\n");
}
else
{
int i = 0;
for(;i<MAXFD;i++)
{
if(fds[i].fd == -1)
{
continue;
}
if(fds[i].revents & POLLRDHUP)
{
close(fds[i].fd);
fds_del(fds,fds[i].fd);
printf("one client hup!");
continue;
}
if(fds[i].revents & POLLIN)
{
if(fds[i].fd == sockfd)
{
struct sockaddr_in caddr;
int len = sizeof(caddr);
int c = accept(sockfd,(struct sockaddr*)&caddr,&len);
if ( c < 0 )
{
continue;
}
fds_add(fds,c);
printf("accept = %d\n",c);
}
else
{
char buff[128] = {0};
int num = recv(fds[i].fd,buff,127,0);
if( num <= 0)
{
close(fds[i].fd);
fds_del(fds,fds[i].fd);
printf("one client over\n");
}
else
{
printf("recv(%d):%s\n",fds[i].fd,buff);
send(fds[i].fd,"ok",2,0);
}
}
}
}
}
}
}
int create_socket()
{
int sockfd = socket(AF_INET,SOCK_STREAM,0);
if(sockfd == -1)
{
return -1;
}
struct sockaddr_in saddr;
memset(&saddr,0,sizeof(saddr));
saddr.sin_family = AF_INET;
saddr.sin_port = htons(6000);
saddr.sin_addr.s_addr = inet_addr("192.168.1.118");
int res = bind(sockfd,(struct sockaddr*)&saddr,sizeof(saddr));
assert(res != -1);
listen(sockfd,5);
return sockfd;
}
3.epoll()
poll系統調用的用途:
epoll是Linux特有的I/O複用函數。它在實現和使用上與select、poll 有很大差異。首先,epoll 使用一組函數來完成任務,而不是單個函數。其次,epoll 把用戶關心的文件描述符上的事件放在內核裏的一個事件表中,從而無須像select和poll那樣每次調用都要重複傳人文件描述符集或事件集。但epoll需要使用一個額外的文件描述符,來唯一標識內核中的這個事件表。這個文件描述符使用如下epoll_ create 函數來創建。
#include <sys/epoll.h>
int epoll_create( int size )
size參數現在並不起作用,只是給內核一個提示,告訴它事件表需要多大。該函數返回的文件描述符將用作其他所有epoll系統調用的第一個參數,以指定要訪問的內核事件表。
下面的函數用來操作epoll的內核事件表:
#include <sys/epoll.h>
int epoll_ctl( int epfd, int op, int fd, struct epoll_event *event )
fd參數是要操作的文件描述符,op 參數則指定操作類型。 操作類型有如下3種:
(1) EPOLL_CTL_ADD,往事件表中註冊fd上的事件。
(2) EPOLL_CTL_MOD,修改fd上的註冊事件。
(3) EPOLL_CTL_DEL,刪除fd.上的註冊事件。
event參數指定事件,它是epoll event 結構指針類型。epoll_event 的定義如下:
struct epoll_event
{
__uint32_t events; /* epoll事件*/
epoll_data_t data; /*用戶數據*/
};
其中events成員描述事件類型。epoll 支持的事件類型和poll基本相同。表示epoll事件類型的宏是在poll對應的宏前加上“E”,比如epoll的數據可讀事件是EPOLLIN.但epoll有兩個額外的事件類型一EPOLLET 和EPOLLONESHOT.它們對於epoll的高效運作非常關鍵,我們將在後面討論它們。data 成員用於存儲用戶數據,其類型epoll_data_t 的定義如下:
typedef union epoll_data
{
void* ptr;int fd;
uint32_ t u32; uint64_ t u64;
} epoll_data_t;
epoll_data_t 是-一個聯合體,其4個成員中使用最多的是fd,它指定事件所從屬的目標文件描述符。ptr成員可用來指定與fd相關的用戶數據。但由於epoll_data_t 是一個聯合體,我們不能同時使用其ptr成員和fd成員,因此,如果要將文件描述符和用戶數據關聯起來, 以實現快速的數據訪問,只能使用其他手段,比如放棄使用epoll_data_t的fd成員,而在ptr指向的用戶數據中包含fd.
epoll_ ctl 成功時返回0,失敗則返回-1並設置errno。
epoll系列系統調用的主要接口是epoll_wait 函數。它在一段超時時間內等待一組文件描述符上的事件,其原型如下:
include <sys/epoll.h>
int epoll_wait( int epfd, struct epoll_ event* events, int maxevents,int timeout ) ;
該函數成功時返回就緒的文件描述符的個數,失敗時返回-1並設置erno。
關於該函數的參數,我們從後往前討論。timeout參數的含義與poll接口的timeout參數相同。maxevents 參數指定最多監聽多少個事件,它必須大於0。
epoll_wait函數如果檢測到事件,就將所有就緒的事件從內核事件表(由epfd 參數指定)中複製到它的第二個參數events指向的數組中。這個數組只用於輸出epoll wait檢測到的就緒事件,而不像select和poll的數組參數那樣既用於傳人用戶註冊的事件,又用於輸出內核檢測到的就緒事件。這就極大地提高了應用程序索引就緒文件描述符的效率。
epoll()在TCP通訊中的使用:
//I/O複用:poll()
#define _GNU_SOURCE
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <pthread.h>
#include <sys/epoll.h>
#define MAXFD 10
int create_socket();
void epoll_add(int epfd,int fd)
{
struct epoll_event ev;
ev.events = EPOLLIN;
ev.data.fd = fd;
if( epoll_ctl(epfd,EPOLL_CTL_ADD,fd,&ev) == -1 )
{
perror("epoll_ctl error");
}
}
void epoll_del(int epfd,int fd)
{
if( epoll_ctl(epfd,EPOLL_CTL_DEL,fd,NULL) == -1 )
{
perror("epoll del erreo");
}
}
int main()
{
int sockfd = create_socket();
assert(sockfd != -1);
int epfd = epoll_create(MAXFD);
assert(epfd != -1);
epoll_add(epfd,sockfd);
struct epoll_event events[MAXFD];
while (1)
{
int n = epoll_wait(epfd,events,MAXFD,5000);
if( n == -1 )
{
perror("epoll error");
}
else if(n == 0)
{
printf("time out\n");
}
else
{
int i = 0;
for(;i<n;i++)
{
if(events[i].data.fd == sockfd)
{
struct sockaddr_in caddr;
int len = sizeof(caddr);
int c = accept(sockfd,(struct sockaddr*)&caddr,&len);
if ( c < 0 )
{
continue;
}
epoll_add(epfd,c);
printf("accept = %d\n",c);
}
else
{
char buff[128] = {0};
int num = recv(events[i].data.fd,buff,127,0);
if( num <= 0)
{
close(events[i].data.fd);
epoll_del(epfd,events[i].data.fd);
printf("one client over\n");
}
else
{
printf("recv(%d):%s\n",events[i].data.fd,buff);
send(events[i].data.fd,"ok",2,0);
}
}
}
}
}
}
int create_socket()
{
int sockfd = socket(AF_INET,SOCK_STREAM,0);
if(sockfd == -1)
{
return -1;
}
struct sockaddr_in saddr;
memset(&saddr,0,sizeof(saddr));
saddr.sin_family = AF_INET;
saddr.sin_port = htons(6000);
saddr.sin_addr.s_addr = inet_addr("192.168.43.163");
int res = bind(sockfd,(struct sockaddr*)&saddr,sizeof(saddr));
assert(res != -1);
listen(sockfd,5);
return sockfd;
}