目录
I/O多路有select和epoll。
select当有事件发生时,会去轮训检查加入的1-max的全部监控集合的描述符,找到发生事件的fd。显而易见,当待监控连接是数以十万计的,返回的只是数百个活跃连接事件,这就是低效率的表现。可见,处理并发上万个连接时,select就完全力不从心了。
epoll同样可以实现select做的事情,而且更高效。
- 返回 == epoll_fd描述符
- poll_create() epoll_ctrl(epoll_fd描述符,添加或者删除待监控的连接fd)
- 返回事件的活跃连接fd == epoll_wait( epoll描述符 )
与select相比,epoll只会返回发生事件的events集合和发生事件的数量,效率高。
- #include
-
- int epoll_create(int size)
-
- 函数说明:
-
- 参数size:必须设置一个大于0的值。
-
- 返回值:调用成功返回一个非负值的文件描述符fd,调用失败返回-1。
有了epoll_fd之后,我们需要将我们需要检测事件的其他fd绑定到这个epoll_fd上,或者修改一个已经绑定上去的fd的事件类型,或者在不需要时将fd从epollfd上解绑,需要使用epoll_ctl函数。
- #include
-
- int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
函数说明:
- 参数epfd:调用epoll_create函数创建的epoll_fd。
- 参数op:操作类型,取值有EPOLL_CTL_ADD、EPOLL_CTL_MOD和EPOLL_CTL_DEL,分别表示向epoll_fd上添加、修改和移除一个其他fd,当取值是EPOLL_CTL_DEL,第四个参数event忽略不计,可以设置为NULL。
- 参数fd:即需要被操作的fd。
- 参数event:是一个epoll_event结构体的地址,epoll_event结构体定义下面会详细介绍。
- 返回值:调用成功返回0,调用失败返回-1,可以通过errno错误码获取具体的错误原因。
epoll_event结构体定义如下:
- struct epoll_event {
-
- uint32_t events; // 需要检测的fd事件,取值与poll函数一样
-
- epoll_data_t data; // 用户自定义数据
-
- };
-
-
-
- typedef union epoll_data {
-
- void *ptr;
-
- int fd; //监控的fd
-
- uint32_t u32;
-
- uint64_t u64;
-
- } epoll_data_t;
epoll_event支持的事件宏如下表:
事件宏 | 描述 |
EPOLLIN | 数据可读(包括普通数据&优先数据) |
EPOLLOUT | 数据可写(包括普通数据&优先数据) |
EPOLLRDHUP | TCP连接被对端关闭,或者关闭了写操作 |
EPOLLPRI | 高优先级数据可读,例如TCP带外数据 |
EPOLLERR | 错误 |
EPOLLHUP | 挂起 |
EPOLLET | 边缘触发模式 |
EPOLLONESHOT | 最多触发其上注册的事件一次 |
创建了epoll_fd,设置好某个fd上需要检测事件并将该fd绑定到epoll_fd上去后,就调用epoll_wait检测事件了。
- #include
-
- int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);
函数说明:
- 参数epfd:调用epoll_create函数创建的epoll_fd。
- 参数events:是一个epoll_event结构数组的首地址,这是一个输出参数,函数调用成功后,events中存放的是与就绪事件相关epoll_event结构体数组。
- 参数maxevents:数组元素的个数。
- 参数timeout:超时时间,单位是毫秒,如果设置为0,epoll_wait会立即返回。-1 阻塞等待,有事件循环。>0 定时,毫秒。
- 返回值:调用成功会返回有事件的fd数目;如果返回0表示超时;调用失败返回-1。
设置方式
ev.events = EPOLLIN;//使用默认LT模式
ev.events = EPOLLIN|EPOLLET;//监听读状态同时设置ET模式
LT:(Level_triggered,水平触发):
当被监控的文件描述符上有可读写事件发生时,epoll_wait()会通知处理程序去读写。如果这次没有把数据一次性全部读写完(如读写缓冲区太小),那么下次调用 epoll_wait()时,它还会通知你在没读写完的文件描述符上继续读写,当然如果你一直不去读写,它会一直通知你,如果系统中有大量你不需要读写的就绪文件描述符,而它们每次都会返回,这样会大大降低处理程序检索自己关心的就绪文件描述符的效率。
当接收buffer长度小于接收缓存区数据的长度时,会分包,会连续出发事件多次,循环recv,直到接收完。
ET:(Edge_triggered,边缘触发):
当被监控的文件描述符上有可读写事件发生时,epoll_wait()会通知处理程序去读写。如果这次没有把数据全部读写完(如读写缓冲区太小),那么下次调用epoll_wait()时,它不会通知你,也就是它只会通知你一次,直到该文件描述符上出现第二次可读写事件才会通知你,这种模式比水平触发效率高,系统不会充斥大量你不关心的就绪文件描述符。
- #include
- #include
- #include
- #include
- #include
- #include
- #include
- #include
- #include
-
-
-
- #define BUFFER_LENGTH 8196
- #define EVENTS_LENGTH 128
-
- char rbuffuf[BUFFER_LENGTH] = {0};
- char wbuffuf[BUFFER_LENGTH] = {0};
-
- int main() {
-
- // block
- int listenfd = socket(AF_INET, SOCK_STREAM, 0); //
- if (listenfd == -1) return -1;
- // listenfd
- struct sockaddr_in servaddr;
- servaddr.sin_family = AF_INET;
- servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
- servaddr.sin_port = htons(9999);
-
- if (-1 == bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr))) {
- return -2;
- }
-
- //fd --> epoll
- int epfd = epoll_create(1); //只需大于零
-
- struct epoll_event ev, events[EVENTS_LENGTH];
- ev.events = EPOLLIN;
- ev.data.fd = listenfd;
-
- epoll_ctl(epfd, EPOLL_CTL_ADD, listenfd, &ev); //epoll非阻塞
-
- printf("fd : %d , %d \n", epfd, listenfd);
-
- while(1){
- int nready = epoll_wait(epfd, events, EVENTS_LENGTH, 1000);
- printf("----- nready = %d\n", nready);
-
- int i = 0;
- for(i = 0; i
- int clientfd = events[i].data.fd; //发生事件的fd.
-
- if(listenfd == clientfd){ //sever
- struct sockaddr_in client;
- socklen_t len = sizeof(client);
- int counfd = accept(listenfd, (struct sockaddr*)&client, &len);
- if(counfd == -1)break;
-
- printf("accept = %d \n" , counfd);
- ev.events = EPOLLIN ;
- ev.data.fd = counfd;
- epoll_ctl(epfd, EPOLL_CTL_ADD, counfd, &ev); //epoll非阻塞
- }
- else if(events[i].events & EPOLLIN){ //client 读
-
- int n = recv(clientfd, rbuffuf, BUFFER_LENGTH, 0);
- if(n > 0){
- rbuffuf[n] = '\0';
- printf("recv = %s, n =%d\n", rbuffuf, n);
-
- memcpy(wbuffuf, rbuffuf , BUFFER_LENGTH);
-
- ev.events = EPOLLOUT ;
- ev.data.fd = clientfd;
- epoll_ctl(epfd, EPOLL_CTL_MOD, clientfd , &ev);
-
- }
- }
- else if(events[i].events & EPOLLOUT){ //写
-
- int sendlen = send(clientfd, wbuffuf, BUFFER_LENGTH, 0);
- printf("sendlen =%d\n", sendlen);
-
- ev.events = EPOLLIN ;
- ev.data.fd = clientfd;
- epoll_ctl(epfd, EPOLL_CTL_MOD, clientfd , &ev);
-
- }
- }
-
- }
- }
-
-
-
-
总结
- epoll监视的描述符数量不受限制
- epoll不同于select和poll轮询的方式,而是通过每个fd定义的回调函数来实现的,只有就绪的fd才会执行回调函数。
一般在fd数量比较多,但某段时间内,就绪事件fd数量较少的情况下,epoll才会体现出它的优势,也就是说socket连接数量较大时而活跃连接较少时epoll模型更高效。