select，poll，epoll的区别以及使用方法

2023年6月14日下午5:54 • Linux • 阅读 88

I/O多路复用是指：通过一种机制，可以 监视多个描述符，一旦某个描述符就绪（一般是读就绪或者写就绪），能够通知程序进行相应的读写操作。

原生socket客户端在与服务端建立连接时，即服务端调用accept方法时是阻塞的，同时服务端和客户端在收发数据(调用recv、send、sendall)时也是阻塞的。原生socket服务端在同一时刻只能处理一个客户端请求，即服务端不能同时与多个客户端进行通信，实现并发，导致服务端资源闲置(此时服务端只占据 I/O，CPU空闲)。

如果我们的需求是要让多个客户端连接至服务器端，而且服务器端需要处理来自多个客户端请求。很明显，原生socket实现不了这种需求，此时我们使用I/O多路复用机制就可以实现这种需求，可以同时监听多个文件描述符，一旦描述符就绪，能够通知程序进行相应的读写操作。

select最早于1983年出现在4.2BSD中，它通过一个select()系统调用来监视多个文件描述符的数组，当select()返回后，该数组中就绪的文件描述符便会被内核修改标志位，使得进程可以获得这些文件描述符从而进行后续的读写操作。

select目前几乎在所有的平台上支持，其良好跨平台支持也是它的一个优点，事实上从现在看来，这也是它所剩不多的优点之一。

select的一个缺点在于单个进程能够监视的文件描述符的数量存在最大限制，在Linux上一般为1024，不过可以通过修改宏定义甚至重新编译内核的方式提升这一限制。

另外，select()所维护的存储大量文件描述符的数据结构，随着文件描述符数量的增大，其复制的开销也线性增长。同时，由于网络响应时间的延迟使得大量TCP连接处于非活跃状态，但调用select()会对所有socket进行一次线性扫描，所以这也浪费了一定的开销。

poll在1986年诞生于System V Release 3，它和select在本质上没有多大差别，但是poll没有最大文件描述符数量的限制。

poll和select同样存在一个缺点就是，包含大量文件描述符的数组被整体复制于用户态和内核的地址空间之间，而不论这些文件描述符是否就绪，它的开销随着文件描述符数量的增加而线性增大。

另外，select()和poll()将就绪的文件描述符告诉进程后，如果进程没有对其进行IO操作，那么下次调用select()和poll()的时候将再次报告这些文件描述符，所以它们一般不会丢失就绪的消息，这种方式称为水平触发（Level Triggered）。

直到Linux2.6才出现了由内核直接支持的实现方法，那就是epoll，它几乎具备了之前所说的一切优点，被公认为Linux2.6下性能最好的多路I/O就绪通知方法。

epoll可以同时支持水平触发和边缘触发（Edge Triggered，只告诉进程哪些文件描述符刚刚变为就绪状态，它只说一遍，如果我们没有采取行动，那么它将不会再次告知，这种方式称为边缘触发），理论上边缘触发的性能要更高一些，但是代码实现相当复杂。

epoll同样只告知那些就绪的文件描述符，而且当我们调用epoll_wait()获得就绪文件描述符时，返回的不是实际的描述符，而是一个代表就绪描述符数量的值，你只需要去epoll指定的一个数组中依次取得相应数量的文件描述符即可，这里也使用了内存映射（mmap）技术，这样便彻底省掉了这些文件描述符在系统调用时复制的开销。

另一个本质的改进在于epoll采用基于事件的就绪通知方式。在select/poll 中，进程只有在调用一定的方法后，内核才对所有监视的文件描述符进行扫描，而epoll事先通过epoll_ctl()来注册一个文件描述符，一旦基于某个文件描述符就绪时，内核会采用类似callback的回调机制，迅速激活这个文件描述符，当进程调用epoll_wait()时便得到通知。

select的几大缺点：

（1）每次调用select，都需要把fd集合从用户态拷贝到内核态，这个开销在fd很多时会很大

（2）同时每次调用select都需要在内核遍历传递进来的所有fd，这个开销在fd很多时也很大

（3）select支持的文件描述符数量太小了，默认是1024

poll的机制与select类似，与select在本质上没有多大差别，管理多个描述符也是进行轮询，根据描述符的状态进行处理，但是poll没有最大文件描述符数量的限制。poll和select同样存在一个缺点就是，包含大量文件描述符的数组被整体复制于用户态和内核的地址空间之间，而不论这些文件描述符是否就绪，它的开销随着文件描述符数量的增加而线性增大。

epoll是在2.6内核中提出的，是之前的select和poll的增强版本。相对于select和poll来说，epoll更加灵活，没有描述符限制。epoll使用一个文件描述符管理多个描述符，将用户关系的文件描述符的事件存放到内核的一个事件表中，这样在用户空间和内核空间的copy只需一次。

&#x6700;&#x7EC8;&#x8C03;&#x7528;epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);&#x51FD;&#x6570;&#x7B49;&#x5F85;&#x4E8B;&#x4EF6;&#x5230;&#x6765;&#xFF0C;&#x8FD4;&#x56DE;&#x503C;&#x662F;&#x9700;&#x8981;&#x5904;&#x7406;&#x7684;&#x4E8B;&#x4EF6;&#x6570;&#x76EE;&#xFF0C;events&#x8868;&#x793A;&#x8981;&#x5904;&#x7406;&#x7684;&#x4E8B;&#x4EF6;&#x96C6;&#x5408;&#x3002;

（1）select，poll实现需要自己不断轮询所有fd集合，直到设备就绪，期间可能要睡眠和唤醒多次交替。而epoll其实也需要调用epoll_wait不断轮询就绪链表，期间也可能多次睡眠和唤醒交替，但是它是设备就绪时，调用回调函数，把就绪fd放入就绪链表中，并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替，但是select和poll在”醒着”的时候要遍历整个fd集合，而epoll在”醒着”的时候只要判断一下就绪链表是否为空就行了，这节省了大量的CPU时间。这就是回调机制带来的性能提升。

（2）select，poll每次调用都要把fd集合从用户态往内核态拷贝一次，并且要把current往设备等待队列中挂一次，而epoll只要一次拷贝，而且把current往等待队列上挂也只挂一次（在epoll_wait的开始，注意这里的等待队列并不是设备等待队列，只是一个epoll内部定义的等待队列）。这也能节省不少的开销。

epoll的接口非常简单，一共就三个函数。

/*
size：在 Linux最新的一些内核版本的实现中，这个 size参数没有任何意义。
返回值：返回值为一个文件描述符，作为后面两个函数的参数
*/
int epoll_create(int size)

此函数可以在内核中创建一个内核事件表，通过返回的内核事件表来管理

/*
epfd：操作内核时间表的文件描述符，即epoll_create函数的返回值
op：操作内核时间表的方式
    EPOLL_CTL_ADD(向内核时间表添加文件描述符，即注册);
    EPOLL_CTL_MOD（修改内核事件表事件）;
    EPOLL_CTL_DEL （删除内核事件表中的事件）;
fd：操作的文件描述符
event：指向struct epoll_event的指针
*/
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)

poll的事件注册函数，epoll_ctl向 epoll对象中添加、修改或者删除感兴趣的事件，返回0表示成功，否则返回–1，此时需要根据errno错误码判断错误类型。

event结构

struct epoll_event
{
    /*
    储存用户感兴趣的事情和就绪事件,
    events可以是以下几个宏的集合：
    EPOLLIN ：表示对应的文件描述符可以读（包括对端SOCKET正常关闭）；
    EPOLLOUT：表示对应的文件描述符可以写；
    EPOLLPRI：表示对应的文件描述符有紧急的数据可读（这里应该表示有带外数据到来）；
    EPOLLERR：表示对应的文件描述符发生错误；
    EPOLLHUP：表示对应的文件描述符被挂断；
    EPOLLET： 将EPOLL设为边缘触发(Edge Triggered)模式，这是相对于水平触发(Level Triggered)来说的。
    EPOLLONESHOT：只监听一次事件，当监听完这次事件之后，如果还需要继续监听这个socket的话，需要再次把这个socket加入到EPOLL队列里
    */
    uint32_t events;
    epoll_data_t data; //联合体最重要的就是fd，即要操作的文件描述符
};

typedef union epoll_data
{
    void *ptr;
    int fd;
    _uint32_t u32;
    _uint64_t u64;
}epoll_data_t;

/*
epfd：同上面函数
events：用于接收内核返回的就绪事件的数组
maxevents：用户最多能处理的事件个数
等待I/O的超时值（后面的编程设为-1，表示永不超时），单位为ms
返回值，指的是就绪事件的个数
*/
int epoll_wait(int epfd, struct epoll_event events, int maxevents, int timeout)

等待事件的产生，类似于select()调用。参数events用来从内核得到事件的集合，maxevents告之内核这个events有多大，这个 maxevents的值不能大于创建epoll_create()时的size，参数timeout是超时时间（毫秒，0会立即返回，-1将不确定，也有说法说是永久阻塞）。该函数返回需要处理的事件数目，如返回0表示已超时。如果返回–1，则表示出现错误，需要检查 errno错误码判断错误类型。

下面通过一个echo回射服务器的客户端和服务端案例介绍epoll的使用方法

服务端事件poll

    int epollFd;
    struct epoll_event events[MAX_EVENTS];
    int ret;
    char buf[MAXSIZE];
    memset(buf,0,MAXSIZE);
    //创建一个epoll描述符,通过这个描述管理多个描述符
    epollFd = epoll_create(FDSIZE);
    //添加监听描述符事件
    add_event(epollFd,listenFd,EPOLLIN);
    while(1){
        //获取已经准备好的描述符事件，阻塞
        ret = epoll_wait(epollFd, events, MAX_EVENTS,-1);
        //处理事件，ret是发生的事件个数
        handle_events(epollFd,events,ret,listenFd,buf);
    }
    close(epollFd);

客户端事件poll

    int                 sockfd;
    struct sockaddr_in  servaddr;
    sockfd = socket(AF_INET,SOCK_STREAM, IPPROTO_TCP);
    bzero(&servaddr,sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_port = htons(SERV_PORT);
    servaddr.sin_addr.s_addr = inet_addr(IPADDRESS);
    printf("start\n");
    if(connect(sockfd,(struct sockaddr*)&servaddr, sizeof(sockaddr_in)) < 0){
        perror("connect err: ");
        return 0;
    }
    else{
        printf("connect succ\n");
    }
    //处理连接
    handle_connection(sockfd);
    close(sockfd);
    return 0;

程序运行结果

客户端

./cli
start
connect succ
cli hello
epollfd 4, rdfd 0, sockfd 3, read 10
epollfd 4, wrfd 3, sockfd 3, write 10
epollfd 4, rdfd 3, sockfd 3, read 10
cli hello
epollfd 4, wrfd 1, sockfd 3, write 10
cli over
epollfd 4, rdfd 0, sockfd 3, read 9
epollfd 4, wrfd 3, sockfd 3, write 9
epollfd 4, rdfd 3, sockfd 3, read 9
cli over
epollfd 4, wrfd 1, sockfd 3, write 9
^C

服务端

./srv accept a new client: 127.0.0.1:37098, fd = 5read fd=5, num read=10read message is : cli hellowrite fd=5, num write=10read fd=5, num read=9read message is : cli overwrite fd=5, num write=9read fd=5, num read=0client close.^C

程序源代码详见公众号 xutopia77 的文章《select，poll，epoll的区别以及使用方法》

Original: https://www.cnblogs.com/xutopia/p/15808573.html
Author: xutopia
Title: select，poll，epoll的区别以及使用方法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/612240/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

前端数据提交给后端之HTML表单简单剖析

写在开篇什么是表单呢？当前端想要提交数据给后端，怎么搞？那么在前端开发中，表单是常用的手段，比如常见的场景有：登录框、账号注册页、主机信息录入CMDB等等场景都是需要表单。那么在…

Linux 2023年6月7日
0087
函数的设计和使用

1.函数的定义将可能需要反复执行的代码封装为函数，并在需要该功能的地方进行调用，不仅可以实现代码复用，更重要的是可以保证代码的一致性，只需要修改函数代码则所有调用均受影响。设计…

Linux 2023年6月7日
00149
无法获取指向控制台的文件描述符 (couldn’t get a file descriptor referring to the console)

背景最近收拾东西，从一堆杂物里翻出来尘封四年多的树莓派 3B 主机来，打扫打扫灰尘，接上电源，居然还能通过之前设置好的 VNC 连上。欣慰之余，开始 clone 我的 git 项…

Linux 2023年5月27日
00135
shell中的段落注释

摘自：感叹号可以用任意的串和字符替代，比如注意！和BLOCK之前不能有空格，但是可以用Tab Original: https://www.cnblogs.com/LiuYanY…

Linux 2023年5月28日
0074
对抗攻击方法BIM与PGD的区别

Basic iterative method(BIM):论文地址笔记地址 Projected gradient descent(PGD):论文地址笔记地址区别1 来自于：ht…

Linux 2023年6月7日
0084
Linux网络配置

第一种通过编辑网络配置文件/etc/sysconfig/network-scripts/ifcfg-ens32 -> TYPE=Ethernet -> #网卡类型是以…

Linux 2023年5月27日
0093
学习一下 SpringCloud （三）– 服务调用、负载均衡 Ribbon、OpenFeign

（1）相关博文地址：学习一下 SpringCloud （一）– 从单体架构到微服务架构、代码拆分（maven 聚合）: https://www.cnblogs.com/l-y…

Linux 2023年6月11日
0076
API 的 Authorization 头里为啥有个 Bearer

在我们设计和使用 API 授权的时候，经常会接触到如下内容： Authorization : Bearer Tokenxxxxxx 为什么前面会有个 Bearer，直接弄成这样不是…

Linux 2023年6月7日
0091
Docker 环境 Nacos2 MySQL8

本文介绍 docker 环境下安装并单机运行 Nacos2，使用 docker 环境下的 MySQL 8 存储数据。 1 拉取镜像 1.1 创建目录在硬盘上创建 nacos 的有…

Linux 2023年6月7日
0088
Golang环境安装

一、下载地址 Golang： Downloads – The Go Programming Language GoLand编辑器： Download GoLand: A…

Linux 2023年6月13日
0091
二分查找

一：二分查找算法本文章列出刷题中常用的二分查找场景：寻找一个数、寻找左侧边界、寻找右侧边界。 ps：什么最大值的最小，最远的最近。->都是二分 1:1二分查找框架 int …

Linux 2023年6月7日
0076
Ubuntu修改静态IP

转载自：https://www.cnblogs.com/xwgcxk/p/10560181.html 第一步：先获取网卡名称，输入ifconfig,如下图，我们的网卡名称为 ens…

Linux 2023年6月8日
0059
Redis in Action 文章投票

首先在 Linux 开启 Redis 服务：如果显示：说明 Redis 服务已经开启，端口号 6379 redis.php init_data.php 用于添加案例的数据 vo…

Linux 2023年5月28日
0099
redis 常用命令

批量删除redis key redis-cli -a xxx keys “prefix_tb_supplier:spl_id*” | xargs redis…

Linux 2023年5月28日
0077
如何写好倒计时

引言本文讲解倒计时为什么建议使用 setTimeout而不使用 setInterval，倒计时为什么存在误差，以及如何解决。倒计时器在前端开发中，倒计时器功能比较常见，比如活…

Linux 2023年6月7日
00317
PYTORCH: 60分钟 | 训练一个分类器

你已经知道怎样定义神经网络，计算损失和更新网络权重。现在你可能会想，那么，数据呢？通常，当你需要解决有关图像、文本或音频数据的问题，你可以使用python标准库加载数据并转换为…

Linux 2023年6月16日
00178

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

select，poll，epoll的区别以及使用方法

大家都在看