个人学习-Linux-IO多路复用

2023年6月6日下午10:06 • Linux • 阅读 72

[1]confirmwz博客：Epoll原理解析https://blog.csdn.net/armlinuxww/article/details/92803381;

[2]hechen知乎专栏：一文看懂IO多路复用https://zhuanlan.zhihu.com/p/115220699;

weixin_39934085博客: io多路复用的原理和实现_彻底理解 IO 多路复用实现机制https://blog.csdn.net/weixin_39934085/article/details/110715861;

[3]UNIX网络编程:卷1[M].[美]W.Richard Stevens,Bill Fenner, Andrew M.Rudoff著;

IO多路复用，实际就是通过单线程或者单进程检测若干个文件描述符时候可以执行IO的能力；

当Linux作为服务端，使用socket和客户端进行通信时，执行顺序是，服务端socket启动，调用监听套接字，然后等待服务器链接;

// 伪代码
int lfd = socket();
// 绑定；
bind();
// 监听；
listen(lfd, 128);
// 等待链接：
int cfd = accept();
/* 使用cfd进行通信 */

多路IO的思路，实际就是把所有需要操作的文件描述符交付内核监控，一旦文件描述符准备就绪，就通知应用程序进行处理，没有就绪，则应用程序阻塞，Linux主要存在三种方式select, poll, epoll 进行管理。（多路指多路网络连接，复用指同一进程）

函数原型：

SYNOPSIS
     #include
     void
     FD_CLR(fd, fd_set *fdset);  // 把文件描述符从fd_set中清楚
     void
     FD_COPY(fd_set *fdset_orig, fd_set *fdset_copy);
     int
     FD_ISSET(fd, fd_set *fdset);  // 判断fd是否在set中
     void
     FD_SET(fd, fd_set *fdset);   // 把fd插入fd_set
     void
     FD_ZERO(fd_set *fdset);  //  把fd_set全赋0进行初始化；
     int
     select(int nfds, fd_set *restrict readfds, fd_set *restrict writefds,
         fd_set *restrict errorfds, struct timeval *restrict timeout);
        /*
            nfds 最大文件描述符;
            readfds : 读文件描述符集；
            writefds: 写文件描述符集；
            errorfds: 标准错误文件描述符集；
            timeout: 检索遍历超时时间;
        */

RETURN VALUES
     select() returns the number of ready descriptors that are contained in the
     descriptor sets, or -1 if an error occurred.  If the time limit expires,
     select() returns 0.  If select() returns with an error, including one due
     to an interrupted call, the descriptor sets will be unmodified and the
     global variable errno will be set to indicate the error.

调用过程：

使用copy_from_user 从客户空间拷贝fd_set到内核空间;
注册回调函数_pollwait();
遍历所有fd, 调用相应poll方法；
__pollwait的主要工作，是把current挂进等待队列，不同设备存在不同的等待队列，对于tcp而言，对应port接收一条网络连接就会唤醒队列；
poll给fd_set赋值，用来描述文件是否就绪；
把fd_set从内核空间拷贝回用户空间；

内核监控的fd_set被唤起的条件：

readfds:该文件描述符里的读缓冲区存在可读数据；

writers: 该描述符写缓冲区可写；

errorfds: 见识文件错误异常；

缺点：

select本质上是通过设置或者检查存放fd标志位的数据结构来进行下一步处理。这样所带来的缺点是：

单个进程所打开的FD是有限制的，通过 FD_SETSIZE 设置，默认1024 ;
每次调用 select，都需要把 fd 集合从用户态拷贝到内核态，这个开销在 fd 很多时会很大；
对 socket 扫描时是线性扫描，采用轮询的方法，效率较低（高并发）

相关API原型：

 #include
int epoll_create(int size);
int epoll_create1(int flags);
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
typedef union epoll_data {
               void        *ptr;
               int          fd;
               uint32_t     u32;
               uint64_t     u64;
           } epoll_data_t;

struct epoll_event {
               uint32_t     events;      /* Epoll events */
               epoll_data_t data;        /* User data variable */
};
op:
EPOLL_CTL_ADD  // 添加文件描述符和相应event到epfd;
EPOLL_CTL_MOD  // 修改对应文件描述符事件；
EPOLL_CTL_DEL  // 删除相应文件描述符;
events:
EPOLLIN
The associated file is available for read(2) operations.

EPOLLOUT
The associated file is available for write(2) operations.

EPOLLRDHUP (since Linux 2.6.17)
Stream socket peer closed connection, or shut down writing half of connection.  (This flag is especially useful for writing simple  code to detect peer shutdown when using Edge Triggered monitoring.)
EPOLLPRI
There is urgent data available for read(2) operations.

EPOLLERR
Error  condition  happened on the associated file descriptor.  epoll_wait(2) will always wait for this event; it is not necessary to set it in events.

EPOLLHUP
Hang up happened on the associated file descriptor.  epoll_wait(2) will always wait for this event; it is not necessary to set it in events.

EPOLLET
Sets  the  Edge Triggered behavior for the associated file descriptor.  The default behavior for epoll is Level Triggered.  See epoll(7) for more detailed information about Edge and Level Triggered event distribution architectures.

int epoll_wait(int epfd, struct epoll_event *events,int maxevents, int timeout);

调用过程：

1.调用poll_create，Linux会创建一个结构体，每一个epoll对象都会又个epoll_event结构体，来存放添加进来的事件，挂在红黑树下；

2.所有事件都会和设备驱动程序建立回调，相应驱动事件发生时，回调用相应的回调函数；

3.当epoll_ctl添加的fd和event发生时，就把发生的事件复制回用户空间。

优点：

没有最大并发连接的限制，能打开的FD的上限远大于1024（1G的内存上能监听约10万个端口）；
效率提升，不是轮询的方式，不会随着FD数目的增加效率下降。只有活跃可用的FD才会调用callback函数；即Epoll最大的优点就在于它只管你”活跃”的连接，而跟连接总数无关，因此在实际的网络环境中，Epoll的效率就会远远高于select和poll；

epoll 有 EPOLLLT 和 EPOLLET 两种触发模式，LT 是默认的模式(水平)，ET 是 “高速” 模式（边沿）。

LT 模式下，只要这个 fd 还有数据可读，每次 epoll_wait 都会返回它的事件，提醒用户程序去操作；
ET 模式下，它只会提示一次，直到下次再有数据流入之前都不会再提示了，无论 fd 中是否还有数据可读。所以在 ET 模式下，read 一个 fd 的时候一定要把它的 buffer 读完，或者遇到 EAGIN 错误。

Original: https://www.cnblogs.com/Albert-lihai/p/16593436.html
Author: Albert_禄遥
Title: 个人学习-Linux-IO多路复用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/577710/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Springboot 实现Redis 同数据源动态切换db

参考：https://developer.aliyun.com/article/952648 Original: https://www.cnblogs.com/herd/p/16…

Linux 2023年5月28日
0086
Java秒杀系统三：web层

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

Linux 2023年6月11日
0088
js之数据类型（1）

可以返回number，string，Boolean，object，undefined，function 运行结果如下：注意如下几个数据类型的输出显示数据类型转换和隐式数据类型转…

Linux 2023年6月13日
0073
jmeter压测报connect reset和unexpected end of file from server的解决方案

今天做负载压测，500并发没有报错，500并发以上就报错，报错率很高，主要有两种错误：报错1：报错2：解决方案： 1.压测机的注册表中添加 DefaultReceiveWin…

Linux 2023年6月8日
0078
搭建docker镜像仓库(一)：使用registry搭建本地镜像仓库

服务器版本 docker软件版本 CPU架构 CentOS Linux release 7.4.1708 (Core) Docker version 20.10.12 x86_64…

Linux 2023年6月7日
0077
MySQL-配置参数时报错：remove CMakeCache.txt and rerun cmake.On Debian/Ubuntu……

报错：remove CMakeCache.txt and rerun cmake.On Debian/Ubuntu…… 原因： 1、第一次配置参数时，不完整…

Linux 2023年6月13日
0098
浅谈kali : aircrack-ng套件

aircrack-ng 套件包含有： Name Description aircrack-ng 破解WEP以及WPA（字典攻击）密钥 airdecap-ng airmon-ng 将…

Linux 2023年6月14日
0069
【CentOS】检查系统是否安装OpenSSH

CentOS7 远程联机哔哩哔哩萌狼蓝天博客：https://mllt.cc 微信公众号：萌狼蓝天检查与安装配置OpenSSH [CentOS7]检查系统是否安装OpenS…

Linux 2023年5月27日
0083
每天一个 HTTP 状态码 100

100 Continue 指示客户端应该继续当前请求；如果请求已经完成… 100 Continue 服务器返回此代码表示已收到请求的第一部分，正在等待其余部分；指示客户…

Linux 2023年6月7日
0085
DDoS攻击–Syn_Flood攻击防护详解(TCP)

https://blog.csdn.net/qq_34777600/article/details/81946514 Original: https://www.cnblogs.c…

Linux 2023年6月7日
0075
JQ 实现对比两个文本的差异并高亮显示差异部分

利用jq对比两段文本的差异，差异的内容用不同颜色表示出来。在线参考demo：http://incaseofstairs.com/jsdiff/ 项目地址：https://gith…

Linux 2023年6月7日
00101
freePBR的UE4材质合集

我手动下载了freepbr.com上的所有ue4材质，放到百度云上分享给大家。 freePBR的UE4材质合集想开个新坑了。但工欲善其事必先利其器。于是我手动下载了freepbr…

Linux 2023年6月6日
0085
Java 内功修炼之数据结构与算法（二）

一、二叉树补充、多叉树 1、二叉树（非递归实现遍历）（1）前提前面一篇介绍了二叉树、顺序二叉树、线索二叉树、哈夫曼树等树结构。可参考：https://www.cnblogs.c…

Linux 2023年6月11日
0069
Nginx参数详解

从配置文件到events之间的内容，主要会设置一些影响nginx服务器整体运行的配置命令。主要包括配置运行nginx服务器的用户（组）、允许生成的worker process数…

Linux 2023年6月11日
0087
Servlet 学习总结

Servlet学习笔记 Servlet学习学习视频为：https://www.bilibili.com/video/BV1Ta4y1H7Vc IDEA的使用 IDEA的简介 ID…

Linux 2023年6月7日
0049
微信小程序开发（1）

微信小程序开发（1）微信小程序开发（1）代码结构与基本配置代码结构与基本配置基本HelloWorld创建开发框架——基本构成微信开发者工具版本控制 WXML wxml…

Linux 2023年6月8日
0084

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

个人学习-Linux-IO多路复用

大家都在看