P270 epoll_wait

2026-05-06 13:02:47 +08:00 · 2019-01-31 13:16:28 +08:00
parent d2660d617d
commit 2aa9fcc3f0
2 changed files with 157 additions and 0 deletions
--- a/README.md
+++ b/README.md
@@ -4214,6 +4214,162 @@ gcc dup.c -o dup

 本章代码，在[TCP-IP-NetworkNote](https://github.com/riba2534/TCP-IP-NetworkNote)中可以找到。

+### 17.1 epoll 理解及应用
+
+select 复用方法由来已久，因此，利用该技术后，无论如何优化程序性能也无法同时介入上百个客户端。这种 select 方式并不适合以 web 服务器端开发为主流的现代开发环境，所以需要学习 Linux 环境下的 epoll
+
+#### 17.1.1 基于 select 的 I/O 复用技术速度慢的原因
+
+第 12 章实现了基于 select 的 I/O 复用技术服务端，其中有不合理的设计如下：
+
+- 调用 select 函数后常见的针对所有文件描述符的循环语句
+- 每次调用 select 函数时都需要向该函数传递监视对象信息
+
+上述两点可以从 [echo_selectserv.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch12/echo_selectserv.c) 得到确认，调用 select 函数后，并不是把发生变化的文件描述符单独集中在一起，而是通过作为监视对象的 fd_set 变量的变化，找出发生变化的文件描述符（54,56行），因此无法避免针对所有监视对象的循环语句。而且，作为监视对象的 fd_set 会发生变化，所以调用 select 函数前应该复制并保存原有信息，并在每次调用 select 函数时传递新的监视对象信息。
+
+select 性能上最大的弱点是：每次传递监视对象信息，准确的说，select 是监视套接字变化的函数。而套接字是操作系统管理的，所以 select 函数要借助操作系统才能完成功能。select 函数的这一缺点可以通过如下方式弥补：
+
+> 仅向操作系统传递一次监视对象，监视范围或内容发生变化时只通知发生变化的事项
+
+这样就无需每次调用 select 函数时都想操作系统传递监视对象信息，但是前提操作系统支持这种处理方式。Linux 的支持方式是 epoll ，Windows 的支持方式是 IOCP。
+
+#### 17.1.2 select 也有有点
+
+select 的兼容性比较高，这样就可以支持很多的操作系统，不受平台的限制，使用 select 函数满足以下两个条件：
+
+- 服务器接入者少
+- 程序应该具有兼容性
+
+#### 17.1.3 实现 epoll 时必要的函数和结构体
+
+能够克服 select 函数缺点的 epoll 函数具有以下优点，这些优点正好与之前的 select 函数缺点相反。
+
+- 无需编写以监视状态变化为目的的针对所有文件描述符的循环语句
+- 调用对应于 select 函数的 epoll_wait 函数时无需每次传递监视对象信息。
+
+下面是 epoll 函数的功能：
+
+- epoll_create：创建保存 epoll 文件描述符的空间
+- epoll_ctl：向空间注册并注销文件描述符
+- epoll_wait：与 select 函数类似，等待文件描述符发生变化
+
+select 函数中为了保存监视对象的文件描述符，直接声明了 fd_set 变量，但 epoll 方式下的操作系统负责保存监视对象文件描述符，因此需要向操作系统请求创建保存文件描述符的空间，此时用的函数就是 epoll_create 。
+
+此外，为了添加和删除监视对象文件描述符，select 方式中需要 FD_SET、FD_CLR 函数。但在 epoll 方式中，通过 epoll_ctl 函数请求操作系统完成。最后，select 方式下调用 select 函数等待文件描述符的变化，而 epoll_wait 调用 epoll_wait 函数。还有，select 方式中通过 fd_set 变量查看监视对象的状态变化，而 epoll 方式通过如下结构体 epoll_event 将发生变化的文件描述符单独集中在一起。
+
+```c
+struct epoll_event
+{
+    __uint32_t events;
+    epoll_data_t data;
+};
+typedef union epoll_data {
+    void *ptr;
+    int fd;
+    __uint32_t u32;
+    __uint64_t u64;
+} epoll_data_t;
+
+```
+
+声明足够大的 epoll_event 结构体数组候，传递给 epoll_wait 函数时，发生变化的文件描述符信息将被填入数组。因此，无需像 select 函数那样针对所有文件描述符进行循环。
+
+#### 17.1.4 epoll_create
+
+epoll 是从 Linux 的 2.5.44 版内核开始引入的。通过以下命令可以查看 Linux 内核版本：
+
+```shell
+cat /proc/sys/kernel/osrelease
+```
+
+下面是 epoll_create 函数的原型：
+
+```c
+#include <sys/epoll.h>
+int epoll_create(int size);
+/*
+成功时返回 epoll 的文件描述符，失败时返回 -1
+size：epoll 实例的大小
+*/
+```
+
+调用 epoll_create 函数时创建的文件描述符保存空间称为「epoll 例程」，但有些情况下名称不同，需要稍加注意。通过参数 size 传递的值决定 epoll 例程的大小，但该值只是向操作系统提出的建议。换言之，size 并不用来决定 epoll 的大小，而仅供操作系统参考。
+
+> Linux 2.6.8 之后的内核将完全传入 epoll_create 函数的 size 函数，因此内核会根据情况调整 epoll 例程大小。但是本书程序并没有忽略 size
+
+epoll_create 函数创建的资源与套接字相同，也由操作系统管理。因此，该函数和创建套接字的情况相同，也会返回文件描述符，也就是说返回的文件描述符主要用于区分 epoll 例程。需要终止时，与其他文件描述符相同，也要调用 close 函数
+
+#### 17.1.5 epoll_ctl
+
+生成例程后，应在其内部注册监视对象文件描述符，此时使用 epoll_ctl 函数。
+
+```c
+#include <sys/epoll.h>
+int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
+/*
+成功时返回 0 ，失败时返回 -1
+epfd：用于注册监视对象的 epoll 例程的文件描述符
+op：用于制定监视对象的添加、删除或更改等操作
+fd：需要注册的监视对象文件描述符
+event：监视对象的事件类型
+*/
+```
+
+与其他 epoll 函数相比，该函数看起来有些复杂，但通过调用语句就很容易理解，假设按照如下形式调用 epoll_ctl 函数：
+
+```CQL
+epoll_ctl(A,EPOLL_CTL_ADD,B,C);
+```
+
+第二个参数 EPOLL_CTL_ADD 意味着「添加」，上述语句有如下意义：
+
+> epoll  例程 A 中注册文件描述符 B ，主要目的是为了监视参数 C 中的事件
+
+再介绍一个调用语句。
+
+```c
+epoll_ctl(A,EPOLL_CTL_DEL,B,NULL);
+```
+
+上述语句中第二个参数意味这「删除」，有以下含义：
+
+> 从 epoll 例程 A 中删除文件描述符 B
+
+从上述示例中可以看出，从监视对象中删除时，不需要监视类型，因此向第四个参数可以传递为 NULL
+
+下面是第二个参数的含义：
+
+- EPOLL_CTL_ADD：将文件描述符注册到 epoll 例程
+- EPOLL_CTL_DEL：从 epoll 例程中删除文件描述符
+- EPOLL_CTL_MOD：更改注册的文件描述符的关注事件发生情况
+
+epoll_event 结构体用于保存事件的文件描述符结合。但也可以在 epoll 例程中注册文件描述符时，用于注册关注的事件。该函数中 epoll_event 结构体的定义并不显眼，因此通过掉英语剧说明该结构体在 epoll_ctl 函数中的应用。
+
+```c
+struct epoll_event event;
+...
+event.events=EPOLLIN;//发生需要读取数据的情况时
+event.data.fd=sockfd;
+epoll_ctl(epfd,EPOLL_CTL_ADD,sockfd,&event);
+...
+```
+
+上述代码将 epfd 注册到 epoll 例程 epfd 中，并在需要读取数据的情况下产生相应事件。接下来给出 epoll_event 的成员 events 中可以保存的常量及所指的事件类型。
+
+- EPOLLIN：需要读取数据的情况
+- EPOLLOUT：输出缓冲为空，可以立即发送数据的情况
+- EPOLLPRI：收到 OOB 数据的情况
+- EPOLLRDHUP：断开连接或半关闭的情况，这在边缘触发方式下非常有用
+- EPOLLERR：发生错误的情况
+- EPOLLET：以边缘触发的方式得到事件通知
+- EPOLLONESHOT：发生一次事件后，相应文件描述符不再收到事件通知。因此需要向 epoll_ctl 函数的第二个参数传递 EPOLL_CTL_MOD ，再次设置事件。
+
+可通过位运算同事传递多个上述参数。
+
+#### 17.1.6 epoll_wait
+
+
+
 ## License

 本仓库遵循 CC BY-NC-SA 4.0（署名 - 非商业性使用） 协议，转载请注明出处。
--- a/ch17/README.md
+++ b/ch17/README.md
@@ -0,0 +1 @@
+17.