From 4931c03be68e93db3d6cdf133ff9e547a512a269 Mon Sep 17 00:00:00 2001 From: riba2534 Date: Wed, 23 Jan 2019 11:37:35 +0800 Subject: [PATCH] =?UTF-8?q?12.2=20=E7=90=86=E8=A7=A3=20select=20=E5=87=BD?= =?UTF-8?q?=E6=95=B0=E5=B9=B6=E5=AE=9E=E7=8E=B0=E6=9C=8D=E5=8A=A1=E5=99=A8?= =?UTF-8?q?=E7=AB=AF=20P203?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 136 +++++++++++++++++++++++++++++++++++++++++++++++++ ch12/README.md | 1 + ch12/select.c | 48 +++++++++++++++++ 3 files changed, 185 insertions(+) create mode 100644 ch12/README.md create mode 100644 ch12/select.c diff --git a/README.md b/README.md index d4b9df2..6c121a9 100644 --- a/README.md +++ b/README.md @@ -3151,7 +3151,143 @@ gcc echo_storeserv.c -o serv ### 12.1 基于 I/O 复用的服务器端 +#### 12.1.1 多进程服务端的缺点和解决方法 +为了构建并发服务器,只要有客户端连接请求就会创建新进程。这的确是实际操作中采用的一种方案,但并非十全十美,因为创建进程要付出很大的代价。这需要大量的运算和内存空间,由于每个进程都具有独立的内存空间,所以相互间的数据交换也要采用相对复杂的方法(IPC 属于相对复杂的通信方法) + +I/O 复用技术可以解决这个问题。 + +#### 12.1.2 理解复用 + +「复用」在电子及通信工程领域很常见,向这些领域的专家询问其概念,可能会得到如下答复: + +> 在 1 个通信频道中传递多个数据(信号)的技术 + +「复用」的含义: + +> 为了提高物理设备的效率,只用最少的物理要素传递最多数据时使用的技术 + +上述两种方法的内容完全一致。可以用纸电话模型做一个类比: + +![](https://s2.ax1x.com/2019/01/23/kA8H81.png) + +上图是一个纸杯电话系统,为了使得三人同时通话,说话时要同事对着两个纸杯,接听时也需要耳朵同时对准两个纸杯。为了完成 3 人通话,可以进行如下图的改进: + +![](https://s2.ax1x.com/2019/01/23/kA8bgx.png) + +如图做出改进,就是引入了复用技术。 + +复用技术的优点: + +- 减少连线长度 +- 减少纸杯个数 + +即使减少了连线和纸杯的量仍然可以进行三人同时说话,但是如果碰到以下情况: + +> 「好像不能同时说话?」 + +实际上,因为是在进行对话,所以很少发生同时说话的情况。也就是说,上述系统采用的是**「时分复用」**技术。因为说话人声频率不同,即使在同时说话也能进行一定程度上的区分(杂音也随之增多)。因此,也可以说是「频分复用技术」。 + +#### 12.1.3 复用技术在服务器端的应用 + +纸杯电话系统引入复用技术之后可以减少纸杯数量和连线长度。服务器端引入复用技术可以减少所需进程数。下图是多进程服务端的模型: + +![](https://s2.ax1x.com/2019/01/23/kAGBM6.png) + +下图是引入复用技术之后的模型: + +![](https://s2.ax1x.com/2019/01/23/kAGrqO.png) + +从图上可以看出,引入复用技术之后,可以减少进程数。重要的是,无论连接多少客户端,提供服务的进程只有一个。 + +### 12.2 理解 select 函数并实现服务端 + +select 函数是最具代表性的实现复用服务器的方法。在 Windows 平台下也有同名函数,所以具有很好的移植性。 + +#### 12.2.1 select 函数的功能和调用顺序 + +使用 select 函数时可以将多个文件描述符集中到一起统一监视,项目如下: + +- 是否存在套接字接收数据? +- 无需阻塞传输数据的套接字有哪些? +- 哪些套接字发生了异常? + +> 术语:「事件」。当发生监视项对应情况时,称「发生了事件」。 + +select 函数的使用方法与一般函数的区别并不大,更准确的说,他很难使用。但是为了实现 I/O 复用服务器端,我们应该掌握 select 函数,并运用于套接字编程当中。认为「select 函数是 I/O 复用的全部内容」也并不为过。select 函数的调用过程如下图所示: + +![](https://s2.ax1x.com/2019/01/23/kAtdRs.png) + +#### 12.2.2 设置文件描述符 + +利用 select 函数可以同时监视多个文件描述符。当然,监视文件描述符可以视为监视套接字。此时首先需要将要监视的文件描述符集中在一起。集中时也要按照监视项(接收、传输、异常)进行区分,即按照上述 3 种监视项分成 3 类。 + +利用 fd_set 数组变量执行此操作,如图所示,该数组是存有0和1的位数组。 + +![](https://s2.ax1x.com/2019/01/23/kAt2i4.png) + +图中最左端的位表示文件描述符 0(所在位置)。如果该位设置为 1,则表示该文件描述符是监视对象。那么图中哪些文件描述符是监视对象呢?很明显,是描述符 1 和 3。在 fd_set 变量中注册或更改值的操作都由下列宏完成。 + +- `FD_ZERO(fd_set *fdset)`:将 fd_set 变量所指的位全部初始化成0 +- `FD_SET(int fd,fd_set *fdset)`:在参数 fdset 指向的变量中注册文件描述符 fd 的信息 +- `FD_SLR(int fd,fd_set *fdset)`:从参数 fdset 指向的变量中清除文件描述符 fd 的信息 +- `FD_ISSET(int fd,fd_set *fdset)`:若参数 fdset 指向的变量中包含文件描述符 fd 的信息,则返回「真」 + +上述函数中,FD_ISSET 用于验证 select 函数的调用结果,通过下图解释这些函数的功能: + +![](https://s2.ax1x.com/2019/01/23/kANR78.png) + +#### 12.2.3 设置检查(监视)范围及超时 + +下面是 select 函数的定义: + +```c +#include +#include + +int select(int maxfd, fd_set *readset, fd_set *writeset, + fd_set *exceptset, const struct timeval *timeout); +/* +成功时返回大于 0 的值,失败时返回 -1 +maxfd: 监视对象文件描述符数量 +readset: 将所有关注「是否存在待读取数据」的文件描述符注册到 fd_set 型变量,并传递其地址值。 +writeset: 将所有关注「是否可传输无阻塞数据」的文件描述符注册到 fd_set 型变量,并传递其地址值。 +exceptset: 将所有关注「是否发生异常」的文件描述符注册到 fd_set 型变量,并传递其地址值。 +timeout: 调用 select 函数后,为防止陷入无限阻塞的状态,传递超时(time-out)信息 +返回值: 发生错误时返回 -1,超时时返回0,。因发生关注的时间返回时,返回大于0的值,该值是发生事件的文件描述符数。 +*/ +``` + +如上所述,select 函数用来验证 3 种监视的变化情况,根据监视项声明 3 个 fd_set 型变量,分别向其注册文件描述符信息,并把变量的地址值传递到上述函数的第二到第四个参数。但在此之前(调用 select 函数之前)需要决定下面两件事: + +1. 文件描述符的监视(检查)范围是? +2. 如何设定 select 函数的超时时间? + +第一,文件描述符的监视范围和 select 的第一个参数有关。实际上,select 函数要求通过第一个参数传递监视对象文件描述符的数量。因此,需要得到注册在 fd_set 变量中的文件描述符数。但每次信件文件描述符时,其值就会增加 1 ,故只需将最大的文件描述符值加 1 再传递给 select 函数即可。加 1 是因为文件描述符的值是从 0 开始的。 + +第二,select 函数的超时时间与 select 函数的最后一个参数有关,其中 timeval 结构体定义如下: + +```c +struct timeval +{ + long tv_sec; + long tv_usec; +}; +``` + +本来 select 函数只有在监视文件描述符发生变化时才返回。如果未发生变化,就会进入阻塞状态。指定超时时间就是为了防止这种情况的发生。通过上述结构体变量,将秒数填入 tv_sec 的成员,将微妙数填入 tv_usec 的成员,然后将结构体的地址值传递到 select 函数的最后一个参数。此时,即使文件描述符未发生变化,只要过了指定时间,也可以从函数中返回。不过这种情况下, select 函数返回 0 。因此,可以通过返回值了解原因。如果不向设置超时,则传递 NULL 参数。 + +#### 12.2.4 调用 select 函数查看结果 + +select 返回正整数时,怎样获知哪些文件描述符发生了变化?向 select 函数的第二到第四个参数传递的 fd_set 变量中将产生如图所示的变化: + +![](https://s2.ax1x.com/2019/01/23/kA06dx.png) + +由图可知,select 函数调用完成候,向其传递的 fd_set 变量将发生变化。原来为 1 的所有位将变成 0,但是发生了变化的文件描述符除外。因此,可以认为值仍为 1 的位置上的文件描述符发生了变化。 + +#### 12.2.5 select 函数调用示例 + +下面是一个 select 函数的例子: diff --git a/ch12/README.md b/ch12/README.md new file mode 100644 index 0000000..949045f --- /dev/null +++ b/ch12/README.md @@ -0,0 +1 @@ +12. \ No newline at end of file diff --git a/ch12/select.c b/ch12/select.c new file mode 100644 index 0000000..527c4a4 --- /dev/null +++ b/ch12/select.c @@ -0,0 +1,48 @@ +#include +#include +#include +#include +#define BUF_SIZE 30 + +int main(int argc, char *argv[]) +{ + fd_set reads, temps; + int result, str_len; + char buf[BUF_SIZE]; + struct timeval timeout; + + FD_ZERO(&reads); //初始化变量 + FD_SET(0, &reads); //将文件描述符0对应的位设置为1 + + /* + timeout.tv_sec=5; + timeout.tv_usec=5000; + */ + + while (1) + { + temps = reads; //为了防止调用了select 函数后,位的内容改变,先提前存一下 + timeout.tv_sec = 5; + timeout.tv_usec = 0; + result = select(1, &temps, 0, 0, &timeout); //如果控制台输入数据,则返回大于0的数,没有就会超时 + if (result == -1) + { + puts("select error!"); + break; + } + else if (result == 0) + { + puts("Time-out!"); + } + else + { + if (FD_ISSET(0, &temps)) //验证发生变化的值是否是标准输入端 + { + str_len = read(0, buf, BUF_SIZE); + buf[str_len] = 0; + printf("message from console: %s", buf); + } + } + } + return 0; +}