第 5 章 基于 TCP 的服务端/客户端(2)结束

This commit is contained in:
riba2534
2019-01-16 15:54:58 +08:00
parent 2fa6747178
commit f530ad9a1d

View File

@@ -1 +1,244 @@
## 第 5 章 基于 TCP 的服务端/客户端2
## 第 5 章 基于 TCP 的服务端/客户端2
本章代码,在[TCP-IP-NetworkNote](https://github.com/riba2534/TCP-IP-NetworkNote)中可以找到。
上一章仅仅是从编程角度学习实现方法,并未详细讨论 TCP 的工作原理。因此,本章将想次讲解 TCP 中必要的理论知识,还将给出第 4 章客户端问题的解决方案。
### 5.1 回声客户端的完美实现
#### 5.1.1 回声服务器没有问题,只有回声客户端有问题?
问题不在服务器端,而在客户端,只看代码可能不好理解,因为 I/O 中使用了相同的函数。先回顾一下服务器端的 I/O 相关代码:
```c
while ((str_len = read(clnt_sock, message, BUF_SIZE)) != 0)
write(clnt_sock, message, str_len);
```
接着是客户端代码:
```c
write(sock, message, strlen(message));
str_len = read(sock, message, BUF_SIZE - 1);
```
二者都在村换调用 read 和 write 函数。实际上之前的回声客户端将 100% 接受字节传输的数据,只不过接受数据时的单位有些问题。扩展客户端代码回顾范围,下面是,客户端的代码:
```c
while (1)
{
fputs("Input message(Q to quit): ", stdout);
fgets(message, BUF_SIZE, stdin);
if (!strcmp(message, "q\n") || !strcmp(message, "Q\n"))
break;
write(sock, message, strlen(message));
str_len = read(sock, message, BUF_SIZE - 1);
message[str_len] = 0;
printf("Message from server: %s", message);
}
```
现在应该理解了问题,回声客户端传输的是字符串,而且是通过调用 write 函数一次性发送的。之后还调用一次 read 函数,期待着接受自己传输的字符串,这就是问题所在。
#### 5.1.2 回声客户端问题的解决办法
这个问题其实很容易解决因为可以提前接受数据的大小。若之前传输了20字节长的字符串则再接收时循环调用 read 函数读取 20 个字节即可。既然有了解决办法,那么代码如下:
- [echo_client2.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch05/echo_client2.c)
这样修改为了接收所有传输数据而循环调用 read 函数。测试及运行结果可参考第四章。
#### 5.1.3 如果问题不在于回声客户端:定义应用层协议
回声客户端可以提前知道接收数据的长度,这在大多数情况下是不可能的。那么此时无法预知接收数据长度时应该如何手法数据?这是需要的是**应用层协议**的定义。在收发过程中定好规则(协议)以表示数据边界,或者提前告知需要发送的数据的大小。服务端/客户端实现过程中逐步定义的规则集合就是应用层协议。
现在写一个小程序来体验应用层协议的定义过程。要求:
1. 服务器从客户端获得多个数组和运算符信息。
2. 服务器接收到数字候对齐进行加减乘运算,然后把结果传回客户端。
例:
1. 向服务器传递3,5,9的同事请求加法运算服务器返回3+5+9的结果
2. 请求做乘法运算,客户端会收到`3*5*9`的结果
3. 如果向服务器传递4,3,2的同时要求做减法则返回4-3-2的运算结果。
请自己实现一个程序来实现功能。
我自己的实现:
- [My_op_server.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch05/My_op_server.c)
- [My_op_client.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch05/My_op_client.c)
编译:
```shell
gcc My_op_client.c -o myclient
gcc My_op_server.c -o myserver
```
结果:
![](https://i.loli.net/2019/01/15/5c3d966b81c03.png)
其实主要是对程序的一点点小改动,只需要再客户端固定好发送的格式,服务端按照固定格式解析,然后返回结果即可。
书上的实现:
- [op_client.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch05/op_client.c)
- [op_server.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch05/op_server.c)
阅读代码要注意一下,`int*``char`之间的转换。TCP 中不存在数据边界。
编译:
```shell
gcc op_client.c -o opclient
gcc op_server.c -o opserver
```
运行:
```shell
./opserver 9190
./opclient 127.0.0.1 9190
```
结果:
![](https://i.loli.net/2019/01/16/5c3ea297c7649.png)
### 5.2 TCP 原理
#### 5.2.1 TCP 套接字中的 I/O 缓冲
TCP 套接字的数据收发无边界。服务器即使调用 1 次 write 函数传输 40 字节的数据,客户端也有可能通过 4 次 read 函数调用每次读取 10 字节。但此处也有一些一问,服务器一次性传输了 40 字节,而客户端竟然可以缓慢的分批接受。客户端接受 10 字节后,剩下的 30 字节在何处等候呢?
实际上write 函数调用后并非立即传输数据, read 函数调用后也并非马上接收数据。如图所示write 函数滴啊用瞬间数据将移至输出缓冲read 函数调用瞬间,从输入缓冲读取数据。
![](https://i.loli.net/2019/01/16/5c3ea41cd93c6.png)
I/O 缓冲特性可以整理如下:
- I/O 缓冲在每个 TCP 套接字中单独存在
- I/O 缓冲在创建套接字时自动生成
- 即使关闭套接字也会继续传递输出缓冲中遗留的数据
- 关闭套接字将丢失输入缓冲中的数据
假设发生以下情况,会发生什么事呢?
> 客户端输入缓冲为 50 字节,而服务器端传输了 100 字节。
因为 TCP 不会发生超过输入缓冲大小的数据传输。也就是说,根本不会发生这类问题,因为 TCP 会控制数据流。TCP 中有滑动窗口Sliding Window协议用对话方式如下
> - A你好最多可以向我传递 50 字节
> - B好的
> - A我腾出了 20 字节的空间,最多可以接受 70 字节
> - B好的
数据收发也是如此,因此 TCP 中不会因为缓冲溢出而丢失数据。
**write 函数在数据传输完成时返回。**
#### 5.2.2 TCP 内部工作原理 1与对方套接字的连接
TCP 套接字从创建到消失所经过的过程分为如下三步:
- 与对方套接字建立连接
- 与对方套接字进行数据交换
- 断开与对方套接字的连接
首先讲解与对方套接字建立连接的过程。连接过程中,套接字的对话如下:
- 套接字A你好套接字 B。我这里有数据给你建立连接吧
- 套接字B好的我这边已就绪
- 套接字A谢谢你受理我的请求
TCP 在实际通信中也会经过三次对话过程,因此,该过程又被称为 **Three-way handshaking三次握手**。接下来给出连接过程中实际交换的信息方式:
![](https://i.loli.net/2019/01/16/5c3ecdec9fc04.png)
套接字是全双工方式工作的。也就是说,它可以双向传递数据。因此,收发数据前要做一些准备。首先请求连接的主机 A 要给主机 B 传递以下信息:
> [SYN] SEQ : 1000 , ACK:-
该消息中的 SEQ 为 1000 ACK 为空,而 SEQ 为1000 的含义如下:
> 现在传递的数据包的序号为 1000如果接收无误请通知我向您传递 1001 号数据包。
这是首次请求连接时使用的消息,又称为 SYN。SYN 是 Synchronization 的简写,表示收发数据前传输的同步消息。接下来主机 B 向 A 传递以下信息:
> [SYN+ACK] SEQ: 2000, ACK: 1001
此时 SEQ 为 2000ACK 为 1001而 SEQ 为 2000 的含义如下:
> 现传递的数据包号为 2000 ,如果接受无误,请通知我向您传递 2001 号数据包。
而 ACK 1001 的含义如下:
> 刚才传输的 SEQ 为 1000 的数据包接受无误,现在请传递 SEQ 为 1001 的数据包。
对于主机 A 首次传输的数据包的确认消息ACK 1001和为主机 B 传输数据做准备的同步消息SEQ 2000捆绑发送。因此此种类消息又称为 SYN+ACK。
收发数据前向数据包分配序号,并向对方通报此序号,这都是为了防止数据丢失做的准备。通过项数据包分配序号并确认,可以在数据包丢失时马上查看并重传丢失的数据包。因此 TCP 可以保证可靠的数据传输。
通过这三个过程,这样主机 A 和主机 B 就确认了彼此已经准备就绪。
#### 5.2.3 TCP 内部工作原理 2与对方主机的数据交换
通过第一步三次握手过程完成了数据交换准备,下面就开始正式收发数据,其默认方式如图所示:
![](https://i.loli.net/2019/01/16/5c3ed1a97ce2b.png)
图上给出了主机 A 分成 2 个数据包向主机 B 传输 200 字节的过程。首先,主机 A 通过 1 个数据包发送 100 个字节的数据,数据包的 SEQ 为 1200 。主机 B 为了确认这一点,向主机 A 发送 ACK 1301 消息。
此时的 ACK 号为 1301 而不是 1201原因在于 ACK 号的增量为传输的数据字节数。假设每次 ACK 号不加传输的字节数,这样虽然可以确认数据包的传输,但无法明确 100 个字节全都正确传递还是丢失了一部分,比如只传递了 80 字节。因此按照如下公式传递 ACK 信息:
> ACK 号 = SEQ 号 + 传递的字节数 + 1
与三次握手协议相同,最后 + 1 是为了告知对方下次要传递的 SEQ 号。下面分析传输过程中数据包丢失的情况:
![](https://i.loli.net/2019/01/16/5c3ed371187a6.png)'
上图表示了通过 SEQ 1301 数据包向主机 B 传递 100 字节数据。但中间发生了错误,主机 B 未收到,经过一段时间后,主机 A 仍然未收到对于 SEQ 1301 的 ACK 的确认因此试着重传该数据包。为了完成该数据包的重传TCP 套接字启动计时器以等待 ACK 应答。若相应计时器发生超时Time-out!)则重传。
#### 5.2.4 TCP 内部工作原理 3断开套接字的连接
TCP 套接字的结束过程也非常优雅。如果对方还有数据需要传输时直接断掉该连接会出问题,所以断开连接时需要双方协商,断开连接时双方的对话如下:
> - 套接字A我希望断开连接
> - 套接字B是吗请稍后。
> - 套接字A我也准备就绪可以断开连接。
> - 套接字B好的谢谢合作。
先由套接字 A 向套接字 B 传递断开连接的信息,套接字 B 发出确认收到的消息,然后向套接字 A 传递可以断开连接的消息,套接字 A 同样发出确认消息。
![](https://i.loli.net/2019/01/16/5c3ed7503c18c.png)
图中数据包内的 FIN 表示断开连接。也就是说,双方各发送 1 次 FIN 消息后断开连接。此过过程经历 4 个阶段因此又称四次握手Four-way handshaking。SEQ 和 ACK 的含义与之前讲解的内容一致,省略。图中,主机 A 传递了两次 ACK 5001也许这里会有困惑。其实第二次 FIN 数据包中的 ACK 5001 只是因为接收了 ACK 消息后未接收到的数据重传的。
### 5.3 基于 Windows 的实现
暂略
### 5.4 习题
> 答案仅代表本人个人观点,可能不是正确答案。
1. **请说明 TCP 套接字连接设置的三次握手过程。尤其是 3 次数据交换过程每次收发的数据内容。**
三次握手主要分为①与对方套接字建立连接②与对方套接字进行数据交换③断开与对方套接字的连接。每次收发的数据内容主要有①由主机1给主机2发送初始的SEQ首次连接请求是关键字是SYN表示收发数据前同步传输的消息。②主机2收到报文以后给主机 1 传递信息用一个新的SEQ表示自己的序号然后ACK代表已经接受到主机1的消息希望接受下一个消息③主机1收到主机2的确认以后还需要给主机2给出确认此时再发送一次SEQ和ACK。
2. **TCP 是可靠的数据传输协议,但在通过网络通信的过程中可能丢失数据。请通过 ACK 和 SEQ 说明 TCP 通过和何种机制保证丢失数据的可靠传输。**
答:通过超时重传机制来保证,如果报文发出去的特定时间内,发送消息的主机没有收到另一个主机的回复,那么就继续发送这条消息,直到收到回复为止。
3. **TCP 套接字中调用 write 和 read 函数时数据如何移动?结合 I/O 缓冲进行说明。**
TCP 套接字调用 write 函数时,数据将移至输出缓冲,在适当的时候,传到对方输入缓冲。这时对方将调用 read 函数从输入缓冲中读取数据。
4. **对方主机的输入缓冲剩余 50 字节空间时,若本主机通过 write 函数请求传输 70 字节,请问 TCP 如何处理这种情况?**
TCP 中有滑动窗口控制协议,所以传输的时候会保证传输的字节数小于等于自己能接受的字节数。