Files
TCP-IP-NetworkNote/ch04/README.md

233 lines
13 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
## 第 4 章 基于 TCP 的服务端/客户端1
本章代码,在[TCP-IP-NetworkNote](https://github.com/riba2534/TCP-IP-NetworkNote)中可以找到。
### 4.1 理解 TCP 和 UDP
根据数据传输方式的不同,基于网络协议的套接字一般分为 TCP 套接字和 UDP 套接字。因为 TCP 套接字是面向连接的因此又被称为基于流stream的套接字。
TCP 是 Transmission Control Protocol (传输控制协议)的简写,意为「对数据传输过程的控制」。因此,学习控制方法及范围有助于正确理解 TCP 套接字。
#### 4.1.1 TCP/IP 协议栈
![](https://i.loli.net/2019/01/14/5c3c21889db06.png)
TCP/IP 协议栈共分为 4 层,可以理解为数据收发分成了 4 个层次化过程,通过层次化的方式来解决问题
#### 4.1.2 链路层
链路层是物理链接领域标准化的结果也是最基本的领域专门定义LAN、WAN、MAN等网络标准。若两台主机通过网络进行数据交换则需要物理连接链路层就负责这些标准。
#### 4.1.3 IP 层
转备好物理连接候就要传输数据。为了再复杂网络中传输数据首先要考虑路径的选择。向目标传输数据需要经过哪条路径解决此问题的就是IP层该层使用的协议就是IP。
IP 是面向消息的、不可靠的协议。每次传输数据时会帮我们选择路径但并不一致。如果传输过程中发生错误则选择其他路径但是如果发生数据丢失或错误则无法解决。换言之IP协议无法应对数据错误。
#### 4.1.4 TCP/UDP 层
IP 层解决数据传输中的路径选择问题秩序照此路径传输数据即可。TCP 和 UDP 层以 IP 层提供的路径信息为基础完成实际的数据传输故该层又称为传输层。UDP 比 TCP 简单,现在我们只解释 TCP 。 TCP 可以保证数据的可靠传输,但是它发送数据时以 IP 层为基础(这也是协议栈层次化的原因)
IP 层只关注一个数据包(数据传输基本单位)的传输过程。因此,即使传输多个数据包,每个数据包也是由 IP 层实际传输的也就是说传输顺序及传输本身是不可靠的。若只利用IP层传输数据则可能导致后传输的数据包B比先传输的数据包A提早到达。另外传输的数据包A、B、C中可能只收到A和C甚至收到的C可能已经损毁 。反之,若添加 TCP 协议则按照如下对话方式进行数据交换。
> 主机A正确接受第二个数据包
>
> 主机B知道了
>
> 主机A正确收到第三个数据包
>
> 主机B可我已经发送第四个数据包了啊您没收到吧我给你重新发。
这就是 TCP 的作用。如果交换数据的过程中可以确认对方已经收到数据并重传丢失的数据那么即便IP层不保证数据传输这类通信也是可靠的。
![](https://i.loli.net/2019/01/14/5c3c268b40be6.png)
#### 4.1.5 应用层
上述内容是套接字通信过程中自动处理的。选择数据传输路径、数据确认过程都被隐藏到套接字内部。向程序员提供的工具就是套接字,只需要利用套接字编出程序即可。编写软件的过程中,需要根据程序的特点来决定服务器和客户端之间的数据传输规则,这便是应用层协议。
### 4.2 实现基于 TCP 的服务器/客户端
#### 4.2.1 TCP 服务端的默认函数的调用程序
![](https://i.loli.net/2019/01/14/5c3c2782a7810.png)
调用 socket 函数创建套接字,声明并初始化地址信息的结构体变量,调用 bind 函数向套接字分配地址。
#### 4.2.2 进入等待连接请求状态
已经调用了 bind 函数给他要借资分配地址,接下来就是要通过调用 listen 函数进入等待链接请求状态。只有调用了 listen 函数,客户端才能进入可发出连接请求的状态。换言之,这时客户端才能调用 connect 函数
```c
#include <sys/socket.h>
int listen(int sockfd, int backlog);
//成功时返回0失败时返回-1
//sock: 希望进入等待连接请求状态的套接字文件描述符,传递的描述符套接字参数称为服务端套接字
//backlog: 连接请求等待队列的长度若为5则队列长度为5表示最多使5个连接请求进入队列
```
#### 4.2.3 受理客户端连接请求
调用 listen 函数后,则应该按序受理。受理请求意味着可接受数据的状态。进入这种状态所需的部件是**套接字**,但是此时使用的不是服务端套接字,此时需要另一个套接字,但是没必要亲自创建,下面的函数将自动创建套接字。
```c
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
/*
成功时返回文件描述符,失败时返回-1
sock: 服务端套接字的文件描述符
addr: 保存发起连接请求的客户端地址信息的变量地址值
addrlen: 的第二个参数addr结构体的长度但是存放有长度的变量地址。
*/
```
sccept 函数受理连接请求队列中待处理的客户端连接请求。函数调用成功后accept 内部将产生用于数据 I/O 的套接字,并返回其文件描述符。需要强调的是套接字是自动创建的,并自动与发起连接请求的客户端建立连接。
#### 4.2.4 回顾 Hello World 服务端
- 代码:[hello_server.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch04/hello_server.c)
重新整理一下代码的思路
1. 服务端实现过程中首先要创建套接字,此时的套接字并非是真正的服务端套接字
2. 为了完成套接字地址的分配,初始化结构体变量并调用 bind 函数。
3. 调用 listen 函数进入等待连接请求状态。连接请求状态队列的长度设置为5.此时的套接字才是服务端套接字。
4. 调用 accept 函数从队头取 1 个连接请求与客户端建立连接,并返回创建的套接字文件描述符。另外,调用 accept 函数时若等待队列为空,则 accept 函数不会返回,直到队列中出现新的客户端连接。
5. 调用 write 函数向客户端传送数据,调用 close 关闭连接
#### 4.2.5 TCP 客户端的默认函数调用顺序
![](https://i.loli.net/2019/01/14/5c3c31d77e86c.png)
与服务端相比,区别就在于「请求连接」,他是创建客户端套接字后向服务端发起的连接请求。服务端调用 listen 函数后创建连接请求等待队列,之后客户端即可请求连接。
```c
#include <sys/socket.h>
int connect(int sock, struct sockaddr *servaddr, socklen_t addrlen);
/*
成功时返回0失败返回-1
sock:客户端套接字文件描述符
servaddr: 保存目标服务器端地址信息的变量地址值
addrlen: 以字节为单位传递给第二个结构体参数 servaddr 的变量地址长度
*/
```
客户端调用 connect 函数候,发生以下函数之一才会返回(完成函数调用):
- 服务端接受连接请求
- 发生断网等一场状况而中断连接请求
注意:**接受连接**不代表服务端调用 accept 函数,其实只是服务器端把连接请求信息记录到等待队列。因此 connect 函数返回后并不应该立即进行数据交换。
#### 4.2.6 回顾 Hello World 客户端
- 代码:[hello_client.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch04/hello_client.c)
重新理解这个程序:
1. 创建准备连接服务器的套接字,此时创建的是 TCP 套接字
2. 结构体变量 serv_addr 中初始化IP和端口信息。初始化值为目标服务器端套接字的IP和端口信息。
3. 调用 connect 函数向服务端发起连接请求
4. 完成连接后,接收服务端传输的数据
5. 接收数据后调用 close 函数关闭套接字,结束与服务器端的连接。
#### 4.2.7 基于 TCP 的服务端/客户端函数调用关系
![](https://i.loli.net/2019/01/14/5c3c35a773b8c.png)
关系如上图所示。
### 4.3 实现迭代服务端/客户端
编写一个回声echo服务器/客户端。顾名思义,服务端将客户端传输的字符串数据原封不动的传回客户端,就像回声一样。在此之前,需要解释一下迭代服务器端。
#### 4.3.1 实现迭代服务器端
在 Hello World 的例子中,等待队列的作用没有太大意义。如果想继续处理好后面的客户端请求应该怎样扩展代码?最简单的方式就是插入循环反复调用 accept 函数,如图:
![](https://i.loli.net/2019/01/15/5c3d3c8a283ad.png)
可以看出,调用 accept 函数后,紧接着调用 I/O 相关的 read write 函数,然后调用 close 函数。这并非针对服务器套接字,而是针对 accept 函数调用时创建的套接字。
#### 4.3.2 迭代回声服务器端/客户端
程序运行的基本方式:
- 服务器端在同一时刻只与一个客户端相连,并提供回声服务。
- 服务器端依次向 5 个客户端提供服务并退出。
- 客户端接受用户输入的字符串并发送到服务器端。
- 服务器端将接受的字符串数据传回客户端,即「回声」
- 服务器端与客户端之间的字符串回声一直执行到客户端输入 Q 为止。
以下是服务端与客户端的代码:
- [echo_server.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch04/echo_server.c)
- [echo_client.c](https://github.com/riba2534/TCP-IP-NetworkNote/blob/master/ch04/echo_client.c)
编译:
```shell
gcc echo_client.c -o eclient
gcc echo_server.c -o eserver
```
分别运行:
```shell
./eserver 9190
./eclient 127.0.0.1 9190
```
过程和结果:
在一个服务端开启后,用另一个终端窗口开启客户端,然后程序会让你输入字符串,然后客户端输入什么字符串,客户端就会返回什么字符串,按 q 退出。这时服务端的运行并没有结束,服务端一共要处理 5 个客户端的连接,所以另外开多个终端窗口同时开启客户端,服务器按照顺序进行处理。
server:
![server.png](https://i.loli.net/2019/01/15/5c3d523d0a675.png)
client:
![client.png](https://i.loli.net/2019/01/15/5c3d523d336e7.png)
#### 4.3.3 回声客户端存在的问题
以上代码有一个假设「每次调用 read、write函数时都会以字符串为单位执行实际 I/O 操作」
但是「第二章」中说过「TCP 不存在数据边界」,上述客户端是基于 TCP 的,因此多次调用 write 函数传递的字符串有可能一次性传递到服务端。此时客户端有可能从服务端收到多个字符串,这不是我们想要的结果。还需要考虑服务器的如下情况:
「字符串太长,需要分 2 个包发送!」
服务端希望通过调用 1 次 write 函数传输数据,但是如果数据太大,操作系统就有可能把数据分成多个数据包发送到客户端。另外,在此过程中,客户端可能在尚未收到全部数据包时就调用 read 函数。
以上的问题都是源自 TCP 的传输特性,解决方法在第 5 章。
### 4.4 基于 Windows 的实现
暂略
### 4.5 习题
> 答案仅代表本人个人观点,不一定是正确答案。
1. **请你说明 TCP/IP 的 4 层协议栈,并说明 TCP 和 UDP 套接字经过的层级结构差异。**
TCP/IP 的四层协议分为应用层、TCP/UDP 层、IP层、链路层。差异是一个经过 TCP 层,一个经过 UDP 层。
2. **请说出 TCP/IP 协议栈中链路层和IP层的作用并给出二者关系**
链路层是物理链接领域标准化的结果专门定义网络标准。若两台主机通过网络进行数据交换则首先要做到的就是进行物理链接。IP层为了在复杂的网络中传输数据首先需要考虑路径的选择。关系链路层负责进行一系列物理连接而IP层负责选择正确可行的物理路径。
3. **为何需要把 TCP/IP 协议栈分成 4 层或7层开放式回答。**
ARPANET 的研制经验表明,对于复杂的计算机网络协议,其结构应该是层次式的。分册的好处:①隔层之间是独立的②灵活性好③结构上可以分隔开④易于实现和维护⑤能促进标准化工作。
4. **客户端调用 connect 函数向服务器端发送请求。服务器端调用哪个函数后,客户端可以调用 connect 函数?**
答:服务端调用 listen 函数后,客户端可以调用 connect 函数。因为,服务端调用 listen 函数后,服务端套接字才有能力接受请求连接的信号。
5. **什么时候创建连接请求等待队列?它有何种作用?与 accept 有什么关系?**
答:服务端调用 listen 函数后accept函数正在处理客户端请求时 更多的客户端发来了请求连接的数据此时就需要创建连接请求等待队列。以便于在accept函数处理完手头的请求之后按照正确的顺序处理后面正在排队的其他请求。与accept函数的关系accept函数受理连接请求等待队列中待处理的客户端连接请求。
6. **客户端中为何不需要调用 bind 函数分配地址?如果不调用 bind 函数那何时、如何向套接字分配IP地址和端口号**
答:在调用 connect 函数时分配了地址客户端IP地址和端口在调用 connect 函数时自动分配,无需调用标记的 bind 函数进行分配。