2.3 MiB
传输层
基本概念
传输层只有主机才有,而路由器这种中间设备至多只有物理层、数据链路层和网络层三层架构。
传输层的功能
- 传输层提供进程与进程之间的逻辑通信。
- 复用与分用。(复用:应用层所有的应用进程都可以通过传输层再传输到网络层;分用:传输层从网络层收到数据后交付指明的应用进程)
- 差错检测。
寻址与端口
- 端口(逻辑端口/软件端口):是传输层的SAP,标识主机中的应用进程。
- 每一个端口有用于区分的端口号,只有本地意义,因特网中不同主机的相同端口号无联系。
- 端口号长度为16bit,能标识65536个不同的端口号。
- 端口号按范围划分可以分为:
- 服务端使用的端口号:
- 熟知端口号(0-1023):给TCP/IP最重要的一些应用程序,让所有用户都知道。
- 登记端口号(1024-49151):为没有熟知端口号的应用程序使用。
- 客户端使用的端口号:仅在客户进程运行时才系统动态分配。
- 服务端使用的端口号:
- 套接字Socket=(主机IP地址,端口号)。唯一标识了网络中的一个主机和它上面的一个进程。
常用的端口号:
| 应用程序 | 熟知端口号 |
|---|---|
| FTP | 21 |
| TELNET | 23 |
| SMTP | 25 |
| DNS | 53 |
| TFTP | 69 |
| HTTP | 80 |
| SNMP | 161 |
| HTTPS | 443 |
UDP协议
用户数据报协议只在IP数据报服务之上添加了很少的功能,即只有复用分用与差错检测功能。
主要特点
- 无连接,减少开销和发送数据之前的时延。
- 使用最大努力交付,而非保证可靠交付。
- 面向报文(不对报文拆分,应用层给多长报文,UDP就会照样一次发送一个完整报文),适合一次性传输少量数据的网络应用。
- 无拥塞控制,适合很多实时应用,实时应用延迟要求高,需要立即响应。
- 支持一对一、一对多、多对一、多对多的交互通信。
- 首部开销小,8B,而TCP20B。
UDP数据报格式
- 源端口号:如果不需要回应,可以不填,即是全0的。
- 目的端口号:是必填的。分用时,如果找不到对应的目的端口号就丢弃该报文,并向发送方发送ICMP端口不可达差错报告报文。
- UDP长度:整个UDP用户数据报的长度,首部加上数据部分。
- UDP检验和:检测整个UDP数据报是否有错,错就丢弃。
具体的UDP数据报格式如下:
- 伪首部只有在计算检验和时才出现,不向下传达也不向上提交。
- 其中的17代表封装UDP报文的IP数据报首部协议字段是17。
- UDP长度是UDP首部8B加上数据长度,不包括伪首部。
UDP协议校验和
发送端:
- 填上伪首部。
- 全0填充检验和字段。
- 全0填充数据部分,UDP数据报要看成许多4B的字符串连接一起。
- 伪首部+首部+数据部分采用二进制反码求和。
- 把和求反码填入校验和字段。
- 去掉伪首部进行发送。
接收端:
- 填上伪首部。
- 伪首部+首部+数据部分采用二进制反码求和。
- 如果结果全为1则无差错,否则出错,丢弃或交给应用层并附上出错的警告。
TCP协议
传输控制协议对比用户数据报协议更复杂。
TCP协议主要特点
- 是面向连接(虚连接)的传输层协议。
- 每一条TCP连接只能有两个端点,所以连接是一对一的。
- 提供可靠有序的服务,无差错不重复。
- 提供全双工通信,包含发送缓存(准备发送的数据与已放送但是未确认的数据)与接受缓存(按序到达但是未被读取的数据与不按序到达的数据)。
- 面向字节流。TCP把应用程序交下来的数据看成一连串的无结构字节流。
TCP数据报格式
- 序号:在一个TCP连接中传送的字节流中的每一个字节都按顺序编号,本字段表示本报文段所发送数据的第一个字节的序号。
- 确认号:期望收到对方下一个报文段的,第一个数据字节的序号。若确认号为N,则证明到序号N-1为止的所有数据都已正确收到。
- 数据偏移(首部长度):TCP报文段的数据起始处距离TCP报文段的起始处有多远,即TCP报头的长度。以4B位单位,即1个数值是4B。
还有六个控制位,除了PSH和RST位都较重要:
- 紧急位URG:URG=1时, 标明此报文段中有紧急数据,是高优先级的数据,应尽快传送,不用在缓存里排队,配合紧急指针字段使用。
- 确认位ACK:ACK=1时确认号有效,在连接建立后所有传送的报文段都必须把ACK置为1。
- 推送位PSH:PSH=1时,接收方尽快交付接收应用进程,不再等到缓存填满再向上交付。如果没有PSH,一般都是接收方缓存满了之后再将数据发送到主机。
- 复位RST:RST=1时, 表明TCP连接中出现严重差错,必须释放连接,然后再重新建立传输链接。
- 同步位SYN:SYN=1时,表明是一个连接请求/连接接受报文。
- 终止位FIN:FIN=1时,表明此报文段文送方数据已发完,要求释放连接。
- 窗口:指的是发送本报文段的一方的接收窗口,即现在允许对方发送的数据量,防止对方发送过多数据导致自己无法接受。
- 检验和:检验首部+数据,检验时要加上12B伪首部,第四个字段为6。
- 紧急指针: URG=1时才有意义,指出本报文段中数据部分的紧急数据的字节数。
- 选项:最大报文段长度MSS、窗口扩大、时间戳、选择确认……
- 填充:当首部长度不为4的整数倍就由填充部分填充0,到4字节的整数倍。
TCP协议连接管理
TCP建立连接采用客户服务器方式。但是实际上任何一台计算机都可能做服务器也可能做客户端。
TCP三次握手(建立连接)
- 最开始客户端与服务端都是关闭状态。
- 服务器端创建传输控制块TCB,进入收听状态准备接受连接请求。
- 客户端创建TCP,发送请求连接报文段,无应用层数据。然后客户端进入同步已发送状态。
- 服务端接受报文段后进入同步收到状态,服务器端为该TCP连接分配缓存和变量,并向客户端返回确认报文段,允许连接,无应用层数据。
- 客户端接受报文后变成已建立连接状态,为该TCP连接分配缓存和变量,并向服务器端返回确认的确认,可以携带数据。
- 服务端接受到报文段后变成已建立连接状态。
注释:其中seq表示序号,指本报文的随机编号;ack表示确认号,指期待对方发送的报文的第一个序号。
- 第一部分:
- SYN=1:主机A要建立连接了。
- seq=x(随机):后面没有数据。
- 第二部分:
- SYN=1:主机B同意主机A建立连接。
- ACK=1:连接确认建立了,之后的ACK必须都置为1,表示开始同步。
- seq=y(随机):后面没有数据。
- ack=x+1:表示期待对方放松的报文段的第一个字节,之前发送方A说发送的是第x位数据(虽然发送方是任意给出的),所以主机B要的是x+1位数据。
- 第三部分:
- SYN=0:SYN只有在建立连接时才为1,其他时候均设为0。
- ACK=1:连接建立了,之后的ACK必须都置为1。
- seq=x+1:主机A发送的报文段的第一个字节就是x+1。
- ack=y+1:之前接收方B说发送的是第y位数据(虽然接收方是任意给出的),所以主机A要的是y+1位数。
SYN洪泛攻击
由于三次握手,可能导致反复确认与占用,产生SYN洪泛攻击。
SYN洪泛攻击发生在OSI第四层,这种方式利用TCP协议的特性,就是三次握手。攻击者发送TCP SYN,SYN是TCP三次握手中的第一个数据包,而当服务器返回ACK后,该攻击者就不对其进行再确认,那这个TCP连接就处于挂起状态,也就是所谓的半连接状态,服务器收不到再确认的话,还会重复发送ACK给攻击者。这样更加会浪费服务器的资源。攻击者就对服务器发送非常大量的这种TCP连接,由于每一个都没法完成三次握手,所以在服务器上,这些TCP连接会因为挂起状态而消耗CPU和内存,最后服务器可能死机,就无法为正常用户提供服务了。可以通过设置SYN Cookies来解决。
TCP四次挥手(连接释放)
每一条TCP连接的两个进程中的任何一个都能终止连接,连接结束后主机的资源将被释放。
- 最开始客户端与服务端都是已建立连接状态。
- 客户端发送连接释放报文段,停止发送数据,主动关闭TCP连接,进入终止等待1状态。
- 服务端会回送一个确认报文段,此时服务器端进入关闭等待状态,客户到服务器这个方向的连接就释放了——半关闭的状态。
- 客户端接受报文段后进入终止等待2状态。
- 服务器发完数据,如果没有要向服务器发送的数据,就发出释放连接报文段,主动关闭TCP连接,进入最后确认阶段。
- 客户端回送一个确认报文字段,服务器端接收后进入关闭状态。客户端等到时间等待计时器设置的2MSL(最长报文段寿命)后彻底关闭连接,进入关闭状态。
注释:
- 第一部分:
- FIN=1:主机A要释放连接。
- seq=u(随机):后面可以有数据也可以没有数据。
- 第二部分:
- ACK=1:连接建立了,之后的ACK必须都置为1。
- seq=v(随机):v=u+第一部分数据长度+1,如果第一部分的确认报文没有数据就是v=u+1。
- ack=u+1:之前发送方A发送的是第u位数据,所以主机B要的是u+1位数据(尽管此时A已经决定释放连接了)。
- 第三部分:
- FIN=1:主机B要释放连接。
- ACK=1:连接建立了,之后的ACK必须都置为1。
- seq=w(随机):w=v+第二部分数据长度+1,如果第二部分的确认报文没有数据就是w=v+1。
- ack=u+1:之前发送方A说发送的是第u位数据,所以主机B要的是u+1位数据(因为A直接不发数据了,所以第二段第三段的ack都是u+1)。
- 第四部分:
- ACK=1:连接建立了,之后的ACK必须都置为1。
- seq=u+1:之前发的数据时第u位数据,B也要第u+1位数据,所以我发第u+1位数据。
- ack=w+1:之前发送方(B)说发送的是第w位数据,所以我(A)要的是w+1位数据。
为什么要等待2MSL时间?
- 保证A发送的最后一个ACK报文段能发送到B,否则B服务器会不断重传从而无法正常关闭。
- 防止已失效的连接请求报文段传输到下一次的连接请求,干扰下一次的连接服务。
TCP协议可靠传输
传输层使用的是GBN与SR的混合。
校验
通过校验的方式来保证数据一致,其方式也是如UDP校验一样增加伪首部与校验和。
序号
TCP报文传输时每个字节都会编上序号,一个字节占用一个序号,并按报文段的形式一起发送,报文段长度不定,根据MTU来定。
序号字段指一个报文段第一个字节的序号。
确认
TCP缓存中的字节流按序传输后不会立刻在缓存中清除,而会等待接收方的确认字段,可以是单独确认也可以携带确认,一般采用的是累计确认的方式。收到确认字段后就可以从缓存中清除对应报文段。
重传
TCP在重传时间内码元收到确认就需要重传已发送的报文段。
TCP采用自适应算法,动态改变重传时间RTTs(加权平均往返时间)。
为了加快发现需要重传的报文段,可以采用冗余ACK(冗余确认/快重传),每当比期望序号大的失序报文段到达时,发送一个冗余ACK,指明下一个期待字节的序号。
如发送方已发送1,2,3,4,5报文段,接收方收到1会返回对1的确认(确认号为2的第一个字节),如果接收方收到3、4,都会返回对1的确认,发送方收到3个对于报文段1的冗余ACK就会认为2报文段丢失,从而快速重传2报文段。
TCP协议流量控制
TCP使用滑动窗口机制来完成流量控制,与数据链路层的滑动窗口类似。
在通信过程中,接收方会根据接收缓存的大小,动态调整发送方发送窗口的大小,即接收窗口rwnd(接受方设置确认报文段的窗口字段,将rwnd通知给发送方),发送方的发送窗口取接收窗口rwnd和拥塞窗口cwnd的最小值。
A向B发送数据,连接建立时,B告诉A:B的rwnd=400B,设每一个报文段100B,报文段序号初始值为1。
B只有处理完接收窗口中的数据才能继续接收A的数据,发送A一个rwnd不为0的报文。
而如果这个告诉A接收窗口rwnd不为0的报文丢失了,A就一直会等待发送,B就会一直等待接收,从而产生死锁般的情况。
TCP为每一个连接设有一个持续计时器,只要TCP连接的一方收到对方的零窗口通知(即rwnd=0的通知)就启动持续计时器。
如果计时器设置的时间到期,A就会发送一个零窗口探测报文段,接收方收到探测报文段就会给出现在的窗口值。
如果窗口仍然是0,那么发送方就重新设置持续计时器。
TCP协议拥塞控制
出现拥塞条件:需求>可用资源。
当网络中有许多资源同时呈现供应不足时网络性能变坏,网络吞吐量将随输入负荷增大而下降。
拥塞控制:防止过多的数据注入网络中。与流量控制不同的是它是面向全局的,是因为网络堵塞。形象来说拥塞控制就是为了控制路上堵车,而流量控制就是添加目的停车位。
接收窗口指接收方能接收缓存设置的值,并告知给发送方,反映接收方容量。
拥塞窗口指发送方根据自己估算的网络拥塞程度而设置的窗口值,反映网络当前容量。
拥塞控制的假定:
- 数据单方向发送,而另一个方向只发送确认,而不会捎带确认。
- 接收方总是有足够大的缓存空间,因而发送窗口大小取决于拥塞程度。发送窗口=Min(接收窗口rwnd,拥塞窗口cwnd)。
慢开始与拥塞避免
cwnd初始值是1,指一个最大报文段长度MSS。
传输轮次指发送了一批报文段并收到其确认的时间,一般指一个往返时延RTT。可能一次性传输多个报文。
- 最开始是慢开始算法,一步步试探网络拥塞,开始时以2的指数形式增长。
- ssthresh的意思是慢开始门限,代表从这个地方注入的报文段就比较多了,需要开始慢速增加了。
- 超过慢开始门限后进行拥塞避免算法,之后一段都是线性增长,每次增加1,直至达到网络拥塞状态。
- 当网络开始拥塞时,进行乘法减小,瞬间将cwnd设置为1,同时调整原来的ssthresh的值到之前达到网络拥塞状态前值的1/2,(这里是24降到12)。
- 重复以上步骤,但是注意此时ssthresh变了之后线性增长的转折点也变了。所以最后拥塞窗口会波动逼近适合当前网络拥塞状态的窗口值。
快重传与快恢复
快重传(冗余ACK)在TCP协议可靠传输中已经提到过,
这里和上面的慢开始和拥塞避免的一开始步骤差不多,都是先指数增长再转变为线性增长。
不同的点是快重传和快恢复算法是在收到连续的ACK确认之后执行,这里的ACK就是冗余ACK,冗余ACK的特点是如果多次对某一段请求的数据没有被收到,达到一定数目之后就会立即执行重传。
但是此时只是降到现在cwnd的一半,再重新线性增长。而不是像慢开始和拥塞避免的从头开始。