DNS,即Domain Name System,域名系统。DNS是一整套从域名映射到 IP 的系统。
TCP/IP中使用IP地址来确定网络上的一台主机,但是IP地址不方便记忆,且不能表达地址组织信息,于是人们发明了域名,并通过域名系统来映射域名和IP地址,域名是一个字符串,如 www.baidu.com , hr.nowcoder.com
域名系统为一个树形结构的系统,包含多个根节点。其中:
DNS域名服务器,即将域名转换为 IP 地址的服务器,浏览器、主机系统、路由器中都保存有DNS缓存,Windows系统的DNS缓存在C:\Windows\System32\drivers\etc\hosts 文件中,Mac/Linux系统的DNS缓存在 /etc/hosts 文件中。
网络通信发送数据时,如果使用目的主机的域名,需要先通过域名解析查找到对应的IP地址:

之前我们讨论了,IPv4协议中,IP 地址数量不充足的问题,NAT技术是当前解决 IP 地址不够用的主要手段,是路由器的一个重要功能;
NAT(Network Address Translation,网络地址转换)技术是当前解决 IP 地址不够用的主要手段,它的作用如下:
IP 地址转换:NAT 技术可以将多个内部私有 IP 地址映射到一个或多个公共 IP 地址上,实现内部网络与外部网络之间的通信。这样就能够有效地扩展私有 IP 地址的使用,减少对公共 IP 地址的需求。
网络安全性增强:通过 NAT,内部网络中的计算机不直接暴露在互联网上,而是通过 NAT 路由器进行通信,对外只显示一个公共 IP 地址。这种方式可以提高网络的安全性,减少恶意攻击和入侵的可能性。
NAT IP转换过程:

如果局域网内,有多个主机都访问同一个外网服务器,如果服务器返回数据的目的IP都是相同的,那么NAT路由器如何判定将这个数据包转发给哪个局域网的主机?
这时候NAPT来解决这个问题了。使用 IP+port 来建立这个关联关系

这种关联关系也是由NAT路由器自动维护的。例如在TCP的情况下,建立连接时,就会生成这个表项;在断开连接后,就会删除这个表项
由于NAT依赖这个转换表,所以有诸多限制:
TCP,即Transmission Control Protocol,传输控制协议。
TCP协议段格式

6位标志位:
16位窗口大小:发送方允许接收方在发送确认之前接收的数据量。
16位校验和:发送端填充,CRC校验。接收端校验不通过,则认为数据有问题。此处的检验和不光包含TCP首部,也包含TCP数据部分。
16位紧急指针:标识哪部分数据是紧急数据;
40字节头部选项:用来扩展TCP头部的功能和选项,其中每个选项都占据5个字节;
TCP对数据传输提供的管控机制,主要体现在两个方面:安全和效率。
这些机制和多线程的设计原则类似:保证数据传输安全的前提下,尽可能的提高传输效率。

TCP将每个字节的数据都进行了编号。即为序列号。

每一个ACK都带有对应的确认序列号,意思是告诉发送者,我已经收到了哪些数据;下一次你从哪里开始发。
例如确认序号1001 的含义:
注意:确认序号取的是发送方送过来的所有数据的最后一个字节序号 + 1,并且接收方的序号和发送方的序号无关。

超时的时间如何确定呢?
TCP为了保证无论在任何环境下都能比较高性能的通信,因此会动态计算这个最大超时时间。
但是,主机A未收到B发来的确认应答,也可能是因为ACK丢失了;

因此主机B会收到很多重复数据。那么TCP协议需要能够识别出那些包是重复的包,并且把重复的丢弃掉。
这时候我们可以利用前面提到的序列号,就可以很容易做到去重的效果。
在正常情况下,TCP要经过三次握手建立连接,四次挥手断开连接
三次握手是指在建立 TCP 连接时,客户端和服务器之间进行的三次通信过程。
第一次握手:客户端向服务器发送一个 SYN(同步)包,告诉服务器自己要建立连接。
第二次握手:服务器收到客户端的 SYN 包后,会回复一个 SYN-ACK(同步-确认)包,表示同意建立连接。
第三次握手:客户端收到服务器的 SYN-ACK 包后,会再发送一个 ACK(确认)包给服务器,表示客户端也同意建立连接。
通过这三次握手,建立了客户端和服务器之间的 TCP 连接。

三次握手这个过程,本质上是投石问路~验证了客户端和服务器,各自的发送能力和接收能力是否正常!!!
这就好比每天地铁的第一趟是空车,不载客人的,这就是为了确认地铁路线是否通畅安全,这空车跑一趟就相当于投石问路
现在,让我们来解释一下为什么这个过程可以验证发送和接收能力是否正常:
通过三次握手的过程,客户端和服务器可以互相验证彼此的发送和接收能力,确保双方都能正常通信。
四次挥手是指终止TCP连接的过程,下面是四次挥手的详细步骤:
客户端发起关闭连接请求:客户端首先发送一个FIN(Finish)报文段给服务器,用来请求关闭连接。
服务器确认关闭请求:服务器收到客户端发送的FIN报文段后,会向客户端发送一个ACK(Acknowledgment)报文段,用来确认收到了关闭请求。
服务器发送关闭请求:服务器在确认客户端的关闭请求后,会发送一个FIN报文段给客户端,表示服务器也希望关闭连接。
客户端确认关闭:客户端收到服务器发送的FIN报文段后,会向服务器发送一个ACK报文段,表示客户端已经确认关闭请求,然后等待一段时间,确保服务器收到了该确认。
关闭连接的一方在发送完最后的ACK报文段后,并不立即关闭连接,而是等待一段时间(即等待2倍的最大报文段生存时间,也就是2MSL),以确保双方都能收到对方的确认。这样可以避免在网络中产生的延迟导致的数据包重传。
四次挥手仅在双方均希望关闭连接时才发生。如果其中一方不希望关闭连接,可以不发送FIN报文段或不回复ACK报文段,从而保持连接的持续性。

为啥三次握手的 syn+ack 能合并,而四次挥手的 ACK+FIN 就不能合并??这是因为:
刚才我们讨论了确认应答策略,对每一个发送的数据段,都要给一个ACK确认应答。收到ACK后再发送下一个数据段。这样做有一个比较大的缺点,就是性能较差。尤其是数据往返的时间较长的时候。

既然这样一发一收的方式性能较低,那么我们一次发送多条数据,就可以大大的提高性能(其实是将多个段的等待时间重叠在一起了)。


当收到 2001 这个 ack 意味着 1-2000 这个数据得到了确认,此时就会立即发下一个5001-6000 这个数据
此时看到的效果,就好像,窗口还是这么大,但是往后挪了一个格子.如果收到的 ack 非常快,此时这个窗口就好像在快速的往后滑动一样
但是如果在传输过程中出现了丢包,如何进行重传?这里分两种情况讨论。
情况一:数据包已经抵达,ACK被丢了。

这种情况下,部分ACK丢了并不要紧,因为可以通过后续的ACK进行确认,如果是最后一个包丢了,就照常超时重传。
情况二:数据包就直接丢了。

这种机制被称为 “高速重发控制”(也叫 “快重传”)。
接收端处理数据的速度是有限的。如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发送端继续发送,就会造成丢包,继而引起丢包重传等等一系列连锁反应。
因此TCP支持根据接收端的处理能力,来决定发送端的发送速度。这个机制就叫做流量控制(FlowControl);

接收端如何把窗口大小告诉发送端呢?回忆我们的TCP首部中,有一个16位窗口字段,就是存放了窗口大小信息;
那么问题来了,16位数字最大表示65535,那么TCP窗口最大就是65535字节么?
实际上,TCP首部40字节选项中还包含了一个窗口扩大因子M,实际窗口大小是 窗口字段的值左移 M位;
虽然TCP有了滑动窗口这个大杀器,能够高效可靠的发送大量的数据。但是如果在刚开始阶段就发送大量的数据,仍然可能引发问题。
因为网络上有很多的计算机,可能当前的网络状态就已经比较拥堵。在不清楚当前网络状态下,贸然发送大量的数据,是很有可能引起雪上加霜的。
TCP引入 慢启动 机制,先发少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传输数据;

像上面这样的拥塞窗口增长速度,是指数级别的。“慢启动” 只是指初使时慢,但是增长速度非常快。

少量的丢包,我们仅仅是触发超时重传;大量的丢包,我们就认为网络拥塞,当TCP通信开始后,网络吞吐量会逐渐上升;随着网络发生拥堵,吞吐量会立刻下降;
拥塞控制,归根结底是TCP协议想尽可能快的把数据传输给对方,但是又要避免给网络造成太大压力的折中方案。
在TCP协议中,发送方会将数据分成一系列的TCP报文段发送给接收方。接收方在接收到数据后,会发送ACK确认包给发送方,以便让发送方知道数据已经接收到了。
然而,为了提高网络传输的效率,接收方不会立即发送ACK确认包,而是采取了一定的策略进行延迟。
这种延迟策略是为了将多个ACK确认信息合并成一个,从而减少网络传输中的ACK包数量,提高网络利用率。
当接收方接收到数据后,并不会立即发送ACK确认包,而是等待一段时间,看是否能接收到更多的数据。只有当一定条件满足时(如等待时间超过一定阈值、接收缓冲区满、收到带有FIN标志的报文段等),接收方才会发送ACK确认包。
延迟应答效应可能导致以下问题:
为了解决延迟应答效应,可以采取一些措施,如优化TCP协议的滑动窗口大小、优化ACK确认包的发送策略、使用关联性ACK确认等。这些措施可以减少延迟并提高网络传输的效率。
那么所有的包都可以延迟应答么?肯定也不是;
具体的数量和超时时间,依操作系统不同也有差异;一般N取2,超时时间取200ms;

在延迟应答的基础上,我们发现,很多情况下,客户端服务器在应用层也是 “一发一收” 的。意味着客户端给服务器说了 “How are you”,服务器也会给客户端回一个 “Fine, thank you”;
那么这个时候ACK就可以搭顺风车,和服务器回应的 “Fine,thank you” 一起回给客户端

当我们创建一个TCP的socket,同时在内核中创建一个 发送缓冲区 和一个 接收缓冲区;
由于缓冲区的存在,TCP程序的读和写不需要一 一匹配,例如:
那么如何避免粘包问题呢?归根结底就是一句话,明确两个包之间的边界。
对于UDP协议来说,并不会像TCP协议那样存在严格意义上的粘包问题。
因为对于UDP,如果还没有上层交付数据,UDP的报文长度仍然在。同时,UDP是一个一个把数据交付给应用层。就有很明确的数据边界。站在应用层的站在应用层的角度,使用UDP的时候,要么收到完整的UDP报文,要么不收。不会出现"半个"的情况。
进程终止:进程终止会释放文件描述符,仍然可以发送FIN。和正常关闭没有什么区别。
机器重启:和进程终止的情况相同。
机器掉电/网线断开:接收端认为连接还在,一旦接收端有写入操作,接收端发现连接已经不在了,就会进行reset。即使没有写入操作,TCP自己也内置了一个保活定时器,会定期询问对方是否还在。如果对方不在,也会把连接释放。
另外,应用层的某些协议,也有一些这样的检测机制。例如HTTP长连接中,也会定期检测对方的状态。例如QQ,在QQ断线之后,也会定期尝试重新连接。
UDP协议端格式:

下面是对各个部分功能的解释的解释:
源端口号(Source Port):用于标识发送方的进程。
目的端口号(Destination Port):用于标识接收方的进程。
UDP长度(UDP Length):该字段指示了UDP数据报的长度
UDP校验和(UDP Checksum):UDP校验和用于检测数据在传输过程中是否被损坏或篡改。发送方在发送UDP数据报之前会计算校验和并将其存储在UDP头中。接收方收到UDP数据报后也会计算校验和,并与接收到的校验和进行比较,以验证数据的完整性。
基于UDP的应用层协议:
当然,也包括自己写UDP程序时自定义的应用层协议。
在复杂的网络环境中确定一个合适的路径。
协议头格式如下:

在IP协议中,这些字段都有不同的作用:
版本号(Version):指示IP数据报使用的IP协议版本,通常为IPv4或IPv6。
头部长度(Header Length):表示IP数据报头部的长度,以32位字(4字节)为单位。
服务类型(Type Of Service):用于指定IP数据报的服务要求,如优先级、延迟、吞吐量和可靠性。
总长度(Total Length):指示整个IP数据报的长度,包括头部和数据部分。
标识(ID):用于识别IP数据报的唯一标识符,通常由发送方生成。
分片偏移(Fragment Offset):用于支持IP数据报的分片与重组。分片偏移指示了当前分片在原始数据报中的位置。
生存时间(Time To Live,TTL):用于设置IP数据报允许经过的最大路由跳数。每经过一个路由器,TTL值会减少1,当TTL为0时,数据报会被丢弃。
头部校验和(Header Checksum):用于检测IP数据报头部在传输过程中是否发生了错误。
源地址和目标地址:指示IP数据报的发送源地址和目标地址,用来确定数据报的发送者和目标接收者。
选项字段(Options):用于提供一些附加的功能和扩展,如记录路由、时间戳等。选项字段的长度最多为40字节。
这些字段共同构成了IP数据报的头部,提供了传输数据所需的基本信息和控制机制。
“以太网” 不是一种具体的网络,而是一种技术标准;既包含了数据链路层的内容,也包含了一些物理层的内容。例如:规定了网络拓扑结构,访问控制方式,传输速率等;
例如以太网中的网线必须使用双绞线;传输速率有10M,100M,1000M等;
以太网是当前应用最广泛的局域网技术;和以太网并列的还有令牌环网,无线LAN等;
以太网帧格式:

MTU(Maximum Transmission Unit)是指网络通信中可以通过单次传输的最大数据包的大小。
以太网帧中的数据长度规定最小46字节,最大1500字节,ARP数据包的长度不够46字节,要在后面补填充位;最大值1500称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU;
如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的MTU了,则需要对数据包进行分(fragmentation);并且不同的数据链路层标准的MTU是不同的;
由于数据链路层MTU的限制,对于较大的IP数据包要进行分包。


让我们回顾一下UDP协议:
让我们再回顾一下TCP协议:
TCP的一个数据报也不能无限大,还是受制于MTU。TCP的单个数据报的最大消息长度,称为MSS(Max Segment Size);
TCP在建立连接的过程中,通信双方会进行MSS协商。
最理想的情况下,MSS的值正好是在IP不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的MTU)。
双方在发送SYN的时候会在TCP头部写入自己能支持的MSS值。
然后双方得知对方的MSS值之后,选择较小的作为最终MSS。
MSS的值就是在TCP首部的40字节变长选项中(kind=2);
MSS和MTU的关系:

虽然我们在这里介绍ARP协议,但是需要强调,ARP不是一个单纯的数据链路层的协议,而是一个介于数据链路层和网络层之间的协议;
ARP协议建立了主机 IP地址 和 MAC地址 的映射关系。
ARP协议的工作流程:

源主机发出ARP请求,询问“IP地址是192.168.0.1的主机的硬件地址是多少”,并将这个请求广播到本地网段(以太网帧首部的硬件地址填FF:FF:FF:FF:FF:FF表示广播);
目的主机接收到广播的ARP请求,发现其中的IP地址与本机相符,则发送一个ARP应答数据包给源主机,将自己的硬件地址填写在应答包中;
每台主机都维护一个ARP缓存表,可以用arp -a命令查看。缓存表中的表项有过期时间(一般为20分钟),如果20分钟内没有再次使用某个表项,则该表项失效,下次还要发ARP请求来获得目的主机的硬件地址