• 你真的知道TCP协议中的序列号确认、上层协议及记录标识问题吗?


    引言

    在前面的内容中,我们已经详细讲解了一系列与TCP相关的面试问题。然而,这些问题都是基于个别知识点进行扩展的。今天,我们将重点讨论一些场景问题,并探讨如何解决这些问题。

    序列号确认问题

    当A主机与B主机建立了TCP连接后,A主机发送了两个TCP报文,分别大小为500和300字节。第一个报文的序列号为200。那么当B主机接收到这两个报文后,返回的确认号应该是多少呢?

    image

    当A主机发送第一个TCP报文时,序列号为200,大小为500。因此,A主机发送的数据范围是200-699(包括200和699)。

    当A主机发送第二个TCP报文时,序列号为700,大小为300。因此,A主机发送的数据范围是700-999(包括700和999)。

    当B主机接收到这两个报文后,确认号应该是下一个预期的序列号。根据TCP的规则,下一个预期的序列号应该是接收到的最后一个字节的序列号加上1。

    所以,B主机接收到的最后一个字节的序列号是999,因此,返回的确认号应该是1000。

    为什么增加的是tcp包的大小而不是单纯+1呢?为什么增加的是TCP包的大小而不是简单地加1呢?在TCP协议中,确认号是基于接收到的数据字节数来计算的,而不是简单地加1。

    当B主机接收到A主机发送的第一个500字节的TCP报文时,B主机期望下一个字节的序列号是200 + 500 = 700。由于TCP是面向字节的传输协议,每个字节都有一个唯一的序列号,因此确认号是基于已接收字节的累积值。所以,B主机返回的确认号是700。

    接着,当B主机接收到A主机发送的第二个300字节的TCP报文时,B主机期望下一个字节的序列号是700 + 300 = 1000。因此,B主机返回的确认号是1000。

    如何确定上层协议?

    收到一个IP数据包后,操作系统中的网络协议栈会进行解析。在解析过程中,有一个关键步骤是确定该数据包应该投递到上层的哪个协议(UDP或TCP)。

    为了更好地理解这个过程,我们先来看一下分层协议结构示意图:

    image

    可以看到,在包装完TCP头信息之后,才会包装IP头信息。因此,在IP头部中应该能够得知当前是什么协议的数据包。接下来,我们来具体查看一下IP头信息的示意图:

    image

    在IP协议中,协议字段用于区分上层协议。在Linux系统的/etc/protocols文件中定义了所有上层协议对应的协议字段。例如,ICMP的协议字段为1,TCP的协议字段为6,UDP的协议字段为17。

    我们知道TCP和UDP是服务器传输数据的常用协议。而ICMP则是用于传输网络传输过程中的一些中间链路的错误信息反馈。正如之前提到的,路由器等网络设备属于三层协议,它们可以判定并修改IP头部中的信息。

    因此,通过对IP头部中的协议字段进行解析,操作系统可以确定接收到的数据包应该传递给哪个上层协议进行处理。

    应用程序应该如何提供他们自己的记录标识?

    TCP提供了一种字节流服务,其中发送方和接收方都不维护记录的边界。这意味着在传输过程中,数据可能会被分割成多个TCP段,而接收方需要确定每个段属于哪个应用程序的记录。应⽤程序应该如何提供他们自己的记录标识呢?

    image

    为了实现这一点,应用程序可以使用一些方法来提供自己的记录标识。以下是一些常用的方法:

    • 使用特定的协议头或标识符:应用程序可以在发送的数据中添加特定的协议头或标识符,以便接收方能够识别和组合相关的数据段。例如,在Redis的通信协议(RESP协议)中,每个命令或数据都以特定的控制字符"\r\n"作为结束符,这样接收方就能够根据这些结束符来识别和组合记录。
    • 使用固定长度的数据块:应用程序可以将数据划分为固定长度的数据块,并在每个数据块前添加标识信息。接收方可以根据这些标识信息来组合和还原应用程序的记录。
    • 使用消息边界标记:应用程序可以在数据中使用特定的消息边界标记,例如特殊字符或预定的控制序列。接收方根据这些边界标记来确定每个记录的边界。

    通过使用这些方法,应用程序可以在数据传输过程中进行分段和还原,从而实现记录的完整性和可靠性。这些方法能够提供自定义的记录标识,使得数据能够准确地组合和还原为应用程序的记录。

    TCP 和 UDP 的区别

    TCP(传输控制协议)和UDP(用户数据报协议)是两种常见的互联网传输协议,它们在网络通信中有以下几个主要的区别:

    • 连接性:TCP是面向连接的协议,它在通信前需要建立一个可靠的连接,然后再进行数据传输。而UDP是无连接的协议,它不需要建立连接就可以直接发送数据。
    • 可靠性:TCP提供可靠的数据传输,它使用确认机制、重传机制、流量控制、拥塞控制和序列号等技术来确保数据的完整性和有序性。UDP则不提供可靠性保证,它只是简单地将数据包发送出去,并不关心是否能够到达目标。
    • 速度:由于TCP提供了可靠性保证和流量控制等机制,因此它的传输速度相对较慢。而UDP没有这些额外的机制,所以传输速度比TCP快。
    • 占用资源:TCP需要维护连接状态和缓存等信息,因此占用的系统资源较多。而UDP不需要维护连接状态,所以占用的系统资源较少。
    • 适用场景:由于TCP提供了可靠性保证,所以在需要确保数据完整性和有序性的场景下使用较多,如文件传输、网页浏览等。而UDP适用于实时性要求较高的场景,如视频和音频流媒体、在线游戏等。

    总结

    通过本文的讲解,我们了解了一些关于TCP的场景问题及其解决方法。我们学习了如何确定TCP报文的应答号,通过解析IP头部的协议字段来确定数据包的上层协议,以及应用程序如何提供自己的记录标识。此外,我们还比较了TCP和UDP的区别,包括连接性、可靠性、速度、资源占用和适用场景等方面。通过深入理解这些问题,我们可以更好地应对TCP相关的面试和实际应用场景。

  • 相关阅读:
    SpringMVC-19-springmvc文件上传
    halcon之区域:多种区域(Region)生成(4)
    【AcWing15】【LeetCode】Tire字典树-139/208/211
    与AI对话的艺术:如何优化Prompt以获得更好的响应反馈
    Go语言中的init函数: 特点、用途和注意事项
    GoFrame框架
    在教学中常被问到的几个vue3.x与typescript的问题,统一解答
    B站-后台开发岗
    问题 A: 二叉排序树 - 文本输出
    发票识别+发票查验API,企业财务进入数字化发票管理时代
  • 原文地址:https://www.cnblogs.com/guoxiaoyu/p/17790470.html