• C++实现UDP可靠传输(二)


    声明:禁止以任何形式转载本文章。本文章仅供个人学习记录与交流探讨,文章中提供的思路只是一种解决方案,代码也并非完整代码,如有需要,请自行设计协议并完成编程任务。 

    食用本文章之前,推荐阅读:C++实现UDP可靠传输(一)

    目录

    流量控制

    GBN算法

    程序实现

    发送消息的函数

    计时线程

    接收ACK消息的线程

    拥塞控制

    New RENO算法

    程序实现

    计时线程

    接收消息的线程

    发送消息的函数

    程序测试


    在上篇文章中,我们实现了一个简单的基于UDP协议的可靠传输,主要使用rdt3.0协议,完成了差错检测和确认重传功能。但这个协议的设计还存在一些缺陷,例如,流量控制采用停等机制可能造成延时过长,没有设置拥塞控制等。在这篇文章中,我们将在上篇文章的基础上改进:

    • 使用GBN算法,实现基于滑动窗口的流量控制机制
    • 使用New RENO算法,实现拥塞控制

    流量控制

    在停等机制中,我们只能一次发送一个数据包,等到该数据包被确认后才能发送下一个数据包,这种情况下链路利用率不高,存在性能问题。我们可以对此进行改进,采用流水线机制,也就是在确认未返回之前允许发送多个数据包。

    但是,我们不能一直发送数据包,否则接收端的缓冲区可能溢出,也可能中途某个数据包丢失,造成失序。本文章中,主要介绍使用GBN算法实现流量控制的方法。

    GBN算法

    GBN算法的基本思想如下:

    • 允许发送端发出N个未得到确认的分组
    • 采用累积确认,只确认连续正确接收分组的最大序列号
    • 发送端设置定时器,定时器超时时,重传所有未确认的分组

    也就是说,使用GBN算法和上一篇文章中的程序设计不同之处在于:

    • 需要增加序列号空间:其实rdt3.0协议中,只需要两个序列号,但是在上一篇文章中,我们设计的序列号有8 bits,能够表示0-255,因此这一点可以忽略。
    • 累积确认,接收端不缓存失序的数据包。
    • 发送端重传只靠超时,如果接收的ACK消息出错,发送端什么也不做。

    发送端的有限状态机如下:

    接收端的有限状态机如下:

    程序实现

    首先来设置一些全局变量,之后我们会看到它们的用途。

    1. int resendCount = 0; // 重传次数
    2. int base = 2; // 窗口最左边
    3. unsigned char nextSeq = 0; // 要发送的下一个序列号
    4. bool resend = false; // 是否超时重传
    5. bool restart = false; // 是否重新开始计时
    6. bool wait = false; // 是否因窗口不够而需等待
    7. long int lenCopy = 0; // 文件数据偏移量的拷贝,供重传时使用

    我们现在采用流水线机制发送消息,因此必须要使用线程来负责计时和接收消息。大家先记住这个需求,我们先写主体部分,也就是发送消息的函数,写完后就明白两个线程应该怎么写了。

    发送消息的函数

    我们先来看看发送消息的函数相比上一篇文章中有什么变化。

    首先当然是窗口的设置。我们需要设置一个固定窗口大小window,窗口的空间就在base到window(不含)之间。

    其次是发送消息的部分。发送消息时,我们需要判断这条消息的序列号是否在窗口空间内,如果是则发送,如果不是,则等待。等到什么时候呢?直到收到ACK消息或超时重传。这就需要用到两个线程了。

    wait标志位表示是否等待窗口,在接收消息的线程中,如果收到正确的ACK消息,线程会更新窗口大小,这时会将wait设置为false。resend标志位表示是否超时重传,在计时的线程中,如果发现超时,我们需要将resend设置为true。

    1. // 若下一个序列号在窗口内,发送消息
    2. // 注意base+window>=256的情况
    3. if (((base + window) < 256 && (int)nextSeq < base + window) ||
    4. ((base + window) >= 256 && ((int)nextSeq >= base || (int)nextSeq < (base + window) % 256))) {
    5. if (sendto(sockSender, sendBuf, h.len + sizeof(h), 0, (SOCKADDR*)&addrReceiver, sizeof(SOCKADDR)) == -1) {
    6. cout << "Error: fail to send messages!" << endl;
    7. return false;
    8. }
    9. else {
    10. nextSeq = (nextSeq + 1) % 256;
    11. sentLen += (int)h.len;
    12. }
    13. }
    14. // 若下一个序列号不在窗口内,等待ACK
    15. else {
    16. cout << "Waiting for window!" << endl;
    17. wait = true;
    18. while (wait & !resend) {
    19. Sleep(100);
    20. }
    21. }

    最后是超时重传的部分。记住计时的部分我们会单独写在计时线程中,线程会判断是否超时并设置resend标志位。在发送消息的函数中,如果resend标志位被设置为true,那么我们需要重传所有未被确认的分组,即从base到nextSeq的数据包。

    看过上一篇文章的读者应该记得,在发送消息的函数中,我写了一个for循环,从k=0开始,发送packNo个数据包。在这里我设计的超时重传方式是更新k和其它变量,让for循环跳到base所对应的k处,相当于重传。大家也可以采取其它方式,例如直接在这里调用sendto函数。

    1. // 超时重传
    2. if (resend) {
    3. if (resendCount >= maxResend) {
    4. cout << "Fail to send messages!" << endl;
    5. return false;
    6. }
    7. if ((nextSeq - 1) < base) {
    8. k -= ((int)nextSeq + 256 - (int)base + 1);
    9. }
    10. else {
    11. k -= ((int)nextSeq - (int)base + 1);
    12. }
    13. nextSeq = base;
    14. sentLen = lenCopy;
    15. resend = false;
    16. resendCount++;
    17. }

    明确了发送消息的函数有什么变化后,我们可以来编写计时线程和接收消息的线程。 

    计时线程

    计时线程比较简单,我们设置了restart标志位,只要在其他的线程中正确设置这个标志位,即计时线程就可以正常运行。我们还设置了resend标志位,这是负责通知主线程应该超时重传了。细心的读者可能发现,我总是通过标志位来统一线程,这是因为我希望线程尽可能保持简单,毕竟线程一旦出错很难debug。

    1. DWORD WINAPI timer(LPVOID lparam) {
    2. clock_t start = clock();
    3. while (true) {
    4. if (restart) {
    5. start = clock();
    6. restart = false;
    7. }
    8. if (clock() - start > maxTime) {
    9. resend = true;
    10. start = clock();
    11. }
    12. }
    13. return 0;
    14. }

    接收ACK消息的线程

    接收消息的线程只负责一件事,就是接收到正确的ACK消息后更新窗口,所以核心其实只有一句:base = (h2.seq + 1) % 256。但是为了程序能够正常运转,我们还需要正确的设置其他的全局变量,例如重新开始计时、停止等待窗口等。特别需要注意的是,需要更新lenCopy,这个值是base所对应的文件的偏移量,在超时重传的时候会用到。大家也可以采用其它的方法标记,只要超时重传能够从base对应的地方读取文件即可。

    1. DWORD WINAPI recvThread(LPVOID IpParameter) {
    2. SOCKET sockSender = *(SOCKET*)IpParameter;
    3. int addrlen = sizeof(SOCKADDR);
    4. char recvBuf[1024];
    5. memset(recvBuf, 0, sizeof(recvBuf));
    6. while (true) {
    7. if (recvfrom(sockSender, recvBuf, 1024, 0, (SOCKADDR*)&addrClient, &addrlen) > 0) {
    8. HeadMsg h2;
    9. memcpy(&h2, recvBuf, sizeof(h2));
    10. // 收到消息需要验证校验和
    11. if (h2.type == ACK && !checkSumVerify((u_short*)&h2, sizeof(h2))) {
    12. lenCopy += (h2.seq - base + 1) * maxSize;
    13. base = (h2.seq + 1) % 256;
    14. restart = true;
    15. resendCount = 0;
    16. wait = false;
    17. }
    18. // 如果报文损坏,什么都不做,重传只靠超时
    19. }
    20. }
    21. return 0;
    22. }

     至此,我们就基本完成了GBN算法实现的流量控制机制。下面我们来看拥塞控制

    拥塞控制

    为了防止主机发送的数据过多或过快,造成网络中的路由器(或其他设备)无法及时处理,从而引入时延或丢弃,我们在发送消息时,还需要进行拥塞控制。TCP协议采用基于窗口的方法,通过拥塞窗口的增大或减小控制发送速率。本文章中,我们也借鉴这样的做法,使用New RENO算法实现拥塞控制。

    New RENO算法

    先来看看RENO算法的原理。文字描述不太清楚,大家还是看有限状态机:

    RENO算法定义了三个阶段:

    • 慢启动阶段:初始拥塞窗口的大小cwnd=1,每个RTT,cwnd翻倍(指数增长),但收到重复ACK消息时cwnd不变。
    • 拥塞避免阶段:每个RTT,cwnd增1(线性增长),但收到重复ACK消息时cwnd不变。
    • 快速恢复阶段:每个RTT,cwnd翻倍(指数增长)。

    这三个阶段之间的关系如下:

    • 连接建立时,进入慢启动阶段(可以理解为刚开始只发送一个报文,试探一下网络的情况)。
    • 拥塞窗口达到阈值时,慢启动阶段结束,进入拥塞避免阶段。
    • 收到三次重复ACK消息时,进入快速恢复阶段。
    • 在快速恢复阶段,收到新的ACK消息时,进入拥塞避免阶段。
    • 超时的情况下,进入慢启动阶段。

    其中,在快速恢复阶段,收到新的ACK消息时,New RENO算法和RENO算法的不同之处在于,它会检查这个New ACK是否为已经发送的最后一个数据包的序列号,也就是说是否所有发送的数据包都被确认,如果不是,将会继续保持快速恢复,而不会进入拥塞避免。这样程序就不会频繁地在快速恢复和拥塞避免两个阶段反复横跳,造成阈值多次折半的问题。

    另外,需要注意的一点是,流量控制和拥塞控制都是基于窗口的机制,二者在窗口大小的计算上是独立的。流量控制的窗口大小取决于接收端的缓冲区,只是我们上面为了简单将其设置为固定大小;拥塞控制的窗口大小是基于网络的情况。而实际发送窗口取决于接收通告窗口和拥塞控制窗口中的较小值

    程序实现

    有了之前的程序,实现New RENO算法只要在此基础上稍加修改即可。

    设置全局变量如下:

    1. const int rwnd = 10; // 接收通告窗口大小,固定值
    2. double cwnd = 1; // 拥塞窗口大小
    3. int ssthresh = 8; // 阈值
    4. unsigned char lastAck = 0; // 上一个ACK序列号
    5. int dupAck = 0; // 重复收到的ACK次数
    6. int renoState = 0; // RENO状态机的状态,0为慢启动,1为拥塞控制,2为快速恢复

    计时线程

    计时线程需要加上超时后阈值和拥塞控制窗口大小的变化情况,以及更新RENO状态机的状态。

    1. if (clock() - start > maxTime) {
    2. // 超时后阈值减半,窗口大小为1
    3. ssthresh = cwnd / 2;
    4. cwnd = 1;
    5. dupAck = 0;
    6. // 超时则进入慢启动阶段
    7. if (renoState != 0)
    8. renoState = 0;
    9. }

    接收消息的线程

    接收到正确的ACK消息后,需要加上RENO状态机的三个状态的处理(参照有限状态机)。

    1. // 慢启动
    2. if (renoState == 0) {
    3. // 判断是否为new ACK,是的话更新窗口空间
    4. if (h2.seq == lastAck) {
    5. dupAck++;
    6. }
    7. else {
    8. dupAck = 0;
    9. lastAck = h2.seq;
    10. cwnd++;
    11. }
    12. // 窗口大小超过阈值,进入拥塞避免阶段
    13. if (cwnd >= ssthresh)
    14. renoState = 1;
    15. // 重复ACK超过3次,进入快速恢复阶段
    16. if (dupAck == 3) {
    17. ssthresh = cwnd / 2;
    18. cwnd = ssthresh + 3;
    19. renoState = 2;
    20. }
    21. }
    22. // 拥塞避免
    23. else if (renoState == 1) {
    24. if (h2.seq == lastAck) {
    25. dupAck++;
    26. }
    27. else {
    28. dupAck = 0;
    29. lastAck = h2.seq;
    30. cwnd += 1.0 / cwnd;
    31. }
    32. // 重复ACK超过3次,进入快速恢复阶段
    33. if (dupAck == 3) {
    34. ssthresh = cwnd / 2;
    35. cwnd = ssthresh + 3;
    36. renoState = 2;
    37. }
    38. }
    39. // 快速恢复
    40. else {
    41. if (h2.seq == lastAck) {
    42. cwnd++;
    43. }
    44. // 接收到new ACK,需要判断是否发送的消息都被接收
    45. // 如果不是,保持快速恢复;如果是,进入拥塞避免阶段
    46. else {
    47. if (h2.seq == (nextSeq - 1 + 256) % 256) {
    48. renoState = 1;
    49. lastAck = h2.seq;
    50. }
    51. }
    52. }

    发送消息的函数

    在发送消息的函数中,window应该代表实际发送窗口的大小,而这取决于接收通告窗口和拥塞控制窗口中的较小值。本文章将rwnd设置为固定窗口大小,读者可以将其设置为可变的,由接收端发送来的消息确定,这就需要在消息头中加上相关的字段表示rwnd。

    1. // 实际发送窗口取决于接收通告窗口和拥塞控制窗口中的较小值
    2. int window = 0;
    3. if (rwnd < cwnd)
    4. window = rwnd;
    5. else
    6. window = cwnd;

    程序测试

    运行程序,可以看到三次握手的过程,成功建立连接。发送端输出消息提示用户输入需要传输的文件或者断开连接。

    我们随便选择一个命令,发送端很快开始发送文件,并输出相关信息。从左到右依次为,发送的数据长度(字节)、消息类型、序列号、校验和、窗口的情况(base为窗口左端,tail为窗口右端)、CWND(拥塞控制的窗口大小)、拥塞控制的阈值。注意,接收通告窗口大小固定为10,方便测试并观察。

    可以看到一开始拥塞控制处于慢启动阶段,每次收到ACK消息窗口都增加1。直到cwnd> ssthresh,程序进入拥塞避免阶段,窗口大小增长减慢。

    直到cwnd=9时,实际的窗口大小还是base+cwnd。cwnd>10后,实际的窗口大小取接收通告窗口和拥塞控制窗口中的较小值,即接收通告窗口10,此后不论cwnd如何增长,实际的窗口大小都为10。

    突然,观察到cwnd=11, ssthresh=8,显然这不是拥塞避免阶段了,发生了什么?

    查看接收端,原来刚刚接收端接收到了损坏的数据包(通过写程序人为破坏),因此丢弃了序列号为49的数据包,并且一直在等待它。而发送端还不知道,依然在流水线地发送后面的数据包,所以接收端将后面来的数据包都丢弃了,并返回ACK=48的消息。发送端一直收到重复的ACK消息,重复ACK次数为3时,发送端会进入快速恢复阶段,ssthresh=cwnd/2, cwnd=ssthresh+3,和我们在发送端观察到的一致。

    可以看到这时候窗口为49-59(不含),发送端发送完序列号为58的数据包后,开始等待窗口。超时后,发送端重传所有未被确认的数据包,也就是从序列号49到序列号58。这时,拥塞控制从快速恢复阶段进入慢启动阶段,阈值减半,cwnd=1。

    查看接收端,发送端重传的数据报被接收端正常收到。

    最后,所有数据包都发送完毕并被成功确认后,发送端输出提示消息,并输出传输时间和吞吐率。

    查看接收端,同样也输出了相关信息。接收消息完毕后,成功写入文件。

    发送端断开连接,可以看到四次挥手的过程,成功断开连接。

  • 相关阅读:
    libevent 梳理
    CentOS 7上安装Python 3.11.5,支持Django
    移动硬盘有文件但看不见怎么恢复文件
    01【C语言 & 趣味算法】百钱百鸡问题(问题简单,非初学者请忽略叭)。请注意算法的设计(程序的框架),程序流程图的绘制,算法的优化。
    OTL Select with MySQL LONGTEXT in stream mode注意事项
    springboot整合mybatis(配置模式+注解模式)
    医疗机械公司网站网页
    12.面试题——Spring Boot
    SQL中的正则使用
    12讲拆解量化金融时序分析,Kaggle master倾力奉献(中文翻译版)
  • 原文地址:https://blog.csdn.net/Roslin_v/article/details/128128224