• 排序算法之【快速排序】


    📙作者简介: 清水加冰,目前大二在读,正在学习C/C++、Python、操作系统、数据库等。

    📘相关专栏:C语言初阶C语言进阶C语言刷题训练营数据结构刷题训练营、有感兴趣的可以看一看。

    欢迎点赞 👍 收藏 ⭐留言 📝 如有错误还望各路大佬指正!

    ✨每一次努力都是一种收获,每一次坚持都是一种成长✨       

    在这里插入图片描述

    目录

     前言

    1. 快速排序

     1.1 hoare版本

    1.2 挖坑法

    1.3 双指针版本

    2. 非递归实现快速排序

    总结 


     前言

            快速排序是一种常用的排序算法,也是一种很高效的排序的,它是由Hoare于1962年提出的一种二叉树结构的交换排序方法。本篇文章我将带你深入了解快速排序。


    1. 快速排序

            快速排序是一种常用的排序算法,它的基本思想是通过一趟排序将待排序的数据分割成独立的两部分,其中一部分的所有数据都比另一部分的所有数据小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列的目的。快速排序常见的实现方法主要分为三种版本:

    1.  hoare版本
    2. 挖坑法版本
    3. 前后指针版本

     我们废话不多说直接步入正题。

     1.1 hoare版本

            hoare版本是选择一个key值(一般选用最左边)例如:

             然后开始从数组两边开始移动寻找符合条件的值,R向左移动寻找小于key的值,L向右移动寻找大于key的值。R和L都找到符合条件的数字后进行交换。

     然后再继续走,直到L和R相遇停止。

     它们相遇的位置是数字3,3比key小,最后再将相遇位置的数据和key的数据进行交换。整个逻辑过程如下图:

     这个图呈现的逻辑过程更加形象,然后我们再从R和L相遇的位置将数组分为两部分,当左半部分和右半部分有序,那么这个数组就会有序,所以我们重复上述过程:

     继续分,数组最终被细分为一个数据或没有数据。

            当数据为1个或没有时就开始返回,执行完毕后左半部分就变得有序,右半部分也是这样的逻辑,返回后两边子数组就会变得有序,进而使整个数组有序。以上便是hoare版本的整个过程。

     接下来我们对代码进行实现:

    1. void PathSort(int* a, int left,int right)
    2. {
    3. int key = a[left];
    4. while (left < right)
    5. {
    6. while (a[right] > a[key])
    7. {
    8. right--;
    9. }
    10. while (a[left] < a[key])
    11. {
    12. left--;
    13. }
    14. Swap(&a[left], &a[right]);
    15. }
    16. Swap(&key, &a[right]);
    17. }

             快速排序的hoare版本有很多的坑,上述的代码是否存在错误呢?

    上述的代码存3个问题:

    1. 死循环问题
    2. 数组越界问题
    3. key值交换问题

             首先是死循环问题,R要找比key小的数据,L要找比key大的数据,那当L和R都遇到了和key相同的数据时,它们都停止移动,开始进行交换,交换后仍然相等,以此往复一直交换,进而形成了死循环。

            数组越界问题,R找比key的值,如果R一直到数组遍历结束都没有找到,那它就会发生越界。

            key值交换问题,我们在上述逻辑中,需要将key值(第一个数据)位置上的数据与L和R相遇位置的数据进行交换。而上述代码中交换的是key的值与L和R相遇位置的数据,实际上第一个数据(key值位置)并没有变,这样会造成数据丢失。

     这三个问题都是在编写代码时经常遇到的错误。改正后代码如下:

    1. int PathSort(int* a, int left,int right)
    2. {
    3. int key = left;
    4. while (left < right)
    5. {
    6. while (right>left && a[right] >= a[key])
    7. {
    8. right--;
    9. }
    10. while (right > left && a[left] <= a[key])
    11. {
    12. left++;
    13. }
    14. Swap(&a[left], &a[right]);
    15. }
    16. Swap(&a[key], &a[left]);
    17. return left;
    18. }

    上述代码我们是进行了一次调整,接下来就是递归使得左右两边数组有序。递归调用这里没有什么问题,重点在于递归结束条件。当递归到最后时,要么是数组只有一个数据,要么是没有数据。

    那要如何编写设置结束条件呢?

            以左边递归为例:第一次进入左边区间是0到4,第二次是0到1,然后key是下标为1的数据,key-1=0,第三次调用传入的key-1=begin=0,返回后调用右边,右边没有数据,key+1=2,end=1,所以由此我们可以做出判断,当begin>=end时,就证明递归已经到最小,然后就返回。

     递归过程如下图:

    1. void QuickSort(int* a, int begin,int end)
    2. {
    3. if (begin >= end)
    4. {
    5. return;
    6. }
    7. int key=PathSort(a, begin, end);
    8. QuickSort(a, begin, key - 1);
    9. QuickSort(a, key + 1, end);
    10. }

             从上述的逻辑过程,可以发现L和R相遇的位置一定比key小(相遇位置比key小交换才有意义),那凭什么说L和R相遇位置一定比key小?

            它是有一个前提的,就是一定要让R先走,但是又会存在两种情况:

    1. 最后一次R不动让L去相遇。
    2.  L不动让R去相遇。

             如下图让R先走,最后是R不动让L去相遇,但如果是L先走,当R到下标为6的位置停止交换后,L开始走,此时相遇位置就会变成下标为6的位置,数据是9比6大。(R不动,让L去相遇)

     当然还有一种情况,最后一次时是L不动让R去相遇:

     两次交换后如上图,此时R先走,11比key大R会继续走,R就会去和L相遇,相遇的位置还是比key小(L和R交换后,L位置数据一定比key小)。

            上述的方式和代码排序很不稳,上述过程最理想的状态是key的值是中位数,这样在分割数组进行递归时能尽可能将数组二分。

    最坏的情况就是没有比key小的数据或者大的数据,那么就会造成如下情况:

             这样它的时间复杂度和空间复杂度也会变差,所以我们还需要对hoare版本的进行优化,以避免这样情况的发生。我们可以将左右和中间的值进行比较,取三数的中间值作为key值。优化后:

    1. //三数取中
    2. int GetMid(int* a, int left, int right)
    3. {
    4. int mid = (left + right) / 2;
    5. if (a[mid] > a[left])
    6. {
    7. if (a[mid] < a[right])
    8. {
    9. return mid;
    10. }
    11. else if(a[left]>a[right])
    12. {
    13. return left;
    14. }
    15. else
    16. {
    17. return right;
    18. }
    19. }
    20. else//a[left]>a[mid]
    21. {
    22. if (a[mid] > a[right])
    23. {
    24. return mid;
    25. }
    26. else if (a[right] < a[left])
    27. {
    28. return right;
    29. }
    30. else
    31. {
    32. return left;
    33. }
    34. }
    35. }
    36. int PathSort(int* a, int left,int right)
    37. {
    38. int mid = GetMid(a, left, right);
    39. Swap(&a[left], &a[mid]);
    40. int key = left;
    41. while (left < right)
    42. {
    43. while (right>left && a[right] >= a[key])
    44. {
    45. right--;
    46. }
    47. while (right > left && a[left] <= a[key])
    48. {
    49. left++;
    50. }
    51. Swap(&a[left], &a[right]);
    52. }
    53. Swap(&a[key], &a[left]);
    54. return left;
    55. }

    1.2 挖坑法

             挖坑法是对hoare版本思路上的一种优化,挖坑法的整体逻辑如下:

             挖坑法不用考虑R先走还是L先走,开始时第一个数据作为坑位,必须R先走,R找到比key小的数数据填补到坑位,R位置形成新的坑位。然后L开始走,遇到比key大的将数据填补到坑位,然后L位置形成新的坑位。具体代码如下:

    1. int PathSort2(int* a, int left, int right)
    2. {
    3. int mid = GetMid(a, left, right);
    4. Swap(&a[left], &a[mid]);
    5. int key = a[left];
    6. //保存key值左边形成第一个坑位
    7. int hole = left;
    8. while (left < right)
    9. {
    10. //右边先走,寻找比key小的数据,填补到左边坑位
    11. while (right > left && a[right] >=key)
    12. {
    13. right--;
    14. }
    15. a[hole] = a[right];
    16. hole = right;
    17. //左边走,寻找比key大的数据,填补到右边坑位
    18. while (right > left && a[left] <= key)
    19. {
    20. left++;
    21. }
    22. a[hole] = a[left];
    23. hole = left;
    24. }
    25. a[hole] =key;
    26. return hole;
    27. }

    1.3 双指针版本

             双指针法是对快排的更近一步优化,相对于前两种,思路和代码也更简单,使用两个指针cur和prev,来控制数据进行调整。

    逻辑如下:

             cur遍历数组,如果cur比key小,那就prev向后移动,将prev指向的数据于cur指向的数据进行交换。

     然后cur继续向后走,遇到比key小的数据就重复上述过程:

     直到cur遍历结束停止,之后再将prev最终指向位置的数据与key位置的数据进行交换。最终情况如下图:

     根据上述的逻辑,我们对代码进行实现:

    1. int PathSort3(int* a, int left, int right)
    2. {
    3. int cur = left + 1;
    4. int prev = left;
    5. int key = left;
    6. while (cur <= right)
    7. {
    8. if (a[cur]
    9. {
    10. prev++;
    11. Swap(&a[prev], &a[cur]);
    12. }
    13. cur++;
    14. }
    15. Swap(&a[key], &a[prev]);
    16. return prev;
    17. }

             在cur指向1和2时,cur指向的数据依然和prev指向的数据进行了交换(此时cur和prev指向同一个数据),此时交换并没有什么意义,所以我们也可以为了防止prev和cur指向同一位置时进行交换,这里我们可以进行优化:

    1. int PathSort3(int* a, int left, int right)
    2. {
    3. int mid = GetMid(a, left, right);
    4. Swap(&a[left], &a[mid]);
    5. int cur = left + 1;
    6. int prev = left;
    7. int key = left;
    8. while (cur <= right)
    9. {
    10. if (a[cur]
    11. {
    12. Swap(&a[prev], &a[cur]);
    13. }
    14. cur++;
    15. }
    16. Swap(&a[key], &a[prev]);
    17. return prev;
    18. }

            双指针法不需要考虑从哪边先走,也不需要考虑数组越界问题,代码和逻辑都十分的清晰简单。在这三种方法的实际调用时都是使用了递归,来进行分治排序。

             但快速排序使用递归是需要不断进行开空间的,快速排序的二分递归模式类似于满二叉树,我们知道,满二叉树的后两层的节点个数占了总个数的75%,所以我们可以考虑在递归到小区间时使用插入排序来进行优化。

    1. void QuickSort2(int* a, int begin, int end)
    2. {
    3. if (begin >= end)
    4. {
    5. return;
    6. }
    7. if ((end - begin + 1) > 10)
    8. {
    9. int key = PathSort3(a, begin, end);
    10. QuickSort(a, begin, key - 1);
    11. QuickSort(a, key + 1, end);
    12. }
    13. else
    14. {
    15. InsertSort(a + begin, end - begin + 1);
    16. }
    17. }

    同时我们还可以使用非递归的方法来实现快排。

    2. 非递归实现快速排序

             上述的快速排序使用了递归,但使用递归还是存在弊端的,递归的深度问题,递归创建的空间在栈区,而栈区的空间大概只有8MB,所以我们还是很有必要学习非递归的方法。

     非递归实现快排需要用到栈的数据结构,通过栈来模拟系统栈区。

     不断地入栈每次调整的数组区间,使用栈的特性来模拟递归调用的调整函数。

     还是以上述的数组为例:

    以左边为例:

    先入栈0和9(数据的区间下标),然后出栈,取栈顶元素作为调整函数的参数,然后调用调整函数,再将key两边的数组下标区间入栈,直至栈为空结束。具体代码实现如下:

    逻辑比较简单,不再进行细节讲解。

    1. void QuickSort3(int* a, int begin, int end)
    2. {
    3. Stack st;
    4. InItStack(&st);
    5. StackPush(&st, end);
    6. StackPush(&st, begin);
    7. while (!IsEmpty(&st))
    8. {
    9. int left=TopData(&st);
    10. StackPop(&st);
    11. int right = TopData(&st);
    12. StackPop(&st);
    13. int key =PathSort3(a, left, right);
    14. if (key < right)
    15. {
    16. StackPush(&st, right);
    17. StackPush(&st, key+1);
    18. }
    19. if (left < key - 1)
    20. {
    21. StackPush(&st, key - 1);
    22. StackPush(&st, left);
    23. }
    24. }
    25. DestoryStack(&st);
    26. }

    总结 

            快速排序是一种极其高效的排序方法,从上述的分析快速排序使用的二分分治排序的方法,可以得出时间复杂度为O(N*logN),同时快速排序并不稳定,我们使用了各种方法来进行优化,使它的时间复杂度稳定在O(N*logN)。好了以上便是本期全部内容,感谢阅读!

  • 相关阅读:
    upload-labs文件上传靶场实操
    Mybatis对象分析
    1039 到底买不买
    JavaSE => 继承和组合
    回溯算法的应用
    [附源码]Python计算机毕业设计大学生项目众筹系统
    利用 Pandoc 将 Latex 转为 MS word 的方法
    【从问题中去学习k8s】k8s中的常见面试题(夯实理论基础)(二)
    【Linux】信号的处理
    vscode快速安装教程
  • 原文地址:https://blog.csdn.net/2202_75605090/article/details/133395093