本文主要讲解插入排序中的直接插入排序和希尔排序。
插入排序基本思想就是在一个已经有序的数列里,插入一个数据,进行排序使得插入数据后仍然有序。
直接插入排序是一种简单的插入排序法,其基本思想是把待排序的数值按照大小顺序逐个插入到一个已经排好序的有序序列中,直到将所有记录插入完为止,得到一个新的有序序列。
[0-end]有序,插入end+1位置的数,使得[0-end+1]序列仍然有序
实际中我们玩扑克牌时,就用了插入排序的思想。
下面的图片就是插入排序的整体过程,第一步认为5是一个有序区间,然后2比5小,就让5向后移,前面填充2,又形成一个有序的序列,以此类推……
单趟变整体:
排序的基本思想是先写一趟排序,然后再嵌套循环,就变成整体排序。
tmp暂时存储end+1的值,避免后移被覆盖掉。
如果end位置的值比tmp小,end位置的值就后移,然后end--,直到end小于0
外层的循环相当于每次插入的扑克牌,内层循环决定了这张扑克牌怎么插,插在哪里
-
- void StraightInsert(int arr[], int n)
- {
- //[0-end]有序,插入end+1位置的数,使得[0-end+1]序列仍然有序
- for (int i = 0;i
-1;i++) - {
- int end = i;
- int tmp = arr[i + 1];
- while (end >= 0)
- {
- if (arr[end] > tmp)
- {
- arr[end + 1] = arr[end];
- end--;
- }
- else
- break;
- }
- arr[end + 1] = tmp;
- }
- }
时间复杂度计算的是完成程序的次数,不能只看是双层循环就 武断 O(N^2)!
前面讲过时间复杂度计算的是最差的情况,最差的情况就是将逆序的排成升序的,1+2+3+……n-1,这是一共累加的次数,求和发现这是一个等差数列求和,最高项就是N^2,因此时间复杂度就是O(N^2)。
最好的情况下本来就是顺序,end位置的值都需要跟前面一个比较,所以就是O(N)。
跟冒泡排序时间的比较:
论时间复杂度他们是同一档次。细节上,如果局部有序,插入排序会更优。
希尔排序是一种特殊的直接插入排序,也算是直接插入排序的优化版本。
我们发现在一些直接插入排序的例子时,发现其实一些排序是很接近O(N)。
比如1,2,5,3,6
因此我们想先进行预排序(让原来的排序更接近有序),接着再进行直接插入排序。
何为预排序?
预排序就是分组排,间隔为gap的为一组,注意 组数==gap的值
我们可以采用多组并排的思想。
因为end从0开始,我们首先肯定比较end和end+gap的值,进行排序,这样就比较完毕。
注意此时的后面的数据还没有排完,直接进入下一组的排序。
下标i++,这时再进行下一组的排序,这样一组一组的比较,直到下标到n-gap,最后插入的值是n-gap+gap。这样全部排序完毕。
这个问题较难回答,这个问题没有官方的答案。
首先gap不可能是一个固定的数,应该与数组的长度n相关,我们一般采用gap == n/ 2的表达式来去定义gap的值,因为要保证最后gap要被除到1为止
/2最后的值就是是1,如果/3最后要加上1
- void ShellSort(int arr[], int n)
- {
- int gap = n;
- while (gap > 1)
- {
- gap = gap / 3+1;
- for (int i = 0; i < n - gap; i++)//这里的循环判断条件也很有讲究,正好能将多组gap排完
- {
- int end = i;
- int tmp = arr[end + gap];
- while (end >= 0)
- {
- if (tmp < arr[end])
- {
- arr[end + gap] = arr[end];//将数据往后移
- end -= gap;
- }
- else
- break;
- }
- arr[end + gap] = tmp;
- }
- }
- }
通过代码,我们不难发现预排序大部分的代码内容与直接插入排序是一样的,只不过将1换成了gap而已。
运算起来希尔排序占有很大的优势,因为冒泡排序不管上面情况都是n-1,n-2,n-3,……2,1这些操作的次数,但是这是希尔排序最差情况下的次数,只要有一段数据是有序的,就会比冒泡排序节省时间。
我们自己可以比较这两种排序方式上的时间差距,经过比较我们发现,直接插入排序的时间要比希尔排序的时间多上很多倍!(随着N的增大,时间差也会增大)
首先外层的while循环执行的次数是logN,内层的循环当gap很大时,执行次数是N,当gap很小时,执行次数也接近于N,所以最终的时间复杂度O(logN*N)。
注意N^2与N*logN两者并不是一个量级的,特别是当N的数非常大时。
一些书上直接给出了结论O(N^1.3)。
希尔排序特性的总结: