本篇根据十大经典排序算法-堆排序算法详解进行整理和补充。
之前在介绍二叉树时讲过一个完全二叉树,具体参考C++数据结构X篇_13_二叉树基本概念、性质及表示法,其中介绍到的完全二叉树,下图即为一个完全二叉树。
可以看到从A–G是一个满二叉树,最后一层靠左,完全二叉树可以按照从上往下,从左往右将A–J存到数组中,将A–J假设为1-10的数(可以认为是下标),D对应数字4的左子树为24=8,对应的D的右子树为24+1,在A–J数组中去看,D的下标为4,左右子树值为8和9。从上可以看出,完全二叉树可以存储到数组中,同时保持其节点关系。
任意非叶子结点,左子树2i,右子树2i+1.
如果将乱序的数给到完全二叉树中,就变成如下图所示的结构:
什么是堆呢?
堆的性质:
堆是一颗完全二叉树
堆是一种重要的数据结构,堆分为大根堆和小根堆
,大根堆堆顶的数据是最大的,小根堆堆顶的数据是最小的,堆在逻辑结构上是一颗完全二叉树,这棵树中如果满足根节点大于左右子树,每个节点都满足这个条件就是大根堆,反之就是小根堆。(这里的大和小并不是传统意义下的大和小,它是相对于优先级而言的)
常用操作中,堆的插入就是把新的元素放到堆底,然后检查它是否符合堆的性质,如果符合就丢在那里了,如果不符合,那就和它的父亲交换一下,一直交换交换交换,直到符合堆的性质,那么就插入完成了
父结点比其子结点都大,最大的数在最上面,称为大顶堆
父结点比其子结点都小,最小的数在最上面,称为小顶堆
如果要实现从小到大的升序排序,可以采用大顶堆,相应的,降序排序的话就采用小顶堆
堆排序就是永远把最大或最小的数扔在顶上。
堆排序(Heapsort)是利用二叉堆的概念来排序的选择排序算法,分为两种:
再对上面已经变为完全二叉树的数据,再将其变为大顶堆
按照大顶堆的概念,父结点比其子结点都大,由于叶子结点没有子树,无法对比,因此只对非叶子结点4、2、8、0调整,进行初始化堆
给了一个数组,可以将其理解为完全二叉树,但还不满足堆的条件,需要初始化堆调整为堆。
int index = len/2; //当前调整的结点
//拿到最后一个非叶子结点及左右子树下标
int lchild = index*2; //最后一个非叶子结点的左子树下标
int rchild = index*2+1;//最后一个非叶子结点的右子树下标
int max = index; //最后一个非叶子结点下标
//进行判断
if(arr[lchild] > arr[max])
{
max = lcild;
}
if(arr[rchild] > arr[max])
{
max = rcild;
}
if
完成0位置结点的大顶堆比较交换,遍历完成4、2、8的结点的遍历交换,直至9到堆顶,这也就完成了初始化堆,形成一个基础的堆,如下:
此处需要注意,视频中遗忘了左子树的比较,所以还是左子树数据存在问题,以右子树来理解思路
)此时的堆顶的0结点不符合大顶堆概念,从该结点开始从上往下调整
实现头和尾交换一次就调整一次,堆排序就是调整的过程
初始化的时候,从下往上调整,i=len / 2 --
为开始调整非叶子结点就变为堆
从上往下调整,结束条件为>=len/2
给定一个最大堆如下图所示,以该最大堆进行演示堆排序
首先,删除堆顶元素10(即最大的元素),并将最后的元素3补充到堆顶,删除的元素10,放置于原来最后的元素3的位置
根据二叉堆的自我调整,第二大的元素9会成为二叉堆新的堆顶
删除元素9,元素8成为最大堆堆顶
删除元素8,元素7成为最大堆堆顶
依次删除最大元素,直至所有元素全部删除
此时,被删除的元素组成了一个从小到大排序的序列
#define _CRT_SECURE_NO_WARNINGS
#include
using namespace std;
void PrintArray(int arr[],int len)
{
for (int i = 0; i < len; i++)
{
cout << arr[i] << " ";
}
cout << endl;
}
void MySwap(int arr[],int a,int b)
{
int temp = arr[a];
arr[a] = arr[b];
arr[b] = temp;
}
/*
@param myArr 待调整的数组
@param index 待调整的结点的下标
@param len 数组的长度
*/
void HeapAdjust(int arr[], int index, int len)
{
//先保存当前结点的下标
int max = index;
//保存左右孩子的数组下标
int lchild = index * 2 + 1;
int rchild = index * 2 + 2;
if (lchild < len && arr[lchild]>arr[max])
{
max = lchild;
}
if (rchild < len && arr[rchild]>arr[max])
{
max = rchild;
}
if (max != index)
{
//调整后还有不满足大顶堆的,交换两个节点
MySwap(arr, max, index);
HeapAdjust(arr, max, len);
}
}
//堆排序
void HeapSort(int myArr[], int len)
{
//初始化堆
for (int i=len/2-1;i>=0;i--)
{
HeapAdjust(myArr, i, len);
}
//交换堆顶元素和最后一个元素
for (int i=len-1;i>=0;i--)
{
MySwap(myArr, 0, i);
//交换之后,需要重新进行调整堆
HeapAdjust(myArr, 0, i);
}
}
int main(void)
{
int myArr [] = {4,2,8,0,5,7,1,3,9};
int len = sizeof(myArr) / sizeof(int);
PrintArray(myArr,len);
//堆排序
HeapSort(myArr, len);
PrintArray(myArr, len);
return 0;
}
运行结果:
下沉调整的时间复杂度等同于堆的高度O(logn),构建二叉堆执行下沉调整次数是n/2,循环删除进行下沉调整次数是n-1,时间复杂度约为O(nlogn)
堆排序算法排序过程中需要一个临时变量进行两两交换,所需要的额外空间为1,因此空间复杂度为O(1)
堆排序算法在排序过程中,相同元素的前后顺序有可能发生改变,所以堆排序是一种不稳定排序算法