目录
在有些情况下,我们不一定要让数据立马全部有序,比如当我们在打游戏时,突然有人打电话,游戏界面就会立马卡住不动,我们可以选择立马接电话或者立马挂电话。这就是我们应用程序在设计时,都需要有个优先级,最重要的一定会排在前面,然后在完成次大.......,这就引出了我们今天要讲的一种数据结构优先级队列,在Java jdk1.8中也给我们提供了接口PriorityQueue.
如果有一个关键码的集合K = {k0,k1, k2,…,kn-1},把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足:Ki <= K2i+1 且 Ki<= K2i+2 (Ki >= K2i+1 且 Ki >= K2i+2) i = 0,1,2…,则称为 小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。
堆的特点

原因是:如果要按照一颗非完全二叉树的顺序来存储,那么存储到数组中的节点必定要有null,节点,这些空节点在数组中某个位置就相当于为空,就会大量浪费数组的空间,空间利用率大大降低。
答案是不可以的因为,我们既然要将这颗二叉树存起来,我们肯定也要将它还原回来,如果不存储的话就无法还原一颗二叉树。
那么如何来建一个大根堆或者小根堆呢???
我们这里以建立大根堆为例
建立一个大根堆,最重要的就是向下调整。
向下调整算法:从最后一个父节点开始进行调整,如果父节点小于任意一个孩子,就进行交换,最终父亲节点比两个孩子大,接着调整上一个父节点,如此往复,最终就是一个大根堆。
最后一个孩子肯定就是数组最后一个元素,而对于一颗完全二叉树来说,给我们孩子节点,我们利用公式 (i -1)/2就是我们的父节点。
当我们调整完一颗子树,开始向下调整,肯定要进行父节点和子节点进行更新,而当我们的子节点超出我们数组有效范围内就证明一颗树向下调整结束。



向下调整
- //向下调整算法
- public void shiftDown(int[] array,int parent,int len){
- int child = 2*parent+1;
- while(child<len){
- //找左右孩子节点最大的值
- if(child+1<len&&array[child]<array[child+1]){
- child++;
- }
- //此时child就是左右孩子节点最大的
- //与父亲节点进行比较
- if(array[parent]<array[child]){
- swap(array,parent,child);
- }else {
- break;//并不需要进行交换这棵树已经是大根堆
- }
- parent = child;
- child = 2*parent+1;
- }
- }
最坏情况下,一路从根节点比较到叶子结点,所以比较次数就是完全二叉树的高度,时间复杂度为O(log2N)
- public class Heap {
-
- public int[] elem;//将堆中存放到数组中
- public int usedSize;//数组的有效个数
-
- public Heap(){
- this.elem = new int[10];
- this.usedSize =0;
- }
-
- //交换两个元素
- public void swap(int[] array,int i,int j){
- int tmp = array[i];
- array[i] = array[j];
- array[j] = tmp;
- }
-
- //向下调整算法
- public void shiftDown(int[] array,int parent,int len){
- int child = 2*parent+1;
- while(child<len){
- //找左右孩子节点最大的值
- if(child+1<len&&array[child]<array[child+1]){
- child++;
- }
- //此时child就是左右孩子节点最大的
- //与父亲节点进行比较
- if(array[parent]<array[child]){
- swap(array,parent,child);
- }else {
- break;//并不需要进行交换这棵树已经是大根堆
- }
- parent = child;
- child = 2*parent+1;
- }
- }
-
- //建堆
- public void createHeap(int[] array){
- //将array数组元素都保存到elem数组中去
- for(int i =0;i<array.length;++i){
- this.elem[i] = array[i];
- this.usedSize++;
- }
- //通过找到最后一个父节点来进行向下调整
- for(int p = (this.usedSize-1-1)/2;p>=0;p--){
- shiftDown(this.elem,p,this.usedSize);
- }
- }
- }



- //向上调整算法
- public void shiftUp(int child){
- int parent = (child-1)/2;//根据孩子节点推算出父节点
- while(parent>=0){//parent小于0则调整结束
- if(this.elem[child]>this.elem[parent]){
- swap(this.elem,parent,child);
- }else {
- break;
- }
- //更新父节点和子节点
- child = parent;
- parent = (child-1)/2;
- }
- }
-
- //增容
- public void grow(){
- this.elem = Arrays.copyOf(this.elem,2*this.elem.length);
- }
-
- //堆的插入
- public void offer(int key){
- if(this.elem.length==this.usedSize){
- grow();
- }
- //先将key插入到数组最后一个位置
- //然后再将key向上调整到合适位置使整个堆依然为大根堆
- this.elem[this.usedSize] = key;
- shiftUp(this.usedSize);
- this.usedSize++;
- }

- public boolean isEmpty(){//判断堆是否为空
- return this.usedSize==this.elem.length;
- }
-
- public void poll(){
- if(isEmpty()){
- System.out.println("该堆为空不能删除");
- return ;
- }
- swap(this.elem,0,this.usedSize-1);//将堆顶元素与最后一个元素交换
- shiftDown(this.elem,0,this.usedSize-1);//将堆顶元素向下调整
- this.usedSize--;//有效个数--
- }
1. 使用时必须导入PriorityQueue所在的包,即:import java.util.PriorityQueue;
2. PriorityQueue中放置的元素必须要能够比较大小,不能插入无法比较大小的对象,否则会抛出
ClassCastException异常
3. 不能插入null对象,否则会抛出NullPointerException
4. 没有容量限制,可以插入任意多个元素,其内部可以自动扩容
5. 插入和删除元素的时间复杂度为O(log2N)
6. PriorityQueue底层使用了堆数据结构, (注意:此处大家可以不用管什么是堆,后文中有介绍)
7. PriorityQueue默认情况下是小堆---即每次获取到的元素都是最小的元素
- //数组初始化默认容量为11
- private static final int DEFAULT_INITIAL_CAPACITY = 11;
- //底层使用一个Object类型的数组
- transient Object[] queue;
- //如果没有传比较器,或者按照默认的排序,则比较器为null
- private final Comparator<? super E> comparator;
- //创建一个默认容量为11的priorityQueue,该队列按照自然排序进行排序(也就是小堆)
- public PriorityQueue() {
- this(DEFAULT_INITIAL_CAPACITY, null);
- }
- //创建一个具有指定容量的PriorityQueue,该队列按照自然排序进行排序(也就是小堆)
- //这里注意初始容量不能小于1,如果小于1就会抛IllegalArgumentException异常
- public PriorityQueue(int initialCapacity) {
- this(initialCapacity, null);
- }
- //创建一个默认容量为11的priorityQueue,该队列按照比较器进行排序
- public PriorityQueue(Comparator<? super E> comparator) {
- this(DEFAULT_INITIAL_CAPACITY, comparator);
- }
- //创建一个具有指定容量的PriorityQueue,该队列按照比较器进行排序
- public PriorityQueue(int initialCapacity,
- Comparator<? super E> comparator) {
- // Note: This restriction of at least one is not actually needed,
- // but continues for 1.5 compatibility
- if (initialCapacity < 1)
- throw new IllegalArgumentException();
- this.queue = new Object[initialCapacity];
- this.comparator = comparator;
- }
-
- //插入元素offer
- //这里还要注意如果比较的是自定义类型,不是内置类型,就必须可比较否则会抛异常
- //ClassCastException
- public boolean offer(E e) {
- if (e == null)//如果插入元素为null,则就会抛空指针异常
- throw new NullPointerException();
- modCount++;
- int i = size;//获取当前优先级队列长度
- if (i >= queue.length)//如果当前优先级队列大于数组长度就要进行扩容
- grow(i + 1);
- size = i + 1;//插入一个元素,有效个数+1
- if (i == 0)//刚开始插入元素,插入0下标
- queue[0] = e;
- else//如果不是第一次插入元素,就向上调整到合适位置
- siftUp(i, e);
- return true;
- }
- //向上调整
- private void siftUp(int k, E x) {
- if (comparator != null)//一个是按照比较器来排序
- siftUpUsingComparator(k, x);
- else//按照自然排序(默认是小堆)
- siftUpComparable(k, x);
- }
- //siftUpComparable
- private void siftUpComparable(int k, E x) {
- //将x强转为Comparable类型能够比较
- Comparable<? super E> key = (Comparable<? super E>) x;
- while (k > 0) {
- //根据k(孩子节点)推算出父亲节点 (i-1)/2
- int parent = (k - 1) >>> 1;
- Object e = queue[parent];//先将父亲节点保存起来然后与传入的元素进行比较
- if (key.compareTo((E) e) >= 0)//(默认是小堆)
- break;//如果传入的元素要大于父亲元素就跳出循环,因为这里是在自然排序
- queue[k] = e;//否则的话比父亲节点要小,就与父亲节点进行交换
- k = parent;
- }
- queue[k] = key;//这里如果key比parent小就交换,否则放回原来的位置
- }
- //返回堆顶元素
- public E peek() {
- return (size == 0) ? null : (E) queue[0];
- }
-
- //弹出堆顶元素
- public E poll() {
- if (size == 0)//如果有效个数为0不能删除
- return null;
- int s = --size;//保存删除元素之后,数组元素最后的下标
- modCount++;
- E result = (E) queue[0];//保存0下标(要删除的元素)的值
- E x = (E) queue[s];//保存删除元素之后,数组最后一个元素
- queue[s] = null;
- if (s != 0)//如果有效个数不为0的话就进行向下调整
- siftDown(0, x);
- return result;
- }
- private void siftDownComparable(int k, E x) {
- Comparable<? super E> key = (Comparable<? super E>)x;
- int half = size >>> 1; // loop while a non-leaf
- while (k < half) {
- int child = (k << 1) + 1; // assume left child is least
- Object c = queue[child];
- int right = child + 1;
- if (right < size &&
- ((Comparable<? super E>) c).compareTo((E) queue[right]) > 0)
- c = queue[child = right];
- if (key.compareTo((E) c) <= 0)
- break;
- queue[k] = c;
- k = child;
- }
- queue[k] = key;
- }
- //扩容
- private void grow(int minCapacity) {
- int oldCapacity = queue.length;
- // Double size if small; else grow by 50%
- //如果容量小于64时,是按照oldCapacity的2倍方式扩容的
- //如果容量大于等于64,是按照oldCapacity的1.5倍方式扩容的
- //如果容量超过MAX_ARRAY_SIZE,按照MAX_ARRAY_SIZE来进行扩容
- int newCapacity = oldCapacity + ((oldCapacity < 64) ?
- (oldCapacity + 2) :
- (oldCapacity >> 1));
- // overflow-conscious code
- if (newCapacity - MAX_ARRAY_SIZE > 0)
- newCapacity = hugeCapacity(minCapacity);
- queue = Arrays.copyOf(queue, newCapacity);
- }
什么是topk问题呢???
比如中国大学的排名,前3名,清华北大浙大。这就是选取众多高校中最厉害的三所高校,对于我们数据也一样,比如我们要在1~10数字之间选择前3大的数据,那肯定就是10,9,8三个元素。那我们知道今天学的优先级队列就是根据数据的优先级而排列的,那我们怎么利用优先级队列这种数据结构来解决topK问题呢???
我们第一个想法那肯定就是建立大堆啊?建立大堆之后我们将堆顶元素弹出3次,这三个元素就是我们的在这个10个数字中前3大的元素。
- public static void main(String[] args) {
- PriorityQueue<Integer> pq = new PriorityQueue<>(new Comparator<Integer>() {
- @Override
- public int compare(Integer o1, Integer o2) {
- return o2-o1;
- }
- });
- int[] array = {1,2,3,4,5,6,7,8,9,10};
- for(int num:array){
- pq.offer(num);
- }
- for(int i =0;i<3;++i){
- System.out.println(pq.poll());
- }
- }
这个时间复杂度为:因为调整的时间复杂度为log2N,我们要选取前n个大的那就是N*log2N
我们能不能在进行优化呢??
我们可以按照:
这里选前k个大的建小堆为例。

- class Solution {
- //取前k个最小的元素
- public int[] smallestK(int[] array, int k) {
- if(k==0){
- return new int[k];
- }
- //建造一个大堆
- PriorityQueue<Integer> maxHeap = new PriorityQueue<>(k,new Comparator<Integer>() {
- @Override
- public int compare(Integer o1, Integer o2) {
- return o2-o1;
- }
- });
- //我们要先建造一个k大小的堆
- int i =0;
- for(i=0;i<k;++i){
- maxHeap.offer(array[i]);
- }
- //此时i指向的元素就是第四个元素
- //因为我们要找前k个最小的元素所以如果碰见这个元素大于堆顶元素,
- //那么这个元素一定不是前k个最小的元素如果这个元素小于堆顶元素,那么就将对顶元素弹出然后将这个元素加入堆中
- for(;i<array.length;++i){
- int temp = maxHeap.peek();
- if(array[i]<temp){
- maxHeap.poll();
- maxHeap.offer(array[i]);
- }
- }
- int[] ret = new int[k];
- for(int j =0;j<k;++j){
- ret[j]=maxHeap.poll();
- }
- return ret;
- }
- }
其实我们还可以发现前三大的是这三个元素,而第三大的就是我们堆顶元素