看动画学算法之:二叉堆Binary Heap
我们坐在高高的谷堆旁边,听妈妈讲那过去的事情。听到了堆,我就想起了这首歌。
没错,今天我们要介绍一个堆,这个堆叫做二叉堆。
二叉树我们之前讲过了,就是每个节点最多有两个子节点的树叫做二叉树。而二叉堆Binary Heap是一种特殊的二叉树。
先看一个二叉堆的图,看看有什么特别的性质:
看起来二叉堆和二叉树没什么太大的区别。
但实际上还是有两点不一样。
- 上面我们展示的是最大二叉堆,也就是说每个节点的值都要比它的任何子节点的值都要大。 同样的我们也可以构建最小二叉堆。
- 第二个特性就是二叉堆是一个完全二叉树。
什么时候完全二叉树呢?
完全二叉树就是说二叉树的每一层都被填满了,除了最下面的一层,并且所有的最底层节点都尽力向左靠拢。
二叉堆这样特殊的数据结构有什么作用呢?
因为二叉堆实际上是一个部分排序的序列,我们可以拿到二叉堆的堆顶元素,也就是最大的值,那么我们可以根据这个特性进行堆排序。
同时,二叉堆的这特性还可以用来实现优先队列,将优先级作为二叉堆的值,我们可以每次都拿到优先级最高的那个数据。
优先队 (PQ) 数据结构 和普通的队列差不多, 但是它多了以下两个主要操作:
- enqueue(x): 放一个新元素 (键值) x 进去优先队
- y =dequeue(): 返回已经在优先队里的有着最高优先级(键值)的元素 y。 如果存在优先级一样的情况,则先返回先入队的那个。也就是说像一个正常的Queue那样先进先出(FIFO)。
当然,还有其他的一些应用。
二叉堆的底层实现可以用数组也可以用链表。这里我们使用数组来进行二叉堆的构建。
上图中的二叉堆,如果我们以层的存储顺序存放到数组中,那么应该是这样的:
arry[0] 一定是最大值。
同样的,我们可以得到下面的特性:
- array[(i-1)/2] i节点的父节点
- array[(2*i)+1] i节点的左子节点
- array[(2*i)+2] i节点的右子节点
我们可以得到下面的BinaryHeap的基本结构,这里我们添加了两个变量,一个是heapSize用来记录heap中存储的数据的个数,一个是capacity用来表示底层数组的最大容量。
public class BinaryHeap {
//底层存储数组用来存储数据
private int[] intArray;
//heap大小
private int heapSize;
//数组容量
private int capacity;
//获取某个index的父节点
private int parent(int i) { return (i-1)>>1; } // (i-1)/2
//获取某个index的左子节点
private int leftChild(int i) { return i<<1+1; } // i*2+1
//获取某个index的右子节点
private int rightChild(int i) { return (i<<1)+2; } // i*2+2
public BinaryHeap(int capacity) {
this.capacity= capacity;
intArray = new int[capacity];
intArray[0]=-1;
heapSize = 0;
}
}
获取二叉堆的最大值很简单,直接返回index=0的元素即可:
public int getMax() {
return intArray[0];
}
先看一个二叉堆插入的动画:
我们向现有的二叉堆中插入了一个100。
首先是插入到数组的最后一个元素,因为插入了新的元素100,而100大于它的父节点,所以需要对二叉堆进行节点调整。
这种调整我们叫做shiftUp,主要是将插入的节点和它的父节点做比较,如果大于父节点,则和父节点互换位置。然后再递归对父节点做shiftUp操作。
相对应的java代码如下:
//递归shift某个节点,将大值移动到最上面
private void shiftUp(int i) {
if (i == 0) return; // 如果是root,则不作操作
if (intArray[i] > intArray[parent(i)]) { // 子节点大于父节点,则需要进行swap操作
swap(intArray, i, parent(i)); // 将子节点和父节点进行互换
shiftUp(parent(i)); // 递归shift父节点
}
}
有了shiftUp操作,我们可以总结一下insert操作的代码如下:
//heap插入,插入到最后的位置,然后进行shift up操作
public void insert(int x) {
if(isFull()){
expandHeap();
}
heapSize++;
intArray[heapSize-1]= x; // 插入最后位置
shiftUp(heapSize-1); // shift up
}
insert直接向数组最后插入一个元素,然后遍历该元素的父节点,并一直到根节点。所以insert操作的时间复杂度应该是O(log N)。
提取Max操作extractMax,就是从二叉堆中删除最大的元素。
先看一个删除最大元素的动画:
删除最大元素的流程是这样的,首先将100和数组中的最后一个元素互换位置,并将heapSize-1,表示已经删除了100这个元素。
现在数组中的26被放在index=0这个位置,但是26很明显不符合二叉堆的定义,所以需要将26元素下移,这个下移操作叫做shiftDown。
节点的左右子节点的大小是不确定的,如果我们想要找到子节点中最大的值,则需要进行两次比较。所以我们先进行左子节点的比较,再进行右子节点的比较,最后交互节点的数据,并继续递归shiftDown子节点。
对于的java代码如下:
//递归shift某个节点,将小值移动到最下面
//比较过程是先比较左子节点,再比较右子节点
private void shiftDown(int i) {
if (i >= heapSize) return; // 超出了数组存储范围,直接返回
int swapId = i; //要互换的id
//如果存在左子节点,并且当前节点小于左子节点,则将要互换的id设置为左子节点
if (leftChild(i) <= heapSize-1 && intArray[i] < intArray[leftChild(i)]){
swapId = leftChild(i);
}
//如果存在右子节点,并且互换的id小于右子节点,则将互换的id设置为右子节点
if (rightChild(i) <= heapSize-1 && intArray[swapId] < intArray[rightChild(i)]){
swapId = rightChild(i);
}
if (swapId != i) { // 需要互换
swap(intArray, i, swapId); // 进行互换
shiftDown(swapId); // 递归要互换的节点
}
}
于是我们可以得到相应的ExtractMax()方法:
//获取最大的数据,
public int extractMax() {
int taken = intArray[0]; //root 就是最大的值
swap(intArray, 0, heapSize-1); // 将root和最后一个值进行互换
heapSize--;
shiftDown(0); // 递归执行shift Down操作
return taken; // 返回root的值
}
同样的,extractMax虽然会多进行一次子节点的比较,但是只会递归log N次,所以extractMax() 的时间复杂度是 O(log N)。
有了插入方法,很明显我们可以通过一个个的插入数据,来构架一个二叉堆:
BinaryHeap pq = new BinaryHeap(20);
pq.insert(5);
pq.insert(2);
pq.insert(7);
pq.insert(3);
看下这种插入的动画:
因为这种创建方法,需要插入N个数据,并且每插入一个数据都需要进行logN次比较,所以它的时间复杂度是O(N log N)。
下面我们来看一个更快的方法:
因为二叉堆是一个完全二叉树,假设树中的元素个数为N,那么其中一半的元素都是叶子节点。也就是说有N/2个叶子节点。
那么我们只需要对现有数组中所有的非叶子节点进行shitDown操作就可以完成排序了。
// 构建二叉堆
for (int i = n / 2 - 1; i >= 0; i--)
shiftDown(arr, n, i);
看下这种创建的动画:
这种创建的时间复杂度是O(log N)。
本文的代码地址:
本文收录于 www.flydean.com
最通俗的解读,最深刻的干货,最简洁的教程,众多你不知道的小技巧等你来发现!
欢迎关注我的公众号:「程序那些事」,懂技术,更懂你!