常用的排序算法属快速排序和堆排序应用的最多,快速排序的递归版本要受限制于栈空间溢出问题的困扰,无法处理大量数据排序(但是对于外存上的数据进行排序,什么排序算法猜算是适合的?也许mergeSort会是一种选择,但是这个要再考虑)。而其他的排序包括插入排序,归并排序,冒泡排序,选择排序,相较于这两种排序算法,或者在时间或者空间上消耗要更大。
HeapSort算法是一个就地的排序算法,时间复杂度和quickSort一样,为O(N*LogN),同时和快速排序一样,是不稳定的排序(貌似ShellSort,QuickSort,HeapSort这三种最高效的排序都是不稳定的,但是InsertSort,BubbleSort是稳定的)。并且在实现上,除了在保持堆结构的过程当中需要使用递归(由于是和深度有关的,所以递归的次数很少,而且应该是可以做尾递归优化的,是不是?),要了解堆排序首先要了解堆得定义。
Heap在计算机领域有两个主要的解释:
1.Heap是一种数据结构,在逻辑上为一颗完全二叉树,在物理上表现为一个数组。
2.Heap是一个程序执行空间当中的可动态申请的内存区域。
在堆排序当中,我们当然是选择第一种解释,堆的性质主要表现在如下的两个方面(以最大堆为例):
1.堆的任何一个节点的都要大于它的后裔
2.堆是一颗完全二叉树
如果把堆看成一种数据结构,那么对于定义抽象数据类型来说,堆的常用操作包括:
1.HeapIdf():保持堆得性质
2.BuildHeap():建立初始堆
3.Insert():插入新的元素进入堆
4.Update():更新堆元素的key并保持堆结构
5.get():获取堆顶部的元素
6.delete():删除堆顶部的元素并保持堆结构
但是对HeapSort来说,只有1,3是用到的,具体的HeapSort算法,我用C实现的版本如下:
#include <stdio.h> #include "heapsort.h" //data:heap data ///size: the size of the heap //i: the node neeeded to be adjusted int parent(int i){ return (i-1)/2; } int left(int i){ return (i*2+1); } int right(int i){ return (i*2+2); } void maxHeapIdf(int data[],int size,int i){ int largerId; int temp; int l,r; l=left(i); r=right(i); largerId=i; if(l<size && data[largerId]<data[l]){ largerId=l; } if(r<size && data[largerId]<data[r]){ largerId=r; } if(largerId!=i){ temp=data[i]; data[i]=data[largerId]; data[largerId]=temp; maxHeapIdf(data,size,largerId); } } void buildMaxHeap(int data[],int size){ int i; for(i=(size-2)/2;i>=0;i--){ maxHeapIdf(data,size,i); } } void heapSort(int data[],int size){ int i; int temp; buildMaxHeap(data,size); for(i=size-1;i>=0;i--){ temp=data[i]; data[i]=data[0]; data[0]=temp; maxHeapIdf(data,i,0); } } void print(int A[],int heap_size) { int i; for(i = 0; i < heap_size;i++) { printf("%d ", A[i]); } printf(" "); } int main(){ int data[]={ 5,2,3,7,6,4,1 }; heapSort(data,7); print(data,7); }
Heap结构除了可以应用到排序上,还是作为优先级队列的一种选择,优先级队里可以用于比如进程调度等场合。