首先,对于评述算法优劣术语的说明:
稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;即排序后2个相等键值的顺序和排序之前它们的顺序相同
不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面;
内排序:所有排序操作都在内存中完成; 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
时间复杂度: 一个算法执行所耗费的时间。 空间复杂度: 运行完一个程序所需内存的大小。
关于时间空间复杂度的更多了解看书程杰大大编写的《大话数据结构》还是很赞的,通俗易懂。
十大经典算法排序总结对比
名词解释:n: 数据规模 k:“桶”的个数 In-place: 占用常数内存,不占用额外内存 Out-place: 占用额外内存
冒泡排序(Bubble Sort)
作为最简单的排序算法之一,冒泡排序就像Abandon在单词书里出现的感觉一样,每次都在第一页第一位,所以最熟悉。。。冒泡排序还有一种优化算法,就是立一个flag,当在一趟序列遍历中元素没有发生交换,则证明该序列已经有序。但这种改进对于提升性能来说并没有什么太大作用。。。
冒泡排序JavaScript代码实现:
1 function bubbleSort(arr) { 2 var len = arr.length; 3 for (var i = 0; i < len; i++) { 4 for (var j = 0; j < len - 1 - i; j++) { 5 if (arr[j] > arr[j+1]) { //相邻元素两两对比 6 var temp = arr[j+1]; //元素交换 7 arr[j+1] = arr[j]; 8 arr[j] = temp; 9 } 10 } 11 } 12 return arr; 13 }
选择排序(Selection Sort)
在时间复杂度上表现最稳定的排序算法之一,因为无论什么数据进去都是O(n²)的时间复杂度。。。所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。
1 function selectionSort(arr) { 2 var len = arr.length; 3 var minIndex, temp; 4 for (var i = 0; i < len - 1; i++) { 5 minIndex = i; 6 for (var j = i + 1; j < len; j++) { 7 if (arr[j] < arr[minIndex]) { //寻找最小的数 8 minIndex = j; //将最小数的索引保存 9 } 10 } 11 temp = arr[i]; 12 arr[i] = arr[minIndex]; 13 arr[minIndex] = temp; 14 } 15 return arr; 16 }
插入排序(Insertion Sort)
插入排序的代码实现虽然没有冒泡排序和选择排序那么简单粗暴,但它的原理应该是最容易理解的了,因为只要打过扑克牌的人都应该能够秒懂。当然,如果你说你打扑克牌摸牌的时候从来不按牌的大小整理牌,那估计这辈子你对插入排序的算法都不会产生任何兴趣了。。。
插入排序和冒泡排序一样,也有一种优化算法,叫做拆半插入。对于这种算法,得了懒癌的我就套用教科书上的一句经典的话吧:感兴趣的同学可以在课后自行研究。。。
1 function insertionSort(arr) { 2 var len = arr.length; 3 var preIndex, current; 4 for (var i = 1; i < len; i++) { 5 preIndex = i - 1; 6 current = arr[i]; 7 while(preIndex >= 0 && arr[preIndex] > current) { 8 arr[preIndex+1] = arr[preIndex]; 9 preIndex--; 10 } 11 arr[preIndex+1] = current; 12 } 13 return arr; 14 }
希尔排序(Shell Sort)
希尔排序是插入排序的一种更高效率的实现。它与插入排序的不同之处在于,它会优先比较距离较远的元素。希尔排序的核心在于间隔序列的设定。既可以提前设定好间隔序列,也可以动态的定义间隔序列。动态定义间隔序列的算法是《算法(第4版》的合著者Robert Sedgewick提出的。在这里,我就使用了这种方法。
1 function shellSort(arr) { 2 var len = arr.length, 3 temp, 4 gap = 1; 5 while(gap < len/3) { //动态定义间隔序列 6 gap =gap*3+1; 7 } 8 for (gap; gap > 0; gap = Math.floor(gap/3)) { 9 for (var i = gap; i < len; i++) { 10 temp = arr[i]; 11 for (var j = i-gap; j >= 0 && arr[j] > temp; j-=gap) { 12 arr[j+gap] = arr[j]; 13 } 14 arr[j+gap] = temp; 15 } 16 } 17 return arr; 18 }
归并排序(Merge Sort)
作为一种典型的分而治之思想的算法应用,归并排序的实现由两种方法:
- 自上而下的递归(所有递归的方法都可以用迭代重写,所以就有了第2种方法)
- 自下而上的迭代
1 function mergeSort(arr) { //采用自上而下的递归方法 2 var len = arr.length; 3 if(len < 2) { 4 return arr; 5 } 6 var middle = Math.floor(len / 2), 7 left = arr.slice(0, middle), 8 right = arr.slice(middle); 9 return merge(mergeSort(left), mergeSort(right)); 10 } 11 12 function merge(left, right) 13 { 14 var result = []; 15 16 while (left.length && right.length) { 17 if (left[0] <= right[0]) { 18 result.push(left.shift()); 19 } else { 20 result.push(right.shift()); 21 } 22 } 23 24 while (left.length) 25 result.push(left.shift()); 26 27 while (right.length) 28 result.push(right.shift()); 29 30 return result; 31 }
快速排序(Quick Sort)
快速排序的最坏运行情况是O(n²),比如说顺序数列的快排。但它的平摊期望时间是O(n log n) ,且O(n log n)记号中隐含的常数因子很小,比复杂度稳定等于O(n log n)的归并排序要小很多。所以,对绝大多数顺序性较弱的随机数列而言,快速排序总是优于归并排序。
1 function quickSort(arr, left, right) { 2 var len = arr.length, 3 partitionIndex, 4 left = typeof left != 'number' ? 0 : left, 5 right = typeof right != 'number' ? len - 1 : right; 6 7 if (left < right) { 8 partitionIndex = partition(arr, left, right); 9 quickSort(arr, left, partitionIndex-1); 10 quickSort(arr, partitionIndex+1, right); 11 } 12 return arr; 13 } 14 15 function partition(arr, left ,right) { //分区操作 16 var pivot = left, //设定基准值(pivot) 17 index = pivot + 1; 18 for (var i = index; i <= right; i++) { 19 if (arr[i] < arr[pivot]) { 20 swap(arr, i, index); 21 index++; 22 } 23 } 24 swap(arr, pivot, index - 1); 25 return index-1; 26 } 27 28 function swap(arr, i, j) { 29 var temp = arr[i]; 30 arr[i] = arr[j]; 31 arr[j] = temp; 32 }
堆排序(Heap Sort)
堆排序可以说是一种利用堆的概念来排序的选择排序。分为两种方法:
- 大顶堆:每个节点的值都大于或等于其子节点的值,在堆排序算法中用于升序排列
- 小顶堆:每个节点的值都小于或等于其子节点的值,在堆排序算法中用于降序排列
var len; //因为声明的多个函数都需要数据长度,所以把len设置成为全局变量 function buildMaxHeap(arr) { //建立大顶堆 len = arr.length; for (var i = Math.floor(len/2); i >= 0; i--) { heapify(arr, i); } } function heapify(arr, i) { //堆调整 var left = 2 * i + 1, right = 2 * i + 2, largest = i; if (left < len && arr[left] > arr[largest]) { largest = left; } if (right < len && arr[right] > arr[largest]) { largest = right; } if (largest != i) { swap(arr, i, largest); heapify(arr, largest); } } function swap(arr, i, j) { var temp = arr[i]; arr[i] = arr[j]; arr[j] = temp; } function heapSort(arr) { buildMaxHeap(arr); for (var i = arr.length-1; i > 0; i--) { swap(arr, 0, i); len--; heapify(arr, 0); } return arr; }
计数排序(Counting Sort)
计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。
作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。
1 function countingSort(arr, maxValue) { 2 var bucket = new Array(maxValue+1), 3 sortedIndex = 0; 4 arrLen = arr.length, 5 bucketLen = maxValue + 1; 6 7 for (var i = 0; i < arrLen; i++) { 8 if (!bucket[arr[i]]) { 9 bucket[arr[i]] = 0; 10 } 11 bucket[arr[i]]++; 12 } 13 14 for (var j = 0; j < bucketLen; j++) { 15 while(bucket[j] > 0) { 16 arr[sortedIndex++] = j; 17 bucket[j]--; 18 } 19 } 20 21 return arr; 22 }
桶排序(Bucket Sort)
桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。
为了使桶排序更加高效,我们需要做到这两点:
- 在额外空间充足的情况下,尽量增大桶的数量
- 使用的映射函数能够将输入的N个数据均匀的分配到K个桶中
同时,对于桶中元素的排序,选择何种比较排序算法对于性能的影响至关重要。
什么时候最快(Best Cases):
当输入的数据可以均匀的分配到每一个桶中
什么时候最慢(Worst Cases):
当输入的数据被分配到了同一个桶中
1 function bucketSort(arr, bucketSize) { 2 if (arr.length === 0) { 3 return arr; 4 } 5 6 var i; 7 var minValue = arr[0]; 8 var maxValue = arr[0]; 9 for (i = 1; i < arr.length; i++) { 10 if (arr[i] < minValue) { 11 minValue = arr[i]; //输入数据的最小值 12 } else if (arr[i] > maxValue) { 13 maxValue = arr[i]; //输入数据的最大值 14 } 15 } 16 17 //桶的初始化 18 var DEFAULT_BUCKET_SIZE = 5; //设置桶的默认数量为5 19 bucketSize = bucketSize || DEFAULT_BUCKET_SIZE; 20 var bucketCount = Math.floor((maxValue - minValue) / bucketSize) + 1; 21 var buckets = new Array(bucketCount); 22 for (i = 0; i < buckets.length; i++) { 23 buckets[i] = []; 24 } 25 26 //利用映射函数将数据分配到各个桶中 27 for (i = 0; i < arr.length; i++) { 28 buckets[Math.floor((arr[i] - minValue) / bucketSize)].push(arr[i]); 29 } 30 31 arr.length = 0; 32 for (i = 0; i < buckets.length; i++) { 33 insertionSort(buckets[i]); //对每个桶进行排序,这里使用了插入排序 34 for (var j = 0; j < buckets[i].length; j++) { 35 arr.push(buckets[i][j]); 36 } 37 } 38 39 return arr; 40 }
基数排序(Radix Sort)
- MSD 从高位开始进行排序
- LSD 从低位开始进行排序
基数排序 vs 计数排序 vs 桶排序
这三种排序算法都利用了桶的概念,但对桶的使用方法上有明显差异:
基数排序:根据键值的每位数字来分配桶
计数排序:每个桶只存储单一键值
桶排序:每个桶存储一定范围的数值
1 //LSD Radix Sort 2 var counter = []; 3 function radixSort(arr, maxDigit) { 4 var mod = 10; 5 var dev = 1; 6 for (var i = 0; i < maxDigit; i++, dev *= 10, mod *= 10) { 7 for(var j = 0; j < arr.length; j++) { 8 var bucket = parseInt((arr[j] % mod) / dev); 9 if(counter[bucket]==null) { 10 counter[bucket] = []; 11 } 12 counter[bucket].push(arr[j]); 13 } 14 var pos = 0; 15 for(var j = 0; j < counter.length; j++) { 16 var value = null; 17 if(counter[j]!=null) { 18 while ((value = counter[j].shift()) != null) { 19 arr[pos++] = value; 20 } 21 } 22 } 23 } 24 return arr; 25 }
原文链接:http://www.jianshu.com/p/1b4068ccd505
著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。
原文链接:http://www.jianshu.com/p/1b4068ccd505
著作权归作者所有,转载请联系作者获得授权,并标注“简书作者”。
http://www.jianshu.com/p/1b4068ccd505