归并排序(英语:Merge sort,或mergesort),是创建在归并操作上的一种有效的排序算法,效率为 O(n·log n)。和快速排序一样,该算法是采用分而治之(Divide and Conquer)的思想,也是一个非常典型的应用,且各层分治递归可以同时进行。
采用分治法:
- 分割:递归地把当前序列平均分割成两半。
- 归并:在保持元素顺序的同时将上一步得到的子序列集成到一起(归并)。
归并操作(merge),指的是将两个已经排序的序列合并成一个序列的操作,归并排序依赖归并操作。仔细观察下面归并排序的过程
归并排序代码如下:
1 static void merge_sort_recursive(int[] arr, int[] result, int start, int end) { 2 if(start>=end) 3 return; 4 int len = end - start, mid = (len >> 1) + start; //二进制位运算法`>>`,mid是指 5 int start1 = start, end1 = mid; 6 int start2 = mid + 1, end2 = end; 7 8 merge_sort_recursive(arr, result, start1, end1);//先拆左边 9 merge_sort_recursive(arr, result, start2, end2);//再拆右边 10 11 int k = start; 12 //拆完后治(排序),比较大小 13 while(start1 <= end1 && start2 <= end2) { 14 result[k++] = arr[start1] < arr[start2] ? arr[start1++]:arr[start2++]; 15 } 16 //合并 17 while(start1 <= end1) { 18 result[k++] = arr[start1++]; 19 } 20 while (start2 <= end2) { 21 result[k++] = arr[start2++]; 22 } 23 for(k = start;k <= end; k++) { 24 arr[k] = result[k]; 25 } 26 } 27 28 public static void merge_sort(int[] arr) { 29 int len = arr.length; 30 int[] result = new int[len]; 31 merge_sort_recursive(arr, result, 0, len - 1); 32 }
该算法使用了递归,思想是一直把数组分成两段,直至分成只有一个数,然后两段开始比较且开始合并,并复制到另外一个数组中。它的递归操作就像一个二叉树,处理完左边的子节点(☞分的段)才开始处理右节点,处理右节点时也是先处理左节点,然后再处理右节点,就是这样一个过程。该算法额外占用了一个相同大小的空数组,因而空间复杂度为O(n)。从下面这个递归树可以看出,第一层时间代价为cn,第二层时间代价为cn/2+cn/2=cn.....每一层代价都是cn,总共有logn+1层,所以总的时间代价为cn*(logn+1),时间复杂度为O(n·logn)。
这里,合并排序是一种递归算法,时间复杂度可以表示为一下递归关系:
T(n) = 2·T(n / 2) + θ(n)
其递归的解是 θ(n·logn)。合并排序的时间复杂度在三种情况下(最好、最坏、平均) 均为 θ(n·logn),因为合并排序始终将数组分为两半,并花费线性时间来合并两半。
下面的图是递归树,利用它来理解递归的时间复杂度问题,它将问题对半递归分解为子问题,树高为 logn,每一层的成本为 cn,最后叶子节点处理成本为 c,总的成本为 c·n·logn + cn,所以这是一个 O(n·logn) 级别的算法。
测试代码如下:
1 public static void main(String[] args) { 2 int[] arr = {8, 4, 5, 7, 1, 3, 6, 2}; 3 4 merge_sort(arr); 5 6 System.out.println(Arrays.toString(arr)); 7 }
结果如下: