• 程序员的算法课(2)-排序算法


    原文链接:https://www.jianshu.com/p/47170b1ced23

    术语说明

    • 稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;
    • 不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面;
    • 内排序:所有排序操作都在内存中完成;
    • 外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;

    一、排序算法总结

    • n: 数据规模
    • k: “桶”的个数
    • In-place: 占用常数内存,不占用额外内存
    • Out-place: 占用额外内存

    二、排序算法分类

    • 比较类排序:通过比较来决定元素间的相对次序,由于其时间复杂度不能突破O(nlogn),因此也称为非线性时间比较类排序。
    • 非比较类排序:不通过比较来决定元素间的相对次序,它可以突破基于比较排序的时间下界,以线性时间运行,因此也称为线性时间非比较类排序。 

    三、各种排序算法介绍

    1、冒泡排序(Bubble Sort)

    冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。 

    1.1 算法描述

    • 比较相邻的元素。如果第一个比第二个大,就交换它们两个;
    • 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
    • 针对所有的元素重复以上的步骤,除了最后一个;
    • 重复步骤1~3,直到排序完成。

    1.2 动图演示

    1.3 代码实现

     public static int[] bubbleSort(int[] array) {
          if (array.length == 0)
              return array;
          for (int i = 0; i < array.length; i++){  //外层循环一次为一趟排序
              /*设置标识,判断这趟排序是否发生了交换。
             如果未发生交换,则说明数组已经有序,不必再排序了*/
              boolean isSwap = false;
              for (int j = 0; j < array.length - 1 - i; j++) //内层循环一次为一次相邻比较
                  if (array[j + 1] < array[j]) {
                      int temp = array[j + 1];
                      array[j + 1] = array[j];
                      array[j] = temp;
                      isSwap = true;
                  }
              if(!isSwap)
                  break;
          }
          return array;
      }

    1.4算法拓展
    鸡尾酒排序,又称定向冒泡排序、搅拌排序等,是对冒泡排序的改进。在把最大的数往后面冒泡的同时,把最小的数也往前面冒泡,同时收缩无序区的左右边界,有序区在序列左右逐渐累积。

    动图如下:

    代码如下:

        public static void cocktailSort(int[] array) {
            int left = 0,right = array.length-1;
            while(left < right) {
                for(int i = left; i < right; i++) 
                  if(array[i] > array[i+1]) 
                        swap(array,i,i + 1);
                right--;
                for(int i = right; i > left; i--) 
                  if(array[i] < array[i-1]) 
                        swap(array,i,i-1);
                left++;
            }
        }

    鸡尾酒排序是稳定的。它的平均时间复杂度为O(n2),最好情况是待排序列原先就是正序的,时间复杂度为O(n),最坏情况是待排序列原先是逆序的,时间复杂度为O(n2)。空间复杂度为O(1)。

    2、选择排序(Selection Sort)

    选择排序(Selection-sort)是一种简单直观的排序算法。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。 

    2.1 算法描述

    n个记录的直接选择排序可经过n-1趟直接选择排序得到有序结果。具体算法描述如下:

    • 初始状态:无序区为R[1..n],有序区为空;
    • 第i趟排序(i=1,2,3…n-1)开始时,当前有序区和无序区分别为R[1..i-1]和R(i..n)。该趟排序从当前无序区中-选出关键字最小的记录 R[k],将它与无序区的第1个记录R交换,使R[1..i]和R[i+1..n)分别变为记录个数增加1个的新有序区和记录个数减少1个的新无序区;
    • n-1趟结束,数组有序化了。

    2.2 动图演示

      

    2.3 代码实现

        public static int[] selectionSort(int[] array) {
            if (array.length == 0)
                 return array;
            for (int i = 0; i < array.length; i++) {
                int minIndex = i;
                for (int j = i; j < array.length; j++) {
                    if (array[j] < array[minIndex]) //找到最小的数
                        minIndex = j; //将最小数的索引保存
                }
                int temp = array[minIndex]; //将最小数和无序区的第一个数交换
                array[minIndex] = array[i];
                array[i] = temp;
            }
            return array;
        }

    2.4 算法分析

    表现最稳定的排序算法之一,因为无论什么数据进去都是O(n2)的时间复杂度,所以用到它的时候,数据规模越小越好。唯一的好处可能就是不占用额外的内存空间了吧。理论上讲,选择排序可能也是平时排序一般人想到的最多的排序方法了吧。

    3、插入排序(Insertion Sort)

    插入排序(Insertion-Sort)的算法描述是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

    3.1 算法描述

    一般来说,插入排序都采用in-place在数组上实现。具体算法描述如下:

    • 从第一个元素开始,该元素可以认为已经被排序;
    • 取出下一个元素,在已经排序的元素序列中从后向前扫描;
    • 如果该元素(已排序)大于新元素,将该元素移到下一位置;
    • 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置;
    • 将新元素插入到该位置后;
    • 重复步骤2~5。

    3.2 动图演示

    3.2 代码实现

        public static int[] insertionSort(int[] array) {
            if (array.length == 0)
                return array;
            int current;
            for (int i = 1; i < array.length; i++) {
                current = array[i];
                int preIndex = i - 1;
                while (preIndex >= 0 && current < array[preIndex]) {
                    array[preIndex + 1] = array[preIndex];
                    preIndex--;
                }
                array[preIndex + 1] = current;
            }
            return array;
        }

    3.4 算法分析

    插入排序在实现上,通常采用in-place排序(即只需用到O(1)的额外空间的排序),因而在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。

    3.5 算法拓展
    在直接插入排序中,待插入的元素总是在有序区线性查找合适的插入位置,没有利用有序的优势,考虑使用二分查找搜索插入位置进行优化,即二分插入排序

    代码实现如下:

        public static int[] BinaryInsertionSort(int[] array) {
            if (array.length == 0)
                return array;
            for(int i = 1;i < array.length;i++) {
                int left = 0;
                int right = i - 1;  // left 和 right 分别为有序区的左右边界 
                int current = array[i];
                while (left <= right) {
               //搜索有序区中第一个大于 current 的位置,即为 current 要插入的位置
                    int mid = left + ((right - left) >> 1);
                    if(array[mid] > current){
                        right = mid - 1;
                    }else{
                        left = mid + 1;
                    }
                }
                for(int j = i - 1;j >= left;j--) {
                    array[j + 1] = array[j];
                }
                array[left] = current; // left 为第一个大于 current 的位置,插入 current
            }
            return array;
         }

    4、希尔排序(Shell Sort)

    1959年Shell发明,第一个突破O(n2)的排序算法,是简单插入排序的改进版。它与插入排序的不同之处在于,它会优先比较距离较远的元素。希尔排序又叫缩小增量排序

    4.1 算法描述

    先将整个待排序的记录序列分割成为若干子序列分别进行直接插入排序,具体算法描述:

    • 选择一个增量序列t1,t2,…,tk,其中ti>tj,tk=1;
    • 按增量序列个数k,对序列进行k 趟排序;
    • 每趟排序,根据对应的增量ti,将待排序列分割成若干长度为m 的子序列,分别对各子表进行直接插入排序。仅增量因子为1 时,整个序列作为一个表来处理,表长度即为整个序列的长度。

    4.2 动图演示

    4.3 代码实现

        public static int[] ShellSort(int[] array) {
            int len = array.length;
            if(len == 0)
                return array;
            int current, gap = len / 2;
            while (gap > 0) {
                for (int i = gap; i < len; i++) {
                    current = array[i];
                    int preIndex = i - gap;
                    while (preIndex >= 0 && array[preIndex] > current) {
                        array[preIndex + gap] = array[preIndex];
                        preIndex -= gap;
                    }
                    array[preIndex + gap] = current;
                }
                gap /= 2;
            }
            return array;
        }

    4.4 算法分析

    希尔排序的核心在于间隔序列的设定。既可以提前设定好间隔序列,也可以动态的定义间隔序列。动态定义间隔序列的算法是《算法(第4版)》的合著者Robert Sedgewick提出的。 

    5、归并排序(Merge Sort)

    归并排序是建立在归并操作上的一种有效的排序算法。该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为2-路归并。 

    5.1 算法描述

    • 把长度为n的输入序列分成两个长度为n/2的子序列;
    • 对这两个子序列分别采用归并排序;
    • 将两个排序好的子序列合并成一个最终的排序序列。

    5.2 动图演示

    5.3 代码实现

    /**
         * 归并排序
         *
         * @param array
         * @return
         */
        public static int[] MergeSort(int[] array) {
            if (array.length < 2) return array;
            int mid = array.length / 2;
            int[] left = Arrays.copyOfRange(array, 0, mid);
            int[] right = Arrays.copyOfRange(array, mid, array.length);
            return merge(MergeSort(left), MergeSort(right));
        }
        /**
         * 归并排序——将两段有序数组结合成一个有序数组
         *
         * @param left
         * @param right
         * @return
         */
        public static int[] merge(int[] left, int[] right) {
           int[] result = new int[left.length + right.length];
           int i = 0,j = 0,k = 0;
           while (i < left.length && j < right.length) {
                if (left[i] <= right[j]) {
                    result[k++] = left[i++];
                } else {
                    result[k++] = right[j++];
                }
            }
            while (i < left.length) {
                result[k++] = left[i++];
            }
            while (j < right.length) {
                result[k++] = right[j++];
            }
            return result;
        }

    5.4 算法分析

    归并排序是一种稳定的排序方法。和选择排序一样,归并排序的性能不受输入数据的影响,但表现比选择排序好的多,因为始终都是O(nlogn)的时间复杂度。代价是需要额外的内存空间。

    6、快速排序(Quick Sort)

    详细请参考:一文搞定十大经典排序算法(Java实现)

    快速排序的基本思想:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。

    6.1 算法描述

    快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:

    • 从数列中挑出一个元素,称为 “基准”(pivot);
    • 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。这个称为分区(partition)操作;
    • 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。

    6.2 动图演示

    6.3 代码实现

    快速排序最核心的步骤就是partition操作,即从待排序的数列中选出一个数作为基准,将所有比基准值小的元素放在基准前面,所有比基准值大的元素放在基准的后面(相同的数可以到任一边),该基准就处于数列的中间位置。partition函数返回基准的位置,然后就可以对基准位置的左右子序列递归地进行同样的快排操作,从而使整个序列有序。

    下面我们来介绍partition操作的两种实现方法:左右指针法挖坑法

    方法一:左右指针法
    基本思路:
    1.将数组的最后一个数 right 作为基准数 key。
    2.分区过程:从数组的首元素 begin 开始向后找比 key 大的数(begin 找大);end 开始向前找比 key 小的数(end 找小);找到后交换两者(swap),直到 begin >= end 终止遍历。最后将 begin(此时begin == end)和最后一个数交换( 这个时候 end 不是最后一个位置),即 key 作为中间数(左区间都是比key小的数,右区间都是比key大的数)
    3.再对左右区间重复第二步,直到各区间只有一个数。

    /**
     * partition操作
     * @param array
     * @param left 数列左边界
     * @param right 数列右边界
     * @return
     */
    public static int partition(int[] array,int left,int right) {
            int begin = left;
            int end = right;
            int key = right;
    
            while( begin < end ) {
                //begin找大
                while(begin < end && array[begin] <= array[key])
                    begin++;
                //end找小
                while(begin < end && array[end] >= array[key])
                    end--;
                swap(array,begin,end);
            }
            swap(array,begin,right);
            return begin;   //返回基准位置
        }
     
    /**
     * 交换数组内两个元素
     * @param array
     * @param i
     * @param j
     */
    public static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }

    方法二:挖坑法
    基本思路:
    1.定义两个指针 left 指向起始位置,right 指向最后一个元素的位置,然后指定一个基准 key(right),作为坑。
    2.left 寻找比基准(key)大的数字,找到后将 left 的数据赋给 right,left 成为一个坑,然后 right 寻找比基数(key)小的数字,找到将 right 的数据赋给 left,right 成为一个新坑,循环这个过程,直到 begin 指针与 end指针相遇,然后将 key 填入那个坑(最终:key的左边都是比key小的数,key的右边都是比key大的数),然后进行递归操作。

    /**
     * partition操作
     * @param array
     * @param left 数列左边界
     * @param right 数列右边界
     * @return
     */
    public static int partition(int[] array,int left,int right) {
            int key = array[right];//初始坑
            while(left < right) {
                //left找大
                while(left < right && array[left] <= key )
                    left++;
                array[right] = array[left];//赋值,然后left作为新坑
                //right找小
                while(left <right && array[right] >= key)
                    right--;
                array[left] = array[right];//right作为新坑
            }
            array[left] = key;
           /*将key赋值给left和right的相遇点,
            保持key的左边都是比key小的数,key的右边都是比key大的数*/
            return left;//最终返回基准
        }

    实现了partition操作,我们就可以递归地进行快速排序了

     /**
     * 快速排序方法
     * @param array
     * @param left 数列左边界
     * @param right 数列右边界
     * @return
     */
    public static void Quicksort(int array[], int left, int right) {
            if(left < right){
                int pos = partition(array, left, right);
                Quicksort(array, left, pos - 1);
                Quicksort(array, pos + 1, right);
            }
        }

    7、堆排序(Heap Sort)

    堆排序(Heapsort)是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构,并同时满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。

    7.1 算法描述

    • 将初始待排序关键字序列(R1,R2….Rn)构建成大顶堆,此堆为初始的无序区;
    • 将堆顶元素R[1]与最后一个元素R[n]交换,此时得到新的无序区(R1,R2,……Rn-1)和新的有序区(Rn),且满足R[1,2…n-1]<=R[n];
    • 由于交换后新的堆顶R[1]可能违反堆的性质,因此需要对当前无序区(R1,R2,……Rn-1)调整为新堆,然后再次将R[1]与无序区最后一个元素交换,得到新的无序区(R1,R2….Rn-2)和新的有序区(Rn-1,Rn)。不断重复此过程直到有序区的元素个数为n-1,则整个排序过程完成。

    7.2 动图演示

    7.3 代码实现

    //声明全局变量,用于记录数组array的长度;
    static int len;
    /**
     * 堆排序算法
     * @param array
     * @return
     */
    public static int[] HeapSort(int[] array) {
            len = array.length;
            if (len == 0) return array;
            //1.构建一个大根堆
            buildMaxHeap(array);
            //2.循环将堆顶(最大值)与堆尾交换,删除堆尾元素,然后重新调整大根堆
            while (len > 0) {
                swap(array, 0, len - 1);
                len--; //原先的堆尾进入有序区,删除堆尾元素
                adjustHeap(array, 0); //重新调整大根堆
            }
            return array;
     }
    
     /**
       * 自顶向下调整以 i 为根的堆为大根堆
       * @param array
       * @param i
       */
    public static void adjustHeap(int[] array, int i) {
            int maxIndex = i;
            //如果有左子树,且左子树大于父节点,则将最大指针指向左子树
            if (2 * i + 1 < len && array[2 * i + 1] > array[maxIndex])
                maxIndex = 2 * i + 1;
            //如果有右子树,且右子树大于父节点,则将最大指针指向右子树
            if (2 * i + 2 < len && array[2 * i + 2] > array[maxIndex])
                maxIndex = 2 * i + 2;
            //如果父节点不是最大值,则将父节点与最大值交换,并且递归调整与父节点交换的位置。
            if (maxIndex != i) {
                swap(array, maxIndex, i);
                adjustHeap(array, maxIndex);
            }
     }
    
     /**
      * 自底向上构建初始大根堆
      * @param array
      */
     public static void buildMaxHeap(int[] array) {
            //从最后一个非叶子节点开始自底向上构造大根堆
            for (int i = (len - 2) / 2; i >= 0; i--) { 
                adjustHeap(array, i);
            }
     }

    8、计数排序(Counting Sort)

    计数排序不是基于比较的排序算法,其核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。 作为一种线性时间复杂度的排序,计数排序要求输入的数据必须是有确定范围的整数。

    8.1 算法描述

    • 找出待排序的数组中最大和最小的元素;
    • 统计数组中每个值为i的元素出现的次数,存入数组C的第i项;
    • 对所有的计数累加(从C中的第一个元素开始,每一项和前一项相加);
    • 反向填充目标数组:将每个元素i放在新数组的第C(i)项,每放一个元素就将C(i)减去1。

    8.2 动图演示

    8.3 代码实现

        /**
         * 计数排序
         *
         * @param array
         * @return
         */
        public static int[] CountingSort(int[] array) {
            if (array.length == 0) return array;
            int bias, min = Integer.MAX_VALUE, max = Integer.MIN_VALUE;
            for (int i = 0; i < array.length; i++) {
                max = Math.max(max, array[i]);
                min = Math.min(min, array[i]);
            }
           //计算偏移量,将 min ~ max 映射到 bucket 数组的 0 ~ (max - min) 位置上
            bias = -min; 
            int[] bucket = new int[max - min + 1];
            Arrays.fill(bucket, 0);
            for (int i = 0; i < array.length; i++) {
                bucket[array[i] + bias]++;
            }
            int index = 0, i = 0;
            while (index < array.length) {
                if (bucket[i] != 0) {
                    array[index] = i - bias;
                    bucket[i]--;
                    index++;
                } else
                    i++;
            }
            return array;
        }

    8.4 算法分析

    计数排序是一个稳定的排序算法。当输入的元素是 n 个 0到 k 之间的整数时,时间复杂度是O(n+k),空间复杂度也是O(n+k),其排序速度快于任何比较排序算法。当k不是很大并且序列比较集中时,计数排序是一个很有效的排序算法。

    9、桶排序(Bucket Sort)

    桶排序是计数排序的升级版。它利用了函数的映射关系,高效与否的关键就在于这个映射函数的确定。桶排序 (Bucket sort)的工作的原理:假设输入数据服从均匀分布,将数据分到有限数量的桶里,每个桶再分别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排)。

    9.1 算法描述

    • 设置一个定量的数组当作空桶;
    • 遍历输入数据,并且把数据一个一个放到对应的桶里去;
    • 对每个不是空的桶进行排序;
    • 从不是空的桶里把排好序的数据拼接起来。 

    9.2 图片演示

    9.3 代码实现

    public static int[] bucketSort(int[] array){
        int max = Integer.MIN_VALUE;
        int min = Integer.MAX_VALUE;
        for(int i = 0; i < array.length; i++){
            max = Math.max(max, array[i]);
            min = Math.min(min, array[i]);
        }
        
        /*桶映射函数:自己设计,要保证桶 i 的数均小于桶 j (i < j)的数,
          即必须桶间必须有序,桶内可以无序。这里桶映射函数为:(i - min) / arr.length*/
        int bucketNum = (max - min) / array.length + 1;
        ArrayList<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketNum);
        for(int i = 0; i < bucketNum; i++){
            bucketArr.add(new ArrayList<Integer>());
        }
        
        //将每个元素放入桶
        for(int i = 0; i < array.length; i++){
            int num = (array[i] - min) / (array.length);
            bucketArr.get(num).add(array[i]);
        }
        
        //对每个桶进行排序
        for(int i = 0; i < bucketArr.size(); i++){
            Collections.sort(bucketArr.get(i));
        }
        
       int k = 0;
       for(int i = 0; i < bucketArr.size(); i++){
          for(int j = 0;j < bucketArr.get(i).size();j++) {
               array[k++] = bucketArr.get(i).get(j);
          }
      }
      return array;
    }

    9.4 算法分析

    桶排序最好情况下使用线性时间O(n),桶排序的时间复杂度,取决与对各个桶之间数据进行排序的时间复杂度,因为其它部分的时间复杂度都为O(n)。很显然,桶划分的越小,各个桶之间的数据越少,排序所用的时间也会越少。但相应的空间消耗就会增大。 

    10、基数排序(Radix Sort)

    基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优先级排序。最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。

    10.1 算法描述

    • 取得数组中的最大数,并取得位数;
    • arr为原始数组,从最低位开始取每个位组成radix数组;
    • 对radix进行计数排序(利用计数排序适用于小范围数的特点);

    10.2 动图演示

    10.3 代码实现

    /**
         * 基数排序
         * @param array
         * @return
         */
    public static int[] RadixSort(int[] array) {
         if (array == null || array.length < 2)
            return array;
            // 1.先算出最大数的位数;
        int max = Integer.MIN_VALUE;
        for (int i = 0; i < array.length; i++) {
                max = Math.max(max, array[i]);
        }
        int maxDigit = 0;
        while (max != 0) {
                max /= 10;
                maxDigit++;
        }
        int div = 1;
        ArrayList<ArrayList<Integer>> bucketList = new ArrayList<ArrayList<Integer>>();
        for (int i = 0; i < 10; i++)
            bucketList.add(new ArrayList<Integer>());
            //2.进行maxDigit趟分配
        for (int i = 0; i < maxDigit; i++,div *= 10) {
                for (int j = 0; j < array.length; j++) {
                    int num = (array[j] / div) % 10;
                    bucketList.get(num).add(array[j]);
                }
            //3.收集
                int index = 0;
                for (int j = 0; j < bucketList.size(); j++) {
                    for (int k = 0; k < bucketList.get(j).size(); k++)
                        array[index++] = bucketList.get(j).get(k);
                    bucketList.get(j).clear();
                }
       }
       return array;
    }

    我的微信公众号:架构真经(id:gentoo666),分享Java干货,高并发编程,热门技术教程,微服务及分布式技术,架构设计,区块链技术,人工智能,大数据,Java面试题,以及前沿热门资讯等。每日更新哦!

    参考资料:

    1. https://www.jianshu.com/p/47170b1ced23
    2. https://blog.csdn.net/hellozhxy/article/details/79911867
    3. https://www.cnblogs.com/onepixel/articles/7674659.html
    4. https://www.cnblogs.com/hokky/p/8529042.html
  • 相关阅读:
    JSON跨域请求
    2013.9.26 心得体会
    MemCached用法
    使用SQL联合查询来构建临时vo对象的应用
    ubuntu 16.04 安装php 5 6等版本
    mac php版本切换
    windows 查看端口占用
    nginx 反向代理到目录
    linux挂在samba服务器到本地(用于备份文件到nas或者windows的文件服务器)
    ubuntu 加载新硬盘或分区
  • 原文地址:https://www.cnblogs.com/anymk/p/11479434.html
Copyright © 2020-2023  润新知