• 十大排序算法--多图预警


     

    十大排序算法

     

    简单的排序算法

    Θ(n^2)

    插入排序

    • 动画演示

     

    enter description here
    enter description here
    • 原理

      将数组看成两部分,一部分为已排序好的数组,后面的部分为未排序数组,每次从后面的数组中取出元素与前面的有序元素一一比较,若小于则向前移动,直到找到正确的位置插入。遍历后面的数组直到整个数组排序完成。

    • 代码

      // 准备工作,交换函数
      public static void exc(int[] a,int i, int j) {
              if (a[i]!=a[j]) {
                  a[i]^=a[j];
                  a[j]^=a[i];
                  a[i]^=a[j];
              }
          }
      // 插入排序
      public static void insertSort(int[] a, int n) {
              for (int i = 1; i < n; i++) {
                  for (int j = i; j>0&&a[j-1]>a[j]; j--) {
                      exc(a, j, j-1);
                  }
              }
          }
    • 分析

      时间复杂度

      • 平均: n×n/4 次比较,n×n/4 次交换
      • 最好: n-1 次比较,0次交换
      • 最坏: n×n/2 次比较, n×n/2 交换

      评价:

      ​ 插入排序与数组的逆序度有关,最好情况为 O(n),所以经常与快速排序一起出现,详见C语言的quickSort的实现

    冒泡排序

    • 动画演示

      enter description here

    • 原理

      就像泡泡一样,不断把大的数字往上浮,遍历完整个数组排序即完成。

    • 代码

      public static void bubbleSort(int[] a, int n) {
              boolean flag = true;
              for (int i = 0; i < n-1&&flag; i++) {
                  flag = false;
                  for (int j = 0; j < n-i-1; j++) {
                      if (a[j]>a[j+1]) {
                          exc(a, j, j+1);
                          flag=true;
                      }
                  }
              }
          }
    • 分析

      时间复杂度:

      • 平均情况下:冒泡比较的次数约是插入排序的两倍,移动次数一致。
      • 平均情况下: 冒泡比较的次数与选择排序是一样的,移动次数是O(n^2)。

    评价:

    大家也看到上述代码有个标记变量 flag,这是冒泡排序的一种改进,如果在第二次循环中没有发生交换说明排序已经完成,不需要再循环下去了。

    选择排序

    • 动画演示

      selectSort

    • 原理

      选择排序的原理很简单,就是从需要排序的数据中选择最小的(从小到大排序),然后放在第一个,选择第二小的放在第二个……

    • 代码

      // 选择排序,稳定
          public static void selectSort(int[] a,int n) {
              for (int i = 0; i < n; i++) {
                  int min=i;
                  for (int j = i+1; j < n; j++) {
                      if(a[min]>a[j]){
                          min = j;
                      }
                  }
                  if (min!=i) {
                      exc(a, i, min);
                  }
                  
              }
          }
    • 分析

      时间复杂度:

      • 比较的次数: (n-1)+(n-2)+...+1= n(n-1)/2

      • 交换的次数: n

      评价:

      • 运行时间与输入无关,因为前一次的操作,不能为后面提供信息
      • 数据的移动次数是最小的

    高效的比较排序算法

    Θ(nlog⁡n)

    希尔排序

    • 图片演示

      shellSort

    • 原理

      希尔排序是基于插入排序进行改进,又称之为递减增量排序。在前面中我们知道,插入排序是将小的元素往前挪动位置,并且每次只移动一个位置。那么希尔排序是怎么解决这个问题的呢?

      希尔排序的理念和梳排序的理念有点类似。在梳排序中,我们比较距离相差为step的两个元素来完成交换。在希尔排序中,我们的做法也是类似。我们在数组中每隔h取出数组中的元素,然后进行插入排序。当h=1时,则就是前面所写的插入排序了。

    • 代码

      // 6. 希尔排序
          public static void shellSort(int[] a, int n) {
              int h =1;
              while (h<n/3) {
                  // 数组 1,4,13,40...
                  h = h*3+1;
              }
              while (h>=1) {
                  for (int i = h; i < n; i++) {
                      for(int j=i;j>=h&&a[j-h]>a[j];j-=h){
                          exc(a, j, j-h);
                      }
                  }
                  h/=3;
              }
          }
    • 分析

      是第一个突破时间复杂度O(n^2)的算法
      思路--计算步长,对每次分组进行直接插入排序,减小逆序度
      算法时间复杂度在插入排序和快速排序之间

    快速排序

    • 动画演示

      quickSort

    • 原理

      快速排序使用了, Divide and Conquer (分治)策略,不断地把数组分为较大和较小的两个子序列,然后对每个子序列进行递归,直到不可再分。思路就是在拆分的同时进行排序归并排序不同。

    • 步骤:

      1. 挑选基准值:从数列中挑出一个元素,称为“基准”(pivot),

      2. 分割:重新排序数列,所有比基准值小的元素摆放在基准前面,所有比基准值大的元素摆在基准后面(与基准值相等的数可以到任何一边)。在这个分割结束之后,对基准值的排序就已经完成。

      3. 递归排序子序列:递归地将小于基准值元素的子序列和大于基准值元素的子序列排序。

      递归到最底部的判断条件是数列的大小是零或一,此时该数列显然已经有序。

    • 代码

      // 第一部分
          public static int partition(int[] a,int l,int h) {
              int mid = l+((h-l)>>1);
              int pivot = a[mid];
              exc(a, l, mid);
              int i = l;
              int j = h+1;
              while (true) {
                  while (a[++i]<pivot) {
                      if(i==h) break;
                  }
                  while (a[--j]>pivot) {
                      if(j==l) break;
                  }
                  if (i>=j) {
                      break;
                  }
                  exc(a, i, j);
              }
              exc(a, l, j);
              return j;
          }
          public static void quickSort(int[] a, int n) {
              quickSort(a, 0, n-1);
      
          }
          // 第二部分
          public static void quickSort(int[] a, int lo, int h) {
              if (lo>=h) {
                  return;
              }
              int j = partition(a, lo, h);
              quickSort(a, lo, j-1);
              quickSort(a, j+1, h);
          }
    • 分析

      快速排序的最坏时间复杂度为O(n^2),平均时间复杂度为 O(n logn),快速排序基本上被认为是比较排序算法中,平均性能最好的。多种语言皆实现了快速排序的类库。

    归并排序

    • 动画演示

      mergeSort

    • 原理

      采用分治法:

      • 分割:递归地把当前序列平均分割成两半。
      • 集成:在保持元素顺序的同时将上一步得到的子序列集成到一起(归并)。
      • 与快速排序不同的是,归并是拆分完成后,在合并阶段进行排序,而快速排序 是边拆分边排序
    • 代码

      // 第一部分 合并
          public static void merge(int[] a, int low, int mid, int high) {
              // 第一种写法
              int i = low;
              int j = mid + 1;
              int k = 0;
              int[] a2 = new int[high - low + 1];
              while (i <= mid && j <= high) {
                  if (a[i] < a[j]) {
                      a2[k] = a[i];
                      i++;
                      k++;
                  } else {
                      a2[k] = a[j];
                      j++;
                      k++;
                  }
              }
              while (i <= mid) {
                  a2[k] = a[i];
                  i++;
                  k++;
              }
              while (j <= high) {
                  a2[k] = a[j];
                  j++;
                  k++;
              }
              for (k = 0, i = low; i <= high; k++, i++) {
                  a[i] = a2[k];
              }
          }
      
      public static void mergeSort(int[] a, int n) {
              mergeSort(a, 0, n - 1);
          }
      // 第二部分 递归
      public static void mergeSort(int[] a, int low, int high) {
              if (low >= high)
                  return;
              int mid = (high + low) / 2;
              mergeSort(a, low, mid);
              mergeSort(a, mid + 1, high);
              merge(a, low, mid, high);
          }
    • 分析

      归并排序是一种稳定的且十分高效的排序。时间复杂度总是 O(nlogn),不论好坏,但缺点是,它不是原地排序,占用额外的空间,空间复杂度为 O(n)

    堆排序

    • 动画演示

      heapSort

    • 原理

      堆排序是借助这一数据结构实现的排序

      heap

      我们利用大顶堆(堆顶元素最大)实现排序,在一个堆中,位置k的结点的父元素的位置是(k+1)/2-1,而它的两个子节点的位置分别是2k+12k+2,这样我们就可以通过计算数组的索引在树中上下移动。

      思路: 不断把堆顶的元素与最后的元素交换位置,重新堆化,不断得到第k(=1,2,3...)大的元素。相当于一个将大的元素 sink(下沉) 的过程。

    • 代码

      // 建堆
      public static void buildHeap(int[] a, int n) {
              for (int i = n / 2; i >= 0; i--) {
                  heapify(a, n - 1, i);
              }
          }
      // 堆化
      public static void heapify(int[] a, int n, int i) {
              while (true) {
                  int maxPos = i;
                  if (i * 2 + 1 <= n && a[i] < a[2 * i + 1]) {
                      maxPos = i * 2 + 1;
                  }
                  if (i * 2 + 2 <= n && a[maxPos] < a[i * 2 + 2]) {
                      maxPos = i * 2 + 2;
                  }
                  if (i == maxPos) {
                      break;
                  }
                  exc(a, i, maxPos);
                  i = maxPos;
              }
          }
      
      public static void heapSort(int[] a, int n) {
              buildHeap(a, n);
              int k = n - 1;
              while (k > 0) {
                  // 交换堆顶元素,把第1,2,3...大元素放到底部
                  exc(a, 0, k);
                  --k;
                  heapify(a, k, 0);
              }
          }
    • 分析

      • 时间复杂度一直都是 O(nlogn),不论最好最坏情况。
      • 缺点:
        1. 不稳定算法
        2. 堆排序的每次排序其数组逆序度都比其他算法高
        3. 对内存访问不友好(不连续)

    牺牲空间的线性排序算法

    Θ(n)

    计数排序

    • 动画演示

      countSort

    • 原理

      计数排序使用一个额外的数组C,其中 C 中第i个元素是待排序数组A中值等于i的元素的个数。然后根据数组C 来将A中的元素排到正确的位置。

      tips:当然,如果数据比较集中的话,我们大可不必创建那么大的数组,我们找出最小和最大的元素,以最小的元素作为基底以减小数组的大小。

    • 代码

      // 非比较排序
          public static void countSort(int[] a, int n) {
              int max = a[0];
              for (int i = 0; i < n; i++) {
                  if (a[i] > max) {
                      max = a[i];
                  }
              }
              int[] c = new int[max + 1];
              int indexArray = 0;
              for (int i = 0; i < n; i++) {
                  c[a[i]]++;
              }
              for (int i = 0; i <= max; i++) {
                  if (c[i] != 0) {
                      a[indexArray] = i;
                      c[i]--;
                      indexArray++;
                  }
              }
          }

    桶排序

    • 图片演示

      bucket

    • 原理

      桶排序的基本思想是假设数据在[min,max]之间均匀分布,其中min、max分别指数据中的最小值和最大值。那么将区间[min,max]等分成n份,这n个区间便称为n个桶。将数据加入对应的桶中,然后每个桶内单独排序。由于桶之间有大小关系,因此可以从大到小(或从小到大)将桶中元素放入到数组中。

    • 代码

      public static void bucketSort(int[] a, int n, int bucketSize) {
              int max = a[0];
              int min = a[1];
              for (int v : a) {
                  if (v > max) {
                      max = v;
                  } else if (v < min) {
                      min = v;
                  }
              }
      
              // 桶的大小
              int bucketCount = (max - min) / bucketSize + 1;
              int bucket[][] = new int[bucketCount][bucketSize];
              int indexArr[] = new int[bucketCount];
              // 将数字放到对应的桶中
              for (int v : a) {
                  int j = (v - min) / bucketSize;
                  if (indexArr[j] == bucket[j].length) {
                      ensureCapacity(bucket, j);
                  }
                  bucket[j][indexArr[j]++] = v;
              }
              // 每个桶快排
          	// 也可以使用插入保证稳定性
              int k = 0;
              for (int i = 0; i < bucketCount; i++) {
                  if (indexArr[i] == 0) {
                      continue;
                  }
                  quickSort(bucket[i], indexArr[i]);
                  for (int j = 0; j < indexArr[i]; j++) {
                      a[k++] = bucket[i][j];
                  }
              }
      
          }
      
          // 扩容函数
          private static void ensureCapacity(int[][] bucket, int j) {
              int[] tempArr = bucket[j];
              int[] newArr = new int[tempArr.length * 2];
              for (int k = 0; k < tempArr.length; k++) {
                  newArr[k] = tempArr[k];
              }
              bucket[j] = newArr;
          }
    • 分析

      桶排序是线性排序的一种,桶排序的核心就是根据数据的范围 (m) ,把数据 (大小为n),尽可能均匀得放到 K个桶里,每个桶再各自实现排序,然后把桶从小到大的列出来,即完成排序。

      • 时间复杂度 O(N+C),其中C=N*(logN-logK),空间复杂度为 O(N+K)
      • 更适用于外部排序,尤其是当 N很大,而M较小时,比如高考排名,分数是固定的,从 0-750分,考生人数很多,用桶排序就能很快得出排名。

    基数排序

    • 动画演示

      radixSort

    • 原理

      在日常的使用中,我们接触基数排序比较少,它也是桶排序的一种变形

      它的具体实现分为 LSD (Least sgnificant digital) , MSD (Most sgnificant digital) 两种方法,上面的演示是第一种(LSD),从低位到高位,根据每一位上的数字将元素放入桶中,再按顺序取出,直到比较完最高位,完成排序。

    • 代码

      /**
           * 
           * @param x  每一位上的值
           * @param d  第d位
           * @param dg 辅助数组
           * @return 对应的桶的标号
           */
          public static int getDigit(int x, int d, int[] dg) {
              return (x / dg[d - 1] % 10);
          }
      
          /**
           * 
           * @param a 待排序数组
           * @param n 数组长度
           */
          public static void radixSort(int[] a, int n) {
              // 最大的数
              int max = 0;
              int j = 0, i = 0;
              // 默认十进制
              final int radix = 10;
              for (int val : a) {
                  if (val > max) {
                      max = val;
                  }
              }
              // 求最大位数
              int N;
              if (max == 0) {
                  N = 1;
              } else {
                  N = (int) Math.log10(max) + 1;
              }
              // 设置辅助数组
              int dg[] = new int[N + 1];
              for (i = 1, dg[0] = 1; i < N + 1; i++) {
                  dg[i] = 10 * dg[i - 1];
              }
              // 初始化桶
              int bucket[][] = new int[radix][n];
              int indexArr[] = new int[radix];
              for (int d = 1; d <= N; d++) {
                  for (int var : a) {
                      j = getDigit(var, d, dg);
                      bucket[j][indexArr[j]++] = var;
                  }
                  int count = 0;
                  for (i = 0; i < radix; i++) {
                      if (indexArr[i] != 0) {
                          for (int k = 0; k < indexArr[i]; k++) {
                              a[count++] = bucket[i][k];
                          }
                          indexArr[i] = 0;
                      }
                  }
              }
          }
    • 分析

      时间复杂度为 O(k*n),空间复杂度为O(n),当处理较大(位数多)的数字排序时,比计数排序更好用。

    综合分析

    1. 我们可以看出基于比较的排序算法,他的时间复杂度的最好上界是逼近 O(nlogn) 的,这是因为,比较排序可以看成是决策树,而数组共有 n! 种排列方式,根据 斯特林公式 比较排序的时间复杂度的最好上界是接近于 nlogn的

    2. 我们可以看出基于非比较排序的线性时间排序的思路,大致相同,都是找到与元素匹配的桶,完成排序。都是空间换时间的思想。

      文章最后,感谢大家的阅读,文中若有错漏之处,请在留言区积极指出,十分欢迎大家一起交流讨论!

      另外感谢朋友们的支持友情链接

  • 相关阅读:
    软考
    十步走-阅读笔记
    软著申请
    十步走-阅读笔记
    基于Ubuntu安装部署ZooKeeper
    基于Ubuntu安装JDK(OPenJDK8)
    Intern Day89
    阿里巴巴Java研发工程师技术一面
    面试
    6_moc.md
  • 原文地址:https://www.cnblogs.com/jiaweixie/p/11286968.html
Copyright © 2020-2023  润新知