各种排序算法时间复杂度、稳定性、初始序列是否对元素比较次数有关

各种排序算法时间复杂度、稳定性、初始序列是否对元素比较次数有关
怎么记忆稳定性：

总过四大类排序：插入、选择、交换、归并（基数排序暂且不算）

比较高级一点的（时间复杂度低一点得）shell排序，堆排序，快速排序（除了归并排序）都是不稳定的，在加上低一级的选择排序是不稳定的。

比较低级一点的（时间复杂度高一点的）插入排序，冒泡排序，归并排序，基数排序都是稳定的。

（4种不稳定，4种稳定）。

怎么记忆初始序列是否对元素的比较次数有关：

[cpp] view plain copy
1. /**
2. * @brief 严版数据结构书代码
3. * 最好的情况,数组本身有序，就只需执行n-1次比较，此时时间复杂度为O(n);
4. * 最坏的情况，数组本身逆序，要执行n(n-1)/2次，此时时间复杂度为O(n^2);
5. */
6. void _insertSort(int R[], int n)
7. {
8. int i, j, temp;
9. for ( i = 1; i < n; ++i ) {
10. if ( R[i] < R[i - 1] ) {//将R[i]插入有序字表
11. temp = R[i]; //设置哨兵
12. for ( j = i - 1; R[j] > temp; --j ) {
13. R[j+1] = R[j];
14. }
15. R[j+1] = temp;
16. }
17. }
18. }
对于直接插入排序:

当最好的情况，如果原来本身就是有序的，比较次数为n-1次（分析（while (j >= 0 && temp < R[j])）这条语句）,时间复杂度为O(n)。

当最坏的情况，原来为逆序，比较次数为2+3+...+n=(n+2)(n-1)/2次，而记录的移动次数为i+1(i=1,2...n)=(n+4)(n-1)/2次。

如果序列是随机的，根据概率相同的原则，平均比较和移动的次数为n^2/4.

[cpp] view plain copy
1. /**
2. * @brief 严版数据结构选择排序
3. * 采用"选择排序"对长度为n的数组进行排序,时间复杂度最好，最坏都是O(n^2)
4. * 当最好的时候，交换次数为0次，比较次数为n(n-1)/2
5. * 最差的时候，也就初始降序时，交换次数为n-1次，最终的排序时间是比较与交换的次数总和，
6. * 总的时间复杂度依然为O(n^2)
7. */
8. void _selectSort(int R[], int n)
9. {
10. int i, j, temp, index;
11. for ( i = 0; i < n; ++i ) {
12. index = i;
13. for ( j = i + 1; j < n; ++j ) {
14. if ( R[index] > R[j] ) {
15. index = j;//index中存放关键码最小记录的下标
16. }
17. }
18. if (index != i) {
19. temp = R[i];
20. R[i] = R[index];
21. R[index] = temp;
22. }
23. }
24. }
选择排序不关心表的初始次序，它的最坏情况的排序时间与其最佳情况没多少区别，其比较次数都为 n(n-1)/2，交换次数最好的时候为0，最差的时候为n-1，尽管和冒泡排序同为O(n)，但简单选择排序性能上要优于冒泡排序。但选择排序可以非常有效的移动元素。因此对次序近乎正确的表，选择排序可能比插入排序慢很多。

[cpp] view plain copy
1. /**
2. * @brief 改进的冒泡排序
3. * @attention 时间复杂度，最好的情况，要排序的表本身有序，比较次数n-1,没有数据交换,时间复杂度O(n)。
4. * 最坏的情况，要排序的表本身逆序，需要比较n(n-1)/2次，并做等数量级的记录移动，总时间复杂度为O(n^2).
5. */
6. void bubbleSort2(int R[], int n)
7. {
8. int i, j, temp;
9. bool flag = TRUE; //flag用来作为标记
11. for ( i = 0; i < n && flag; ++i ) {
12. flag = FALSE;
13. for ( j = n - 1; j > i; --j ) {
14. if (R[j] < R[j - 1]) {
15. temp = R[j];
16. R[j] = R[j - 1];
17. R[j - 1] = temp;
18. flag = TRUE;//如果有数据交换，则flag为true
19. }
20. }
21. }
22. }
冒泡排序：

最好的情况，n-1次比较，移动次数为0，时间复杂度为O(n)。

最坏的情况，n(n-1)/2次比较，等数量级的移动，时间复杂度为O(O^2)。

[cpp] view plain copy
1. /**
2. * @brief 希尔排序, 对于长度为n的数组,经过 "希尔排序" 输出
3. */
4. void shellSort(int R[], int n)
5. {
6. int i, j, temp;
7. int k = n / 2;
8. while (k >= 1) {
9. for (i = k; i < n; ++i) {
10. temp = R[i];
11. j = i - k;
12. while (R[j] < temp && j >= 0) {
13. R[j+k] = R[j];
14. j = j - k;
15. }
16. R[j+k] = temp;
17. }
18. k = k / 2;
19. }
希尔排序初始序列对元素的比较次数有关。

[cpp] view plain copy
1. /**
2. * @brief 构建大顶堆
3. * @attention 个人版本，堆排序
4. */
5. void heapAdjust(int R[], int start, int end)
6. {
7. int j, temp;
8. temp = R[start];
9. for ( j = 2 * start + 1; j <= end; j = j * 2 + 1 ) {
11. if ( j < end && R[j] < R[j + 1] ) {
12. ++j;
13. }
14. if ( temp > R[j] ) {
15. break;
16. }
17. R[start] = R[j];
18. start = j;
19. }
20. R[start] = temp;
21. }
23. /**
24. * @brief 堆排序
25. * @param R为待排序的数组，size为数组的长度
26. * 时间复杂度:构建大(小)顶堆，完全二叉树的高度为log(n+1)，因此对每个结点调整的时间复杂度为O(logn)
27. * 两个循环，第一个循环做的操作次数为n/2，第二个操作次数为(n-1)，因此时间复杂度为O(nlogn)
28. */
29. void heapSort(int R[], int size)
30. {
31. int i, temp;
32. for ( i = size / 2 - 1; i >= 0; --i ) {
33. heapAdjust(R, i, size);
34. }
35. for ( i = size - 1; i >= 0; --i ) {
36. temp = R[i];
37. R[i] = R[0];
38. R[0] = temp;//表尾和表首的元素交换
39. heapAdjust(R, 0, i - 1);//把表首的元素换成表尾的元素后，重新构成大顶堆，因为除表首的元素外，
40. //后面的结点都满足大顶堆的条件，故heapAdjust()的第二个参数只需为0
41. }
42. }
[cpp] view plain copy
1. /**
2. * @brief 将有序的长度为n的数组a[]和长度为m的b[]归并为有序的数组c[]
3. * 只要从比较二个数列的第一个数，谁小就先取谁，取了之后在对应的数列中删除这个数。
4. * 然后再进行比较，如果有数列为空，那直接将另一个数列的数据依次取出即可。
5. * 将两个有序序列a[first...mid]和a[mid...last]合并
6. */
7. void mergeArray(int a[], int first, int mid, int last, int tmp[])
8. {
9. int i = first, j = mid + 1;
10. int k = 0;
11. while ( i <= mid && j <= last ) {
12. if ( a[i] <= a[j] )
13. tmp[k++] = a[i++];
14. else
15. tmp[k++] = a[j++];
16. }
17. while ( i <= mid ) {
18. tmp[k++] = a[i++];
19. }
20. while ( j <= last ) {
21. tmp[k++] = a[j++];
22. }
23. for (i = 0; i < k; i++) {//这里千万不能丢了这个
24. a[first + i] = tmp[i];
25. }
26. }
27. /**
28. * @brief 归并排序，其的基本思路就是将数组分成二组A，B，如果这二组组内的数据都是有序的，
29. * 那么就可以很方便的将这二组数据进行排序。如何让这二组组内数据有序了？
31. * 可以将A，B组各自再分成二组。依次类推，当分出来的小组只有一个数据时，
32. * 可以认为这个小组组内已经达到了有序，然后再合并相邻的二个小组就可以了。这样通过先 (递归) 的分解数列，
33. * 再 (合并) 数列就完成了归并排序。
34. */
35. void mergeSort(int a[], int first, int last, int tmp[])
36. {
37. int mid;
38. if ( first < last ) {
39. mid = ( first + last ) / 2;
40. mergeSort(a, first, mid, tmp); //左边有序
41. mergeSort(a, mid + 1, last, tmp); //右边有序
42. mergeArray(a, first, mid, last, tmp);
43. }
44. }
[cpp] view plain copy
1. /**
2. * @brief 虽然快速排序称为分治法，但分治法这三个字显然无法很好的概括快速排序的全部步骤。
3. * 因此我的对快速排序作了进一步的说明：挖坑填数+分治法：
4. * @param R为待排数组，low和high为无序区
5. * 时间复杂度：最好O(nlogn),最坏O(n^2)，平均O(nlogn)，空间复杂度O(logn)；
6. */
7. void quickSort(int R[], int low, int high)
8. {
9. if ( low < high ) {
10. int i = low, j = high, temp = R[low];
12. while ( i < j ) {
13. //从右往左扫描，如果数组元素大于temp，则继续，直至找到第一个小于temp的元素
14. while ( i < j && R[j] >= temp ) {
15. --j;
16. }
17. if ( i < j ) {
18. R[i++] = R[j];
19. }
20. while ( i < j && R[i] <= temp ) {
21. ++i;
22. }
23. if ( i < j ) {
24. R[j--] = R[i];
25. }
26. }
27. R[i] = temp;
28. quickSort(R, low, i - 1);
29. quickSort(R, i + 1, high);
30. }
31. }
各排序算法整体分析

冒泡排序、插入排序、希尔排序以及快速排序对数据的有序性比较敏感，尤其是冒泡排序和插入排序；

选择排序不关心表的初始次序，它的最坏情况的排序时间与其最佳情况没多少区别，其比较次数为 n(n-1)/2，但选择排序可以   非常有效的移动元素。因此对次序近乎正确的表，选择排序可能比插入排序慢很多。

冒泡排序在最优情况下只需要经过n-1次比较即可得出结果（即对于完全正序的表），最坏情况下也要进行n(n-1)/2 次比较，与选择排序的比较次数相同，但数据交换的次数要多余选择排序，因为选择排序的数据交换次数顶多为 n-1，而冒泡排序最坏情况下的数据交换n(n-1)/2 。冒泡排序不一定要进行趟，但由于它的记录移动次数较多，所以它的平均时间性能比插入排序要差一些。

插入排序在最好的情况下有最少的比较次数，但是它在元素移动方面效率非常低下，因为它只与毗邻的元素进行比较，效率比较低。

希尔排序实际上是预处理阶段优化后的插入排序，一般而言，在比较大时，希尔排序要明显优于插入排序。

快速排序采用的“大事化小，小事化了”的思想，用递归的方法，将原问题分解成若干规模较小但与原问题相似的子问题进行求解。快速算法的平均时间复杂度为O(nlogn) ，平均而言，快速排序是基于关键字比较的内部排序算法中速度最快者；但是由于快速排序采用的是递归的方法，因此当序列的长度比较大时，对系统栈占用会比较多。快速算法尤其适用于随机序列的排序。

因此，平均而言，对于一般的随机序列顺序表而言，上述几种排序算法性能从低到高的顺序大致为：冒泡排序、插入排序、选择排序、希尔排序、快速排序。但这个优劣顺序不是绝对的，在不同的情况下，甚至可能出现完全的性能逆转。

对于序列初始状态基本有正序，可选择对有序性较敏感的如插入排序、冒泡排序、选择排序等方法

对于序列长度比较大的随机序列，应选择平均时间复杂度较小的快速排序方法。

各种排序算法都有各自的优缺点，适应于不同的应用环境，因此在选择一种排序算法解决实际问题之前，应当先分析实际问题的类型，再结合各算法的特点，选择一种合适的算法

这里特别介绍下快速排序：

快速排序的时间主要耗费在划分操作上，对长度为k的区间进行划分，需要k-1次关键字比较。

（1）最坏的时间复杂度

最坏情况是每次划分选取的基准都是当前无序区中关键字最小（或最大）的记录，划分的结果是基准左边的子区间为空（或右边的子区间为空），而划分所得的另一个非空的子区间中记录数目，仅仅比划分前的的无序区中记录个数减少一个。

    因此，快速排序必须做n-1次划分，第i次划分开始区间长度为n-i+1,所需的比较次数为n-i(1<=i<=n-1),故总的比较次数达到最大值：n(n-1)/2；

    如果按上面给出的划分算法，每次取当前无序区的第1个记录为基准，那么当文件的记录已按递增序(或递减序)排列时，每次划分所取的基准就是当前无序区中关键字最小(或最大)的记录，则快速排序所需的比较次数反而最多。

（2）最坏的时间复杂度

在最好情况下，每次划分所取的基准都是当前无序区的"中值"记录，划分的结果是基准的左、右两个无序子区间的长度大致相等。总的关键字比较次数：

        0(nlgn)

（3）平均时间复杂度

    尽管快速排序的最坏时间为O(n2)，但就平均性能而言，它是基于关键字比较的内部排序算法中速度最快者，快速排序亦因此而得名。它的平均时间复杂度为O(nlgn)。

（4）空间复杂度

    快速排序在系统内部需要一个栈来实现递归。若每次划分较为均匀，则其递归树的高度为O(lgn)，故递归后需栈空间为O(lgn)。最坏情况下，递归树的高度为O(n)，所需的栈空间为O(n)。

转载：http://blog.csdn.net/hr10707020217/article/details/10581371
相关阅读:
Linux 环境变量
 sharepoint webapp 部署注意点
 如何让html中的td文字只显示部分
 作业服务笔记
 HBase全分布安装配置
 CentOS Hadoop安装配置详细
 WCF访问超时：HTTP 请求已超过xx:yy分配的超时。为此操作分配的时间可能是较长超时的一部分。
Apache Spark支持三种分布式部署方式 standalone、spark on mesos和 spark on YARN区别
 ext3文件系统挂载优化--HBase
CentOS安装HBase
原文地址：https://www.cnblogs.com/datascientist/p/3520112.html