数据结构与算法—排序（冒泡排序，选择排序，插入排序、希尔排序、快速排序、归并排序）

数据结构与算法—排序（冒泡排序，选择排序，插入排序、希尔排序、快速排序、归并排序）
排序

排序算法（英语：Sorting algorithm）是一种能将一串数据依照特定顺序进行排列的一种算法。

排序算法的稳定性

稳定性：稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的，当有两个相等键值的纪录R和S，且在原本的列表中R出现在S之前，在排序过的列表中R也将会是在S之前。
假设以下的数对将要以他们的第一个数字来排序。
```
(4, 1)  (3, 1)  (3, 7)（5, 6）
```
在这个状况下，有可能产生两种不同的结果，一个是让相等键值的纪录维持相对的次序，而另外一个则没有：
```
(3, 1)  (3, 7)  (4, 1)  (5, 6)  （维持次序, 稳定排序）  
(3, 7)  (3, 1)  (4, 1)  (5, 6)  （次序被改变，不稳定排序）   
```
1. 冒泡排序

冒泡排序（英语：Bubble Sort）是一种简单的排序算法。它重复地遍历要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。

冒泡排序算法的运作如下：
- 比较相邻的元素。如果第一个比第二个大（升序），就交换他们两个。
- 对每一对相邻元素作同样的工作，从开始第一对到结尾的最后一对。这步做完后，最后的元素会是最大的数。
- 针对所有的元素重复以上的步骤，除了最后一个。
- 持续每次对越来越少的元素重复上面的步骤，直到没有任何一对数字需要比较。
（1）分析

交换过程图示(第一次)：

那么我们需要进行n-1次冒泡过程，每次对应的比较次数如下图所示：

（2）代码实现
```
def bubble_sort(alist):
    """冒泡排序法"""
    # 冒泡排序法需要进行n-1次冒泡过程  
    # 每一次需要比较的次数分别为：n-1,n-2,n-3,...,1
    for j in range(len(alist)-1,0,-1):
        for i in range(j):
            if alist[i] > alist[i+1]:
                alist[i],alist[i+1] = alist[i+1],alist[i]  

li = [54,26,93,17,77,31,44,55,20]
bubble_sort(li)
print(li)
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
改进

有时候序列本身就可能已部分或全部排好序，不需要全部遍历交换一遍。如果没有遍历完就提前完成排序，可以直接退出。
思路是，可以对每一次冒泡过程的交换次数做个计数，若某个过程的交换次数已为0，则该子序列已经完成排序，则更小的子序列也一样是排好序的。
```
def bubble_sort(alist):
    """冒泡排序法的改进"""
    # 冒泡排序法需要进行n-1次冒泡过程  
    # 每一次需要比较的次数分别为：n-1,n-2,n-3,...,1  
    for j in range(len(alist)-1,0,-1):
        # 对每一次冒泡过程的交换次数计数
        count = 0 
        for i in range(j):
            if alist[i] > alist[i+1]:
                alist[i],alist[i+1] = alist[i+1],alist[i]  
                count += 1
        # 若还未遍历完全部冒泡过程就完成了排序，则可以提前退出
        if count == 0:
            break
                

li = [54,26,93,17,77,31,44,55,20]
bubble_sort(li)
print(li)
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
（3）时间复杂度
- 最优时间复杂度：(O(n)) （表示遍历一次发现没有任何可以交换的元素，排序结束。改进法可以做到）
- 最坏时间复杂度：(O(n^2))
- 稳定性：稳定
2. 选择排序

选择排序（Selection sort）是一种简单直观的排序算法。它的工作原理如下。首先在未排序序列中找到最小（大）元素，存放到未排序序列的起始位置，然后，再从剩余未排序元素中继续寻找最小（大）元素，然后放到剩下的未排序序列的起始位置。以此类推，直到所有元素均排序完毕。

选择排序和冒泡排序的区别：
选择排序与冒泡排序都遍历未排序的元素进行比较，因此比较容易混淆。选择排序与冒泡排序的区别在于每一轮遍历比较未排序序列时，冒泡排序两两比较，最多可能交换n-1次位置，从而把最大值放到未排序序列尾部；而选择排序是两辆比较时不改变元素位置，只记录下未排序序列中最小值下标，最后最多只交换1次位置（最小值与未排序序列首交换位置）。

（1）分析

（2）代码
```
def select_sort(alist):
    """选择排序"""
    n = len(alist)
    # 注意边界值，可以画图理解
    for i in range(n-1):
        # min代表最小元素的下表，初始化取还未排序的第一个值
        min = i
        for j in range(i+1,n):
            # 将最小元素与未排序的元素比较，若存在小于min下标对应的值，则更新min下标
            if alist[min] > alist[j]:
                min = j
        # 将 未排序元素的第一个值 与 未排序元素中的最小值 交换位置
        if min != i:
            alist[i],alist[min] = alist[min],alist[i]
li = [54,26,93,17,77,31,44,55,20]
select_sort(li)
print(li)
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
（3）复杂度
- 最优时间复杂度：O(n2)
- 最坏时间复杂度：O(n2)
- 稳定性：不稳定（考虑升序每次选择最大的情况）
3. 插入排序

插入排序（英语：Insertion Sort）是一种简单直观的排序算法。它的工作原理是通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。插入排序在实现上，在从后向前扫描过程中，需要反复把已排序元素逐步向后挪位，为最新元素提供插入空间。

(2) 分析

（2）代码
```
def insert_sort(alist):
    """插入排序"""
    n = len(alist)
    # 从第二个位置，即下标为1的元素开始向前插入
    for i in range(1, n):
        # 从第i个元素开始向前比较，如果小于前一个元素，交换位置
        for j in range(i,0,-1):
            if alist[j] < alist[j-1]:
                alist[j], alist[j-1] = alist[j-1], alist[j]
                
li = [54,26,93,17,77,31,44,55,20]
insert_sort(li)
print(li)
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
改进
- 当alist[j] < alist[j-1] 需要交换位置
- 但是当alist[j] > alist[j-1]时，由于j-1之前都是有序的，即alist[j] 会大于alist[j-1]前的所有数，所以可以提前退出。
```
def insert_sort(alist):
    """插入排序"""
    n = len(alist)
    # 从第二个位置，即下标为1的元素开始向前插入
    for i in range(1, n):
        # 从第i个元素开始向前比较，如果小于前一个元素，交换位置
        for j in range(i,0,-1):
            if alist[j] < alist[j-1]:
                alist[j], alist[j-1] = alist[j-1], alist[j]
            else:
                break
                
li = [54,26,93,17,77,31,44,55,20]
insert_sort(li)
print(li)
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
（3）时间复杂度
- 最优时间复杂度：O(n) （升序排列，序列已经处于升序状态）
- 最坏时间复杂度：O(n2)
- 稳定性：稳定
4.希尔排序

希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序，是直接插入排序算法的一种更高效的改进版本。

希尔排序的基本思想是：将数组列在一个表中并对列分别进行插入排序，重复这过程，不过每次用更长的列（步长更长了，列数更少了）来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法，算法本身还是使用数组进行排序。

例如，假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ]，如果我们以步长为5开始进行排序，我们可以通过将这列表放在有5列的表中来更好地描述算法，这样他们就应该看起来是这样(竖着的元素是步长组成)：
```
13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10
```
然后我们对每列进行排序：
```
10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45
```
将上述四行数字，依序接在一起时我们得到：[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ]。这时10已经移至正确位置了，然后再以3为步长进行排序：
```
10 14 73
25 23 13
27 94 33
39 25 59
94 65 82
45
```
排序之后变为：
```
10 14 13
25 23 33
27 25 59
39 65 73
45 94 82
94
```
最后以1步长进行排序（此时就是简单的插入排序了）

(1) 分析

（2）代码
```
def shell_sort(alist):
    n=len(alist)
    gap = n //2
    while gap >0:
        # 各个小组以gap为界，gap后的元素开始向前插入
        for i in range(gap, n):
            # 从第i个元素开始向前比较，如果小于前一个元素（相距gap），交换位置
            for j in range(i, 0, -gap):
                if alist[j] < alist[j-gap]:
                    alist[j], alist[j-gap] = alist[j-gap], alist[j]
                else:
                    break
        # 缩短gap长度
        gap = gap //2

alist = [54,26,93,17,77,31,44,55,20]
shell_sort(alist)
print(alist)
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
（3）时间复杂度
- 最优时间复杂度：根据步长序列的不同而不同
- 最坏时间复杂度：O(n2)
- 稳定想：不稳定
5.快速排序

快速排序（英语：Quicksort），又称划分交换排序（partition-exchange sort），通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

1.分析

2.代码
```
def quick_sort(alist, start, end):
    """快速排序算法"""
    # 递归的终止条件
    if start >= end:
        return
    # 定义两个指针分别初始化指向要排序序列的首尾
    low = start
    high = end
    mid = alist[start]
    # 当low和high没有重叠的时候，需要不断比较
    while low < high:
        while low<high and alist[high]>=mid:
            high -= 1
        alist[low] = alist[high]
        while low<high and alist[low]<mid:
            low += 1
        alist[high]=alist[low]
    # 此时low和high指向同一个位置，即为mid所在位置
    alist[low] = mid
    # 递归调用
    quick_sort(alist,start,low-1)
    quick_sort(alist,low+1,end)
    
alist = [54,26,93,17,77,31,44,55,20]
quick_sort(alist,0,len(alist)-1)
print(alist)   
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
3.时间复杂度

分析思路：

（1）首先，每次分成两部分分别进行排序，是分区运算，数组的元素都会在每次循环中走访过一次，因此每一层合起来的复杂度都为o(n)
（2）然后，一个长为n的序列，每次分为两部分，最终每部分都分为只有1个元素。要计算多少层？
最好情况为log(n),即每次恰好都是对半分，n/(2^x)=1 -> x=logn。最坏情况为n，即每次分为的两部分都为首个元素和其他。

因此，总的时间复杂度为：
- 最优时间复杂度：O(nlogn)
- 最坏时间复杂度：O(n2)
- 稳定性：不稳定
6.归并排序

归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组，再合并数组。

将数组分解最小之后，然后合并两个有序数组，基本思路是比较两个数组的最前面的数，谁小就先取谁，取了后相应的指针就往后移一位。然后再比较，直至一个数组为空，最后把另一个数组的剩余部分复制过来即可。

(1)代码
```
def merge_sort(alist):
    # 递归终止条件
    n = len(alist)
    if n<=1:
        return alist
    mid = n//2
    left = merge_sort(alist[:mid])
    right = merge_sort(alist[mid:])
    # 定义两个指针，分别初始化指向左右两个列表的首个元素
    l, r = 0, 0
    # 初始化返回结果
    result = []
    while l <len(left) and r<len(right):
        if left[l] <= right[r]:
            result.append(left[l])
            l += 1
        else:
            result.append(right[r])
            r += 1
    result += left[l:]
    result += right[r:]
    return result
            
alist = [54,26,93,17,77,31,44,55,20]
sorted_alist = merge_sort(alist)
print(sorted_alist)       
```
```
[17, 20, 26, 31, 44, 54, 55, 77, 93]
```
（2）时间复杂度

分析思路：
跟快排类似
（1）首先，每一层都分组进行合并排序，数组的元素都会在每次循环中走访过一次，因此每一层合起来的复杂度都为o(n)
（2）然后，每一层都是二分数组，n/(2^x) =1,x=logn，因此一共有logn层
因此，总的时间复杂度为：
- 最优时间复杂度：O(nlogn)
- 最坏时间复杂度：O(nlogn)
- 稳定性：稳定
注意：虽然归并排序的时间复杂度较低，但是算法会返回一个新的列表，需要额外的内存开销，因此所占用的内存会高一些。

7. 常见排序算法效率比较
相关阅读:
Dos命令大全（收藏）
asp.net读写Cookies
asp.net文件下载
 使用存储过程分页
 （十）死锁检测算法
 poj1664
一席话惊醒梦中人
 深入了解scanf()/getchar()和gets()/cin等函数
 小结《malloc与new之区别》
（六）文件管理
原文地址：https://www.cnblogs.com/laiyaling/p/13912195.html

数据结构与算法—排序（冒泡排序，选择排序，插入排序、希尔排序、快速排序、归并排序）

排序

排序算法的稳定性

1. 冒泡排序

（1）分析

（2）代码实现

改进

（3）时间复杂度

2. 选择排序

（1）分析

（2）代码

（3）复杂度

3. 插入排序

(2) 分析

（2）代码

改进

（3）时间复杂度

4.希尔排序

(1) 分析

（2）代码

（3）时间复杂度

5.快速排序

1.分析

2.代码

3.时间复杂度

6.归并排序

(1)代码

（2）时间复杂度

7. 常见排序算法效率比较