八大排序算法python实现

一、概述

排序有内部排序和外部排序，内部排序是数据记录在内存中进行排序，而外部排序是因排序的数据很大，一次不能容纳全部的排序记录，在排序过程中需要访问外存。

我们这里说说八大排序就是内部排序。

当n较大，则应采用时间复杂度为O(nlog2n)的排序方法：快速排序、堆排序或归并排序序。

快速排序：是目前基于比较的内部排序中被认为是最好的方法，当待排序的关键字是随机分布时，快速排序的平均时间最短；

unsortedList=[55, 91, 63, 71, 72, 7, 74, 16, 4, 31, 100, 51, 94, 35, 49, 46, 43, 59, 18, 17]

二、算法实现

1.插入排序——直接插入排序(Straight Insertion Sort)

基本思想:

将一个记录插入到已排序好的有序表中，从而得到一个新，记录数增1的有序表。即：先将序列的第1个记录看成是一个有序的子序列，然后从第2个记录逐个进行插入，直至整个序列有序为止。

要点：设立哨兵，作为临时存储和判断数组边界之用。

直接插入排序示例：从后往前插入

如果碰见一个和插入元素相等的，那么插入元素把想插入的元素放在相等元素的后面。所以，相等元素的前后顺序没有改变，从原无序序列出去的顺序就是排好序后的顺序，所以插入排序是稳定的。

（无哨兵）直接插入排序——算法的实现：

def insertionSort(unsortedList):  
    list_length=len(unsortedList)  
    if list_length<2:  #这种情况就不用排序了
        return unsortedList  
    for i in range(1,list_length):  #所有的数据都要进行排序
        key=unsortedList[i]  
        j=i-1  
        while j>=0 and key<unsortedList[j]:  #插入排序：如果带排序数字小于当前，则往前移动
            unsortedList[j+1]=unsortedList[j]  
            j=j-1  
        unsortedList[j+1]=key  
    return unsortedList

如果要实现有哨兵的插入排序算法，就是把第0个元素当做哨兵，本来应该给key的值给数组第0个位置。

两个好处：

1.保存了要插入元素，相当于上边变量key的作用

2.循环的时候不用判断边界，因为判断边界需要浪费时间，所以，有哨兵的会节省时间。

带来的问题：

因为我们通常传进来的数组第0个位置都是有记录的，所以需要把数组往后移动一下，可以把第一个元素直接放到最后最后的位置。

转自：http://blog.csdn.net/u013719780/article/details/49201143

2.插入排序——希尔排序

基本思想：希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序，是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。

def shellSort(arrays):
    length=len(arrays)
    if length<2:
        return arrays
    dist=length/2#增量，至少为1
    while (dist>=1):#增量至少为1，即最后一次
        for i in range(1,length):
            key=arrays[i]
            j=i-dist
            while j>=0 and arrays[j]>key:#有增量的插入排序（一定要想明白，这里是插入排序）
                arrays[j+dist]=arrays[j]
                j=j-dist
            arrays[j+dist]=key
        dist=dist/2#增量减小
    return arrays

转自：http://blog.csdn.net/hinyunsin/article/details/6311707

3.选择排序——简单选择排序

算法思想：从未排序的序列中找到一个最小的元素，放到第一位，再从剩余未排序的序列中找到最小的元素，放到第二位，依此类推，直到所有元素都已排序完毕。假设序列元素总共n+1个，则我们需要找n轮，就可以使该序列排好序。

因为交换的原因，可能导致相同大小数字顺序发生改变，所以是不稳定排序。

def selectSort(arrays):
    length=len(arrays)
    if length<2:
        return arrays
    for i in range(length):
        min_index=i#保存最小值的位置
        for j in range(i+1,length):#找最小值
            if arrays[j]<arrays[min_index]:
                min_index=j
        arrays[i],arrays[min_index]=arrays[min_index],arrays[i]#找到最小值，然后让该值和选择排序位置上的数进行交换
    return arrays

4.选择排序——堆排序

算法思想：先建立一个最大堆，在建立最大堆的过程中需要不断调整元素的位置。最大堆建立后，顶端元素必定是最大的元素，把该最大元素与最末尾元素位置置换，最大元素就出现在列表末端。重复此过程，直到排序。

def adjust(arr,start,length):#调整堆  
    tmp=arr[start]  
    j=2*start+1  
    while j<length:  
        if j<length-1 and arr[j]<arr[j+1]:  
            j+=1  
        if tmp>=arr[j]:  
            break  
        arr[start]=arr[j]  
        start=j  
        j=2*j+1  
    arr[start]=tmp  

def buildHeap(arr): #从一堆乱序中创建一个初始堆  
    length=len(arr)  
    for i in range(length/2-1,-1,-1):  
        adjust(arr,i,length)  
def heapSort(arr):  #堆排序
    length=len(arr)  
    buildHeap(arr)  
    ''''' 
    建立大根堆后，第一个元素为列表的最大元素，将它跟最后一个元素交换，列表大小-1 
    重新调整列表为大根堆，重复此操作直到最后一个元素 
    '''  
    for i in range(length-1,0,-1):  
        arr[i],arr[0]=arr[0],arr[i]  
        adjust(arr,0,i)
    return arr

版本2：第一个元素我们不用，这样更好判断孩子节点的位置

def heapSort(arrays):
    
    length=len(arrays)#length是数据元素个数
    arrays.insert(0,0)#第一个位置插入0，不使用
    
    buildHeap(arrays)#建立大根堆，array[0]是最大值
    
    for i in range(length,1,-1):
        arrays[i],arrays[1]=arrays[1],arrays[i]#让第一个元素和最后一个元素交换，把最大值放到最后位置，相当于已经排好序的
        heapAdjust(arrays,1,i-1)#调整剩下的元素
        
    arrays.pop(0)#把我们强加的第一个元素删掉
    return arrays
        
def buildHeap(arrays):
    for i in range((len(arrays)-1)/2,0,-1):#因为我们的arrays加了一个0，所以长度要再减去1,第二个参数写0，因为我们array特性，实际上取到1的位置。
                                           #实际上是对(len（arrays）-1)/2……1的元素进行调整
        heapAdjust(arrays,i,len(arrays)-1)

def heapAdjust(arrays, start,length):#start是被调整的元素，length是剩余堆的长度
    temp=arrays[start]#被调整的位置上的元素临时给temp
    for j in range(start*2,length+1):#到孩子节点找比start节点大的元素的位置
        if (j<length and arrays[j]<arrays[j+1]):
            j=j+1
        if(temp>arrays[j]):#如果被调整的位置元素比两个孩子节点都大，不用调整，直接退出
            break
        arrays[start]=arrays[j]#把两个孩子节点中大的值给arrays[start]
        start=j#需要被调整的位置发生变化（变成被调整到父节点的那个节点）
        
    arrays[start]=temp#把最开始我们的temp（需要被调整的元素值）赋给我们找到的合适的位置

5.交换排序——冒泡排序

冒泡1：从后边开始，和第一个比较，如果比第一个数小，交换，然后一直往前，比较。

def bubbleSort1(lists):
    length = len(lists)
    for i in range(0, length): #i从0开始
        for j in range(i + 1, length): #j从i+1开始
            if lists[i] > lists[j]: #冗余交换，具体参考《大话数据结构》
                lists[i], lists[j] = lists[j], lists[i]
    return lists

冒泡2：从后开始

def bubbleSort2(arrays):#这应该是最常用的版本了
    length=len(arrays)
    for i in range(0,length):
        for j in range(length-1,i,-1):
            if arrays[j]<arrays[j-1]:
                arrays[j],arrays[j-1]=arrays[j-1],arrays[j]
    return arrays

冒泡3：设置标记，如果此次没有交换，说明已经有序了

def bubbleSort3(arrays):
    length=len(arrays)
    flag=True #设置标记
    for i in range(0,length):
        if flag==False: #如果此次没有交换，说明已经排好序了，直接跳出循环
            break
        flag=False
        for j in range(length-1,i,-1):
            if arrays[j]<arrays[j-1]:
                flag=True
                arrays[j],arrays[j-1]=arrays[j-1],arrays[j]
    return arrays

6.交换排序——快速排序

算法思想：通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

def quickSort(arr): #快排
    if arr==[]:
        return []
    low=0
    high=len(arr)-1
    quickS(arr,low,high)
    return arr

def quickS(arr,low,high): #递归调用
    if low<high:
        pivot=Partition(arr,low,high)
 
        quickS(arr,low,pivot-1) #和二分查找类似，这里必须有一个进步的阶段，否则会跳不出来循环      
        quickS(arr,pivot+1,high)
 
 
def Partition(arr,low,high): #找中轴函数
    pivotkey=arr[low]
    while(low<high):
        while(low<high and arr[high]>pivotkey): #因为low那个地方是要覆盖掉的，所以，这里必须要从high开始
            high=high-1
        arr[low],arr[high]=arr[high],arr[low]
        while(low<high and arr[low]<pivotkey):
            low=low+1
        arr[low],arr[high]=arr[high],arr[low]#交换，这也是快速排序归为交换排序的原因
    return low #结束循环的地方就是在low和high相等的地方，就是中轴的位置

改进1：实际上Partition函数的那一部分可以改进，不需要交换

只需要改进Partition函数即可

def Partition(arr,low,high): #找中轴函数
    pivotkey=arr[low]
    while(low<high):
        while(low<high and arr[high]>pivotkey):
            high=high-1
        arr[low]=arr[high]
        while(low<high and arr[low]<pivotkey):
            low=low+1
        arr[high]=arr[low]#交换，这也是快速排序归为交换排序的原因
    arr[low]=pivotkey
    return low #结束循环的地方就是在low和high相等的地方，就是中轴的位置

改进2：当数组非常小的时候，快速排序反而不如直接插入排序的效果好（直接插入排序是简单排序中性能最好的），其原因是快排用到了递归操作。

只需改进quickS函数即可。——有没有写对？不太自信，主要是觉着《大话数据结构上》的写法是错误的。

def quickS(arr,low,high): #递归调用
    if (high-low>5):#假设大于5的时候
        pivot=Partition(arr,low,high)
 
        quickS(arr,low,pivot-1)       
        quickS(arr,pivot+1,high)
    else:
        insertionSort(arr[low:pivot-1])
        insertionSort(arr[pivot+1,high])

改进3：如果中轴选择的不合理，会导致快速排序的效率非常的慢，可以从三个数中选择一个中间值，或者九个数中选择一个中间值等。

改进4：把递归改成尾递归方式。

7.归并排序

算法思想：归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。将已有序的子序列合并，得到完全有序的序列；即先使每个子序列有序，再使子序列段间有序。若将两个有序表合并成一个有序表，称为二路归并。

def merge(left, right):#对left和right数组进行合并
    i, j = 0, 0
    result = []
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result += left[i:]
    result += right[j:]
    return result
 
def mergeSort(lists):
    # 归并排序
    if len(lists) <= 1:
        return lists
    num = len(lists) / 2
    left = mergeSort(lists[:num])#left是数组，存放着数据
    right = mergeSort(lists[num:])
    return merge(left, right)#把left数组和right数组合并

改进：非递归形式。

8.基数排序

算法思想：基数排序（radix sort）属于“分配式排序”（distribution sort），又称“桶子法”（bucket sort）或bin sort，顾名思义，它是透过键值的部份资讯，将要排序的元素分配至某些“桶”中，藉以达到排序的作用，基数排序法是属于稳定性的排序，其时间复杂度为O (nlog(r)m)，其中r为所采取的基数，而m为堆数，在某些时候，基数排序法的效率高于其它的稳定性排序法。

def RadixSort(list,d):    
    for k in xrange(d):#d轮排序,即有几位
        s=[[] for i in xrange(10)]#因为每一位数字都是0~9，故建立10个桶
        '''对于数组中的元素，首先按照最低有效数字进行
           排序，然后由低位向高位进行。'''
        for i in list:
            '''对于3个元素的数组[977, 87, 960]，第一轮排序首先按照个位数字相同的
               放在一个桶s[7]=[977],s[7]=[977,87],s[0]=[960]
               执行后list=[960,977,87].第二轮按照十位数，s[6]=[960],s[7]=[977]
               s[8]=[87],执行后list=[960,977,87].第三轮按照百位，s[9]=[960]
               s[9]=[960,977],s[0]=87,执行后list=[87,960,977],结束。'''
            s[i/(10**k)%10].append(i)  #/(10**k)%10是求相应位上的数字
        list=[j for i in s for j in i]
    return list

易错点：多个变量之间的关系，防止变量被修改，比如i,j,k之间，不要产生修改的情况，否则会出错的。

参考：

https://www.liaoxuefeng.com/article/001373888684944cc1e1ec7beca42ccb8b03caf0f879dc1000

https://www.nowcoder.com/profile/9220992/codeBookDetail?submissionId=11240164

相关阅读:
SNMP的安全隐患及对策
 jsp+servlet+Tomcat+mysql实现用户注册、登录、查看、修改实例之——信息修改
 jsp+servlet+Tomcat+mysql实现用户注册、登录、查看、修改实例之——信息查看
 jsp+servlet+Tomcat+mysql实现用户注册、登录、查看、修改实例之——用户删除
 多线程的陷阱
 安装部署FastDFS
你的知识需要管理
 1、什么是接口测试
 2、接口测试流程
 软件测试生命周期
原文地址：https://www.cnblogs.com/shixisheng/p/7203562.html