• 几个常用排序的代码实现堆排序|快排|归并排序 Marathon


    以下内容来自网络,如侵权请联系我

    堆排序|快排|归并排序

    • 三种排序算法的时间复杂度:O(nlogn)

    • 三种排序算法的空间复杂度:

      • 快排:平均O(logn), 最坏O(n)
      • 归并:O(n)
      • 堆排:O(1),topK问题可能O(k)
    • 运行时间:快排 < 归并排序 < 堆排序

    • 算法特点:

      • 快排:不稳定,极端情况排序效率低,最坏会退化成O(n^2)
      • 归并排序:稳定,需要额外的内存空间开销
      • 堆排序:不稳定,在效率较高的排序算法中,相对较慢

    1.快速排序

    python

    # 快速排序
    
    def partition(nums: [int], left: int, right: int):
        """分区函数,左边比中间小,右边比中间大"""
        if left > right:
            return nums
        pivot = left
        i, j = left, right
        while i < j:  # while循环的操作在于寻找pivot位置并交换元素,最终使得pivot为基准,分割左右半区元素,继续递归
            while i < j and nums[j] >= nums[pivot]:  # 大于pivot对应元素时, j--,实现右指针左移,直到 j <= i(往往相遇时相等) 或者 nums[j] < nums[pivot]
                j -= 1
            while i < j and nums[i] < nums[pivot]:  # 小于等于pivot对应元素时,i++,实现左指针右移,直到 i >= j(往往相遇时相等) 或者 num[i] > nums[pivot]
                i += 1
            nums[i], nums[j] = nums[j], nums[i]  # 当 i=j 时,已经跳出上面两个while循环,即左右指针相遇,或者(j的元素小于等于pivot && i的元素大于pivot),肯定需要交换不同位置元素,实现pivot分割数组,最终使得左右指针相遇
        nums[pivot], nums[j] = nums[j], nums[pivot]  # 交换基准与左右指针相遇位置的元素,此次分区结束,新排序的数组一定是pivot元素大于左区,小于右区
        partition(nums, left, j - 1)  # 递归左半区
        partition(nums, j + 1, right)  # 递归右半区
        return nums
    
    def quickSort(nums: [int]) -> [int]:
        """快速排序"""
        length = len(nums)
        return partition(nums, 0, length-1)
    
    
    if __name__ == "__main__":
        import random
        nums = list(range(50))
        random.shuffle(nums)
        randomNums = nums[:10]
        print(randomNums)
        print(quickSort(randomNums))
    

    golang

    func quickSort(nums []int) []int {
    	// 快速排序
    	length := len(nums)
    	return partition(nums, 0, length-1)
    }
    
    func partition(nums []int, left, right int) []int {
    	// 分区及排序,快排的具体实现
    	// 递归终止条件
    	if left > right {return nil}
    	// 设置基准-哨兵
    	pivot := left
    	i, j := left, right
    	// 循环遍历,直到 i==j
    	for i < j {
    		for i < j && nums[j] >= nums[pivot] {
    			j--
    		}
    		for i < j && nums[i] <= nums[pivot] {
    			i++
    		}
    		// 交换元素
    		nums[i], nums[j] = nums[j], nums[i]
    	}
    	// 交换基准与此轮相遇位置元素
    	nums[pivot], nums[j] = nums[j], nums[pivot]
    	// 递归左区
    	partition(nums, left, i-1)
    	// 递归右区
    	partition(nums, i+1, right)
    	return nums
    }
    

    2.归并排序

    Python内部的sort()方法是基于归并排序实现的。

    # 归并排序
    
    def merge(arr: [int], start: int, mid: int, end: int):
        i = start
        j = mid + 1
        tmpArr = [] # 开辟临时容器
        while i <= mid and j <= end: # 当左右两个分区都有数据时
            if arr[i] < arr[j]: # 左边小,加入tmpArr
                tmpArr.append(arr[i])
                i += 1
            else:
                tmpArr.append(arr[j]) # 右边小,加入tmpArr
                j += 1
        # 上面while完成后,左右两区有一区没数据,另外一区直接添加到尾部
        while i <= mid:
            tmpArr.append(arr[i])
            i += 1
        while j <= end:
            tmpArr.append(arr[j])
            j += 1
        arr[start:end+1] = tmpArr # tmpArr按arr原位置写入
    
    def mergeSort(arr: [int], start: int, end: int) -> [int]:
        if start < end:
            mid = (start+end) >> 1
            # 递归左边
            mergeSort(arr, start, mid)
            # 递归右边
            mergeSort(arr, mid+1, end)
            # 合并数据
            merge(arr, start, mid, end)
    
        return arr
    
    if __name__ == "__main__":
        import random
        nums = list(range(100))
        random.shuffle(nums)
        nums = nums[:20]
        randomNums = [60, 54, 62, 49, 24, 13, 88, 59, 66, 57, 42, 23, 0, 15, 8, 67, 21, 9, 12, 78]
        print(mergeSort(randomNums, 0, 19))
    

    golang实现

    // mergeSort
    func mergeSort(nums []int) []int {
    	// 递归终止
    	if len(nums) <= 1 {
    		return nums
    	}
    	// 拆分与合并
    	mid := len(nums) >> 1
    	left := mergeSort(nums[:mid])
    	right := mergeSort(nums[mid:])
    	return merge(left, right)
    }
    
    // 合并func
    func merge(left, right []int) []int {
    	res := make([]int, len(left)+len(right))
    	l, r, i := 0, 0, 0
    	for l < len(left) && r < len(right) {
    		if left[l] <= right[r] {
    			res[i] = left[l]
    			l++
    		} else {
    			res[i] = right[r]
    			r++
    		}
    		i++
    	}
    	// 左右区,哪个还未遍历完就把对应区的元素加入res
    	for l < len(left) {
    		res[i] = left[l]
    		i++
    		l++
    	}
    	for r < len(right) {
    		res[i] = right[r]
    		i++
    		r++
    	}
    	/* 加入剩余区的元素的另一种写法
    	copy(res[i:], left[l:]) // 如果右区遍历完,执行左区copy
    	copy(res[i+len(left)-l:], right[r:]) // 如果左区空,执行这个copy, l=len(left)
    	*/
    	return res
    }
    

    3.堆排序

    堆排序(Heap Sort)是利用堆这种数据结构所设计的一种排序算法。

    堆的结构是一棵完全二叉树的结构,并且满足堆积的性质:每个节点(叶节点除外)的值都大于等于(或都小于等于)它的子节点。

    关于二叉树和完全二叉树的介绍可以参考:二叉树简介

    堆排序先按从上到下、从左到右的顺序将待排序列表中的元素构造成一棵完全二叉树,然后对完全二叉树进行调整,使其满足堆积的性质:每个节点(叶节点除外)的值都大于等于(或都小于等于)它的子节点。构建出堆后,将堆顶与堆尾进行交换,然后将堆尾从堆中取出来,取出来的数据就是最大(或最小)的数据。重复构建堆并将堆顶和堆尾进行交换,取出堆尾的数据,直到堆中的数据全部被取出,列表排序完成。

    堆的应用

    • 1.堆排序
    • 2.优先级队列
      • 2.1 合并小文件
      • 2.2 高性能定时器
    • 3.取top k元素
    • 4.取中位数
      • 4.1 99%的响应时间

    重点
    列表排序的算法思路:

    • 1.重复构建堆,并交换堆顶和队尾元素
    • 2.取出队尾数据
    • 3.直到堆中数据全部取出

    堆结构分为大顶堆和小顶堆:

      1. 大顶堆:每个节点(叶节点除外)的值都大于等于其子节点的值,根节点的值是所有节点中最大的,所以叫大顶堆,在堆排序算法中用于升序排列。
      1. 小顶堆:每个节点(叶节点除外)的值都小于等于其子节点的值,根节点的值是所有节点中最小的,所以叫小顶堆,在堆排序算法中用于降序排列。

    堆排序的原理如下:

      1. 将待排序列表中的数据按从上到下、从左到右的顺序构造成一棵完全二叉树。
      1. 将完全二叉树中每个节点(叶节点除外)的值与其子节点(子节点有一个或两个)中较大的值进行比较,如果节点的值小于子节点的值,则交换他们的位置(大顶堆,小顶堆反之)。
      1. 将节点与子节点进行交换后,要继续比较子节点与孙节点的值,直到不需要交换或子节点是叶节点时停止。比较完所有的非叶节点后,即可构建出堆结构。
      1. 将数据构造成堆结构后,将堆顶与堆尾交换,然后将堆尾从堆中取出来,添加到已排序序列中,完成一轮堆排序,堆中的数据个数减1。
      1. 重复步骤2,3,4,直到堆中的数据全部被取出,列表排序完成。

    3.1 大顶堆

    代码中,先实现一个bigHeapify(array, start, end)函数,用于比较节点与其子节点中的较大者,如果值小于子节点的值则进行交换。代码中不需要真正将数据都添加到完全二叉树中,而是根据待排序列表中的数据索引来得到节点与子节点的位置关系。完全二叉树中,节点的索引为i,则它的左子节点的索引为2*i+1,右子节点的索引为2*i+2,有n个节点的完全二叉树中,非叶子节点有n//2个,列表的索引从0开始,所以索引为0~n//2-1的数据为非叶子节点。

    实现堆排序函数heapSort(array)时,先调用bigHeapify(array, start, end)函数循环对非叶子节点进行调整,构造大顶堆,然后将堆顶和堆尾交换,将堆尾从堆中取出,添加到已排序序列中,完成一轮堆排序。然后循环构建大顶堆,每次将最大的元素取出,直到堆中的数据全部被取出。

    堆排序的时间复杂度和稳定性

      1. 时间复杂度
        在堆排序中,构建一次大顶堆可以取出一个元素,完成一轮堆排序,一共需要进行n轮堆排序。每次构建大顶堆时,需要进行的比较和交换次数平均为logn(第一轮构建堆时步骤多,后面重建堆时步骤会少很多)。时间复杂度为 T(n)=nlogn ,再乘每次操作的步骤数(常数,不影响大O记法),所以堆排序的时间复杂度为 O(nlogn) 。
      1. 稳定性
        在堆排序中,会交换节点与子节点,如果有相等的数据,可能会改变相等数据的相对次序。所以堆排序是一种不稳定的排序算法。
        python
        扩展阅读:
    • 堆排、python实现堆排

    # 堆排序-大顶堆-升序排列
    
    def maxHeapify(arr: [int], start: int, end: int) -> None:
        """向下调整,堆化"""
        root = start
        # left child index
        child = root*2 + 1
        while child <= end:
            # 比较左右子节点的大值
            if child+1 <= end and arr[child] < arr[child+1]:
                child += 1
            if arr[root] < arr[child]:
                # 子节点更大,交换节点与子节点的值
                arr[root], arr[child] = arr[child], arr[root]
                # 更新节点到子节点位置,继续下一轮交换
                root = child
                child = root*2 + 1
            else:
                break
    
    # 递归法
    def maxHeapify_(arr, start, end):
        pos = start
        child = pos*2 + 1
        if child < end:
            right = child + 1
            if right < end and arr[right] > arr[child]:
                child = right
            if arr[child] > arr[pos]:
                arr[pos], arr[child] = arr[child], arr[pos]
                maxHeapify_(arr, pos, end)
    
    def maxheapSort(arr: [int]) -> [int]:
        """大顶堆排序"""
        # 初始化非叶子节点
        first = (len(arr) >> 1) - 1
        for start in range(first, -1, -1):
            # 从下往上,从右至左对每个非叶子节点进行向下调整,循环构成大顶堆
            maxHeapify(arr, start, len(arr)-1)
        # 交换堆顶尾数据,堆数量--,重新堆化
        for end in range(len(arr)-1, 0, -1):
            # 交换堆顶堆尾数据, 构造大顶堆
            arr[0],arr[end] = arr[end], arr[0]
            # 重新调整堆,构造大顶堆
            maxHeapify(arr, 0, end-1)
        return arr
    
    
    if __name__ == "__main__":
        import random
        nums = list(range(20))
        random.shuffle(nums)
        nums = [19, 1, 11, 4, 12, 8]
        orderNums = maxheapSort(nums)
        print(orderNums)
    

    golang

    func maxHeapSort(nums []int) []int {
    	// max heap sort
    	end := len(nums)-1
    	// 从最后一个非叶子节点开始堆化
    	for i:=end>>1;i>=0;i-- {
    		maxHeapify(nums, i, end)
    	}
    	// 依次弹出堆顶元素,然后堆化,相当于依次把最大的放尾部
    	for i:=end;i>=0;i-- {
    		nums[0], nums[i] = nums[i], nums[0]
    		end--
    		maxHeapify(nums, 0, end)
    	}
    	return nums
    }
    
    func maxHeapify(nums []int, root, end int)  {
    	// 大顶堆堆化,堆顶值小就一直下沉
    	for {
    		// 获取做左孩子
    		child := root*2 + 1
    		// 越界跳出
    		if child > end {
    			return
    		}
    		// 比较左右孩子节点,如果右孩子大则取右孩子与root比较,否则左右孩子左孩子大, child不用++
    		if child < end && nums[child] <= nums[child+1] {
    			child++
    		}
    		// 如果父节点值大于左右孩子的大值,说明,已经堆化
    		if nums[root] > nums[child] {
    			return
    		}
    		// 交换父节点与较大的子节点
    		nums[root], nums[child] = nums[child], nums[root]
    		// 更新父节点为孩子节点,继续与孙节点比较,不断往下沉
    		root = child
    	}
    }
    

    3.2 小顶堆

    以小顶堆应用的topK问题为例。

    TopK
    现有n个数,得到前k大的数,显然这需要降序排列,取前k个数即可(k<n)。
    使用小顶堆的解决思路:

    • 1.取数组的前k个元素建立一个小顶堆,堆顶就是第k大的元素
    • 2.依次向后遍历数组,对于数组中的元素,如果小于堆顶,忽略,大于堆顶元素,将堆顶替换为该元素,并且调整堆
    • 3.遍历数组的所有元素,倒序弹出堆顶

    时间:

    • 1.排序后的切片: O(nlogn)
    • 2.排序的三人组: O(kn)
    • 3.堆排序思路: O(nlogk)

    python

    # 小顶堆-降序排列
    
    def minHeapify(arr: [int], start: int, end: int):
        """大的节点往下沉,小的往上冒-小顶堆化"""
        root = start
        child = root*2 + 1
        tmpVal = arr[start]
        while child <= end:
            if child + 1 <= end and arr[child+1] < arr[child]:
                child += 1
            if arr[child] < tmpVal:
                arr[root] = arr[child]
                root = child
                child = 2*root + 1
            else:
                arr[root] = tmpVal
                break
        else:
            arr[root] = tmpVal
    
    def minHeapSort(arr: [int], k: int) -> [int]:
        """小顶堆,升序排列, topK"""
        # 以arr切片作为heap的初始序列
        heap = arr[:k]
        # 初始化topK的小顶堆的非叶子节点
        first = (k-2) >> 1
        # 小顶堆,堆化
        for i in range(first, -1, -1):
            minHeapify(heap, i, k-1)
        # 依次遍历arr的第k+1及以后的元素,入小顶堆顶,小顶堆化
        for i in range(k, len(arr)-1):
            if arr[i] > heap[0]:
                heap[0] = arr[i]
                minHeapify(heap, 0, k-1)
        # 排序heap, 小顶堆数量--
        for i in range(k-1, -1, -1):
            heap[0], heap[i] = heap[i], heap[0]
            minHeapify(heap, 0, i-1)
        return heap
    
    def minHeapSort_(arr: [int]) -> [int]:
        """小顶堆,降序输出"""
        length = len(arr)
        # 初始化非叶子结点
        first = (length-2) >> 1
        # 遍历非叶子节点,小堆化
        for i in range(first, -1, -1):
            minHeapify(arr, i, length-1)
        # 排序数组, 小顶堆数量--
        for i in range(length-1, -1, -1):
            arr[0], arr[i] = arr[i], arr[0]
            minHeapify(arr, 0, i-1)
        return arr
    
    if __name__ == "__main__":
        nums = [0, 8, 9, 12, 13, 15, 21, 23]
        # print(minHeapSort(nums, 5)) # top5, 前5的数
        # print(minHeapSort(nums, 8)) # k == len(nums), topK即为原数组的降序排列, copy
        print(minHeapSort_(nums))
    

    golang

    func minHeapify(arr []int, root, end int)  {
    	// 小顶堆,堆化,非叶子节点大的下沉
    	for {
    		child := root*2 + 1
    		// 越界跳出
    		if child > end {
    			return
    		}
    		// root的值和子节点的小值比较
    		if child < end && arr[child] >= arr[child+1] {
    			child++
    		}
    		// root节点已经小于子节点,跳出
    		if arr[root] < arr[child] {
    			return
    		}
    		// root节点大于等于子节点,交换
    		arr[root], arr[child] = arr[child], arr[root]
    		root = child
    	}
    }
    
    func minHeapSort(arr []int) []int  {
    	// 小顶堆,降序输出
    	length := len(arr)
    	// 非叶子节点初始化, int(n/2)
    	first := (length-2) >> 1
    	// 遍历所有非叶子节点,大的下沉
    	for i:=first;i>=0;i-- {
    		minHeapify(arr, i, length-1)
    	}
    	// 依次弹出堆尾节点,交换后继续堆化
    	for i:=length-1;i>=0;i-- {
    		arr[0], arr[i] = arr[i], arr[0]
    		minHeapify(arr, 0, i-1)
    	}
    	return arr
    }
    
    func minHeapSort_(arr []int, k int) []int {
    	// 小顶堆, top K
    	heap := arr[:k]
    	// 初始化非叶子节点
    	first := (k-2) >> 1
    	// 形成一个数量为k的小顶堆
    	for i:=first;i>=0;i-- {
    		minHeapify(heap, i, k-1)
    	}
    	// 遍历后续节点,只有大于堆顶的元素,放入堆顶,堆化
    	for i:=k;i<len(arr)-1;i++ {
    		if arr[i] > heap[0] {
    			heap[0] = arr[i]
    			minHeapify(heap, 0, k-1)
    		}
    	}
    	// 依次弹出heap堆中的堆顶元素,弹出的元素就是topK
    	for i:=k-1;i>=0;i-- {
    		heap[0], heap[i] = heap[i], heap[0]
    		minHeapify(heap, 0, i-1)
    	}
    	return heap
    }
    

    补充

    4.插入排序 vs 希尔排序

    希尔排序可以看做插入排序的升级版。

    两种排序算法的时空复杂度:

    • 时间复杂度: 都是O(n^2)
    • 空间复杂度: 都是O(1)

    插入排序

    python实现

    # 插入排序
    
    def insertSort(nums: [int]) -> [int]:
        length = len(nums)
        for i in range(1, length):
            while i > 0 and nums[i-1] > nums[i]:
                nums[i-1], nums[i] = nums[i], nums[i-1]
                i -= 1
        return nums
    
    
    if __name__ == "__main__":
        import random
        nums = list(range(100))
        random.shuffle(nums)
        randomNums = nums[:10]
        print(randomNums)
        print(insertSort(randomNums))
    

    golang

    func insertSort(nums []int) []int {
    	length := len(nums)
    	for i:=0;i<length;i++ {
    		for j:=i;j>0;j-- {
    			if nums[j-1] > nums[j] {
    				nums[j-1], nums[j] = nums[j], nums[j-1]
    			}
    		}
    	}
    	return nums
    }
    

    希尔排序

    python

    # 希尔排序
    
    def shellSort(nums: [int]) -> [int]:
        length = len(nums)
        gap = length >> 1
        while gap:
            for i in range(gap, length):
                while i-gap >= 0 and nums[i-gap] > nums[i]:
                    nums[i-gap], nums[i] = nums[i], nums[i-gap]
                    i -= gap
            gap >>= 1
        return nums
    
    
    if __name__ == "__main__":
        import random
        nums = list(range(100))
        random.shuffle(nums)
        randomNums = nums[:10]
        print(randomNums)
        print(shellSort(randomNums))
    

    golang

    func shellSort(nums []int) []int {
    	length := len(nums)
    	gap := length >> 1
    	for gap > 0 {
    		for i:=gap;i<length;i++ {
    			j := i
    			for j-gap >= 0 && nums[j-gap] > nums[j] {
    				nums[j-gap], nums[j] = nums[j], nums[j-gap]
    				j -= gap
    			}
    		}
    		gap >>= 1
    	}
    	return nums
    }
    
  • 相关阅读:
    Oracle数据库的非归档模式迁移到归档模式
    对Dataguard的三种模式的理解
    RMAN中建立Catalog 用数据库的例子
    Oracle中实现dblink的作法
    expdp 简单例子
    Oracle单节点_Grid_Infrastructure_DB_安装过程图解(三/三)
    Oracle单节点_Grid_Infrastructure_DB_安装过程图解(一/三)
    Oracle单节点_Grid_Infrastructure_DB_安装过程图解(二/三)
    Oracle 安装过程中 File not found "WFMLRSVCApp.ear" 的原因
    基于Django的在线考试系统
  • 原文地址:https://www.cnblogs.com/davis12/p/15659785.html
Copyright © 2020-2023  润新知