• 堆排序概述及代码实现


    一、堆排序概述

    当你看到这里请去原作者那里点个赞, 原文链接

    1.堆是一种数据结构 

    可以将堆看作一棵完全二叉树,这棵二叉树满足,任何一个非叶节点的值都不大于(或不小于)其左右孩子节点的值。 
    这里写图片描述

    2. 堆的存储 

    一般用数组来表示堆,若根节点存在于序号0处,i结点的父结点下表就为(i-1)/2,i结点的左右子结点下标分别为2i+1和2i+2

    3. 堆排序思想 

    利用大顶堆(小顶堆)堆顶记录的是最大关键字(最小关键字)这一特性,使得每次从无序中选择最大记录(最小记录)变得简单。

    4. 堆排序的实现 

    堆排序需要解决两个问题:

    • 如何由一个无序序列建成一个堆
    • 如何在输出堆顶元素之后,调整剩余元素成为一个新的堆?

    针对第二个问题:一般在输出堆顶元素之后,视为将这个元素排除,然后用表中最后一个元素填补它的位置,自上向下进行调整:首先将堆顶元素和它的左右子树的根结点进行比较,把最小的元素交换到堆顶;然后顺着被破坏的路径一路调整下去,直至叶子结点,就得到新的堆。

    Step 1: 构造初始堆

    初始化堆时是对所有的非叶子结点进行筛选 
    最后一个非终端元素的下标是[n/2]向下取整,所以筛选只需要从第[n/2]向下取整个元素开始,从后往前进行调整。

    Step 2:进行堆排序

    堆排序是一种选择排序。建立的初始堆为初始的无序区。

    排序开始,首先输出堆顶元素(因为它是最值),将堆顶元素和最后一个元素交换,这样,第n个位置(即最后一个位置)作为有序区,前n-1个位置仍是无序区,对无序区进行调整,得到堆之后,再交换堆顶和最后一个元素,这样有序区长度变为2。。。

    不断进行此操作,将剩下的元素重新调整为堆,然后输出堆顶元素到有序区。每次交换都导致无序区-1,有序区+1。不断重复此过程直到有序区长度增长为n-1,排序完成。

    5. 堆排序实例 

    1)首先,建立初始的堆结构图 
    这里写图片描述 
    2)然后,交换堆顶的元素和最后一个元素,此时最后一个位置作为有序区(有序区显示为黄色),然后进行其他无序区的堆调整,重新得到大顶堆后,交换堆顶和倒数第二个元素的位置…… 
    这里写图片描述 
    3)重复此过程 
    这里写图片描述 
    4)最后,有序区扩展完成即排序完成 
    这里写图片描述

    由排序过程可见,若想得到升序,则建立大顶堆,若想得到降序,则建立小顶堆。

    6. 堆排序分析 

    稳定性: 
    时间复杂度:O(nlogn) 
    空间复杂度:

    堆排序方法对记录数较少的文件并不值得提倡,但对n较大的文件还是很有效的。因为其运行时间主要耗费在建初始堆和调整建新堆时进行的反复“筛选”上。

    二: Python代码

    简洁版:

    def sift_down(arr, start, end):
        root = start
        while True:
            # 从root开始对最大堆调整
            child = 2 * root + 1
            if child > end:
                break
    
            # 找出两个child中交大的一个
            if child + 1 <= end and arr[child] < arr[child + 1]:
                child += 1
    
            if arr[root] < arr[child]:
                # 最大堆小于较大的child, 交换顺序
                arr[root], arr[child] = arr[child], arr[root]
    
                # 正在调整的节点设置为root
                root = child
            else:
                # 无需调整的时候, 退出
                break
    
    
    def heap_sort(arr):
        # 从最后一个有子节点的孩子来调整最大堆
        first = len(arr) // 2 - 1
        for start in range(first, -1, -1):
            sift_down(arr, start, len(arr) - 1)
    
        # 将最大的放到堆的最后一个, 堆-1, 继续调整排序
        for end in range(len(arr) -1, 0, -1):
            arr[0], arr[end] = arr[end], arr[0]
            sift_down(arr, 0, end - 1)
    View Code

    注释版:

    def sift_down(arr, start, end):
        root = start
        while True:
            # 从root开始对最大堆调整
            child = 2 * root + 1
            # child为root的左孩子
            if child > end:
                # 超出序列的范围
                break
    
            # 找出两个child中较大的一个
            if child + 1 <= end and arr[child] < arr[child + 1]:
                # 如果右孩子存在, 而且左孩子小于右孩子
                child += 1
                # 将child指向右孩子
    
            if arr[root] < arr[child]:
                # 如果root 小于 它的较大child
                arr[root], arr[child] = arr[child], arr[root]
                # root 与 child, 交换位置
    
                root = child
                # 正在调整的节点设置为root
            else:
                # 无需调整的时候, 退出
                break
    
    
    def heap_sort(arr):
    
        # 从最后一个有子节点的节点 来 调整最大堆
        first = len(arr) // 2 - 1
        # first: 最后一个有子节点的节点的下标
        for start in range(first, -1, -1):
            sift_down(arr, start, len(arr) - 1)
    
        # 将堆内的首节点存储到有序区
        for end in range(len(arr) -1, 0, -1):
    
            arr[0], arr[end] = arr[end], arr[0]
            sift_down(arr, 0, end - 1)
    
            """
                有序区: 从尾节点的位置, 根据循环的次数, 依次向前移动, 直到堆为空, 即: 有序区的长度为堆的原始长度
                
                1. for end in range(len(arr)-1, 0, -1)
                    len(arr)-1: arr内的最后一个节点的下标
                    end: 从arr的最后一个节点开始遍历, 即: 将arr倒序遍历
                
                2. arr[0], arr[end] = arr[end], arr[0]
                    
                    将arr内的首节点, 存储到有序区
                    1. 
                        arr[0]: 
                        root节点, 堆顶, arr内的第一个元素,
                        如果arr是大顶堆, 则是arr内的最大元素,
                        如果arr是小顶堆, 则是arr内的最小元素
                    
                    2. 
                        arr[end]:
                        arr内的尾节点, 有序区的首节点 
                        根据循环的次数, 位置依次向前移动
                
            """
    
    
    
    if __name__ == "__main__":
        l = list(i for i in range(0, 1000))
        print("洗牌之前的列表:" + str(l))
        random.shuffle(l)
        print("洗牌之后的列表:" + str(l))
        heap_sort(l)
        print(l)
    View Code
  • 相关阅读:
    mybatis常用的配置解析
    shiro学习(一)
    三、maven学习-高级
    二、maven学习
    一、maven学习
    常用工具类
    三、redis学习(jedis连接池)
    一、redis学习(基础)
    校验用户名是否存在(ajax+jackson)
    Spring-简介-IOC理论推导
  • 原文地址:https://www.cnblogs.com/amou/p/9057050.html
Copyright © 2020-2023  润新知