• python下实现二叉堆以及堆排序


    python下实现二叉堆以及堆排序

    堆是一种特殊的树形结构, 堆中的数据存储满足一定的堆序。堆排序是一种选择排序, 其算法复杂度, 时间复杂度相对于其他的排序算法都有很大的优势。

    堆分为大头堆和小头堆, 正如其名, 大头堆的第一个元素是最大的, 每个有子结点的父结点, 其数据值都比其子结点的值要大。小头堆则相反。

    我大概讲解下建一个树形堆的算法过程:
    找到N/2 位置的数组数据, 从这个位置开始, 找到该节点的左子结点的索引, 先比较这个结点的下的子结点, 找到最大的那个, 将最大的子结点的索引赋值给左子结点, 然后将最大的子结点和父结点进行对比, 如果比父结点大, 与父节点交换数据。当然, 我只是大概说了下实现, 在此过程中, 还需要考虑结点不存在的情况。看下代码:

    # 构建二叉堆 
    def binaryHeap(arr, lenth, m): 
     temp = arr[m] # 当前结点的值 
     while(2*m+1 < lenth): 
     lchild = 2*m+1 
     if lchild != lenth - 1 and arr[lchild] < arr[lchild + 1]: 
     lchild = lchild + 1 
     if temp < arr[lchild]: 
     arr[m] = arr[lchild] 
     else: 
     break 
     m = lchild 
     arr[m] = temp 
     
     
    def heapsort(arr, length): 
     i = int(len(arr)/2) 
     while(i >= 0): 
     binaryHeap(arr, len(arr), i) 
     i = i - 1 
     
     print("二叉堆的物理顺序为:") 
     print(arr) # 输出二叉堆的物理顺序 
     
     
    if __name__ == '__main__': 
     arr = [2, 87, 39, 49, 34, 62, 53, 6, 44, 98] 
     
     heapsort(arr, len(arr))

    堆排序过程就是依次将最后的结点与首个节点进行对比交换:

    # 构建二叉堆
    def binaryHeap(arr, lenth, m):
        temp = arr[m]  # 当前结点的值
        while(2*m+1 < lenth):
            lchild = 2*m+1
            if lchild != lenth - 1 and arr[lchild] < arr[lchild + 1]:
                lchild = lchild + 1
            if temp < arr[lchild]:
                arr[m] = arr[lchild]
            else:
                break
            m = lchild
        arr[m] = temp
    
    
    def heapsort(arr, length):
        i = int(len(arr)/2)
        while(i >= 0):
            binaryHeap(arr, len(arr), i)
            i = i - 1
    
        print("二叉堆的物理顺序为:")
        print(arr)  # 输出二叉堆的物理顺序
    
        i = length-1
        while(i > 0):
            arr[i], arr[0] = arr[0], arr[i]  # 变量交换
            binaryHeap(arr, i, 0)
            i = i - 1560
    
    
    def pop(arr):
        first = arr.pop(0)
        return first
    
    
    if __name__ == '__main__':
        arr = [2, 87, 39, 49, 34, 62, 53, 6, 44, 98]
    
        heapsort(arr, len(arr))
    
        print("堆排序后的物理顺序")
        print(arr)  # 输出经过堆排序之后的物理顺序
    
        data = pop(arr)
        print(data)
    
        print(arr)

    堆排序的过程就是将原有的二叉堆(我这里实现大顶堆, 即第一个元素是最大的,父结点的数据值大于子结点)的第一个元素放到堆尾,随后就是将剩下的结点再重新构成二叉堆(依旧是大顶堆),因此只要递归原二叉堆实现过程就行。

    python封装了一个堆模块, 我们使用该模块可以很高效的实现一个优先队列:

    import heapq
    
    
    class Item:
        def __init__(self, name):
            self.name = name
    
        def __repr__(self):
            return 'Item({!r})'.format(self.name)
    
    
    class PriorityQueue:
        def __init__(self):
            self._queue = []
            self._index = 0
    
        def push(self, item, priority):
            heapq.heappush(self._queue, (-priority, self._index, item))  # 存入一个三元组
            self._index += 1
    
        def pop(self):
            return heapq.heappop(self._queue)[-1]  # 逆序输出
    
    
    if __name__ == '__main__':
        p = PriorityQueue()
        p.push(Item('foo'), 1)
        p.push(Item('bar'), 5)
        p.push(Item('spam'), 4)
        p.push(Item('grok'), 1)
    
        print(p.pop())
        print(p.pop())

    具体请看heapq官网

  • 相关阅读:
    Thinking in Java 第十六章学习笔记----数组
    Thinking in Java第十五章学习笔记----泛型
    Thinking in Java第十四章学习笔记----类型信息
    Thinking in Java第十三章学习笔记----字符串
    Kaggle竞赛--Titanic:Machine Learning from Disaster
    sklearn 常用算法参数设置与选择
    Pandas 入门知识
    机器学习常用数据集
    感知机PLA
    决策树CART--原理与实现
  • 原文地址:https://www.cnblogs.com/zhiyong-ITNote/p/7608330.html
Copyright © 2020-2023  润新知