學習筆記 | 優先隊列Priority Queue

原創

2020-07-05 10:46

優先隊列（Priority Queue）

特點

能保證每次取出的元素都是隊列中優先級別最高的。
優先級別可以是自定義的，例如，數據的數值越大，優先級越高；或者數據的數值越小，優先級越高。優先級別甚至可以通過各種複雜的計算得到。

應用場景

從一堆雜亂無章的數據當中按照一定的順序（或者優先級）逐步地篩選出部分乃至全部的數據。

舉例：任意一個數組，找出前 k 大的數。

解法 1：先對這個數組進行排序，然後依次輸出前 k 大的數，複雜度將會是 O(nlogn)，其中，n 是數組的元素個數。這是一種直接的辦法。

解法 2：使用優先隊列，複雜度優化成 O(k + nlogk)。

當數據量很大（即 n 很大），而 k 相對較小的時候，顯然，利用優先隊列能有效地降低算法複雜度。因爲要找出前 k 大的數，並不需要對所有的數進行排序。

實現

優先隊列的本質是一個二叉堆結構。堆在英文裏叫 Binary Heap，它是利用一個數組結構來實現的完全二叉樹。 換句話說，優先隊列的本質是一個數組，數組裏的每個元素既有可能是其他元素的父節點，也有可能是其他元素的子節點，而且，每個父節點只能有兩個子節點，很像一棵二叉樹的結構。

牢記下面優先隊列有三個重要的性質。

數組裏的第一個元素 array[0] 擁有最高的優先級別。
給定一個下標 i，那麼對於元素 array[i] 而言：

它的父節點所對應的元素下標是 (i-1)/2
它的左孩子所對應的元素下標是 2×i + 1
它的右孩子所對應的元素下標是 2×i + 2

數組裏每個元素的優先級別都要高於它兩個孩子的優先級別。

優先隊列最基本的操作有兩個。

1. 向上篩選（sift up / bubble up）

當有新的數據加入到優先隊列中，新的數據首先被放置在二叉堆的底部。
不斷進行向上篩選的操作，即如果發現該數據的優先級別比父節點的優先級別還要高，那麼就和父節點的元素相互交換，再接着往上進行比較，直到無法再繼續交換爲止。
時間複雜度：由於二叉堆是一棵完全二叉樹，並假設堆的大小爲 k，因此整個過程其實就是沿着樹的高度往上爬，所以只需要 O(logk) 的時間。

2. 向下篩選（sift down / bubble down）

當堆頂的元素被取出時，要更新堆頂的元素來作爲下一次按照優先級順序被取出的對象，需要將堆底部的元素放置到堆頂，然後不斷地對它執行向下篩選的操作。
將該元素和它的兩個孩子節點對比優先級，如果優先級最高的是其中一個孩子，就將該元素和那個孩子進行交換，然後反覆進行下去，直到無法繼續交換爲止。
時間複雜度：整個過程就是沿着樹的高度往下爬，所以時間複雜度也是 O(logk)。因此，無論是添加新的數據還是取出堆頂的元素，都需要 O(logk) 的時間。

初始化

優先隊列的初始化是一個最重要的時間複雜度，是分析運用優先隊列性能時必不可少的，也是經常容易弄錯的地方。

舉例：有 n 個數據，需要創建一個大小爲 n 的堆。
誤區：每當把一個數據加入到堆裏，都要對其執行向上篩選的操作，這樣一來就是 O(nlogn)。
解法：在創建這個堆的過程中，二叉樹的大小是從 1 逐漸增長到 n 的，所以整個算法的複雜度經過推導，最終的結果是 O(n)。

注意：算法面試中是不要求推導的，你只需要記住，初始化一個大小爲 n 的堆，所需要的時間是 O(n) 即可

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

學習筆記 | 無重複字符最長子串

01 無重複字符最長子串快慢指針 class Solution(object): def lengthOfLongestSubstring(self, s): """ :type s

2020-06-29 07:17:36

學習筆記 | 二叉樹：前序遍歷、中序遍歷、後序遍歷

二叉樹：前序遍歷、中序遍歷、後序遍歷 class Node: def __init__(self, value=None, left=None, right=None): self.value = val

2020-06-23 00:53:12

學習筆記 | 搜索旋轉排序數組、二分查找

class Solution(object): def search(self, nums, target): """ :type nums: List[int] :typ

2020-07-05 10:46:53

學習筆記 | 在排序數組中查找元素的第一個和最後一個位置

class Solution(object): def searchRange(self, nums, target): """ :type nums: List[int]

2020-07-05 10:46:52

學習筆記 | 前 K 個高頻元素、優先隊列、最小堆

class Solution(object): def topKFrequent(self, nums, k): """ :type nums: List[int] :t

2020-07-05 10:46:52

學習筆記 | 貪心算法(貪婪算法)

貪心算法，是從問題的初始解開始，一步一步地做出當前最好的選擇，逐步逼近問題的目標，儘可能地得到最優解，即使達不到最優解，也可以得到最優解的近似解。也就是說，它期望通過局部最優選擇從而得到全劇最優的解決方案。在貪心算法中，我

2020-06-29 07:17:36

學習筆記 | 測試杯子在哪個樓層破碎的問題

題目描述：有一種玻璃杯質量確定但未知，需要檢測。有一棟100層的大樓，該種玻璃杯從某一層樓扔下，剛好會碎。現給你兩個杯子，問怎樣檢測出這個杯子的質量，即找到在哪一層樓剛好會碎？題目分析：首先兩個杯子的質量是相同的。

2020-06-08 07:58:41

學習筆記 | python set discard

01 set discard() 方法 discard() 方法用於移除指定的集合元素。該方法不同於 remove() 方法，因爲 remove() 方法在移除一個不存在的元素時會發生錯誤，而 discard() 方法不會。

2020-06-23 02:49:03

學習筆記 | 刪除列表中的重複元素並保持順序不變

藉助集合和生成器實現 def dedupe(items): seen = set() for item in items: if item not in seen: yie

2020-06-23 00:53:12

學習筆記 | Counter找出列表中出現次數最多的元素

找出列表中出現次數最多的元素在Python程序中，如果想找出列表中出現次數最多的元素，可以考慮使用collections模塊中的Counter類，調用Counter類中的函數most_common() 來實現上述功能。 fr

2020-06-23 00:53:12

學習筆記 | Python同時遍歷多個列表一一對應

Python同時遍歷多個列表一一對應 zip()

2020-06-23 00:53:12

學習筆記 | 如何輸出二叉樹中的所有路徑

如何輸出二叉樹中的所有路徑路徑的定義就是從根節點到葉節點的點的集合。要輸出二叉樹中的所有路徑，還需要利用遞歸來實現。先用一個列表保存經過的節點，如果已經是葉節點，那麼輸出列表的所有內容；如果不是，那麼將節點加入列表，然後繼

2020-06-23 00:53:12

學習筆記 | Python知識要點圖

Python知識要點 —— 思維導圖

2020-06-12 20:13:15

學習筆記 | 提高Python代碼質量的20個技巧

程序 = 算法 + 數據結構 01 基本數據類型推導式、字符串的連接和拆分、格式化字符串、collections 02 函數可變長參數、Lambda表達式、高階函數、裝飾器、生成器可變長參數：參數

2020-06-12 20:13:15

學習筆記 | 靜態鏈接庫、動態鏈接庫

01 DLL文件是什麼？它有幾種調用方式？ DLL文件（Dynamic Linkable Library即動態鏈接庫文件），是一種不能單獨運行的文件，它允許程序共享執行特殊任務所必需的代碼和其他資源。比較大的應用程序都由很多模

2020-06-29 07:17:36

24小時熱門文章

最新文章

最新評論文章