計算機排序算法

在計算機科學與數學中,一個排序算法(Sorting algorithm)是一種能將一串數據依照特定排序方式的一種算法。最常用到的排序方式是數值順序以及字典順序。有效的排序算法在一些算法(例如搜索算法與合併算法)中是重要的,如此這些算法才能得到正確解答。排序算法也用在處理文字數據以及產生人類可讀的輸出結果。基本上,排序算法的輸出必須遵守下列兩個原則:

  1. 輸出結果爲遞增串行(遞增是針對所需的排序順序而言)
  2. 輸出結果是原輸入的一種排列、或是重組

雖然排序算法是一個簡單的問題,但是從計算機科學發展以來,在此問題上已經有大量的研究。舉例而言,冒泡排序在1956年就已經被研究。雖然大部分人認爲這是一個已經被解決的問題,有用的新算法仍在不斷的被髮明。(例子:圖書館排序在2004年被髮表)

分類

在計算機科學所使用的排序算法通常被分類爲:

  • 計算的複雜度(最差、平均、和最好性能),依據列表(list)的大小(n)。一般而言,好的性能是O(n log n),且壞的性能是O(n2)。對於一個排序理想的性能是O(n)。僅使用一個抽象關鍵比較運算的排序算法總平均上總是至少需要O(n log n)。
  • 存儲器使用量(以及其他電腦資源的使用)
  • 穩定度:穩定排序算法會依照相等的關鍵(換言之就是值)維持紀錄的相對次序。也就是一個排序算法是穩定的,就是當有兩個有相等關鍵的紀錄RS,且在原本的列表中R出現在S之前,在排序過的列表中R也將會是在S之前。
  • 一般的方法:插入、交換、選擇、合併等等。交換排序包含冒泡排序和快速排序。選擇排序包含希爾排序和堆排序。

穩定度

當相等的元素是無法分辨的,比如像是整數,穩定度並不是一個問題。然而,假設以下的數對將要以他們的第一個數字來排序。

(4, 1)  (3, 1)  (3, 7)  (5, 6)

在這個狀況下,有可能產生兩種不同的結果,一個是依照相等的鍵值維持相對的次序,而另外一個則沒有:

(3, 1)  (3, 7)  (4, 1)  (5, 6)   (維持次序)
(3, 7)  (3, 1)  (4, 1)  (5, 6)   (次序被改變)

不穩定排序算法可能會在相等的鍵值中改變紀錄的相對次序,但是穩定排序算法從來不會如此。不穩定排序算法可以被特別地實現爲穩定。作這件事情的一個方式是人工擴充鍵值的比較,如此在其他方面相同鍵值的兩個對象間之比較,(比如上面的比較中加入第二個標準:第二個鍵值的大小)就會被決定使用在原先數據次序中的條目,當作一個同分決賽。然而,要記住這種次序通常牽涉到額外的空間負擔。

排列算法列表

在這個表格中,n是要被排序的紀錄數量以及k是不同鍵值的數量。

穩定的

  • 冒泡排序(bubble sort) — O(n2)
  • 雞尾酒排序 (Cocktail sort, 雙向的冒泡排序) — O(n2)
  • 插入排序 (insertion sort)— O(n2)
  • 桶排序 (bucket sort)— O(n); 需要 O(k) 額外空間
  • 計數排序 (counting sort) — O(n+k); 需要 O(n+k) 額外空間
  • 合併排序 (merge sort)— O(n log n); 需要 O(n) 額外空間
  • 原地合併排序 — O(n2)
  • 二叉排序樹排序 (Binary tree sort) — O(n log n)期望時間; O(n2)最壞時間; 需要 O(n) 額外空間
  • 鴿巢排序 (Pigeonhole sort) — O(n+k); 需要 O(k) 額外空間
  • 基數排序 (radix sort)— O(n·k); 需要 O(n) 額外空間
  • Gnome 排序 — O(n2)
  • 圖書館排序 — O(n log n) with high probability, 需要 (1+ε)n 額外空間

不穩定

  • 選擇排序 (selection sort)— O(n2)
  • 希爾排序 (shell sort)— O(n log n) 如果使用最佳的現在版本
  • 組合排序 — O(n log n)
  • 堆排序 (heapsort)— O(n log n)
  • 平滑排序 — O(n log n)
  • 快速排序 (quicksort)— O(n log n) 期望時間, O(n2) 最壞情況; 對於大的、亂數列表一般相信是最快的已知排序
  • Introsort — O(n log n)
  • Patience sorting — O(n log n + k) 最壞情況時間,需要 額外的 O(n + k) 空間,也需要找到最長的遞增子串行(longest increasing subsequence)

不實用的排序算法

  • Bogo排序 — O(n × n!),最壞的情況下期望時間爲無窮。
  • Stupid sort — O(n3); 遞歸版本需要 O(n2) 額外存儲器
  • 珠排序(Bead sort) — O(n) or O(√n), 但需要特別的硬件
  • Pancake sorting — O(n), 但需要特別的硬件
  • [Stooge排序] 算法簡單,但需要約n^2.7的時間

平均時間複雜度

平均時間複雜度由高到低爲:

  • 冒泡排序 O(n2)
  • 插入排序 O(n2)
  • 選擇排序 O(n2)
  • 歸併排序 O(n log n)
  • 堆排序 O(n log n)
  • 快速排序 O(n log n)
  • 希爾排序 O(n1.25)
  • 基數排序 O(n)

說明:雖然完全逆序的情況下,快速排序會降到選擇排序的速度,不過從概率角度來說(參考信息學理論,和概率學),不對算法做編程上優化時,快速排序的平均速度比堆排序要快一些。

簡要比較

 

名稱 數據對象 穩定性 時間複雜度 空間複雜度 描述
平均 最壞
插入排序 數組、鏈表 是 O(n^2) O(1) (有序區,無序區)。把無序區的第一個元素插入到有序區的合適的位置。對數組:比較得少,換得多。
直接選擇排序 數組 否 O(n^2) O(1) (有序區,無序區)。在無序區裏找一個最小的元素跟在有序區的後面。 對數組:比較得多,換得少。
鏈表 是
堆排序 數組 否 O(nlogn) O(1) (最大堆,有序區)。從堆頂把根卸出來放在有序區之前,再恢復堆。
歸併排序 數組、鏈表 是 O(nlogn) O(n) +O(logn), 如果不是從下到上 把數據分爲兩段,從兩段中逐個選最小的元素移入新數據段的末尾。可從上到下或從下到上進行。
快速排序 數組 否 O(nlogn) O(n^2) O(logn) ,O(n) (小數,樞紐元,大數)。
Accum qsort 鏈表 是 O(nlogn) O(n^2) O(logn) ,O(n) (無序區,有序區)。把無序區分爲(小數,樞紐元,大數),從後到前壓入有序區。
   
決策樹排序   是 O(logn!) O(n!) O(n) <O(logn!) <O(nlogn)
   
計數排序 數組、鏈表 是 O(n) O(n+m) 統計小於等於該元素值的元素的個數 i,於是該元素就放在目標數組的索引 i位。(i≥0)
桶排序 數組、鏈表 是 O(n) O(m) 將值爲 i 的元素放入i 號桶,最後依次把桶裏的元素倒出來。
基數排序 數組、鏈表 是 O(k*n),最壞:O(n^2)   一種多關鍵字的排序算法,可用桶排序實現。
  • 均按從小到大排列
  • k 代表數值中的"數位"個數
  • n 代表數據規模
  • m 代表數據的最大值減最小
作者:cpoint
本文版權歸作者和博客園共有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出原文連接,否則保留追究法律責任的權利.
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章