三種快速排序以及快速排序的優化

1、快速排序的基本思想：
   快速排序使用分治的思想，通過一趟排序將待排序列分割成兩部分，其中一部分記錄的關鍵字均比另一部分記錄的關鍵字小。之後分別對這兩部分記錄繼續進行排序，以達到整個序列有序的目的。
2、快速排序的三個步驟：
(1)選擇基準：在待排序列中，按照某種方式挑出一個元素，作爲 "基準"（pivot）
(2)分割操作：以該基準在序列中的實際位置，把序列分成兩個子序列。此時，在基準左邊的元素都比該基準小，在基準右邊的元素都比基準大
(3)遞歸地對兩個序列進行快速排序，直到序列爲空或者只有一個元素。
3、選擇基準的方式
對於分治算法，當每次劃分時，算法若都能分成兩個等長的子序列時，那麼分治算法效率會達到最大。也就是說，基準的選擇是很重要的。選擇基準的方式決定了兩個分割後兩個子序列的長度，進而對整個算法的效率產生決定性影響。
最理想的方法是，選擇的基準恰好能把待排序序列分成兩個等長的子序列
我們介紹三種選擇基準的方法
方法(1)：固定位置
思想：取序列的第一個或最後一個元素作爲基準
基本的快速排序
[cpp]view
plaincopyprint?

int SelectPivot(int arr[],int low,int high)  

{  

    return arr[low];//選擇選取序列的第一個元素作爲基準  

}  
注意：基本的快速排序選取第一個或最後一個元素作爲基準。但是，這是一直很不好的處理方法。
測試數據：
測試數據分析：如果輸入序列是隨機的，處理時間可以接受的。如果數組已經有序時，此時的分割就是一個非常不好的分割。因爲每次劃分只能使待排序序列減一，此時爲最壞情況，快速排序淪爲起泡排序，時間複雜度爲Θ(n^2)。而且，輸入的數據是有序或部分有序的情況是相當常見的。因此，使用第一個元素作爲樞紐元是非常糟糕的，爲了避免這個情況，就引入了下面兩個獲取基準的方法。
方法(2)：隨機選取基準
引入的原因：在待排序列是部分有序時，固定選取樞軸使快排效率底下，要緩解這種情況，就引入了隨機選取樞軸
思想：取待排序列中任意一個元素作爲基準
隨機化算法
[cpp]view
plaincopyprint?

/*隨機選擇樞軸的位置，區間在low和high之間*/  

int SelectPivotRandom(int arr[],int low,int high)  

{  

    //產生樞軸的位置  

    srand((unsigned)time(NULL));  

    int pivotPos = rand()%(high - low) + low;  

  

    //把樞軸位置的元素和low位置元素互換，此時可以和普通的快排一樣調用劃分函數  

    swap(arr[pivotPos],arr[low]);  

    return arr[low];  

}  
測試數據：
測試數據分析：:這是一種相對安全的策略。由於樞軸的位置是隨機的，那麼產生的分割也不會總是會出現劣質的分割。在整個數組數字全相等時，仍然是最壞情況，時間複雜度是O(n^2）。實際上，隨機化快速排序得到理論最壞情況的可能性僅爲1/(2^n）。所以隨機化快速排序可以對於絕大多數輸入數據達到O(nlogn）的期望時間複雜度。一位前輩做出了一個精闢的總結：“隨機化快速排序可以滿足一個人一輩子的人品需求。”
方法(3)：三數取中（median-of-three）
引入的原因：雖然隨機選取樞軸時，減少出現不好分割的機率，但是還是最壞情況下還是O(n^2），要緩解這種情況，就引入了三數取中選取樞軸
分析：最佳的劃分是將待排序的序列分成等長的子序列，最佳的狀態我們可以使用序列的中間的值，也就是第N/2個數。可是，這很難算出來，並且會明顯減慢快速排序的速度。這樣的中值的估計可以通過隨機選取三個元素並用它們的中值作爲樞紐元而得到。事實上，隨機性並沒有多大的幫助，因此一般的做法是使用左端、右端和中心位置上的三個元素的中值作爲樞紐元。顯然使用三數中值分割法消除了預排序輸入的不好情形，並且減少快排大約14%的比較次數

舉例：待排序序列爲：8 1 4 9 6 3 5 2 7 0
左邊爲：8，右邊爲0，中間爲6.
我們這裏取三個數排序後，中間那個數作爲樞軸，則樞軸爲6
注意：在選取中軸值時，可以從由左中右三個中選取擴大到五個元素中或者更多元素中選取，一般的，會有（2t＋1）平均分區法（median-of-(2t+1)，三平均分區法英文爲median-of-three）。
具體思想：對待排序序列中low、mid、high三個位置上數據進行排序，取他們中間的那個數據作爲樞軸，並用0下標元素存儲樞軸。
即：採用三數取中，並用0下標元素存儲樞軸。
[cpp]view
plaincopyprint?

/*函數作用：取待排序序列中low、mid、high三個位置上數據，選取他們中間的那個數據作爲樞軸*/  

int SelectPivotMedianOfThree(int arr[],int low,int high)  

{  

    int mid = low + ((high - low) >> 1);//計算數組中間的元素的下標  

  

    //使用三數取中法選擇樞軸  

    if (arr[mid] > arr[high])//目標: arr[mid] <= arr[high]  

    {  

        swap(arr[mid],arr[high]);  

    }  

    if (arr[low] > arr[high])//目標: arr[low] <= arr[high]  

    {  

        swap(arr[low],arr[high]);  

    }  

    if (arr[mid] > arr[low]) //目標: arr[low] >= arr[mid]  

    {  

        swap(arr[mid],arr[low]);  

    }  

    //此時，arr[mid] <= arr[low] <= arr[high]  

    return arr[low];  

    //low的位置上保存這三個位置中間的值  

    //分割時可以直接使用low位置的元素作爲樞軸，而不用改變分割函數了  

}  
測試數據：
測試數據分析：使用三數取中選擇樞軸優勢還是很明顯的，但是還是處理不了重複數組
優化1、當待排序序列的長度分割到一定大小後，使用插入排序。
原因：對於很小和部分有序的數組，快排不如插排好。當待排序序列的長度分割到一定大小後，繼續分割的效率比插入排序要差，此時可以使用插排而不是快排
截止範圍：待排序序列長度N = 10，雖然在5~20之間任一截止範圍都有可能產生類似的結果，這種做法也避免了一些有害的退化情形。摘自《數據結構與算法分析》Mark Allen Weiness 著
[cpp]view
plaincopyprint?

if (high - low + 1 < 10)  

{  

    InsertSort(arr,low,high);  

    return;  

}//else時，正常執行快排  
測試數據：
測試數據分析：針對隨機數組，使用三數取中選擇樞軸+插排，效率還是可以提高一點，真是針對已排序的數組，是沒有任何用處的。因爲待排序序列是已經有序的，那麼每次劃分只能使待排序序列減一。此時，插排是發揮不了作用的。所以這裏看不到時間的減少。另外，三數取中選擇樞軸+插排還是不能處理重複數組
優化2、在一次分割結束後，可以把與Key相等的元素聚在一起，繼續下次分割時，不用再對與key相等元素分割
舉例：
待排序序列 1 4 6 7 6 6 7 6 8 6
三數取中選取樞軸：下標爲4的數6
轉換後，待分割序列：6 4 6 7 1 6 7 6 8 6
             樞軸key：6
本次劃分後，未對與key元素相等處理的結果：1 4 6 6 7
6 7 6 8 6
下次的兩個子序列爲：1 4 6 和 7 6 7 6 8 6
本次劃分後，對與key元素相等處理的結果：1
4 6 6 6 6 6 7 8 7
下次的兩個子序列爲：1
4 和 7 8 7

經過對比，我們可以看出，在一次劃分後，把與key相等的元素聚在一起，能減少迭代次數，效率會提高不少
具體過程：在處理過程中，會有兩個步驟
第一步，在劃分過程中，把與key相等元素放入數組的兩端
第二步，劃分結束後，把與key相等的元素移到樞軸周圍
舉例：
待排序序列 1 4 6 7 6 6 7 6 8 6
三數取中選取樞軸：下標爲4的數6
轉換後，待分割序列：6 4 6 7 1 6 7 6 8 6
             樞軸key：6
第一步，在劃分過程中，把與key相等元素放入數組的兩端結果爲：6
4 1 6(樞軸) 7 8 7 6 6 6
此時，與6相等的元素全放入在兩端了
第二步，劃分結束後，把與key相等的元素移到樞軸周圍

結果爲：1 4 66(樞軸)  6
6 6 7 8 7
此時，與6相等的元素全移到樞軸周圍了
之後，在1 4 和 7 8 7兩個子序列進行快排
代碼
[cpp]view
plaincopyprint?

void QSort(int arr[],int low,int high)  

{  

    int first = low;  

    int last = high;  

  

    int left = low;  

    int right = high;  

  

    int leftLen = 0;  

    int rightLen = 0;  

  

    if (high - low + 1 < 10)  

    {  

        InsertSort(arr,low,high);  

        return;  

    }  

      

    //一次分割  

    int key = SelectPivotMedianOfThree(arr,low,high);//使用三數取中法選擇樞軸  

          

    while(low < high)  

    {  

        while(high > low && arr[high] >= key)  

        {  

            if (arr[high] == key)//處理相等元素  

            {  

                swap(arr[right],arr[high]);  

                right--;  

                rightLen++;  

            }  

            high--;  

        }  

        arr[low] = arr[high];  

        while(high > low && arr[low] <= key)  

        {  

            if (arr[low] == key)  

            {  

                swap(arr[left],arr[low]);  

                left++;  

                leftLen++;  

            }  

            low++;  

        }  

        arr[high] = arr[low];  

    }  

    arr[low] = key;  

  

    //一次快排結束  

    //把與樞軸key相同的元素移到樞軸最終位置周圍  

    int i = low - 1;  

    int j = first;  

    while(j < left && arr[i] != key)  

    {  

        swap(arr[i],arr[j]);  

        i--;  

        j++;  

    }  

    i = low + 1;  

    j = last;  

    while(j > right && arr[i] != key)  

    {  

        swap(arr[i],arr[j]);  

        i++;  

        j--;  

    }  

    QSort(arr,first,low - 1 - leftLen);  

    QSort(arr,low + 1 + rightLen,last);  

}  
測試數據：
 測試數據分析：三數取中選擇樞軸+插排+聚集相等元素的組合，效果竟然好的出奇。
原因：在數組中，如果有相等的元素，那麼就可以減少不少冗餘的劃分。這點在重複數組中體現特別明顯啊。
其實這裏，插排的作用還是不怎麼大的。
優化3：優化遞歸操作
快排函數在函數尾部有兩次遞歸操作，我們可以對其使用尾遞歸優化
優點：如果待排序的序列劃分極端不平衡，遞歸的深度將趨近於n，而棧的大小是很有限的，每次遞歸調用都會耗費一定的棧空間，函數的參數越多，每次遞歸耗費的空間也越多。優化後，可以縮減堆棧深度，由原來的O(n)縮減爲O(logn)，將會提高性能。

代碼：
[cpp]view
plaincopyprint?

void QSort(int arr[],int low,int high)  

{   

    int pivotPos = -1;  

    if (high - low + 1 < 10)  

    {  

        InsertSort(arr,low,high);  

        return;  

    }  

    while(low < high)  

    {  

        pivotPos = Partition(arr,low,high);  

        QSort(arr,low,pivot-1);  

        low = pivot + 1;  

    }  

}  
注意：在第一次遞歸後，low就沒用了，此時第二次遞歸可以使用循環代替
測試數據：
測試數據分析：其實這種優化編譯器會自己優化，相比不使用優化的方法，時間幾乎沒有減少
優化4：使用並行或多線程處理子序列（略）
所有的數據測試：
概括：這裏效率最好的快排組合 是：三數取中+插排+聚集相等元素,它和STL中的Sort函數效率差不多
注意：由於測試數據不穩定，數據也僅僅反應大概的情況。如果時間上沒有成倍的增加或減少，僅僅有小額變化的話，我們可以看成時間差不多。
參考文獻
http://blog.sina.com.cn/s/blog_5a3744350100jnec.html
http://www.blogjava.net/killme2008/archive/2010/09/08/331404.html
http://www.cnblogs.com/cj723/archive/2011/04/27/2029993.html
http://blog.csdn.net/zuiaituantuan/article/details/5978009
http://blog.csdn.net/insistgogo/article/details/7785038