算法select可以確認一個有n>1個不同元素的輸入數組中第i小的元素。(如果n=1,則select只返回它的唯一輸入數值作爲第i小的元素。)
1.將輸入數組的n個元素劃分爲n/5(向下取整)組,每組5個元素,則至多隻有一組由剩下的n mod 5個元素組成。
2.尋找這n/5(向上取整)組中每一組的中位數:首先對每組元素進行插入排序,然後確定每組有序元素的中位數。
3.對第2步中找出的n/5(向上取整)箇中位數,遞歸調用select以找出其中位數x(如果有偶數箇中位數,爲了方便,約定x是較小的中位數)。
4.利用修改過的PARTITION版本,按中位數的中位數x對輸入數組進行劃分。讓k比劃分的地區中的元素數目多1,因此x是第k小的元素,並且有n-k個元素在劃分的高區。
5.如果i=k,則返回x。如果i<k,則在低區遞歸調用select來找出第i小的元素。如果i>k,則在高區遞歸查找第i-k小的元素。
參考代碼
#include <stdio.h>
#define ARRAY_SIZE 10
int select(int a[], int l, int r, int k);
int partition(int a[],int p,int r,int pivot);
void insertsort(int a[], int low, int high);
void swap(int a[], int i, int j);
int main(void)
{
int a[ARRAY_SIZE]={25,31,89,12,67,53,44,59,71,19};
printf("%d\n",select(a,0,ARRAY_SIZE-1,6));
}
int select(int a[], int l, int r, int k)
{
int group;
int i;
int left,right,mid;
int pivot;
int p,left_num;
if (r-l+1 <= 5) {
insertsort(a,l,r);
return a[l+k-1];
}
group = (r-l+1+5)/5;
for(i=0; i<group; i++) {
left = l+5*i;
right = (l+5*i+4) > r?r:l+5*i+4; //超出右便捷就使用右邊界賦值
mid = (left+right)/2;
insertsort(a,left,right);
//將各組中位數與前i個元素互換位置,方便遞歸select尋找中位數的中位數
swap(a,l+i,mid);
}
pivot = select(a,l,l+group-1,(group+1)/2); // 找出中位數的中位數
// 用中位數的中位數作爲基準的位置
p = partition(a,l,r,pivot);
left_num = p-l;
if(k == left_num+1)
return a[p];
else if(k<=left_num) //k在低區
return select(a, l, p-1, k);
else //k在高區
return select(a, p+1, r, k-left_num-1);
}
int partition(int a[],int p,int r,int pivot)
{
int x;
int i=p-1;
int j,tmp;
for (j=p;j<r;j++) {
if(a[j] == pivot) {
swap(a,j,r);
}
}
x = a[r];
for(j=p;j<r;j++) {
if(a[j]<=x) {
i++;
tmp=a[i];
a[i]=a[j];
a[j]=tmp;
}
}
tmp=a[r];
a[r]=a[i+1];
a[i+1]=tmp;
return i+1;
}
// 插入排序
void insertsort(int a[], int low, int high)
{
int i,j;
int key;
for(i=low+1; i<=high; i++) {
key = a[i];
for (j=i-1;j>=low&&key<a[j];j--) {
a[j+1] = a[j];
}
a[j+1] = key;
}
}
void swap(int a[], int i, int j)
{
int tmp=a[i];
a[i] = a[j];
a[j] = tmp;
}
它的時間複雜度爲O(n)。