JavaScript 數據結構與算法之美 - 冒泡排序、插入排序、選擇排序

JavaScript 數據結構與算法之美

1. 前言

算法爲王。

想學好前端,先練好內功,只有內功深厚者,前端之路纔會走得更遠

筆者寫的 JavaScript 數據結構與算法之美 系列用的語言是 JavaScript ,旨在入門數據結構與算法和方便以後複習。

之所以把冒泡排序、選擇排序、插入排序放在一起比較,是因爲它們的平均時間複雜度都爲 O(n2)。

請大家帶着問題:爲什麼插入排序比冒泡排序更受歡迎 ?來閱讀下文。

2. 如何分析一個排序算法

複雜度分析是整個算法學習的精髓。

  • 時間複雜度: 一個算法執行所耗費的時間。
  • 空間複雜度: 運行完一個程序所需內存的大小。

時間和空間複雜度的詳解,請看 JavaScript 數據結構與算法之美 - 時間和空間複雜度

學習排序算法,我們除了學習它的算法原理、代碼實現之外,更重要的是要學會如何評價、分析一個排序算法。

分析一個排序算法,要從 執行效率內存消耗穩定性 三方面入手。

2.1 執行效率

1. 最好情況、最壞情況、平均情況時間複雜度

我們在分析排序算法的時間複雜度時,要分別給出最好情況、最壞情況、平均情況下的時間複雜度。
除此之外,你還要說出最好、最壞時間複雜度對應的要排序的原始數據是什麼樣的。

2. 時間複雜度的係數、常數 、低階

我們知道,時間複雜度反應的是數據規模 n 很大的時候的一個增長趨勢,所以它表示的時候會忽略係數、常數、低階。

但是實際的軟件開發中,我們排序的可能是 10 個、100 個、1000 個這樣規模很小的數據,所以,在對同一階時間複雜度的排序算法性能對比的時候,我們就要把係數、常數、低階也考慮進來。

3. 比較次數和交換(或移動)次數

這一節和下一節講的都是基於比較的排序算法。基於比較的排序算法的執行過程,會涉及兩種操作,一種是元素比較大小,另一種是元素交換或移動。

所以,如果我們在分析排序算法的執行效率的時候,應該把比較次數和交換(或移動)次數也考慮進去。

2.2 內存消耗

也就是看空間複雜度。

還需要知道如下術語:

  • 內排序:所有排序操作都在內存中完成;
  • 外排序:由於數據太大,因此把數據放在磁盤中,而排序通過磁盤和內存的數據傳輸才能進行;
  • 原地排序:原地排序算法,就是特指空間複雜度是 O(1) 的排序算法。
    其中,冒泡排序就是原地排序算法。

2.3 穩定性

  • 穩定:如果待排序的序列中存在值相等的元素,經過排序之後,相等元素之間原有的先後順序不變
    比如: a 原本在 b 前面,而 a = b,排序之後,a 仍然在 b 的前面;
  • 不穩定:如果待排序的序列中存在值相等的元素,經過排序之後,相等元素之間原有的先後順序改變
    比如:a 原本在 b 的前面,而 a = b,排序之後, a 在 b 的後面;

3. 冒泡排序

冒泡

思想

  • 冒泡排序只會操作相鄰的兩個數據。
  • 每次冒泡操作都會對相鄰的兩個元素進行比較,看是否滿足大小關係要求。如果不滿足就讓它倆互換。
  • 一次冒泡會讓至少一個元素移動到它應該在的位置,重複 n 次,就完成了 n 個數據的排序工作。

特點

  • 優點:排序算法的基礎,簡單實用易於理解。
  • 缺點:比較次數多,效率較低。

實現

// 冒泡排序(未優化)
const bubbleSort = arr => {
	console.time('改進前冒泡排序耗時');
	const length = arr.length;
	if (length <= 1) return;
	// i < length - 1 是因爲外層只需要 length-1 次就排好了,第 length 次比較是多餘的。
	for (let i = 0; i < length - 1; i++) {
		// j < length - i - 1 是因爲內層的 length-i-1 到 length-1 的位置已經排好了,不需要再比較一次。
		for (let j = 0; j < length - i - 1; j++) {
			if (arr[j] > arr[j + 1]) {
				const temp = arr[j];
				arr[j] = arr[j + 1];
				arr[j + 1] = temp;
			}
		}
	}
	console.log('改進前 arr :', arr);
	console.timeEnd('改進前冒泡排序耗時');
};

優化:當某次冒泡操作已經沒有數據交換時,說明已經達到完全有序,不用再繼續執行後續的冒泡操作。

// 冒泡排序(已優化)
const bubbleSort2 = arr => {
	console.time('改進後冒泡排序耗時');
	const length = arr.length;
	if (length <= 1) return;
	// i < length - 1 是因爲外層只需要 length-1 次就排好了,第 length 次比較是多餘的。
	for (let i = 0; i < length - 1; i++) {
		let hasChange = false; // 提前退出冒泡循環的標誌位
		// j < length - i - 1 是因爲內層的 length-i-1 到 length-1 的位置已經排好了,不需要再比較一次。
		for (let j = 0; j < length - i - 1; j++) {
			if (arr[j] > arr[j + 1]) {
				const temp = arr[j];
				arr[j] = arr[j + 1];
				arr[j + 1] = temp;
				hasChange = true; // 表示有數據交換
			}
		}

		if (!hasChange) break; // 如果 false 說明所有元素已經到位,沒有數據交換,提前退出
	}
	console.log('改進後 arr :', arr);
	console.timeEnd('改進後冒泡排序耗時');
};

測試

// 測試
const arr = [7, 8, 4, 5, 6, 3, 2, 1];
bubbleSort(arr);
// 改進前 arr : [1, 2, 3, 4, 5, 6, 7, 8]
// 改進前冒泡排序耗時: 0.43798828125ms

const arr2 = [7, 8, 4, 5, 6, 3, 2, 1];
bubbleSort2(arr2);
// 改進後 arr : [1, 2, 3, 4, 5, 6, 7, 8]
// 改進後冒泡排序耗時: 0.318115234375ms

分析

  • 第一,冒泡排序是原地排序算法嗎 ?
    冒泡的過程只涉及相鄰數據的交換操作,只需要常量級的臨時空間,所以它的空間複雜度爲 O(1),是一個原地排序算法。
  • 第二,冒泡排序是穩定的排序算法嗎 ?
    在冒泡排序中,只有交換纔可以改變兩個元素的前後順序。
    爲了保證冒泡排序算法的穩定性,當有相鄰的兩個元素大小相等的時候,我們不做交換,相同大小的數據在排序前後不會改變順序。
    所以冒泡排序是穩定的排序算法。
  • 第三,冒泡排序的時間複雜度是多少 ?
    最佳情況:T(n) = O(n),當數據已經是正序時。
    最差情況:T(n) = O(n2),當數據是反序時。
    平均情況:T(n) = O(n2)。

動畫

冒泡排序動畫

冒泡排序動畫

4. 插入排序

插入排序又爲分爲 直接插入排序 和優化後的 拆半插入排序希爾排序,我們通常說的插入排序是指直接插入排序。

一、直接插入

思想

一般人打撲克牌,整理牌的時候,都是按牌的大小(從小到大或者從大到小)整理牌的,那每摸一張新牌,就掃描自己的牌,把新牌插入到相應的位置。

插入排序的工作原理:通過構建有序序列,對於未排序數據,在已排序序列中從後向前掃描,找到相應位置並插入。

步驟

  • 從第一個元素開始,該元素可以認爲已經被排序;
  • 取出下一個元素,在已經排序的元素序列中從後向前掃描;
  • 如果該元素(已排序)大於新元素,將該元素移到下一位置;
  • 重複步驟 3,直到找到已排序的元素小於或者等於新元素的位置;
  • 將新元素插入到該位置後;
  • 重複步驟 2~5。

實現

// 插入排序
const insertionSort = array => {
	const len = array.length;
	if (len <= 1) return

	let preIndex, current;
	for (let i = 1; i < len; i++) {
		preIndex = i - 1; //待比較元素的下標
		current = array[i]; //當前元素
		while (preIndex >= 0 && array[preIndex] > current) {
			//前置條件之一: 待比較元素比當前元素大
			array[preIndex + 1] = array[preIndex]; //將待比較元素後移一位
			preIndex--; //遊標前移一位
		}
		if (preIndex + 1 != i) {
			//避免同一個元素賦值給自身
			array[preIndex + 1] = current; //將當前元素插入預留空位
			console.log('array :', array);
		}
	}
	return array;
};

測試

// 測試
const array = [5, 4, 3, 2, 1];
console.log("原始 array :", array);
insertionSort(array);
// 原始 array:    [5, 4, 3, 2, 1]
// array:  		 [4, 5, 3, 2, 1]
// array:  		 [3, 4, 5, 2, 1]
// array: 		 [2, 3, 4, 5, 1]
// array:  		 [1, 2, 3, 4, 5]

分析

  • 第一,冒泡排序是原地排序算法嗎 ?
    插入排序算法的運行並不需要額外的存儲空間,所以空間複雜度是 O(1),所以,這是一個原地排序算法。
  • 第二,冒泡排序是穩定的排序算法嗎 ?
    在插入排序中,對於值相同的元素,我們可以選擇將後面出現的元素,插入到前面出現元素的後面,這樣就可以保持原有的前後順序不變,所以插入排序是穩定的排序算法。
  • 第三,冒泡排序的時間複雜度是多少 ?
    最佳情況:T(n) = O(n),當數據已經是正序時。
    最差情況:T(n) = O(n2),當數據是反序時。
    平均情況:T(n) = O(n2)。

動畫

insertion-sort.gif

二、拆半插入

插入排序也有一種優化算法,叫做拆半插入

思想

折半插入排序是直接插入排序的升級版,鑑於插入排序第一部分爲已排好序的數組, 我們不必按順序依次尋找插入點, 只需比較它們的中間值與待插入元素的大小即可。

步驟

  • 取 0 ~ i-1 的中間點 ( m = (i-1)>>1 ),array[i] 與 array[m] 進行比較,若 array[i] < array[m],則說明待插入的元素 array[i] 應該處於數組的 0 ~ m 索引之間;反之,則說明它應該處於數組的 m ~ i-1 索引之間。
  • 重複步驟 1,每次縮小一半的查找範圍,直至找到插入的位置。
  • 將數組中插入位置之後的元素全部後移一位。
  • 在指定位置插入第 i 個元素。

注:x>>1 是位運算中的右移運算,表示右移一位,等同於 x 除以 2 再取整,即 x>>1 == Math.floor(x/2) 。

// 折半插入排序
const binaryInsertionSort = array => {
	const len = array.length;
	if (len <= 1) return;

	let current, i, j, low, high, m;
	for (i = 1; i < len; i++) {
		low = 0;
		high = i - 1;
		current = array[i];

		while (low <= high) {
			//步驟 1 & 2 : 折半查找
			m = (low + high) >> 1; // 注: x>>1 是位運算中的右移運算, 表示右移一位, 等同於 x 除以 2 再取整, 即 x>>1 == Math.floor(x/2) .
			if (array[i] >= array[m]) {
				//值相同時, 切換到高半區,保證穩定性
				low = m + 1; //插入點在高半區
			} else {
				high = m - 1; //插入點在低半區
			}
		}
		for (j = i; j > low; j--) {
			//步驟 3: 插入位置之後的元素全部後移一位
			array[j] = array[j - 1];
			console.log('array2 :', JSON.parse(JSON.stringify(array)));
		}
		array[low] = current; //步驟 4: 插入該元素
	}
	console.log('array2 :', JSON.parse(JSON.stringify(array)));
	return array;
};

測試

const array2 = [5, 4, 3, 2, 1];
console.log('原始 array2:', array2);
binaryInsertionSort(array2);
// 原始 array2:  [5, 4, 3, 2, 1]
// array2 :     [5, 5, 3, 2, 1]
// array2 :     [4, 5, 5, 2, 1]
// array2 :     [4, 4, 5, 2, 1]
// array2 :     [3, 4, 5, 5, 1]
// array2 :     [3, 4, 4, 5, 1]
// array2 :     [3, 3, 4, 5, 1]
// array2 :     [2, 3, 4, 5, 5]
// array2 :     [2, 3, 4, 4, 5]
// array2 :     [2, 3, 3, 4, 5]
// array2 :     [2, 2, 3, 4, 5]
// array2 :     [1, 2, 3, 4, 5]

注意:和直接插入排序類似,折半插入排序每次交換的是相鄰的且值爲不同的元素,它並不會改變值相同的元素之間的順序,因此它是穩定的。

三、希爾排序

希爾排序是一個平均時間複雜度爲 O(nlogn) 的算法,會在下一個章節和 歸併排序、快速排序、堆排序 一起講,本文就不展開了。

5. 選擇排序

思路

選擇排序算法的實現思路有點類似插入排序,也分已排序區間和未排序區間。但是選擇排序每次會從未排序區間中找到最小的元素,將其放到已排序區間的末尾。

步驟

  1. 首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置。
  2. 再從剩餘未排序元素中繼續尋找最小(大)元素,然後放到已排序序列的末尾。
  3. 重複第二步,直到所有元素均排序完畢。

實現

const selectionSort = array => {
	const len = array.length;
	let minIndex, temp;
	for (let i = 0; i < len - 1; i++) {
		minIndex = i;
		for (let j = i + 1; j < len; j++) {
			if (array[j] < array[minIndex]) {
				// 尋找最小的數
				minIndex = j; // 將最小數的索引保存
			}
		}
		temp = array[i];
		array[i] = array[minIndex];
		array[minIndex] = temp;
		console.log('array: ', array);
	}
	return array;
};

測試

// 測試
const array = [5, 4, 3, 2, 1];
console.log('原始array:', array);
selectionSort(array);
// 原始 array:  [5, 4, 3, 2, 1]
// array:  		 [1, 4, 3, 2, 5]
// array:  		 [1, 2, 3, 4, 5]
// array: 		 [1, 2, 3, 4, 5]
// array:  		 [1, 2, 3, 4, 5]

分析

  • 第一,選擇排序是原地排序算法嗎 ?
    選擇排序空間複雜度爲 O(1),是一種原地排序算法。
  • 第二,選擇排序是穩定的排序算法嗎 ?
    選擇排序每次都要找剩餘未排序元素中的最小值,並和前面的元素交換位置,這樣破壞了穩定性。所以,選擇排序是一種不穩定的排序算法。
  • 第三,選擇排序的時間複雜度是多少 ?
    無論是正序還是逆序,選擇排序都會遍歷 n2 / 2 次來排序,所以,最佳、最差和平均的複雜度是一樣的。
    最佳情況:T(n) = O(n2)。
    最差情況:T(n) = O(n2)。
    平均情況:T(n) = O(n2)。

動畫

selection-sort.gif

6. 解答開篇

爲什麼插入排序比冒泡排序更受歡迎 ?

冒泡排序和插入排序的時間複雜度都是 O(n2),都是原地排序算法,爲什麼插入排序要比冒泡排序更受歡迎呢 ?

這裏關乎到 逆序度、滿有序度、有序度。

  • 有序度:是數組中具有有序關係的元素對的個數。
    有序元素對用數學表達式表示就是這樣:
有序元素對:a[i] <= a[j], 如果 i < j。
  • 滿有序度:把完全有序的數組的有序度叫作 滿有序度

  • 逆序度:正好跟有序度相反(默認從小到大爲有序)。

逆序元素對:a[i] > a[j], 如果 i < j。

同理,對於一個倒序排列的數組,比如 6,5,4,3,2,1,有序度是 0;
對於一個完全有序的數組,比如 1,2,3,4,5,6,有序度就是 n(n-1)/2* ,也就是滿有序度爲 15。

原因

  • 冒泡排序不管怎麼優化,元素交換的次數是一個固定值,是原始數據的逆序度。
  • 插入排序是同樣的,不管怎麼優化,元素移動的次數也等於原始數據的逆序度。
  • 但是,冒泡排序的數據交換要比插入排序的數據移動要複雜,冒泡排序需要 3 個賦值操作,而插入排序只需要 1 個,數據量一旦大了,這差別就非常明顯了。

7. 排序算法的複雜性對比

複雜性對比

名稱 最好 平均 最壞 內存 穩定性 備註
冒泡 n n2 n2 1 Yes
插入 n n2 n2 1 Yes
選擇 n2 n2 n2 1 No

算法可視化工具

這裏推薦一個算法可視化工具。

算法可視化工具 algorithm-visualizer 是一個交互式的在線平臺,可以從代碼中可視化算法,還可以看到代碼執行的過程。

效果如下圖。

算法可視化工具

8. 文章輸出計劃

JavaScript 數據結構與算法之美 的系列文章,堅持 3 - 7 天左右更新一篇,暫定計劃如下表。

標題 鏈接
時間和空間複雜度 https://github.com/biaochenxuying/blog/issues/29
線性表(數組、鏈表、棧、隊列) https://github.com/biaochenxuying/blog/issues/34
實現一個前端路由,如何實現瀏覽器的前進與後退 ? https://github.com/biaochenxuying/blog/issues/30
棧內存與堆內存 、淺拷貝與深拷貝 https://github.com/biaochenxuying/blog/issues/35
遞歸 https://github.com/biaochenxuying/blog/issues/36
非線性表(樹、堆) https://github.com/biaochenxuying/blog/issues/37
冒泡排序、選擇排序、插入排序 https://github.com/biaochenxuying/blog/issues/39
歸併排序、快速排序、希爾排序、堆排序 精彩待續
計數排序、桶排序、基數排序 精彩待續
十大經典排序彙總 精彩待續
強烈推薦 GitHub 上值得前端學習的數據結構與算法項目 https://github.com/biaochenxuying/blog/issues/43

如果有錯誤或者不嚴謹的地方,請務必給予指正,十分感謝。

9. 最後

喜歡就點個贊吧。

文中所有的代碼及測試事例都已經放到我的 GitHub 上了。

參考文章:

全棧修煉

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章