什麼是數據結構?
簡單地說,數據結構是以某種特定的佈局方式存儲數據的容器。這種“佈局方式”決定了數據結構對於某些操作是高效的,而對於其他操作則是低效的。首先我們需要理解各種數據結構,才能在處理實際問題時選取最合適的數據結構。
爲什麼我們需要數據結構?
數據是計算機科學當中最關鍵的實體,而數據結構則可以將數據以某種組織形式存儲,因此,數據結構的價值不言而喻。
無論你以何種方式解決何種問題,你都需要處理數據——無論是涉及員工薪水、股票價格、購物清單,還是隻是簡單的電話簿問題。
數據需要根據不同的場景,按照特定的格式進行存儲。有很多數據結構能夠滿足以不同格式存儲數據的需求。
常見的數據結構
首先列出一些最常見的數據結構,我們將逐一說明:
-
數組
-
棧:是一個類,原理是先進後出。
-
隊列:是一個接口,原理是先進先出。
-
鏈表
-
樹:平衡樹,二叉樹。
-
圖
-
字典樹(這是一種高效的樹形結構,但值得單獨說明)
-
散列表(哈希表)
數組
數組是最簡單、也是使用最廣泛的數據結構。棧、隊列等其他數據結構均由數組演變而來。下圖是一個包含元素(1,2,3和4)的簡單數組,數組長度爲4。
每個數據元素都關聯一個正數值,我們稱之爲索引,它表明數組中每個元素所在的位置。大部分語言將初始索引定義爲零。
以下是數組的兩種類型:
-
一維數組(如上所示)
-
多維數組(數組的數組)
數組的基本操作
-
Insert——在指定索引位置插入一個元素
-
Get——返回指定索引位置的元素
-
Delete——刪除指定索引位置的元素
-
Size——得到數組所有元素的數量
面試中關於數組的常見問題
-
尋找數組中第二小的元素
-
找到數組中第一個不重複出現的整數
-
合併兩個有序數組
-
重新排列數組中的正值和負值
棧
著名的撤銷操作幾乎遍佈任意一個應用。但你有沒有思考過它是如何工作的呢?這個問題的解決思路是按照將最後的狀態排列在先的順序,在內存中存儲歷史工作狀態(當然,它會受限於一定的數量)。這沒辦法用數組實現。但有了棧,這就變得非常方便了。
可以把棧想象成一列垂直堆放的書。爲了拿到中間的書,你需要移除放置在這上面的所有書。這就是LIFO(後進先出)的工作原理。
下圖是包含三個數據元素(1,2和3)的棧,其中頂部的3將被最先移除:
https://mp.weixin.qq.com/s/QZr1muWafFD_dsYqfeMEcQ
棧的基本操作
-
Push——在頂部插入一個元素
-
Pop——返回並移除棧頂元素
-
isEmpty——如果棧爲空,則返回true
-
Top——返回頂部元素,但並不移除它
面試中關於棧的常見問題
-
使用棧計算後綴表達式
-
對棧的元素進行排序
-
判斷表達式是否括號平衡
隊列
與棧相似,隊列是另一種順序存儲元素的線性數據結構。棧與隊列的最大差別在於棧是LIFO(後進先出),而隊列是FIFO,即先進先出。
一個完美的隊列現實例子:售票亭排隊隊伍。如果有新人加入,他需要到隊尾去排隊,而非隊首——排在前面的人會先拿到票,然後離開隊伍。
下圖是包含四個元素(1,2,3和4)的隊列,其中在頂部的1將被最先移除:
移除先入隊的元素、插入新元素
隊列的基本操作
-
Enqueue() —— 在隊列尾部插入元素
-
Dequeue() ——移除隊列頭部的元素
-
isEmpty()——如果隊列爲空,則返回true
-
Top() ——返回隊列的第一個元素
面試中關於隊列的常見問題
-
使用隊列表示棧
-
對隊列的前k個元素倒序
-
使用隊列生成從1到n的二進制數
鏈表
鏈表是另一個重要的線性數據結構,乍一看可能有點像數組,但在內存分配、內部結構以及數據插入和刪除的基本操作方面均有所不同。
鏈表就像一個節點鏈,其中每個節點包含着數據和指向後續節點的指針。 鏈表還包含一個頭指針,它指向鏈表的第一個元素,但當列表爲空時,它指向null或無具體內容。
鏈表一般用於實現文件系統、哈希表和鄰接表。
這是鏈表內部結構的展示:
鏈表包括以下類型:
-
單鏈表(單向)
-
雙向鏈表(雙向)
鏈表的基本操作:
-
InsertAtEnd - 在鏈表的末尾插入指定元素
-
InsertAtHead - 在鏈接列表的開頭/頭部插入指定元素
-
Delete - 從鏈接列表中刪除指定元素
-
DeleteAtHead - 刪除鏈接列表的第一個元素
-
Search - 從鏈表中返回指定元素
-
isEmpty - 如果鏈表爲空,則返回true
面試中關於鏈表的常見問題
-
反轉鏈表
-
檢測鏈表中的循環
-
返回鏈表倒數第N個節點
-
刪除鏈表中的重複項
圖
圖是一組以網絡形式相互連接的節點。節點也稱爲頂點。 一對節點(x,y)稱爲邊(edge),表示頂點x連接到頂點y。邊可以包含權重/成本,顯示從頂點x到y所需的成本。
圖的類型
-
無向圖
-
有向圖
在程序語言中,圖可以用兩種形式表示:
-
鄰接矩陣
-
鄰接表
常見圖遍歷算法
-
廣度優先搜索
-
深度優先搜索
面試中關於圖的常見問題
-
實現廣度和深度優先搜索
-
檢查圖是否爲樹
-
計算圖的邊數
-
找到兩個頂點之間的最短路徑
樹
樹形結構是一種層級式的數據結構,由頂點(節點)和連接它們的邊組成。 樹類似於圖,但區分樹和圖的重要特徵是樹中不存在環路。
樹形結構被廣泛應用於人工智能和複雜算法,它可以提供解決問題的有效存儲機制。
這是一個簡單樹的示意圖,以及樹數據結構中使用的基本術語:
Root - 根節點
Parent - 父節點
Child - 子節點
Leaf - 葉子節點
Sibling - 兄弟節點
以下是樹形結構的主要類型:
-
N元樹
-
平衡樹
-
二叉樹
-
二叉搜索樹
-
AVL樹
-
紅黑樹
-
2-3樹
其中,二叉樹和二叉搜索樹是最常用的樹。
面試中關於樹結構的常見問題:
-
求二叉樹的高度
-
在二叉搜索樹中查找第k個最大值
-
查找與根節點距離k的節點
-
在二叉樹中查找給定節點的祖先節點
字典樹(Trie)
字典樹,也稱爲“前綴樹”,是一種特殊的樹狀數據結構,對於解決字符串相關問題非常有效。它能夠提供快速檢索,主要用於搜索字典中的單詞,在搜索引擎中自動提供建議,甚至被用於IP的路由。
以下是在字典樹中存儲三個單詞“top”,“so”和“their”的例子:
這些單詞以頂部到底部的方式存儲,其中綠色節點“p”,“s”和“r”分別表示“top”,“thus”和“theirs”的底部。
面試中關於字典樹的常見問題
-
計算字典樹中的總單詞數
-
打印存儲在字典樹中的所有單詞
-
使用字典樹對數組的元素進行排序
-
使用字典樹從字典中形成單詞
-
構建T9字典(字典樹+ DFS )
哈希表
哈希法(Hashing)是一個用於唯一標識對象並將每個對象存儲在一些預先計算的唯一索引(稱爲“鍵(key)”)中的過程。因此,對象以鍵值對的形式存儲,這些鍵值對的集合被稱爲“字典”。可以使用鍵搜索每個對象。基於哈希法有很多不同的數據結構,但最常用的數據結構是哈希表。
哈希表通常使用數組實現。
散列數據結構的性能取決於以下三個因素:
-
哈希函數
-
哈希表的大小
-
碰撞處理方法
下圖爲如何在數組中映射哈希鍵值對的說明。該數組的索引是通過哈希函數計算的。
面試中關於哈希結構的常見問題:
-
在數組中查找對稱鍵值對
-
追蹤遍歷的完整路徑
-
查找數組是否是另一個數組的子集
-
檢查給定的數組是否不相交
以上是在編程面試之前你應該知曉的八大數據結構。