前言

樹是數據結構中的重中之重，尤其以各類二叉樹爲學習的難點。一直以來，對於樹的掌握都是模棱兩可的狀態，現在希望通過寫一個關於二叉樹的專題系列。在學習與總結的同時更加深入的瞭解掌握二叉樹。本系列文章將着重介紹一般二叉樹、完全二叉樹、滿二叉樹、線索二叉樹、霍夫曼樹、二叉排序樹、平衡二叉樹、紅黑樹、B樹。

1 重點概念

1.1 結點概念

結點是數據結構中的基礎，是構成複雜數據結構的基本組成單位。

1.2 樹結點聲明

本系列文章中提及的結點專指樹的結點。例如：結點A在圖中表示爲：

2 樹

2.1 定義

樹（Tree）是n（n>=0)個結點的有限集。n=0時稱爲空樹。在任意一顆非空樹中：
1）有且僅有一個特定的稱爲根（Root）的結點；
2）當n>1時，其餘結點可分爲m(m>0)個互不相交的有限集T1、T2、......、Tn，其中每一個集合本身又是一棵樹，並且稱爲根的子樹。

此外，樹的定義還需要強調以下兩點：
1）n>0時根結點是唯一的，不可能存在多個根結點，數據結構中的樹只能有一個根結點。
2）m>0時，子樹的個數沒有限制，但它們一定是互不相交的。
示例樹：
圖2.1爲一棵普通的樹：

由樹的定義可以看出，樹的定義使用了遞歸的方式。遞歸在樹的學習過程中起着重要作用，如果對於遞歸不是十分了解，建議先看看遞歸算法

2.2 結點的度

結點擁有的子樹數目稱爲結點的度。
圖2.2中標註了圖2.1所示樹的各個結點的度。

2.3 結點關係

結點子樹的根結點爲該結點的孩子結點。相應該結點稱爲孩子結點的雙親結點。
圖2.2中，A爲B的雙親結點，B爲A的孩子結點。
同一個雙親結點的孩子結點之間互稱兄弟結點。
圖2.2中，結點B與結點C互爲兄弟結點。

2.4 結點層次

從根開始定義起，根爲第一層，根的孩子爲第二層，以此類推。
圖2.3表示了圖2.1所示樹的層次關係

2.5 樹的深度

樹中結點的最大層次數稱爲樹的深度或高度。圖2.1所示樹的深度爲4。

3 二叉樹

3.1 定義

二叉樹是n(n>=0)個結點的有限集合，該集合或者爲空集（稱爲空二叉樹），或者由一個根結點和兩棵互不相交的、分別稱爲根結點的左子樹和右子樹組成。
圖3.1展示了一棵普通二叉樹：

3.2 二叉樹特點

由二叉樹定義以及圖示分析得出二叉樹有以下特點：
1）每個結點最多有兩顆子樹，所以二叉樹中不存在度大於2的結點。
2）左子樹和右子樹是有順序的，次序不能任意顛倒。
3）即使樹中某結點只有一棵子樹，也要區分它是左子樹還是右子樹。

3.3 二叉樹性質

1）在二叉樹的第i層上最多有2i-1 個節點。（i>=1）
2）二叉樹中如果深度爲k,那麼最多有2k-1個節點。(k>=1）
3）n0=n2+1 n0表示度數爲0的節點數，n2表示度數爲2的節點數。
4）在完全二叉樹中，具有n個節點的完全二叉樹的深度爲[log2n]+1，其中[log2n]是向下取整。
5）若對含 n 個結點的完全二叉樹從上到下且從左至右進行 1 至 n 的編號，則對完全二叉樹中任意一個編號爲 i 的結點有如下特性：

(1) 若 i=1，則該結點是二叉樹的根，無雙親, 否則，編號爲 [i/2] 的結點爲其雙親結點;
(2) 若 2i>n，則該結點無左孩子，否則，編號爲 2i 的結點爲其左孩子結點；
(3) 若 2i+1>n，則該結點無右孩子結點，否則，編號爲2i+1 的結點爲其右孩子結點。

3.4 斜樹

斜樹：所有的結點都只有左子樹的二叉樹叫左斜樹。所有結點都是隻有右子樹的二叉樹叫右斜樹。這兩者統稱爲斜樹。

3.5 滿二叉樹

滿二叉樹：在一棵二叉樹中。如果所有分支結點都存在左子樹和右子樹，並且所有葉子都在同一層上，這樣的二叉樹稱爲滿二叉樹。
滿二叉樹的特點有：
1）葉子只能出現在最下一層。出現在其它層就不可能達成平衡。
2）非葉子結點的度一定是2。
3）在同樣深度的二叉樹中，滿二叉樹的結點個數最多，葉子數最多。

3.6 完全二叉樹

完全二叉樹：對一顆具有n個結點的二叉樹按層編號，如果編號爲i(1<=i<=n)的結點與同樣深度的滿二叉樹中編號爲i的結點在二叉樹中位置完全相同，則這棵二叉樹稱爲完全二叉樹。
圖3.5展示一棵完全二叉樹

特點：
1）葉子結點只能出現在最下層和次下層。
2）最下層的葉子結點集中在樹的左部。
3）倒數第二層若存在葉子結點，一定在右部連續位置。
4）如果結點度爲1，則該結點只有左孩子，即沒有右子樹。
5）同樣結點數目的二叉樹，完全二叉樹深度最小。
注：滿二叉樹一定是完全二叉樹，但反過來不一定成立。

3.7 二叉樹的存儲結構

3.7.1 順序存儲

二叉樹的順序存儲結構就是使用一維數組存儲二叉樹中的結點，並且結點的存儲位置，就是數組的下標索引。

圖3.6所示的一棵完全二叉樹採用順序存儲方式，如圖3.7表示：

由圖3.7可以看出，當二叉樹爲完全二叉樹時，結點數剛好填滿數組。
那麼當二叉樹不爲完全二叉樹時，採用順序存儲形式如何呢？例如：對於圖3.8描述的二叉樹：

其中淺色結點表示結點不存在。那麼圖3.8所示的二叉樹的順序存儲結構如圖3.9所示：

其中，∧表示數組中此位置沒有存儲結點。此時可以發現，順序存儲結構中已經出現了空間浪費的情況。
那麼對於圖3.3所示的右斜樹極端情況對應的順序存儲結構如圖3.10所示：

由圖3.10可以看出，對於這種右斜樹極端情況，採用順序存儲的方式是十分浪費空間的。因此，順序存儲一般適用於完全二叉樹。

3.7.2 二叉鏈表

既然順序存儲不能滿足二叉樹的存儲需求，那麼考慮採用鏈式存儲。由二叉樹定義可知，二叉樹的每個結點最多有兩個孩子。因此，可以將結點數據結構定義爲一個數據和兩個指針域。表示方式如圖3.11所示：

定義結點代碼：

typedef struct BiTNode{
    TElemType data;//數據
    struct BiTNode *lchild, *rchild;//左右孩子指針
} BiTNode, *BiTree;

則圖3.6所示的二叉樹可以採用圖3.12表示。

圖3.12中採用一種鏈表結構存儲二叉樹，這種鏈表稱爲二叉鏈表。

3.8 二叉樹遍歷

二叉樹的遍歷一個重點考查的知識點。

3.8.1 定義

二叉樹的遍歷是指從二叉樹的根結點出發，按照某種次序依次訪問二叉樹中的所有結點，使得每個結點被訪問一次，且僅被訪問一次。
二叉樹的訪問次序可以分爲四種：

前序遍歷
中序遍歷
後序遍歷
層序遍歷

3.8.2 前序遍歷

前序遍歷通俗的說就是從二叉樹的根結點出發，當第一次到達結點時就輸出結點數據，按照先向左在向右的方向訪問。

圖3.13所示二叉樹前序訪問如下：

從根結點出發，則第一次到達結點A，故輸出A;
繼續向左訪問，第一次訪問結點B，故輸出B；
按照同樣規則，輸出D，輸出H；
當到達葉子結點H，返回到D，此時已經是第二次到達D，故不在輸出D，進而向D右子樹訪問，D右子樹不爲空，則訪問至I，第一次到達I，則輸出I；
I爲葉子結點，則返回到D，D左右子樹已經訪問完畢，則返回到B，進而到B右子樹，第一次到達E，故輸出E；
向E左子樹，故輸出J；
按照同樣的訪問規則，繼續輸出C、F、G；

則3.13所示二叉樹的前序遍歷輸出爲：
ABDHIEJCFG

3.8.3 中序遍歷

中序遍歷就是從二叉樹的根結點出發，當第二次到達結點時就輸出結點數據，按照先向左在向右的方向訪問。

圖3.13所示二叉樹中序訪問如下：

從根結點出發，則第一次到達結點A，不輸出A，繼續向左訪問，第一次訪問結點B，不輸出B；繼續到達D，H；
到達H，H左子樹爲空，則返回到H，此時第二次訪問H，故輸出H；
H右子樹爲空，則返回至D，此時第二次到達D，故輸出D；
由D返回至B，第二次到達B，故輸出B；
按照同樣規則繼續訪問，輸出J、E、A、F、C、G；

則3.13所示二叉樹的中序遍歷輸出爲：
HDIBJEAFCG

3.8.4 後序遍歷

後序遍歷就是從二叉樹的根結點出發，當第三次到達結點時就輸出結點數據，按照先向左在向右的方向訪問。

圖3.13所示二叉樹後序訪問如下：

從根結點出發，則第一次到達結點A，不輸出A，繼續向左訪問，第一次訪問結點B，不輸出B；繼續到達D，H；
到達H，H左子樹爲空，則返回到H，此時第二次訪問H，不輸出H；
H右子樹爲空，則返回至H，此時第三次到達H，故輸出H；
由H返回至D，第二次到達D，不輸出D；
繼續訪問至I，I左右子樹均爲空，故第三次訪問I時，輸出I；
返回至D，此時第三次到達D，故輸出D；
按照同樣規則繼續訪問，輸出J、E、B、F、G、C，A；

則圖3.13所示二叉樹的後序遍歷輸出爲：
HIDJEBFGCA
雖然二叉樹的遍歷過程看似繁瑣，但是由於二叉樹是一種遞歸定義的結構，故採用遞歸方式遍歷二叉樹的代碼十分簡單。
遞歸實現代碼如下：

/*二叉樹的前序遍歷遞歸算法*/
void PreOrderTraverse(BiTree T)
{
    if(T==NULL)
    return;
    printf("%c", T->data);  /*顯示結點數據，可以更改爲其他對結點操作*/
    PreOrderTraverse(T->lchild);    /*再先序遍歷左子樹*/
    PreOrderTraverse(T->rchild);    /*最後先序遍歷右子樹*/
}


/*二叉樹的中序遍歷遞歸算法*/
void InOrderTraverse(BiTree T)
{
    if(T==NULL)
    return;
    InOrderTraverse(T->lchild); /*中序遍歷左子樹*/
    printf("%c", T->data);  /*顯示結點數據，可以更改爲其他對結點操作*/
    InOrderTraverse(T->rchild); /*最後中序遍歷右子樹*/
}


/*二叉樹的後序遍歷遞歸算法*/
void PostOrderTraverse(BiTree T)
{
    if(T==NULL)
    return;
    PostOrderTraverse(T->lchild);   /*先後序遍歷左子樹*/
    PostOrderTraverse(T->rchild);   /*再後續遍歷右子樹*/
    printf("%c", T->data);  /*顯示結點數據，可以更改爲其他對結點操作*/
}

3.8.5 層次遍歷

層次遍歷就是按照樹的層次自上而下的遍歷二叉樹。針對圖3.13所示二叉樹的層次遍歷結果爲：
ABCDEFGHIJ

3.8.6 遍歷常考考點

對於二叉樹的遍歷有一類典型題型。
1）已知前序遍歷序列和中序遍歷序列，確定一棵二叉樹。
例題：若一棵二叉樹的前序遍歷爲ABCDEF，中序遍歷爲CBAEDF，請畫出這棵二叉樹。
分析：前序遍歷第一個輸出結點爲根結點，故A爲根結點。早中序遍歷中根結點處於左右子樹結點中間，故結點A的左子樹中結點有CB，右子樹中結點有EDF。
如圖3.14所示：

按照同樣的分析方法，對A的左右子樹進行劃分，最後得出二叉樹的形態如圖3.15所示：

2）已知後序遍歷序列和中序遍歷序列，確定一棵二叉樹。
後序遍歷中最後訪問的爲根結點，因此可以按照上述同樣的方法，找到根結點後分成兩棵子樹，進而繼續找到子樹的根結點，一步步確定二叉樹的形態。
注：已知前序遍歷序列和後序遍歷序列，不可以唯一確定一棵二叉樹。

4 結語

通過上述的介紹，已經對於二叉樹有了初步的認識。本篇文章介紹的基礎知識希望讀者能夠牢牢掌握，並且能夠在腦海中建立一棵二叉樹的模型，爲後續學習打好基礎。

二叉樹的深入學習（一）二叉樹基礎

前言