簡介
在開發中經常遇到樹形結構的場景,本文將以部門表爲例對比幾種設計的優缺點;
問題
需求背景:根據部門檢索人員,
問題:選擇一個頂級部門情況下,跨級展示當前部門以及子部門下的所有人員,表怎麼設計更合理 ?
- 遞歸嗎 ?遞歸可以解決,但是勢必消耗性能
設計1:鄰接表
表設計
CREATE TABLE `dept_info01` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
`dept_id` int(10) NOT NULL COMMENT '部門id',
`dept_name` varchar(100) NOT NULL COMMENT '部門名稱',
`dept_parent_id` int(11) NOT NULL COMMENT '父部門id',
`create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '創建時間',
`update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
這樣是最常見的設計,能正確的表達菜單的樹狀結構且沒有冗餘數據,但在跨層級查詢需要遞歸處理。
SQL示例
1.查詢某一個節點的直接子集
SELECT * FROM dept_info01 WHERE dept_parent_id =1001
優點
- 結構簡單 ;
缺點
1.不使用遞歸情況下無法查詢某節點所有父級,所有子集
設計2:路徑枚舉
在設計1基礎上新增一個父部門id集字段,用來存儲所有父集,多個以固定分隔符分隔,比如逗號。
表設計
CREATE TABLE `dept_info02` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
`dept_id` int(10) NOT NULL COMMENT '部門id',
`dept_name` varchar(100) NOT NULL COMMENT '部門名稱',
`dept_parent_id` int(11) NOT NULL COMMENT '父部門id',
`dept_parent_ids` varchar(255) NOT NULL DEFAULT '' COMMENT '父部門id集',
`create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '創建時間',
`update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
SQL示例
1.查詢所有子集
1).通過模糊查詢
SELECT
*
FROM
dept_info02
WHERE
dept_parent_ids like '%1001%'
2).推薦使用 FIND_IN_SET 函數
SELECT
*
FROM
dept_info02
WHERE
FIND_IN_SET( '1001', dept_parent_ids )
優點
- 方便查詢所有的子集 ;
- 可以因此通過比較字符串dept_parent_ids長度獲取當前節點層級 ;
缺點
- 新增節點時需要將dept_parent_ids字段值處理好 ;
- dept_parent_ids字段的長度很難確定,無論長度設爲多大,都存在不能夠無限擴展的情況 ;
- 節點移動複雜,需要同時變更所有子集中的dept_parent_ids字段值 ;
設計3:閉包表
- 閉包表是解決分級存儲的一個簡單而優雅的解決方案,這是一種通過空間換取時間的方式 ;
- 需要額外創建了一張TreePaths表它記錄了樹中所有節點間的關係 ;
- 包含兩列,祖先列與後代列,即使這兩個節點之間不是直接的父子關係;同時增加一行指向節點自己 ;
表設計
- 主表
CREATE TABLE `dept_info03` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
`dept_id` int(10) NOT NULL COMMENT '部門id',
`dept_name` varchar(100) NOT NULL COMMENT '部門名稱',
`create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '創建時間',
`update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
- 祖先後代關係表
CREATE TABLE `dept_tree_path_info` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
`ancestor` int(10) NOT NULL COMMENT '祖先id',
`descendant` int(10) NOT NULL COMMENT '後代id',
`depth` tinyint(4) NOT NULL DEFAULT '0' COMMENT '層級深度',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
注:depth 層級深度字段 ,自我引用爲 1,直接子節點爲 2,再一下層爲 3,一次類推,第幾層就是幾 。
SQL示例
插入新節點
INSERT INTO dept_tree_path_info (ancestor, descendant,depth)
SELECT t.ancestor, 3001,t.depth+1 FROM dept_tree_path_info AS t
WHERE t.descendant = 2001
UNION ALL
SELECT 3001,3001,1
查詢所有祖先
SELECT
c.*
FROM
dept_info03 AS c
INNER JOIN dept_tree_path_info t ON c.dept_id = t.ancestor
WHERE
t.descendant = 3001
查詢所有後代
SELECT
c.*
FROM
dept_info03 AS c
INNER JOIN dept_tree_path_info t ON c.dept_id = t.descendant
WHERE
t.ancestor = 1001
刪除所有子樹
DELETE
FROM
dept_tree_path_info
WHERE
descendant IN
(
SELECT
a.dept_id
FROM
( SELECT descendant dept_id FROM dept_tree_path_info WHERE ancestor = 1001 ) a
)
刪除葉子節點
DELETE
FROM
dept_tree_path_info
WHERE
descendant = 2001
移動節點
- 刪除所有子樹(先斷開與原祖先的關係)
- 建立新的關係
優點
- 非遞歸查詢減少冗餘的計算時間 ;
- 方便非遞歸查詢任意節點所有的父集 ;
- 方便查詢任意節點所有的子集 ;
- 可以實現無限層級 ;
- 支持移動節點 ;
### 缺點
- 層級太多情況下移動樹節點會帶來關係表多條操作 ;
- 需要單獨一張表存儲對應關係,在新增與編輯節點時操作相對複雜 ;
結合使用
可以將鄰接表方式與閉包表方式相結合使用。實際上就是將父id冗餘到主表中,在一些只需要查詢直接關係的業務中就可以直接查詢主表,而不需要關聯2張表了。在需要跨級查詢時祖先後代關係表就顯得尤爲重要。
表設計
- 主表
CREATE TABLE `dept_info04` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
`dept_id` int(10) NOT NULL COMMENT '部門id',
`dept_name` varchar(100) NOT NULL COMMENT '部門名稱',
`dept_parent_id` int(11) NOT NULL COMMENT '父部門id',
`create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '創建時間',
`update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
- 祖先後代關係表
CREATE TABLE `dept_tree_path_info` (
`id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
`ancestor` int(10) NOT NULL COMMENT '祖先id',
`descendant` int(10) NOT NULL COMMENT '後代id',
`depth` tinyint(4) NOT NULL DEFAULT '0' COMMENT '層級深度',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
總結
其實,在以往的工作中,曾見過不同類型的設計,鄰接表,路徑枚舉,鄰接表路徑枚舉一起來的都見過。每種設計都各有優劣,如果選擇設計依賴於應用程序中哪種操作最需要性能上的優化。
設計 | 表數量 | 查詢直接子 | 查詢子樹 | 同時查詢多個節點子樹 | 插入 | 刪除 | 移動 |
---|---|---|---|---|---|---|---|
鄰接表 | 1 | 簡單 | 需要遞歸 | 需要遞歸 | 簡單 | 簡單 | 簡單 |
枚舉路徑 | 1 | 簡單 | 簡單 | 查多次 | 相對複雜 | 簡單 | 複雜 |
閉包表 | 2 | 簡單 | 簡單 | 簡單 | 相對複雜 | 簡單 | 複雜 |
綜上所述
- 只需要建立子父集關係中可以使用鄰接表方式 ;
- 涉及向上查找,向下查找的需要建議使用閉包表方式 ;
公衆號
更多精彩內容、編程故事、心得分享,歡迎關注公衆號