Oracle遞歸樹select...start with... connect by ...prior 理解

Oracle樹查詢的最重要的就是select...start with... connect by ...prior 語法了。依託於該語法,我們可以將一個表形結構的中以樹的順序列出來。在下面列述了Oracle中樹型查詢的常用查詢方式以及經常使用的與樹查詢相關的Oracle特性函數等,在這裏只涉及到一張表中的樹查詢方式而不涉及多表中的關聯等。

      以我做過的一個項目中的表爲例,表結構如下:

Sql代碼 複製代碼
  1. CREATE TABLE FLFL   
  2. (   
  3.   ID      NUMBER                                NOT NULL,   
  4.   MC      NVARCHAR2(20),   
  5.   FLJB    NUMBER,   
  6.   SJFLID  NUMBER   
  7. )  
CREATE TABLE FLFL
(
  ID      NUMBER                                NOT NULL,
  MC      NVARCHAR2(20),
  FLJB    NUMBER,
  SJFLID  NUMBER
)

      FLJB是作爲樹的級別,在很多查詢中可以加快SQL的查詢效率。在下面演示的功能基本上不使用這個關鍵字。

      SJFLID存儲的是上級ID,如果是頂級父節點,該SJFLID爲null(得補充一句,當初的確是這樣設計的,不過現在知道,表中最好別有null記錄,這會引起全文掃描,建議改成0代替)。

      我們從最基本的操作,逐步列出樹查詢中常見的操作,所以查詢出來的節點以家族中的輩份作比方。

 

      1. 查找樹中的所有頂級父節點(輩份最長的人)。 假設這個樹是個目錄結構,那麼第一個操作總是找出所有的頂級節點,再根據該節點找到其下屬節點。

Sql代碼 複製代碼
  1. SELECT * FROM flfl WHERE sjflid IS NULL;  
SELECT * FROM flfl WHERE sjflid IS NULL;

      這是個引子,沒用到樹型查詢。

 

      2.查找一個節點的直屬子節點(所有兒子)。 如果查找的是直屬子類節點,也是不用用到樹型查詢的。

Sql代碼 複製代碼
  1. SELECT * FROM flfl WHERE sjflid = 819459;  
SELECT * FROM flfl WHERE sjflid = 819459;

      這個可以找到ID爲819459的直屬子類節點。

 

      3.查找一個節點的所有 直屬子節點(所有後代)。

Sql代碼 複製代碼
  1. SELECT * FROM flfl START WITH ID = 819459 CONNECT BY sjflid = PRIOR ID;  
SELECT * FROM flfl START WITH ID = 819459 CONNECT BY sjflid = PRIOR ID;

      這個查找的是ID爲819459的節點下的所有直屬子類節點,包括子輩的和孫子輩的所有直屬節點。

 

      4.查找一個節點的直屬父節點(父親)。 如果查找的是節點的直屬父節點,也是不用用到樹型查詢的。

Sql代碼 複製代碼
  1. SELECT b.* FROM flfl a JOIN flfl b ON a.sjflid = b.ID WHERE a.ID = 6758;  
SELECT b.* FROM flfl a JOIN flfl b ON a.sjflid = b.ID WHERE a.ID = 6758;

      這個找到的是ID爲6758的節點的直屬父節點,要用到同一張表的關聯了。

 

      5.查找一個節點的所有直屬父節點(祖宗)。

Sql代碼 複製代碼
  1. SELECT * FROM flfl START WITH ID = 6758 CONNECT BY PRIOR sjflid = ID;  
SELECT * FROM flfl START WITH ID = 6758 CONNECT BY PRIOR sjflid = ID;

      這裏查找的就是ID爲6758的所有直屬父節點,打個比方就是找到一個人的父親、祖父等。但是值得注意的是這個查詢出來的結果的順序是先列出子類節點再列出父類節點,姑且認爲是個倒序吧。

 

      上面列出兩個樹型查詢方式,第3條語句和第5條語句,這兩條語句之間的區別在於prior關鍵字的位置不同,所以決定了查詢的方式不同。 當sjflid = PRIOR ID時,數據庫會根據當前的ID迭代出sjflid與該ID相同的記錄,所以查詢的結果是迭代出了所有的子類記錄;而PRIOR ID = sjflid時,數據庫會跟據當前的sjflid來迭代出與當前的sjflid相同的id的記錄,所以查詢出來的結果就是所有的父類結果。

      以下是一系列針對樹結構的更深層次的查詢,這裏的查詢不一定是最優的查詢方式,或許只是其中的一種實現而已。

 

      6.查詢一個節點的兄弟節點(親兄弟)。

Sql代碼 複製代碼
  1. SELECT a.*   
  2.   FROM flfl a   
  3.  WHERE EXISTS (SELECT *   
  4.                  FROM flfl b   
  5.                 WHERE a.sjflid = b.sjflid AND b.ID = 6757);  
SELECT a.*
  FROM flfl a
 WHERE EXISTS (SELECT *
                 FROM flfl b
                WHERE a.sjflid = b.sjflid AND b.ID = 6757);

      這裏查詢的就是與ID爲6757的節點同屬一個父節點的節點了,就好比親兄弟了。

 

      7.查詢與一個節點同級的節點(族兄弟)。 如果在表中設置了級別的字段,上表中的FLJB,那麼在做這類查詢時會很輕鬆,同一級別的就是與那個節點同級的,在這裏列出不使用該字段時的實現!

Sql代碼 複製代碼
  1. WITH tmp AS  
  2.      (SELECT     a.*, LEVEL lev   
  3.             FROM flfl a   
  4.       START WITH a.sjflid IS NULL  
  5.       CONNECT BY a.sjflid = PRIOR a.ID)   
  6. SELECT *   
  7.   FROM tmp   
  8.  WHERE lev = (SELECT lev   
  9.                 FROM tmp   
  10.                WHERE ID = 819394)  
WITH tmp AS
     (SELECT     a.*, LEVEL lev
            FROM flfl a
      START WITH a.sjflid IS NULL
      CONNECT BY a.sjflid = PRIOR a.ID)
SELECT *
  FROM tmp
 WHERE lev = (SELECT lev
                FROM tmp
               WHERE ID = 819394)

       這裏使用兩個技巧,一個是使用了LEVEL來標識每個節點在表中的級別,還有就是使用with語法模擬出了一張帶有級別的臨時表。

 

      8.查詢一個節點的父節點的的兄弟節點(伯父與叔父)。

Sql代碼 複製代碼
  1. WITH tmp AS  
  2.      (SELECT     flfl.*, LEVEL lev   
  3.             FROM flfl   
  4.       START WITH sjflid IS NULL  
  5.       CONNECT BY sjflid = PRIOR ID)   
  6. SELECT b.*   
  7.   FROM tmp b,   
  8.        (SELECT *   
  9.           FROM tmp   
  10.          WHERE ID = 7004 AND lev = 2) a   
  11.  WHERE b.lev = 1   
  12. UNION ALL  
  13. SELECT *   
  14.   FROM tmp   
  15.  WHERE sjflid = (SELECT DISTINCT x.ID   
  16.                             FROM tmp x,   
  17.                                  tmp y,   
  18.                                  (SELECT *   
  19.                                     FROM tmp   
  20.                                    WHERE ID = 7004 AND lev > 2) z   
  21.                            WHERE y.ID = z.sjflid AND x.ID = y.sjflid);  
WITH tmp AS
     (SELECT     flfl.*, LEVEL lev
            FROM flfl
      START WITH sjflid IS NULL
      CONNECT BY sjflid = PRIOR ID)
SELECT b.*
  FROM tmp b,
       (SELECT *
          FROM tmp
         WHERE ID = 7004 AND lev = 2) a
 WHERE b.lev = 1
UNION ALL
SELECT *
  FROM tmp
 WHERE sjflid = (SELECT DISTINCT x.ID
                            FROM tmp x,
                                 tmp y,
                                 (SELECT *
                                    FROM tmp
                                   WHERE ID = 7004 AND lev > 2) z
                           WHERE y.ID = z.sjflid AND x.ID = y.sjflid);

       這裏查詢分成以下幾步。首先,將第7個一樣,將全表都使用臨時表加上級別;其次,根據級別來判斷有幾種類型,以上文中舉的例子來說,有三種情況:(1)當前節點爲頂級節點,即查詢出來的lev值爲1,那麼它沒有上級節點,不予考慮。(2)當前節點爲2級節點,查詢出來的lev值爲2,那麼就只要保證lev級別爲1的就是其上級節點的兄弟節點。(3)其它情況就是3以及以上級別,那麼就要選查詢出來其上級的上級節點(祖父),再來判斷祖父的下級節點都是屬於該節點的上級節點的兄弟節點。 最後,就是使用UNION將查詢出來的結果進行結合起來,形成結果集。

 

      9.查詢一個節點的父節點的同級節點(族叔)。

      這個其實跟第7種情況是相同的。

Sql代碼 複製代碼
  1. WITH tmp AS  
  2.      (SELECT     a.*, LEVEL lev   
  3.             FROM flfl a   
  4.       START WITH a.sjflid IS NULL  
  5.       CONNECT BY a.sjflid = PRIOR a.ID)   
  6. SELECT *   
  7.   FROM tmp   
  8.  WHERE lev = (SELECT lev   
  9.                 FROM tmp   
  10.                WHERE ID = 819394) - 1  
WITH tmp AS
     (SELECT     a.*, LEVEL lev
            FROM flfl a
      START WITH a.sjflid IS NULL
      CONNECT BY a.sjflid = PRIOR a.ID)
SELECT *
  FROM tmp
 WHERE lev = (SELECT lev
                FROM tmp
               WHERE ID = 819394) - 1

      只需要做個級別判斷就成了。

 

      基本上,常見的查詢在裏面了,不常見的也有部分了。其中,查詢的內容都是節點的基本信息,都是數據表中的基本字段,但是在樹查詢中還有些特殊需求,是對查詢數據進行了處理的,常見的包括列出樹路徑等。

      補充一個概念,對於數據庫來說,根節點並不一定是在數據庫中設計的頂級節點,對於數據庫來說,根節點就是start with開始的地方。

      下面列出的是一些與樹相關的特殊需求。

 

      10.名稱要列出名稱全部路徑。

      這裏常見的有兩種情況,一種是是從頂級列出,直到當前節點的名稱(或者其它屬性);一種是從當前節點列出,直到頂級節點的名稱(或其它屬性)。舉地址爲例:國內的習慣是從省開始、到市、到縣、到居委會的,而國外的習慣正好相反(老師說的,還沒接過國外的郵件,誰能寄個瞅瞅 )。

      從頂部開始:

Sql代碼 複製代碼
  1. SELECT     SYS_CONNECT_BY_PATH (mc, '/')   
  2.       FROM flfl   
  3.      WHERE ID = 6498   
  4. START WITH sjflid IS NULL  
  5. CONNECT BY sjflid = PRIOR ID;  
SELECT     SYS_CONNECT_BY_PATH (mc, '/')
      FROM flfl
     WHERE ID = 6498
START WITH sjflid IS NULL
CONNECT BY sjflid = PRIOR ID;

      從當前節點開始:

Sql代碼 複製代碼
  1. SELECT     SYS_CONNECT_BY_PATH (mc, '/')   
  2.       FROM flfl   
  3. START WITH ID = 6498   
  4. CONNECT BY PRIOR sjflid = ID;  
SELECT     SYS_CONNECT_BY_PATH (mc, '/')
      FROM flfl
START WITH ID = 6498
CONNECT BY PRIOR sjflid = ID;

      在這裏我又不得不放個牢騷了。oracle只提供了一個sys_connect_by_path函數,卻忘了字符串的連接的順序。在上面的例子中,第一個SQL是從根節點開始遍歷,而第二個SQL是直接找到當前節點,從效率上來說已經是千差萬別,更關鍵的是第一個SQL只能選擇一個節點,而第二個SQL卻是遍歷出了一顆樹來。再次PS一下。

      sys_connect_by_path函數就是從start with開始的地方開始遍歷,並記下其遍歷到的節點,start with開始的地方被視爲根節點,將遍歷到的路徑根據函數中的分隔符,組成一個新的字符串,這個功能還是很強大的。

 

      11.列出當前節點的根節點。

      在前面說過,根節點就是start with開始的地方。

Sql代碼 複製代碼
  1. SELECT     CONNECT_BY_ROOT mc, flfl.*   
  2.       FROM flfl   
  3. START WITH ID = 6498   
  4. CONNECT BY PRIOR sjflid = ID;  
SELECT     CONNECT_BY_ROOT mc, flfl.*
      FROM flfl
START WITH ID = 6498
CONNECT BY PRIOR sjflid = ID;

      connect_by_root函數用來列的前面,記錄的是當前節點的根節點的內容。

 

      12.列出當前節點是否爲葉子。

      這個比較常見,尤其在動態目錄中,在查出的內容是否還有下級節點時,這個函數是很適用的。

Sql代碼 複製代碼
  1. SELECT     CONNECT_BY_ISLEAF, flfl.*   
  2.       FROM flfl   
  3. START WITH sjflid IS NULL  
  4. CONNECT BY sjflid = PRIOR ID;  
SELECT     CONNECT_BY_ISLEAF, flfl.*
      FROM flfl
START WITH sjflid IS NULL
CONNECT BY sjflid = PRIOR ID;

      connect_by_isleaf函數用來判斷當前節點是否包含下級節點,如果包含的話,說明不是葉子節點,這裏返回0;反之,如果不包含下級節點,這裏返回1。

 

      至此,oracle樹型查詢基本上講完了,以上的例子中的數據是使用到做過的項目中的數據,因爲裏面的內容可能不好理解,所以就全部用一些新的例子來進行闡述。以上所有SQL都在本機上測試通過,也都能實現相應的功能,但是並不能保證是解決這類問題的最優方案(如第8條明顯寫成存儲過程會更好),如果誰有更好的解決方案、或者有關oracle樹查詢的任何問題,歡迎留言討論,以上的SQL有什麼問題也歡迎大家留言批評。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章