B+樹索引搜索（Index Seek）與索引掃描（Index Scan）

原創

2023-05-21 23:18

在本文中，我探討了數據庫中索引搜索（Index Seek）和索引掃描（Index Scan）的性能影響。雖然這些術語主要與 SQL Server 相關，但它們對於在數據庫管理系統（DBMS）平臺中搜索 B+樹非常重要。

搜索還是掃描

索引搜索通過從根節點開始遍歷 B+樹，查找葉節點頁中的單個值。這至少需要 2 次I/O操作，具體取決於 B+樹的深度。而索引掃描通過掃描已經排序和鏈接的 B+樹葉節點頁來進行操作。

索引掃描更適用於範圍查詢或接近的大值，而索引搜索適用於返回非常少的結果或者更具選擇性的查詢。

爲了更好地說明這一點，我們以學生表爲例，其中包含了 ID 整數字段等。我們特別關注 ID 字段上的 B+樹索引。

假設一個頁面大小可以容納多達 2000 個元素（鍵值對），那麼結構可能如下所示。

讓我們看一些例子。

索引搜索示例

考慮針對學生表的以下查詢：

SELECT *
FROM STUDENTS
WHERE ID = 1 OR ID = 5003 or ID = 9000

對於 ID 字段上的索引，該查詢需要執行 3 次索引搜索，分別針對值 1、5003 和 9000。每個值都位於不同的頁面上，這意味着沒有緩存命中。

當然，一旦我們獲得了鍵值元素對，值將是指向表中所有字段的行 ID。這在數據庫系統之間有所不同，取決於 ID 是否是主索引以及是否是聚集索引。

注意：如果過濾條件中包含 ID = 2，那麼該條件將與存儲在同一頁上的值 1 滿足條件，因此我們已經獲取了它。緩存命中是關鍵。

索引掃描示例

在同一張表上，讓我們執行以下查詢：

SELECT *
FROM STUDENTS
WHERE ID BETWEEN 1000 and 9000

根據具體實現，該查詢可能會在範圍中的最低元素（1000）上執行搜索，以找到最低頁，並沿着鏈接的葉子頁面遍歷，直到達到具有條目9000的頁爲止，此時索引掃描停止。

這是可能的，因爲葉子頁面中的條目是有序的，並且彼此鏈接。

每個葉子頁面都指向下一個頁面，這是 B+Tree 的一個特性。

爲什麼需要搜索和掃描？

對於在1000到9000之間的每個值都進行搜索會導致更多的I/O，並且減慢查詢速度。而在第一個示例中，從具有值1的頁面到具有9000的頁面進行掃描，尋找1、5003和9000是一種IO浪費。數據庫最終會獲取不需要的頁面。

問題所在

在某些情況下，搜索或掃描是顯而易見的，我上面提供的示例就是如此。但並非所有情況都如此簡單。

有些情況下，查詢優化器可能會根據內部查詢結果的結果選擇不同的計劃。

以查找分數高於90分的學生的完整學生行爲例，這些成績存儲在單獨的表 STUDENTS_GRADES 中。

SELECT *
FROM STUDENTS
WHERE ID IN 
(SELECT ID 
FROM STUDENTS_GRADES
WHERE GRADE > 90 
)

內部查詢可能返回單個值，也可能返回散佈在各處的數千個 ID。根據輸出結果，查詢優化器可能會選擇掃描或搜索。

內部查詢結果集越大，使用索引的效率就越低。分散的 ID 將分佈在許多頁面中，導致過多的 I/O 操作。在某些情況下，爲了避免不必要的 I/O 操作，查詢優化器可能會完全跳過索引而進行全表掃描。

坦率地說，我不喜歡結果不可預測的查詢，這隻會讓人感到困擾。我會盡量消除不可預測性，即使需要進行模式更改。

總結

你如何知道哪個更好？掃描還是搜索？查詢優化器會盡力而爲，但到最後可能會錯過並選擇錯誤的計劃。因此，如果可能的話，我們需要以可預測的方式編寫查詢。我知道這並不總是可能的，但瞭解背後發生的事情是第一步。

如果你喜歡我的文章，點贊，關注，轉發！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

B+樹索引搜索（Index Seek）與索引掃描（Index Scan）

搜索還是掃描

索引搜索示例

索引掃描示例

爲什麼需要搜索和掃描？

問題所在

總結

AI模型 Llama 3體驗筆記

【面試準備】又一次失敗的面試經歷，題目離譜～資深軟件測試工程師

dotnet 8 版本與銀河麒麟V10和UOS系統的 glibc 兼容性

iTOP-3588開發板Buildroot系統功能測試-USB鼠標鍵盤測試

記一次北京某大學邏輯漏洞挖掘

DataGear 5.0.0 新特性之圖表追加更新模式

1 名工程師輕鬆管理 20 個工作流，創業企業用 Serverless 讓數據處理流程提效

無需重新學習，使用 Kibana 查詢/可視化 SLS 數據

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結