我用DB2的這幾年（三）

系統運行一段時間以後，用戶抱怨某些操作響應速度過慢；這個在項目前期沒有出現過類似問題，因此懷疑是數據量過大造成的原因。但是，查詢相關業務表中僅僅只有3萬多的的數據量，不足以構成影響程序響應速度過慢的瓶頸。更奇怪的是採用導入的方法將此表數據裝載進來卻沒有發現上述現象，我百思不得其解。

幾天後，無意間翻閱一本雜誌，其中有這麼一段話——“每當SQL語句被髮送到到DB2 數據庫管理器中處理時，SQL 優化器會去讀取系統編目表來確定被引用的列的特性以及在被引用的表中時候已經定義了索引，同時被語句引用的每個表的大小也包括在內。根據這些得到的信息，優化器可以估算出能滿足SQL語句需要的每一種數據存取路徑的成本，然後推薦最佳的一個。優化器用於做決策的數據庫統計集合數據在系統編目表中是一個關鍵性的元素。所以，統計的變化可能導致選擇存取路徑的變化；如果信息丟失或過時，優化器也許選擇出來的存取計劃將導致SQL語句執行時間比正常的要長。例如，一個刪除操作可能留下以後不能再使用的空的數據頁面。對各種長度的字段進行更新可能導致新的字段值不適合在同一個數據頁面中存放。這將導致某些行被移動到不同得頁面並且在表裏產生內部空隙或者未使用空間。因此，DB2不得不去讀取更多的物理頁面來取回應用程序所需要的數據”。結合前面遇見的這個問題，該操作所涉及的物理表的確是經常進行增刪改操作的，是不是因爲這個原因呢？剛好前段時間學習過關於表重組和運行統計的內容，知道DB2有runstats和reorg工具來完成表的運行統計和重組。於是我就做了以下試驗：

---1首先檢查是否要重新組織數據 reorgchk current statistics on table db2admin.t_ckd 得到表的統計信息和索引的統計信息顯示如下：

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

表統計信息：

F1: 100 * OVERFLOW / CARD < 5

F2: 100 * TSIZE / ((FPAGES-1) * (TABLEPAGESIZE-76)) > 70

F3: 100 * NPAGES / FPAGES > 80

CREATOR NAME CARD OV NP FP TSIZE F1 F2 F3 REORG

--------------------------------------------------------------------------------

DB2ADMIN T_CKD 1 0 1 12 9 0 0 8 -**

--------------------------------------------------------------------------------

索引統計信息：

F4: CLUSTERRATIO 或正常化的 CLUSTERFACTOR > 80

F5: 100 * (KEYS * (ISIZE+8) + (CARD-KEYS) * 4) / (NLEAF * INDEXPAGESIZE) > 50

F6: (100-PCTFREE) * (INDEXPAGESIZE-96) / (ISIZE+12) ** (NLEVELS-2) * (INDEXPAGESIZE-96) / (KEYS * (ISIZE+8) + (CARD-KEYS) * 4) < 100

CREATOR NAME CARD LEAF LVLS ISIZE KEYS F4 F5 F6 REORG

--------------------------------------------------------------------------------

表：DB2ADMIN.T_CKD

DB2ADMIN XAK1T_CKD 1 1 2 28 1 100 - +++ ---

DB2ADMIN XIE1T_CKD 1 1 1 10 1 100 - - ---

DB2ADMIN XIE2T_CKD 1 1 1 10 1 100 - - ---

DB2ADMIN XIE3T_CKD 1 1 1 4 1 100 - - ---

DB2ADMIN XIE4T_CKD 1 1 1 18 1 100 - - ---

SYSIBM SQL010510174815750 1 1 2 28 1 100 - +++ ---

--------------------------------------------------------------------------------

CLUSTERRATIO 或正常化的 CLUSTERFACTOR (F4) 將指示索引需要 REORG，該索引與基表不在相同的序列中。當在表中定義了多個索引時，一個或多個索引可能被標記爲需要 REORG。指定 REORG 順序的最重要索引。

可以看到表統計信息中要求f1<5,f2>70,f3>80而實際的表的f1＝0，f2＝0，f3＝8不能滿足要求，索引的大部分f4,f5,f6也不能滿足要求，必須進行重新統計

----2重新組織數據庫表的索引

reorg table db2admin.t_ckd index DB2ADMIN.XIE3T_CKD

----3重新統計索引

runstats on table db2admin.t_ckd and indexes all

----4重新統計後可以再看看數據表的信息 reorgchk current statistics on table db2admin.t_ckd 得到表的統計信息和索引的統計信息顯示如下：

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

表統計信息：

F1: 100 * OVERFLOW / CARD < 5

F2: 100 * TSIZE / ((FPAGES-1) * (TABLEPAGESIZE-76)) > 70

F3: 100 * NPAGES / FPAGES > 80

CREATOR NAME CARD OV NP FP TSIZE F1 F2 F3 REORG

--------------------------------------------------------------------------------

DB2ADMIN T_CKD 4893 0 401 401 1546188 0 96 100 ---

--------------------------------------------------------------------------------

索引統計信息：

F4: CLUSTERRATIO 或正常化的 CLUSTERFACTOR > 80

F5: 100 * (KEYS * (ISIZE+8) + (CARD-KEYS) * 4) / (NLEAF * INDEXPAGESIZE) > 50

F6: (100-PCTFREE) * (INDEXPAGESIZE-96) / (ISIZE+12) ** (NLEVELS-2) * (INDEXPAGESIZE-96) / (KEYS * (ISIZE+8) + (CARD-KEYS) * 4) < 100

CREATOR NAME CARD LEAF LVLS ISIZE KEYS F4 F5 F6 REORG

--------------------------------------------------------------------------------

表：DB2ADMIN.T_CKD

DB2ADMIN XAK1T_CKD 4893 49 2 28 4893 81 87 2 ---

DB2ADMIN XIE1T_CKD 4893 7 2 10 3 99 68 18 ---

DB2ADMIN XIE2T_CKD 4893 7 2 10 2 99 68 18 ---

DB2ADMIN XIE3T_CKD 4893 7 2 4 18 100 68 18 ---

DB2ADMIN XIE4T_CKD 4893 6 2 18 6 90 80 18 ---

SYSIBM SQL010510174815750 4893 49 2 28 4893 81 87 2 ---

--------------------------------------------------------------------------------

至此，試驗完成。接下來比較一下運行統計和重組前後運行成本，如下圖：

運行重組統計前

運行重組統計後

對比運行統計前後的SQL語句成本可以看出由運行前的4469變成了運行後的1572，運行成本是原來的三分之一多。然後再運行程序發現響應速度比以前有大幅度的提高，到此這個棘手的問題算是解決了（當然這是治標不治本，要從根本改變就應該從SQL語句本身入手優化它的性能）。同時我對於“採用導入的方法將此表數據裝載進來卻沒有發現上述現象”這個問題也找到了答案，那就是——在IMPORT過程中由於導入目標表示新表，IMPORT工具將會用類似運行統計的方式將數據均勻填充到葉面當中，因此速度也會加快。這個問題說明對於在數據庫中那些經常發生變動的表，定期進行運行統計是對數據庫性能提高是有幫助的。

【附錄：一些其他的背景知識】

對 reorgchk 所使用的度量的考慮因素包括：（當查看 reorgchk 工具的輸出時，找到用於表的 F1、F2 和 F3 這幾列，以及用於索引的 F4、F5、F6、F7 和 F8 這幾列。如果這些列中的任何一列有星號 (*)，則說明當前的表和/或索引超出了閾值。） F1: 屬於溢出記錄的行所佔的百分比。當這個百分比大於 5% 時，在輸出的 F1 列中將有一個星號 (*)。

F2: 數據頁中使用了的空間所佔的百分比。當這個百分比小於 70% 時，在輸出的 F2 列上將有一個星號 (*)。

F3: 其中含有包含某些記錄的數據的頁所佔的百分比。當這個百分比小於 80% 時，在輸出的 F3 列上將有一個星號 (*)。

F4: 羣集率，即表中與索引具有相同順序的行所佔的百分比。當這個百分比小於 80% 時，那麼在輸出的F4 列上將有一個星號 (*)。

F5: 在每個索引頁上用於索引鍵的空間所佔的百分比。當這個百分比小於 50% 時，在輸出的 F5 列上將有一個星號 (*)。

F6: 可以存儲在每個索引級的鍵的數目。當這個數字小於 100 時，在輸出的 F6 列上將有一個星號 (*)。

F7: 在一個頁中被標記爲 deleted 的記錄 ID（鍵）所佔的百分比。當這個百分比大於 20% 時，在輸出的 F7 列上將有一個星號 (*)。

F8: 索引中空葉子頁所佔的百分比。當這個百分比大於 20% 時，在輸出的 F8 列上將有一個星號 (*)。

對所有表運行 reorgchk 工具，並確保您正在使用當前統計信息，可使用命令：

reorgchk update statistics on table user

可以使用如下語句來檢查任何沒有統計信息的表：

select tabname from syscat.tables where stats_time is null

可以使用如下語句來檢查任何沒有統計信息的索引：

select indname from syscat.indexes where stats_time is null

可以使用如下語句來查找具有時間超過 30 天的統計信息的表和索引：

select tabname from syscat.tables where stats_time < current timestamp - 30 days select indname from syscat.indexes where stats_time < current timestamp - 30 days

注意：在使用 runstats 命令的時候，必須指定表所在的模式。

我用DB2的這幾年（三）

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

Tomcat環境下配置oracle數據源的方法

IBM DB2 基本性能調整3

近期計劃出以下文章

臨時存儲多層交換

DB2 v9的第一部書籍出現在我的視野中

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結