Oracle動態採樣詳解

 

動態採樣概述 
動態採樣(Dynamic Sampling)技術的最初提出是在Oracle 9i R2,在段(表,索引,分區)沒有分析的情況下,爲了使CBO 優化器得到足夠的信息以保證做出正確的執行計劃而發明的一種技術,可以把它看做分析手段的一種補充。
當段對象沒有統計信息時(即沒有做分析),動態採樣技術可以通過直接從需要分析的對象上收集數據塊(採樣)來獲得CBO需要的統計信息。
一個簡單的例子:
創建表:
SQL>  create table t as select  owner,object_type from dba_objects;
Table created.
 
查看錶的記錄數:
SQL> select count(*) from t
  COUNT(*)
----------
     50419
   -- 記錄數
這裏創建了一張普通表,沒有做分析,我們在hint中用0級來限制動態採樣,此時CBO唯一可以使用的信息就是表存儲在數據字典中的一些信息,如有多少個extent,有多少個block,但是這些信息是不夠的。
SQL> set autotrace trace exp
SQL> select /*+ dynamic_sampling(t 0) */ * from t;
Execution Plan
----------------------------------------------------------
Plan hash value: 1601196873
--------------------------------------------------------------------------
| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      | 12007 |   328K|    34   (0)| 00:00:01 |
|   1 |  TABLE ACCESS FULL| T    | 12007 |   328K|    34   (0)| 00:00:01 |
--------------------------------------------------------------------------
 
在沒有做動態分析的情況下
 ,CBO估計的記錄數是 12007條,與真實的 50419相差甚遠。 
動態分析來後:
 
SQL> select * from t;
Execution Plan
----------------------------------------------------------
Plan hash value: 1601196873
--------------------------------------------------------------------------
| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      | 45596 |  1246K|    35   (3)| 00:00:01 |
|   1 |  TABLE ACCESS FULL| T    | 45596 |  1246K|    35   (3)| 00:00:01 |
--------------------------------------------------------------------------
Note
-----
   - dynamic sampling used for this statement
 
在Oracle 10g中默認對沒有分析的段做動態採樣,上面的查詢結果顯示使用了動態採樣,CBO計的結果是 45596與 50419很接近了。 由於動態採樣只是對有限的一些數據塊做分析,來對整個表做出估算,所以無法和實際值完全吻合也是很正常的。
注意:在沒有動態採樣的情況下,對於沒有分析過的段,CBO也可能錯誤地將結果判斷的程度擴大話 。 
見下列
SQL> delete from t;
50419 rows deleted.
SQL> set autotrace trace exp                
SQL> select /*+ dynamic_sampling(t 0) */ * from t;
Execution Plan
----------------------------------------------------------
Plan hash value: 1601196873
-----------------------------------------------------------------------------
| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      | 12007 |   328K|    34   (0)| 00:00:01 |
|   1 |  TABLE ACCESS FULL| T    | 12007 |   328K|    34   (0)| 00:00:01 |
--------------------------------------------------------------------------
SQL> select * from t;
Execution Plan
----------------------------------------------------------
Plan hash value: 1601196873
--------------------------------------------------------------------------
| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      |     1 |    28 |    34   (0)| 00:00:01 |
|   1 |  TABLE ACCESS FULL| T    |     1 |    28 |    34   (0)| 00:00:01 |
--------------------------------------------------------------------------
Note
-----
   - dynamic sampling used for this statement
 
可以看到,在沒有采用動態分析的情況下,CBO對t表估計的還是12007行記錄
 ,但是用動態分析就顯示1條記錄。 而表中的數據在查詢之前已經刪除掉了,出現這種情況的原因是因爲高水位。 由於沒有采用動態採樣時的表信息來自 前面提到的數據字典中的 extent和block信息, 雖然表的數據已經刪除,但是表分配的extent 和block沒有被回收,在這種情況下CBO 依然認爲有那麼多的數據存在。
通過這一點,我們可以看出,此時CBO能夠使用的信息非常有限,也就是這個表有幾個extent,有幾個block。但動態採樣之後,Oracle 立即發現,原來數據塊中都是空的。
如果是通過設置sql_trace=true來查看執行計劃,動態採樣會體現出如下信息:
********************************************************************************
SELECT /* OPT_DYN_SAMP */ /*+ ALL_ROWS IGNORE_WHERE_CLAUSE
  NO_PARALLEL(SAMPLESUB) opt_param('parallel_execution_enabled', 'false')
  NO_PARALLEL_INDEX(SAMPLESUB) NO_SQL_TUNE */ NVL(SUM(C1),:"SYS_B_0"),
  NVL(SUM(C2),:"SYS_B_1")
FROM
 (SELECT /*+ IGNORE_WHERE_CLAUSE NO_PARALLEL("T1") FULL("T1")
  NO_PARALLEL_INDEX("T1") */ :"SYS_B_2" AS C1, CASE WHEN "T1"."ID"=:"SYS_B_3"
  THEN :"SYS_B_4" ELSE :"SYS_B_5" END AS C2 FROM "T1" SAMPLE BLOCK
  (:"SYS_B_6" , :"SYS_B_7") SEED (:"SYS_B_8") "T1") SAMPLESUB
call     count       cpu    elapsed       disk      query    current        rows
------- ------  -------- ---------- ---------- ---------- ----------  ----------
Parse        1      0.00       0.00          0          0          0           0
Execute      1      0.00       0.00          0          0          0           0
Fetch        1      0.03       0.09        171         70          0           1
------- ------  -------- ---------- ---------- ---------- ----------  ----------
total        3      0.03       0.10        171         70          0           1
Misses in library cache during parse: 1
Misses in library cache during execute: 1
Optimizer mode: ALL_ROWS
Parsing user id: 55     (recursive depth: 1)
Rows     Row Source Operation
-------  ---------------------------------------------------
      1  SORT AGGREGATE (cr=70 pr=171 pw=0 time=97308 us)
  14049   TABLE ACCESS SAMPLE T1 (cr=70 pr=171 pw=0 time=720915 us)
********************************************************************************
SELECT /* OPT_DYN_SAMP */ /*+ ALL_ROWS opt_param('parallel_execution_enabled',
   'false') NO_PARALLEL(SAMPLESUB) NO_PARALLEL_INDEX(SAMPLESUB) NO_SQL_TUNE
  */ NVL(SUM(C1),:"SYS_B_0"), NVL(SUM(C2),:"SYS_B_1"), NVL(SUM(C3),:"SYS_B_2")
FROM
 (SELECT /*+ NO_PARALLEL("T1") INDEX("T1" T1_INX) NO_PARALLEL_INDEX("T1") */
  :"SYS_B_3" AS C1, :"SYS_B_4" AS C2, :"SYS_B_5" AS C3  FROM "T1" "T1" WHERE
  "T1"."ID"=:"SYS_B_6" AND ROWNUM <= :"SYS_B_7") SAMPLESUB
call     count       cpu    elapsed       disk      query    current        rows
------- ------  -------- ---------- ---------- ---------- ----------  ----------
Parse        1      0.00       0.00          0          0          0           0
Execute      1      0.00       0.00          0          0          0           0
Fetch        1      0.00       0.00          0          2          0           1
------- ------  -------- ---------- ---------- ---------- ----------  ----------
total        3      0.00       0.00          0          2          0           1
Misses in library cache during parse: 1
Misses in library cache during execute: 1
Optimizer mode: ALL_ROWS
Parsing user id: 55     (recursive depth: 1)
Rows     Row Source Operation
-------  ---------------------------------------------------
      1  SORT AGGREGATE (cr=2 pr=0 pw=0 time=660 us)
      1   VIEW  (cr=2 pr=0 pw=0 time=521 us)
      1    COUNT STOPKEY (cr=2 pr=0 pw=0 time=368 us)
      1     INDEX RANGE SCAN T1_INX (cr=2 pr=0 pw=0 time=156 us)(object id 52550)
 
動態採樣的作用 
1、CBO 依賴的是充分的統計分析信息,但是並不是每個用戶都會非常認真,及時地去對每個表做分析。爲了保證執行計劃都儘可能地正確,Oracle需要使用動態採樣技術來幫助CBO 獲取儘可能多的信息。
2、全局臨時表。通常來講,臨時表的數據是不做分析的,因爲它存放的數據是臨時性的,可能很快就釋放了,但是當一個查詢關聯到這樣的臨時表時,CBO要想獲得臨時表上的統計信息分析數據,就只能依賴於動態採樣了。
3、動態採樣除了可以在段對象沒有分析時,給CBO提供分析數據之外,還有一個獨特的能力,它可以對不同列之間的相關性做統計。這點通常發生在表設計不符合3NF的情況下,這個特性在表
 符合3NF設計的 情況下少見。感興趣的讀者可以參看如下鏈接:
http://fanng.blogspot.com/2008/12/oracle_28.html
動態採樣的級別 
Level 0:不做動態分析
Level 1:Oracle 對沒有分析的表進行動態採樣,但需要同時滿足以下4個條件。
1、SQL中至少有一個未分析的表
2、未分析的表出現在關聯查詢或者子查詢中
3、未分析的表沒有索引
4、未分析的表佔用的數據塊要大於動態採樣默認的數據塊(32個)
Level 2:對所有的未分析表做分析,動態採樣的數據塊是默認數據塊的2倍,即64個。
Level 3:採樣的表包含滿足Level 2定義的所有表,同時包括,那些謂詞有可能潛在地需要動態採樣的表,這些動態採樣的數據塊爲默認數據塊,對沒有分析的表,動態採樣的默認塊爲默認數據塊的2倍,
 即64個 
Level 4:採樣的表包含滿足Level 3定義的表,同時還包括一些表,他們包含一個單表的謂詞會引用另外的2個列或者更多的列;採樣的塊數是動態採樣默認數據塊數;對沒有分析的表,動態採樣的數據塊爲默認數據塊的2倍。
Level 5,6,7,8,9:採樣的表包含滿足Level 4定義的表,同時分別使用動態採樣默認數據塊的2,4,8,32,128 倍的數量來做動態分析。
Level 10:採樣的表包含滿足Level 9定義的所有表,同時對錶的所有數據進行動態採樣。
採樣的數據塊越多,得到的分析數據就越接近與真實,但同時伴隨着資源消耗的也越大。
什麼時候使用動態採樣 

儘管看到動態採樣的優點,但是它的缺點也是顯而易見,否則Oracle一定會一直使用動態採樣來取代數據分析:
1、
 在OLAP或者數據倉庫環境下,SQL執行消耗的資源要遠遠大於SQL解析,那麼讓解析在消耗多一點資源做一些動態採樣分析,從而做出一個最優的執行計劃是非常值得的。 實際上在這樣的環境中,硬分析消耗的資源幾乎是可以忽略的。但是 採樣的數據塊有限,對於海量數據的表,結果難免有偏差。 所以一般在OLAP 或者數據倉庫環境中,將動態採樣的level 設置爲3或者4比較好 
2、
 動態採樣需要額外的消耗數據庫資源,所以,如果 SQL被反覆執行,變量被綁定,硬分析很少,在這樣一個環境中,是不宜使用動態採樣的。 動態採樣發生在硬分析時,如果很少有硬分析發生,動態採樣的意義就不大。 當然如果沒有使用綁定變量,導致頻繁進行硬解析和動態採樣消耗過多資源也是不可行的,故OLTP系統非常不適宜使用動態採樣 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章