SQL語句優化技術分析

 
<script>function StorePage(){d=document;t=d.selection?(d.selection.type!='None'?d.selection.createRange().text:''):(d.getSelection?d.getSelection():'');void(keyit=window.open('http://www.365key.com/storeit.aspx?t='+escape(d.title)+'&u='+escape(d.location.href)+'&c='+escape(t),'keyit','scrollbars=no,width=475,height=575,left=75,top=20,status=no,resizable=yes'));keyit.focus();}</script>
 

操作符優化

IN 操作符

IN寫出來的SQL的優點是比較容易寫及清晰易懂,這比較適合現代軟件開發的風格。

但是用INSQL性能總是比較低的,從ORACLE執行的步驟來分析用INSQL與不用INSQL有以下區別:

       ORACLE試圖將其轉換成多個表的連接,如果轉換不成功則先執行IN裏面的子查詢,再查詢外層的表記錄,如果轉換成功則直接採用多個表的連接方式查詢。由此可見用INSQL至少多了一個轉換的過程。一般的SQL都可以轉換成功,但對於含有分組統計等方面的SQL就不能轉換了。

       推薦方案:在業務密集的SQL當中儘量不採用IN操作符。

NOT IN操作符

       此操作是強列推薦不使用的,因爲它不能應用表的索引。

       推薦方案:用NOT EXISTS 或(外連接+判斷爲空)方案代替

<> 操作符(不等於)

       不等於操作符是永遠不會用到索引的,因此對它的處理只會產生全表掃描。

推薦方案:用其它相同功能的操作運算代替,如

       a<>0 改爲 a>0 or a<0

       a<>’’ 改爲 a>’’

IS NULL IS NOT NULL操作(判斷字段是否爲空)

       判斷字段是否爲空一般是不會應用索引的,因爲B樹索引是不索引空值的。

       推薦方案:

用其它相同功能的操作運算代替,如

       a is not null 改爲 a>0 a>’’等。

       不允許字段爲空,而用一個缺省值代替空值,如業擴申請中狀態字段不允許爲空,缺省爲申請。

       建立位圖索引(有分區的表不能建,位圖索引比較難控制,如字段值太多索引會使性能下降,多人更新操作會增加數據塊鎖的現象)

 

 

 

> < 操作符(大於或小於操作符)

       大於或小於操作符一般情況下是不用調整的,因爲它有索引就會採用索引查找,但有的情況下可以對它進行優化,如一個表有100萬記錄,一個數值型字段A30萬記錄的A=030萬記錄的A=139萬記錄的A=21萬記錄的A=3。那麼執行A>2A>=3的效果就有很大的區別了,因爲A>2ORACLE會先找出爲2的記錄索引再進行比較,而A>=3ORACLE則直接找到=3的記錄索引。

 

 

 

LIKE操作符

LIKE操作符可以應用通配符查詢,裏面的通配符組合可能達到幾乎是任意的查詢,但是如果用得不好則會產生性能上的問題,如LIKE ‘%5400%’ 這種查詢不會引用索引,而LIKE ‘X5400%’則會引用範圍索引。一個實際例子:用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號 YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描,如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個範圍的查詢,性能肯定大大提高。

 

 

 

UNION操作符

UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與歷史表UNION。如:

select * from gc_dfys

union

select * from ls_jg_dfys

這個SQL在運行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,如果表數據量大的話可能會導致用磁盤進行排序。

推薦方案:採用UNION ALL操作符替代UNION,因爲UNION ALL操作只是簡單的將兩個結果合併後就返回。

select * from gc_dfys

union all

select * from ls_jg_dfys

 

 

 

SQL書寫的影響

同一功能同一性能不同寫法SQL的影響

如一個SQLA程序員寫的爲

       Select * from zl_yhjbqk

B程序員寫的爲

       Select * from dlyx.zl_yhjbqk(帶表所有者的前綴)

C程序員寫的爲

       Select * from DLYX.ZLYHJBQK(大寫表名)

D程序員寫的爲

       Select *  from DLYX.ZLYHJBQK(中間多了空格)

 

 

 

以上四個SQLORACLE分析整理之後產生的結果及執行的時間是一樣的,但是從ORACLE共享內存SGA的原理,可以得出ORACLE對每個SQL 都會對其進行一次分析,並且佔用共享內存,如果將SQL的字符串及格式寫得完全相同則ORACLE只會分析一次,共享內存也只會留下一次的分析結果,這不僅可以減少分析SQL的時間,而且可以減少共享內存重複的信息,ORACLE也可以準確統計SQL的執行頻率。

 

 

 

WHERE後面的條件順序影響

 

 

 

WHERE子句後面的條件順序對大數據量表的查詢會產生直接的影響,如

Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1

Select * from zl_yhjbqk where xh_bz=1  and dy_dj = '1KV以下'

以上兩個SQLdy_dj(電壓等級)及xh_bz(銷戶標誌)兩個字段都沒進行索引,所以執行的時候都是全表掃描,第一條SQLdy_dj = '1KV以下'條件在記錄集內比率爲99%,而xh_bz=1的比率只爲0.5%,在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較,而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此可以得出第二條SQLCPU佔用率明顯比第一條低。

 

 

 

查詢表順序的影響

FROM後面的表中的列表順序會對SQL執行性能影響,在沒有索引及ORACLE沒有對錶進行統計分析的情況下ORACLE會按表出現的順序進行鏈接,由此因爲表的順序不對會產生十分耗服務器資源的數據交叉。(注:如果對錶進行了統計分析,ORACLE會自動先進小表的鏈接,再進行大表的鏈接)

 

 

 

SQL語句索引的利用

對操作符的優化(見上節)

對條件字段的一些優化

採用函數處理的字段不能利用索引,如:

substr(hbs_bh,1,4)=’5400’,優化處理:hbs_bh like ‘5400%’

trunc(sk_rq)=trunc(sysdate), 優化處理:

sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1)

進行了顯式或隱式的運算的字段不能進行索引,如:

ss_df+20>50,優化處理:ss_df>30

‘X’||hbs_bh>’X5400021452’,優化處理:hbs_bh>’5400021542’

sk_rq+5=sysdate,優化處理:sk_rq=sysdate-5

hbs_bh=5401002554,優化處理:hbs_bh=’ 5401002554’注:此條件對hbs_bh 進行隱式的to_number轉換,因爲hbs_bh字段是字符型。

條件內包括了多個本表的字段運算時不能進行索引,如:

ys_df>cx_df,無法進行優化

qc_bh||kh_bh=’5400250000’,優化處理:qc_bh=’5400’ and kh_bh=’250000’

 

 

 

應用ORACLEHINT(提示)處理

 

 

 

提示處理是在ORACLE產生的SQL分析執行路徑不滿意的情況下要用到的。它可以對SQL進行以下方面的提示

目標方面的提示:

COST(按成本優化)

RULE(按規則優化)

CHOOSE(缺省)(ORACLE自動選擇成本或規則進行優化)

ALL_ROWS(所有的行儘快返回)

FIRST_ROWS(第一行數據儘快返回)

執行方法的提示:

USE_NL(使用NESTED LOOPS方式聯合)

USE_MERGE(使用MERGE JOIN方式聯合)

USE_HASH(使用HASH JOIN方式聯合)

索引提示:

INDEXTABLE INDEX)(使用提示的表索引進行查詢)

其它高級提示(如並行處理等等)

 

 

 

ORACLE的提示功能是比較強的功能,也是比較複雜的應用,並且提示只是給ORACLE執行的一個建議,有時如果出於成本方面的考慮ORACLE也可能不會按提示進行。根據實踐應用,一般不建議開發人員應用ORACLE提示,因爲各個數據庫及服務器性能情況不一樣,很可能一個地方性能提升了,但另一個地方卻下降了,ORACLESQL執行分析方面已經比較成熟,如果分析執行的路徑不對首先應在數據庫結構(主要是索引)、服務器當前性能(共享內存、磁盤文件碎片)、數據庫對象(表、索引)統計信息是否正確這幾方面分析。

 

 

 

操作符優化

IN 操作符

IN寫出來的SQL的優點是比較容易寫及清晰易懂,這比較適合現代軟件開發的風格。

但是用INSQL性能總是比較低的,從ORACLE執行的步驟來分析用INSQL與不用INSQL有以下區別:

       ORACLE試圖將其轉換成多個表的連接,如果轉換不成功則先執行IN裏面的子查詢,再查詢外層的表記錄,如果轉換成功則直接採用多個表的連接方式查詢。由此可見用INSQL至少多了一個轉換的過程。一般的SQL都可以轉換成功,但對於含有分組統計等方面的SQL就不能轉換了。

       推薦方案:在業務密集的SQL當中儘量不採用IN操作符。

NOT IN操作符

       此操作是強列推薦不使用的,因爲它不能應用表的索引。

       推薦方案:用NOT EXISTS 或(外連接+判斷爲空)方案代替

<> 操作符(不等於)

       不等於操作符是永遠不會用到索引的,因此對它的處理只會產生全表掃描。

推薦方案:用其它相同功能的操作運算代替,如

       a<>0 改爲 a>0 or a<0

       a<>’’ 改爲 a>’’

IS NULL IS NOT NULL操作(判斷字段是否爲空)

       判斷字段是否爲空一般是不會應用索引的,因爲B樹索引是不索引空值的。

       推薦方案:

用其它相同功能的操作運算代替,如

       a is not null 改爲 a>0 a>’’等。

       不允許字段爲空,而用一個缺省值代替空值,如業擴申請中狀態字段不允許爲空,缺省爲申請。

       建立位圖索引(有分區的表不能建,位圖索引比較難控制,如字段值太多索引會使性能下降,多人更新操作會增加數據塊鎖的現象)

 

 

 

> < 操作符(大於或小於操作符)

       大於或小於操作符一般情況下是不用調整的,因爲它有索引就會採用索引查找,但有的情況下可以對它進行優化,如一個表有100萬記錄,一個數值型字段A30萬記錄的A=030萬記錄的A=139萬記錄的A=21萬記錄的A=3。那麼執行A>2A>=3的效果就有很大的區別了,因爲A>2ORACLE會先找出爲2的記錄索引再進行比較,而A>=3ORACLE則直接找到=3的記錄索引。

 

 

 

LIKE操作符

LIKE操作符可以應用通配符查詢,裏面的通配符組合可能達到幾乎是任意的查詢,但是如果用得不好則會產生性能上的問題,如LIKE ‘%5400%’ 這種查詢不會引用索引,而LIKE ‘X5400%’則會引用範圍索引。一個實際例子:用YW_YHJBQK表中營業編號後面的戶標識號可來查詢營業編號 YY_BH LIKE ‘%5400%’ 這個條件會產生全表掃描,如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會利用YY_BH的索引進行兩個範圍的查詢,性能肯定大大提高。

 

 

 

UNION操作符

UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與歷史表UNION。如:

select * from gc_dfys

union

select * from ls_jg_dfys

這個SQL在運行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,如果表數據量大的話可能會導致用磁盤進行排序。

推薦方案:採用UNION ALL操作符替代UNION,因爲UNION ALL操作只是簡單的將兩個結果合併後就返回。

select * from gc_dfys

union all

select * from ls_jg_dfys

 

 

 

SQL書寫的影響

同一功能同一性能不同寫法SQL的影響

如一個SQLA程序員寫的爲

       Select * from zl_yhjbqk

B程序員寫的爲

       Select * from dlyx.zl_yhjbqk(帶表所有者的前綴)

C程序員寫的爲

       Select * from DLYX.ZLYHJBQK(大寫表名)

D程序員寫的爲

       Select *  from DLYX.ZLYHJBQK(中間多了空格)

 

 

 

以上四個SQLORACLE分析整理之後產生的結果及執行的時間是一樣的,但是從ORACLE共享內存SGA的原理,可以得出ORACLE對每個SQL 都會對其進行一次分析,並且佔用共享內存,如果將SQL的字符串及格式寫得完全相同則ORACLE只會分析一次,共享內存也只會留下一次的分析結果,這不僅可以減少分析SQL的時間,而且可以減少共享內存重複的信息,ORACLE也可以準確統計SQL的執行頻率。

 

 

 

WHERE後面的條件順序影響

 

 

 

WHERE子句後面的條件順序對大數據量表的查詢會產生直接的影響,如

Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1

Select * from zl_yhjbqk where xh_bz=1  and dy_dj = '1KV以下'

以上兩個SQLdy_dj(電壓等級)及xh_bz(銷戶標誌)兩個字段都沒進行索引,所以執行的時候都是全表掃描,第一條SQLdy_dj = '1KV以下'條件在記錄集內比率爲99%,而xh_bz=1的比率只爲0.5%,在進行第一條SQL的時候99%條記錄都進行dy_dj及xh_bz的比較,而在進行第二條SQL的時候0.5%條記錄都進行dy_dj及xh_bz的比較,以此可以得出第二條SQLCPU佔用率明顯比第一條低。

 

 

 

查詢表順序的影響

FROM後面的表中的列表順序會對SQL執行性能影響,在沒有索引及ORACLE沒有對錶進行統計分析的情況下ORACLE會按表出現的順序進行鏈接,由此因爲表的順序不對會產生十分耗服務器資源的數據交叉。(注:如果對錶進行了統計分析,ORACLE會自動先進小表的鏈接,再進行大表的鏈接)

 

 

 

SQL語句索引的利用

對操作符的優化(見上節)

對條件字段的一些優化

採用函數處理的字段不能利用索引,如:

substr(hbs_bh,1,4)=’5400’,優化處理:hbs_bh like ‘5400%’

trunc(sk_rq)=trunc(sysdate), 優化處理:

sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1)

進行了顯式或隱式的運算的字段不能進行索引,如:

ss_df+20>50,優化處理:ss_df>30

‘X’||hbs_bh>’X5400021452’,優化處理:hbs_bh>’5400021542’

sk_rq+5=sysdate,優化處理:sk_rq=sysdate-5

hbs_bh=5401002554,優化處理:hbs_bh=’ 5401002554’注:此條件對hbs_bh 進行隱式的to_number轉換,因爲hbs_bh字段是字符型。

條件內包括了多個本表的字段運算時不能進行索引,如:

ys_df>cx_df,無法進行優化

qc_bh||kh_bh=’5400250000’,優化處理:qc_bh=’5400’ and kh_bh=’250000’

 

 

 

應用ORACLEHINT(提示)處理

 

 

 

提示處理是在ORACLE產生的SQL分析執行路徑不滿意的情況下要用到的。它可以對SQL進行以下方面的提示

目標方面的提示:

COST(按成本優化)

RULE(按規則優化)

CHOOSE(缺省)(ORACLE自動選擇成本或規則進行優化)

ALL_ROWS(所有的行儘快返回)

FIRST_ROWS(第一行數據儘快返回)

執行方法的提示:

USE_NL(使用NESTED LOOPS方式聯合)

USE_MERGE(使用MERGE JOIN方式聯合)

USE_HASH(使用HASH JOIN方式聯合)

索引提示:

INDEXTABLE INDEX)(使用提示的表索引進行查詢)

其它高級提示(如並行處理等等)

 

 

 

ORACLE的提示功能是比較強的功能,也是比較複雜的應用,並且提示只是給ORACLE執行的一個建議,有時如果出於成本方面的考慮ORACLE也可能不會按提示進行。根據實踐應用,一般不建議開發人員應用ORACLE提示,因爲各個數據庫及服務器性能情況不一樣,很可能一個地方性能提升了,但另一個地方卻下降了,ORACLESQL執行分析方面已經比較成熟,如果分析執行的路徑不對首先應在數據庫結構(主要是索引)、服務器當前性能(共享內存、磁盤文件碎片)、數據庫對象(表、索引)統計信息是否正確這幾方面分析。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章