SQL使用經驗 IN 還是 EXISTS的選用,哪個性能更好
有時候會將一列和一系列值相比較。最簡單的辦法就是在where子句中使用子查詢。在where子句中可以使用兩種格式的子查詢。
第一種格式是使用IN操作符:
... where column in(select * from ... where ...);
第二種格式是使用EXIST操作符:
... where exists (select 'X' from ...where ...);
我相信絕大多數人會使用第一種格式,因爲它比較容易編寫,而實際上第二種格式要遠比第一種格式的效率高。可以幾乎將所有的IN操作符子查詢改寫爲使用EXISTS的子查詢。
第二種格式中,子查詢以‘select 'X'開始。運用EXISTS子句不管子查詢從表中抽取什麼數據它只查看where子句。這樣優化器就不必遍歷整個表而僅根據索引就可完成工作(這裏假定在where語句中使用的列存在索引)。相對於IN子句來說,EXISTS使用相連子查詢,構造起來要比IN子查詢困難一些。
通過使用 EXISTS,系統會首先檢查主查詢,然後運行子查詢直到它找到第一個匹配項,這就節省了時間。系統在執行IN子查詢時,首先執行子查詢,並將獲得的結果列表存放在在一個加了索引的臨時表中。在執行子查詢之前,系統先將主查詢掛起,待子查詢執行完畢,存放在臨時表中以後再執行主查詢。這也就是使用 EXISTS比使用IN通常查詢速度快的原因。
同時應儘可能使用NOT EXISTS來代替NOT IN,儘管二者都使用了NOT(不能使用索引而降低速度),NOT EXISTS要比NOT IN查詢效率更高。
但是:
一、EXISTS 並非總比IN 快,究竟應該選用 IN 還是 EXISTS ,可參考以下分析:
1、Select * from t1 where x in ( select y from t2 )
相當於
select *
from t1, ( select distinct y from t2 ) t2
where t1.x = t2.y;
2、select * from t1 where exists ( select null from t2 where y = x )
相當於
for x in ( select * from t1 )
loop
if ( exists ( select null from t2 where y = x.x )
then
OUTPUT THE RECORD
end if
end loop
如果t2的記錄很多而t1的記錄相對較少的話,建議採用第二種寫法;相反,如果t1的記錄很多而t2的記錄相對較少,則建議採用第一種寫法。
其它情況,則需要仔細分析再決定是選擇IN還是選擇EXISTS
二、NOT IN 並不等價於NOT EXISTS
例如下面這兩個句子,只有在t1.c1不爲NULL的時候,兩者返回的記錄纔是相同的,大家在用NOT EXISTS來替換NOT IN 時可能會忽略掉這一點
select t1.*
from table1 t1
where not exists
(select t2.c1 from table2 t2 where t2.c1 = t1.c1)
select t1.*
from table1 t1
where t1.c1 not in (select t2.c1 from table2 t2)
摘自:http://mrnavy.itpub.net/post/5657/284155
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.