在數據庫中,UNION和UNION ALL關鍵字都是將兩個結果集合併爲一個,但這兩者從使用和效率上來說都有所不同。
MySQL中的UNION
UNION在進行錶鏈接後會篩選掉重複的記錄,所以在錶鏈接後會對所產生的結果集進行排序運算,刪除重複的記錄再返回結果。實際大部分應用中是不會產生重複的記錄,最常見的是過程表與歷史表UNION。如:
select * from gc_dfys union select * from ls_jg_dfys
這個SQL在運行時先取出兩個表的結果,再用排序空間進行排序刪除重複的記錄,最後返回結果集,如果表數據量大的話可能會導致用磁盤進行排序。
MySQL中的UNION ALL
而UNION ALL只是簡單的將兩個結果合併後就返回。這樣,如果返回的兩個結果集中有重複的數據,那麼返回的結果集就會包含重複的數據了。
從效率上說,UNION ALL 要比UNION快很多,所以,如果可以確認合併的兩個結果集中不包含重複的數據的話,那麼就使用UNION ALL,如下:
select * from gc_dfys union all select * from ls_jg_dfys
使用Union,則所有返回的行都是唯一的,如同您已經對整個結果集合使用了DISTINCT
使用Union all,則不會排重,返回所有的行
如果您想使用ORDER BY或LIMIT子句來對全部UNION結果進行分類或限制,則應對單個地SELECT語句加圓括號,並把ORDER BY或LIMIT放到最後一個的後面:
(SELECT a FROM tbl_name WHERE a=10 AND B=1)
UNION
(SELECT a FROM tbl_name WHERE a=11 AND B=2)
ORDER BY a LIMIT 10;
麻煩一點也可以這麼幹:
select userid from (
select userid from testa union all select userid from testb) t
order by userid limit 0,1;
如果你還想group by,而且還有條件,那麼:
select userid from (select userid from testa union all select userid from testb) t group by userid having count(userid) = 2;
注意:在union的括號後面必須有個別名,否則會報錯
當然了,如果當union的幾個表的數據量很大時,建議還是採用先導出文本,然後用腳本來執行
因爲純粹用sql,效率會比較低,而且它會寫臨時文件,如果你的磁盤空間不夠大,就有可能會出錯
Error writing file '/tmp/MYLsivgK' (Errcode: 28)