T-SQL查詢進階--數據集之間的運算
概述
關係數據庫的起源起源於數學中的集合概念.所以集合與集合之間,也同樣繼承了數學集合之間的運算.而對於在關係數據庫中,常常用於兩個數據集中並沒有直接的關係數據庫中的“關係”,比如外鍵.但兩個數據集會有間接的關係,比如兩屆比賽,參加比賽人員集合之間會有間接關係.
數據集運算的種類
在T-SQL中,關係運算實際上可以分爲四類,首先看我們舉例子用的表:
這裏的例子表分別爲兩個不同會議參加的人員記錄,分別爲Meeting1和Meeting2,如下:
關係運算的具體可以分爲以下四類:
1.A∩B,既是所求數據集既在A中,又在B中
在實例表中,實際的例子爲既參加第一個會議,又參加第二個會議人的集合,如下圖:
2.A∪B,既所求數據在數據集A中,或在數據集B中
在實例表中,實際的例子爲參加第一個會議,或參加第二個會議人的集合,如下圖:
3.A-B,既所求數據在數據集A中,不在數據集B中
在實例表中,實際的例子爲參加了第一個會議,同時沒有參加第二個會議的人的集合,如下圖:
4.B-A,既所求數據在數據集B中,不在數據集A中
這個其實和上面第三種情況沒有本質區別,只是順序顛倒了一下,如下圖:
數據集的來源
在T-SQL中,參與數據集運算的兩個數據集可以來自任何返回數據集的表達式.比如,一張表,一張表的子集,多張表,臨時表變量,虛擬列,甚至是一個scalar值
數據集運算的條件
並不是所有的數據集都可以做運算。就像一個蘋果+一個鴨梨不能等於2一樣,在T-SQL中,數據集之間的運算需要符合下面3個條件:
1.兩個數據集之間必須有相同數量的列(Column)
2.兩個數據集之間列出現的次序必須一致
3.兩個數據集之間每一個對應的列的數據類型必須匹配
數據集運算在T-SQL中的實現
1.A∪B 使用UNION實現
T-SQL中提供了UNION來實現A∪B的運算,實際上UNION有兩個版本,分別爲:
UNION
UNION表示了A∪B的關係,當遇到兩個數據集中相同的行時,保留唯一一個:
UNION ALL
UNION ALL同樣實現了A∪B的邏輯,但與UNION不同的是,當遇到兩個數據集中重複的行時,全部保留:
2.A∩B,使用INTERSECT實現
T-SQL提供了INTERSECT關鍵字來實現A∩B的關係:
3.A-B,使用EXCEPT實現
T-SQL提供了EXCEPT關鍵字來實現A-B的關係:
數據集運算的別名和排序
如果沒有爲數據列指定別名,則數據列的名稱按照出現在第一個集合對應的列名算:
做UNION後:
如若我們想自定義列名,則需要爲數據集運算中出現在第一位的數據集指定別名:
對運算後的結果進行排序
對運算後的結果進行排序是一件非常簡單的事情,只需要在運算的最後加上ORDER BY子句,但是這裏一定要注意:
1.ORDER BY是對整個運算後的結果排序,並不是對單個數據集
2.ORDER BY後面排序的字段名稱是第一個數據集的字段名或者別名
總結
本文詳細介紹了簡單的集合運算,並給出了簡單集合運算在T-SQL中的實現。在文章最後還介紹了運算的別名規則和排序規則.掌握集合之間的運算對更加清晰的瞭解T-SQL查詢有很大的幫助。