sql之分析函數

一、lag 和lead函數

 可以 獲取結果集中,按一定排序所排列的當前行的上下相鄰若干offset 的某個行的某個列(不用結果集的自關聯);
lag ,lead 分別是向前,向後;
lag 和lead 有三個參數,第一個參數是列名,第二個參數是偏移的offset,第三個參數是 超出記錄窗口時的默認值)

lag(expression<,offset><,default>)函數可以訪問組內當前行之前的行,

而lead(expression<,offset><,default>)函數則正相反,可以訪問組內當前行之後的行.

其中,offset是正整數,默認爲1.因組內第一個條記錄沒有之前的行,最後一行沒有之後的行,

default就是用於處理這樣的信息,默認爲空.

注意:這2個函數必須指定 order By 字句.

create table temp_a (a varchar(10),b varchar(10),c varchar(10),d varchar(10));

insert into temp_a values('1','100','102','103');
insert into temp_a values('2','200','202','203');
insert into temp_a values('3','300','302','303');
insert into temp_a values('4','400','402','403');
commit;

SQL> select a,b,c,d,lag(d) over (order by d) lag,lead(d) over (order by d) lead from temp_a;

A B C D LAG LEAD
---------- ---------- ---------- ---------- ---------- ----------
1 100 102 103 203
2 200 202 203 103 303
3 300 302 303 203 403
4 400 402 403 303 
SQL> select a,b,c,d,lag(d,1,0) over (order by d) lag,lead(d,1,d) over (order by d) lead from temp_a;

A B C D LAG LEAD
---------- ---------- ---------- ---------- ---------- ----------
1 100 102 103 0 203
2 200 202 203 103 303
3 300 302 303 203 403
4 400 402 403 303 403


二、group by和partition by區別

group by是對檢索結果的保留行進行單純分組,一般總愛和聚合函數一塊用例如AVG(),COUNT(),max(),main()等一塊用。 

partition by雖然也具有分組功能,但同時也具有其他的功能。 
它屬於oracle的分析用函數。 
借用一個勤快人的數據說明一下: 

sum()   over   (PARTITION   BY   ...)   是一個分析函數。   他執行的效果跟普通的sum   ...group   by   ...不一樣,它計算組中表達式的累積和,而不是簡單的和。   
    
表a,內容如下:   
B C D   
02 02 1   
02 03 2   
02 04 3   
02 05 4   
02 01 5   
02 06 6   
02 07 7   
02 03 5   
02 02 12   
02 01 2   
02 01 23   
    
select   b,c,sum(d)   e   from   a   group   by   b,c   
得到:   
B C E   
02 01 30   
02 02 13   
02 03 7   
02 04 3   
02 05 4   
02 06 6   
02 07 7   
    
而使用分析函數得到的結果是:   
SELECT   b,   c,   SUM(d)   OVER(PARTITION   BY   b,c   ORDER   BY   d)   e   FROM   a   
B C E   
02 01 2   
02 01 7   
02 01 30   
02 02 1   
02 02 13   
02 03 2   
02 03 7   
02 04 3   
02 05 4   
02 06 6   
02 07 7   
結果不一樣,這樣看還不是很清楚,我們把d的內容也顯示出來就更清楚了:   
SELECT   b,   c,   d,SUM(d)   OVER(PARTITION   BY   b,c   ORDER   BY   d)   e   FROM   a   
B C D E   
02 01 2 2                     d=2,sum(d)=2   
02 01 5 7                     d=5,sum(d)=7   
02 01 23 30                   d=23,sum(d)=30   
02 02 1 1                     c值不同,重新累計   
02 02 12 13   
02 03 2 2   
02 03 5 7   
02 04 3 3   
02 05 4 4   
02 06 6 6   
02 07 7 7

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章