sql窗口函數介紹以及常用的幾個功能

窗口函數可以進行排序,生成序列號等一般的聚合函數無法實現的高級操作。

窗口函數也稱爲OLAP函數,意思是對數據庫數據進行實時分析處理。窗口函數就是爲了實現OLAP而添加的標準SQL功能。

窗口函數語法:其中[]中的內容可以省略

<窗口函數> over ([partition by <列清單>]
                        order by <排序用列清單>)
窗口函數大體可以分爲以下兩種:1.能夠作爲窗口函數的聚合函數(sum,avg,count,max,min)

                                                      2.rank,dense_rank。row_number等專用窗口函數。

語法的基本使用方法:使用rank函數

rank函數是用來計算記錄排序的函數。

select product_name, product_type, sale_price,
       rank () over (partition by product_type
                            order by sale_price) as ranking
from Product;


partition by 能夠設定排序的對象範圍,類似於group by語句,這裏就是以product_type劃分排序範圍。

order by能夠指定哪一列,何種順序進行排序。也可以通過asc,desc來指定升序降序。

窗口函數兼具分組和排序兩種功能。通過partition by分組後的記錄集合稱爲窗口。

然而partition by不是窗口函數所必須的:

select product_name, product_type, sale_price,
       rank () over (order by sale_price) as ranking
from Product;
沒有進行範圍的劃分,直接對全部的商品進行排序。

專用函數的種類:1.rank函數:計算排序時,如果存在相同位次的記錄,則會跳過之後的位次。

                             2.dense_rank函數:同樣是計算排序,即使存在相同位次的記錄,也不會跳過之後的位次。

                             3.row_number函數:賦予唯一的連續位次。

select product_name, product_type, sale_price,
       rank () over (order by sale_price) as ranking,
       dense_rank () over (order by sale_price) as dense_ranking,
       row_number () over (order by sale_price) as row_num
from Product;


由於窗口函數無需參數,因此通常括號裏都是空的。

窗口函數的適用範圍:只能在select子句中使用。

作爲窗口函數使用的聚合函數:

sum:

select product_id, product_name, sale_price,
       sum(sale_price) over (order by product_id) as current_sum
from Product;
以累計的方式進行計算。

計算出商品編號小於自己的商品的銷售單價的合計值。

avg:

select product_id, product_name, sale_price,
       avg(sale_price) over (order by product_id) as current_sum
from Product;
作爲的統計對象同樣是排在自己之上的記錄。

1行:1000/1

2行:(1000 + 500)/2

3行:(1000+500+4000)/3

...

計算移動平均

窗口函數就是將表以窗口爲單位進行分割,並在其中進行排序的函數。其中還包含在窗口中指定更加詳細的彙總範圍的備選功能,該備選功能中的彙總範圍稱爲框架。

指定最靠近的3行做爲彙總對象:

select product_id, product_name, sale_price,
       avg (sale_price) over (order by product_id
                              rows 2 preceding) as moving_avg
from Product;
指定框架(彙總範圍):這裏使用的rows(行)和preceding(之前)兩個關鍵字,將框架指定爲截止到之前?行,因此rows 2 preceding就是將框架指定爲截止到之前2行,也就是將作爲彙總對象的記錄限定爲如下的最靠近3行

1.自身(當前記錄)

2.之前1行的記錄

3.之前2行的記錄

所以結果:

假設當前行爲3000,前1行記錄爲4000,前兩行記錄爲500,所以(500+4000+3000)/3=2500

這樣的統計方法稱爲移動平均。

使用關鍵字following(之後)替換preceding,就可以將框架改爲截止到之後?行。

將當前記錄的前後行作爲彙總對象:

select product_id, product_name, sale_price,
       avg(sale_price) over (order by product_id
                              rows between 1 preceding and 1 following) as moving_avg--使用between規劃範圍,語句意思爲rows 1 preceding
                                                                                     --到rows 1 following
from Product;
語句意思:1.之前1行的記錄

                  2.自身(當前記錄)

                  3.之後1行的記錄

整的框架就是這樣

還是假設3000爲當前記錄,框架計算4000爲前一行記錄,6800爲後一行記錄(4000+3000+6800)/3 = 4600

總行數還是3.

兩個order by

select product_name, product_type, sale_price,
       rank() over (order by product_name) as ranking
from Product;
這時候價格會顯得混亂不堪

可以在語句最後添加一個order by子句,來約束sale_price

select product_name, product_type, sale_price,
       rank() over (order by product_name) as ranking
from Product
order by sale_price;

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章