Back: 在excel中經常會看到絕對引用、相對引用、混合引用的蹤影。例如在計算lift table時,可用其計算TPR FPR KS
1. 先show一下lift table是什麼:
Lift Table一般包含以下特徵列:好佔比(1) - 壞佔比(0) - 累計好佔比(1:TPR) - 累計壞佔比(0:FPR) - ks=max(累計好佔比-累計壞佔比)=max(TPR-FPR)。
各個特徵計算方式舉例如下: good_pct (該分組下的好樣本數/所有好樣本數) - bad_pct(該分組下的壞樣本數/所有壞樣本數) - good_cum(累計到該分組下的好樣本數/所有好樣本數) - bad_cum(累計到該分組下的壞樣本數/所有壞樣本數) - ks(max(good_cum - bad_cum))。 在excel中計算需要用到相對引用,絕對引用(混合引用)
lift值實際衡量的是,與不利用模型相比,模型的預測能力變好了多少。lift(提升指數)越大,模型的運行效果越好,實際上它是投入與產出比。
2. 絕對引用、相對引用、混合引用的介紹:
A1:相對引用
$A$1:絕對引用行和列
$A1:絕對引用列
A$1:絕對引用行【$在誰的前面就絕對引用誰】
相對引用、絕對引用和混合引用是指在公式中使用單元格或單元格區域的地址時,當將公式向旁邊複製時,地址是如
何變化的。
具體情況舉例說明:
1、相對引用,複製公式時地址跟着發生變化
2、絕對引用,複製公式時地址不會跟着發生變化
3、混合引用,複製公式時地址的部分內容跟着發生變化(沒有$的部分內容發生改變)
回顧:lift table的計算方式和特徵列,沒有貼結果,,,,
3.今天學習到的一個SQL函數:PERCENT_RANK 函數
含義:
與 PERCENT 函數類似,PERCENT_RANK 函數爲窗口的 ORDER BY 子句所指定列中的值返回秩,但以介於 0 和 1 之間的小數形式表示,計算方法爲 (RANK - 1)/(- 1)。
隨着窗口在輸入行中向下移動,會計算在窗口的 ORDER BY 子句中所指定的表達式的秩。當 ORDER BY 子句包括多個表達式時,若第一個表達式與相鄰行具有相同值,則第二個及後續表達式將用於區分並列情況。NULL 值排在任何其它值的前面(在升序序列中)。
舉例:
以下示例返回按性別顯示 New York 僱員薪水排位的結果集。該結果使用百分比數按降序列出排位並按性別分區。
SELECT DepartmentID, Surname, Salary, Sex,
PERCENT_RANK( ) OVER ( PARTITION BY Sex
ORDER BY Salary DESC ) AS PctRank
FROM Employees
WHERE State IN ( 'NY' );