第二期:
第一課:數據分析基本知識複習(2課時)
1. 數據分析的基本概念
a. 目的
b. 數據獲取和清理
c. 數據的描述性統計與可視化
2. 數據分析的常用模型
a. 監督式模型:(廣義)線性迴歸,決策樹,隨機森林,支持向量機,神經網絡
b. 非監督式模型:聚類分析,因子分析,主成分分析
第二課:銀行信貸客戶的聚類分析-非監督式聚類(2課時)
1. 數值型變量的歸一化
2. 類別型變量的編碼
3. 距離的概念和種類
4. 閔可夫斯基距離
5. VDM(Value Difference Metric)距離
6. 聚類的性能度量
a. Davies-Bouldin Index
b. Dunn Index
7. K-均值算法的難題:如何選取k
第三課:銀行信貸客戶的聚類分析-非監督式聚類(續)(2課時)
1. 數據描述
2. 數據預處理的實操:歸一化與編碼
3. K-均值算法用於信貸客戶的聚類分析
4. 層次聚類法用於信貸客戶的聚類分析
第四課:銀行信貸客戶的聚類分析-半監督式聚類(2課時)
1. 半監督聚類
a. 約束K-均值算法
2. 帶有少量標籤的K-均值算法
第五課:行爲評分卡模型的簡介(2課時)
1. 個人信貸產品的簡介及其中的各類風險
2. 什麼是評分卡模型
3. 信用風險領域的評分卡模型
a. 申請評分卡
b. 行爲評分卡
c. 催收評分卡
4. 評分卡模型的時間窗口概念
a. 表現期
b. 觀察期
5. 拓展:PD模型與巴塞爾協議
第六課:行爲評分卡模型的特徵構造(2課時)
1. 訓練集和測試集的劃分
2. 特徵構造
a. 逾期類型特徵
b. 還款率類型特徵
c. 使用率類型特徵
d. 消費類型特徵
e. 其他類型特徵
3. 變量的分箱和WOE計算
第七課:行爲評分卡模型的特徵挑選(2課時)
1. IV的概念
2. 單變量分析
3. 多變量分析
4. 線性相關性
5. 多重共線性
第八課:行爲評分卡模型的邏輯迴歸模型(2課時)
1. 邏輯迴歸模型的基本概念
a. 什麼是邏輯迴歸
b. 邏輯迴歸中的參數估計
c. 邏輯迴歸的正則化:LASSO(L1約束) & Ridge(L2約束)
2. 用邏輯迴歸構造行爲評分卡模型
3. 從概率到分數
第九課:行爲評分卡模型的驗證、監控和調優(2課時)
1. 評分卡模型常用的評價指標
a. KS
b. AR
c. PSI
d. Kendal’s Tau
2. Assigned PD & Actual PD
3. 模型監控的概念
a. 模型監控的頻率
b. 模型監控的解讀
4. 模型的調優
第十課:組合評分卡模型(2課時)
1. 組合模型概述
2. 串行結構的評分組合模型
3. 異態並行結構的評分組合模型
4. 同態並行結構的評分組合模型
第一期:
課程大綱:
第一講:數據分析基本知識複習(2課時)
1. 數據分析的基本概念
a. 目的
b. 數據獲取和清理
c. 數據的描述性統計
2. 數據可視化
3. 數據分析的常用模型
a. 監督式模型:(廣義)線性迴歸,決策樹,隨機森林,支持向量機,神經網絡
b. 非監督式模型:聚類分析,因子分析,主成分分析
c. 半監督式模型
4. 數據分析的常用工具
a. R和Python
第二課:銀行內客戶流失預警模型的介紹(2課時)
1. 銀行客羣和產品的類別
2. 爲什麼要做客戶流失預警模型
3. 數據介紹和描述
第三課:金融客戶流失預警模型中的數據預處理和特徵衍生(2課時)
1. 流失數據中的極端值和缺失值的處理
2. 構建流失行爲的特徵
第四課:GBDT模型在流失預警模型中的應用(2課時)
1. GBDT模型如何應用在金融客戶流失預警模型中
2. 如何從客戶流失數據中推導GBDT模型的參數
3. GBDT模型對防範客戶流失的指導意義
第五課:神經網絡模型在流失預警模型中的應用(2課時)
1. 神經網絡模型如何應用在金融客戶流失預警模型中
2. 如何從客戶流失數據中推導神經網絡模型的參數
3. 神經網絡模型對防範客戶流失的指導意義
4. 神經網絡模型和GBDT模型在客戶流失預警工作中的功效比較
第六課:信用卡賬戶違約預測模型的介紹(2課時)
1. 信貸違約的基本概念
2. 爲什麼要做違約預測模型
3. 信貸違約預測模型的特性
4. 數據介紹和描述
5. 非平衡樣本問題的定義和解決方法
a. 過抽樣和欠抽樣
b. SMOTE算法
第七課:違約預測模型中的數據預處理和特徵衍生(2課時)
1. 構建信用風險類型的特徵
2. 特徵的分箱
a. 分箱的優點
b. Best-KS分箱法和卡方分箱法
3. 特徵信息度的計算
第八課:違約預測模型中的數據預處理和特徵衍生(續,2課時)
1. 分箱後如何編碼
a. WOE的概念、優點和計算
2. 信用風險中的單變量分析和多變量分析
第九課:邏輯迴歸模型在違約預測模型中的應用(2課時)
1. 邏輯迴歸在違約預測模型中的作用的概述
2. 降維的方法
a. 主成分法
3. 變量選擇的方法
a. LASSO方法
b. 逐步迴歸法
c. 隨機森林法
4. 帶誤判懲罰的邏輯迴歸模型
第十課:違約預測模型的評價標準(2課時)
1. 模型對違約與非違約人羣的區分度
2. 模型的準確度衡量:
a. 儘可能抓住足夠多的違約人羣
b. 儘可能不誤抓非違約人羣