金融數據分析

第二期:
第一課:數據分析基本知識複習(2課時)
     1.  數據分析的基本概念
          a.  目的
          b.  數據獲取和清理
          c.  數據的描述性統計與可視化
     2.  數據分析的常用模型
          a.  監督式模型:(廣義)線性迴歸,決策樹,隨機森林,支持向量機,神經網絡
          b.  非監督式模型:聚類分析,因子分析,主成分分析
第二課:銀行信貸客戶的聚類分析-非監督式聚類(2課時)
     1.  數值型變量的歸一化
     2.  類別型變量的編碼
     3.  距離的概念和種類
     4.  閔可夫斯基距離
     5.  VDM(Value Difference Metric)距離
     6.  聚類的性能度量
          a.  Davies-Bouldin Index
          b.  Dunn Index
     7.  K-均值算法的難題:如何選取k
第三課:銀行信貸客戶的聚類分析-非監督式聚類(續)(2課時)
     1.  數據描述
     2.  數據預處理的實操:歸一化與編碼
     3.  K-均值算法用於信貸客戶的聚類分析
     4.  層次聚類法用於信貸客戶的聚類分析
第四課:銀行信貸客戶的聚類分析-半監督式聚類(2課時)
     1.  半監督聚類
    a.  約束K-均值算法
     2.  帶有少量標籤的K-均值算法
第五課:行爲評分卡模型的簡介(2課時)
     1.  個人信貸產品的簡介及其中的各類風險
     2.  什麼是評分卡模型
     3.  信用風險領域的評分卡模型
           a.  申請評分卡
           b.  行爲評分卡
           c.  催收評分卡
     4.  評分卡模型的時間窗口概念
           a.  表現期
           b.  觀察期
5.  拓展:PD模型與巴塞爾協議
第六課:行爲評分卡模型的特徵構造(2課時)
     1.  訓練集和測試集的劃分
     2.  特徵構造
    a.  逾期類型特徵
           b.  還款率類型特徵
    c.  使用率類型特徵
    d.  消費類型特徵
    e.  其他類型特徵
     3.  變量的分箱和WOE計算
第七課:行爲評分卡模型的特徵挑選(2課時)
     1.  IV的概念
     2.  單變量分析
     3.  多變量分析
     4.  線性相關性
     5.  多重共線性
第八課:行爲評分卡模型的邏輯迴歸模型(2課時)
     1.  邏輯迴歸模型的基本概念
           a.  什麼是邏輯迴歸
           b.  邏輯迴歸中的參數估計
           c.  邏輯迴歸的正則化:LASSO(L1約束) & Ridge(L2約束)
     2.  用邏輯迴歸構造行爲評分卡模型
     3.  從概率到分數
第九課:行爲評分卡模型的驗證、監控和調優(2課時)
     1.  評分卡模型常用的評價指標
           a.  KS
           b.  AR
           c.  PSI
           d.  Kendal’s Tau
     2.  Assigned PD & Actual PD
     3.  模型監控的概念
          a.  模型監控的頻率
          b.  模型監控的解讀
     4.  模型的調優
第十課:組合評分卡模型(2課時)
     1.  組合模型概述
     2.  串行結構的評分組合模型
     3.  異態並行結構的評分組合模型
     4.  同態並行結構的評分組合模型

第一期:
課程大綱:
第一講:數據分析基本知識複習(2課時)
      1.  數據分析的基本概念
           a.  目的
           b.  數據獲取和清理
           c.  數據的描述性統計
      2.  數據可視化
      3.  數據分析的常用模型
           a.  監督式模型:(廣義)線性迴歸,決策樹,隨機森林,支持向量機,神經網絡
           b.  非監督式模型:聚類分析,因子分析,主成分分析
           c.  半監督式模型
      4.  數據分析的常用工具
           a.  R和Python
第二課:銀行內客戶流失預警模型的介紹(2課時)
      1.  銀行客羣和產品的類別
      2.  爲什麼要做客戶流失預警模型
      3.  數據介紹和描述
第三課:金融客戶流失預警模型中的數據預處理和特徵衍生(2課時)
      1.  流失數據中的極端值和缺失值的處理
      2.  構建流失行爲的特徵
第四課:GBDT模型在流失預警模型中的應用(2課時)
      1.  GBDT模型如何應用在金融客戶流失預警模型中
      2.  如何從客戶流失數據中推導GBDT模型的參數
      3.  GBDT模型對防範客戶流失的指導意義
第五課:神經網絡模型在流失預警模型中的應用(2課時)
      1.  神經網絡模型如何應用在金融客戶流失預警模型中
      2.  如何從客戶流失數據中推導神經網絡模型的參數
      3.  神經網絡模型對防範客戶流失的指導意義
      4.  神經網絡模型和GBDT模型在客戶流失預警工作中的功效比較
第六課:信用卡賬戶違約預測模型的介紹(2課時)
      1.  信貸違約的基本概念
      2.  爲什麼要做違約預測模型
      3.  信貸違約預測模型的特性
      4.  數據介紹和描述
      5.  非平衡樣本問題的定義和解決方法
           a.  過抽樣和欠抽樣
           b.  SMOTE算法
第七課:違約預測模型中的數據預處理和特徵衍生(2課時)
      1.  構建信用風險類型的特徵
      2.  特徵的分箱
           a.  分箱的優點
           b.  Best-KS分箱法和卡方分箱法
      3.  特徵信息度的計算
第八課:違約預測模型中的數據預處理和特徵衍生(續,2課時)
      1.  分箱後如何編碼
           a.  WOE的概念、優點和計算
      2.  信用風險中的單變量分析和多變量分析
第九課:邏輯迴歸模型在違約預測模型中的應用(2課時)
      1.  邏輯迴歸在違約預測模型中的作用的概述
      2.  降維的方法
           a.  主成分法
      3.  變量選擇的方法
           a.  LASSO方法
           b.  逐步迴歸法
           c.  隨機森林法
      4.  帶誤判懲罰的邏輯迴歸模型
第十課:違約預測模型的評價標準(2課時)
      1.  模型對違約與非違約人羣的區分度
      2.  模型的準確度衡量:
           a.  儘可能抓住足夠多的違約人羣
           b.  儘可能不誤抓非違約人羣

 

百度網盤

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章