【應用】信用評分卡:邏輯迴歸

筆者邀請您,先思考:

1 您理解邏輯迴歸分析?

邏輯迴歸入門 - 你快樂嗎?

幾年前,我和妻子在英格蘭和蘇格蘭度過了幾個星期的假期。就在登上英國航空公司的飛機之前,一名空姐告訴我們,我們已升級爲商務艙。快樂!度假真是一個美好的開始。一旦我們登上飛機,我們又獲得了另一個誘人的提議,可以進一步升級到頭等艙。然而,這一次,有一個問題 - 只有一個座位可用。當然,這是一種恥辱,我們無法接受這個提議。在提供頭等艙優惠之前,商務艙座位非常棒 - 順便說一下,所有免費升級。這是行爲經濟學家描述爲相對論和錨定的情況 - 用簡單的英語比較。錨定或比較是企業定價策略的根源,也是所有人類悲傷的根源。然而,最終度假心情接管了,我們徹底享受了商務艙。人類在適應最終情況方面非常擅長並享受它。在最困難的情況下,你會發現一些最快樂的面孔。以下是亨利米勒的一句話:“我沒有錢,沒有資源,沒有希望。我是最幸福的人“。人類的行爲充滿了異常 - 充滿了謎題。以下是加強本論文的一個例子。

Lennon, McCartney, Harrison, 和 Best 是這個星球上最着名的樂隊 - 甲殼蟲樂隊的成員。 好的,我知道你發現了這個錯誤。 到現在爲止,你必須說出正確的名字:John Lennon,Paul McCartney,George Harrison和Ringo Starr,而不是Pete Best。 實際上,Ringo Starr是Pete Best的替代品,Pete Best是甲殼蟲樂隊的原始常規鼓手。 皮特一定是被摧毀了,看到他的夥伴們在落後的時候冉冉升起。 錯了,在Google上搜索他 - 他是所有人中最快樂的披頭士樂隊。 現在這是違反直覺的,我想我們不知道是什麼讓我們開心。

正如在前一篇文章中所承諾的那樣,在本文中,我將嘗試使用邏輯迴歸來探索幸福 - 這種技術廣泛用於記分卡開發。

Logistic迴歸 - 一個實驗

我是一位徹底的經驗主義者 - 支持基於事實的管理。 因此,讓我設計一個快速而骯髒的實驗來生成數據來評估幸福感。 我們的想法是確定影響我們整體幸福感的因素/變量。 讓我列出一個生活在城市中的工作成年人的代表性因素列表:

現在,在上面的列表中加入一些其他因素,例如 - 善意的隨機行爲或對朋友的無計劃訪問。 如您所見,上面的列表可以很容易地擴展(回想一下關於變量選擇的文章 - 文章3)。 這是一個代表性的清單,您必須創建自己的清單,以找出影響您的幸福水平的因素。

實驗的第二部分是收集數據。 這就像維護日記只有這一個將在Microsoft Excel中。 每天晚上睡覺之前,你可以評估你的一天,並填寫電子表格中的數字以及當天的整體幸福水平(如下圖所示)。

經過幾年的數據收集,您將有足夠的觀察來創建模型 - 在這種情況下的邏輯迴歸模型。 我們試圖在上面的數據集中用其他列(C到I)模擬幸福感(B列)。 如果我們在Y軸上繪製B並且在X軸上繪製C到I的加法組合(我們將其稱爲Z),它將看起來像下面所示的圖。

邏輯迴歸背後的想法是以這樣的方式優化Z,使得我們在快樂和悲傷面孔之間得到最佳區分,如上圖所示。這是一個曲線擬合問題,其中sigmoid函數(紫色曲線)作爲函數的選擇。

我建議在我們的模型中使用觀察日期(A欄);這可能會給季節帶來有趣的影響。

銀行和金融業的應用

這正是我們在分析記分卡(例如信用評分卡,行爲評分卡,欺詐評分卡或購買傾向模型)的情況下所做的事情。用來替換快樂和悲傷的面孔

  • 好的和壞的借款人
  • 欺詐和真實案件
  • 買家和非買家

對於相應的情況,你有模型。如果您記得上一篇文章4,我已經展示了一個簡單的信用記分卡模型:信用評分=年齡+貸款與價值比率(LTV)+分期付款(EMI)與收入比率(IIR)

Sigmoid函數的直接轉換將幫助我們得到線的上述等式。這是到達所需評分卡的最後一個鏈接。

信用評分卡中的變量轉換

我喜歡電影Kill-Bill這兩部分。 在第一部分中,當Uma Thurman的角色去日本從傳說中的劍士HattoriHanzō手中拿劍時,我很享受。 在瞭解了她的動機之後,他同意爲她做出最好的劍。 然後電影導演昆汀·塔倫蒂諾(Quentin Tarantino)簡要介紹了製作劍的過程。 HattoriHanzō將一塊普通的鐵片變成了神話般的劍 - 這真是一個工匠。 這與分析師如何將S形函數轉換爲線性方程非常相似。 不同之處在於,分析師使用數學工具而不是錘子,並不像HattoriHanzō那樣具有傳奇色彩。

拒絕推理

拒絕推斷是信用或應用記分卡的一個顯着方面,它與所有其他分類模型不同。 對於應用記分卡,由於拒絕貸款缺乏績效,開發樣本存在偏差。 拒絕推斷是一種糾正這一缺點並消除樣本偏差的方法。 我們將在後面有關您的CANalytics的文章中詳細討論拒絕推斷。

總結

現在我們已準備好評分卡,下一個任務是驗證評分卡的預測能力。 這正是我們將在下一篇文章中做的。 再見。

參考資料

  1. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring – Naeem Siddiqi
  2. Credit Scoring for Risk Managers: The Handbook for Lenders – Elizabeth Mays and Niall Lynas

作者:Roopam Upadhyay

原文鏈接

http://ucanalytics.com/blogs/credit-scorecards-logistic-regression-part-5/

版權聲明:作者保留權利,嚴禁修改,轉載請註明原文鏈接。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章