數據集來自 UCI
UCI_Credit_Card.csv
數據集信息
此數據集包含有關2005年4月至2005年9月臺灣地區信用卡客戶的默認付款,人口統計因素,信用數據,付款歷史和賬單的信息。
內容
有25個變量:
ID:每個客戶的ID
LIMIT_BAL:以新臺幣計的給定信用額度(包括個人和家庭/輔助信用額)
性別:性別(1 =男性,2 =女性)
教育程度:(1 =研究生院,2 =大學,3 =高中,4 =其他,5 =未知,6 =未知)
婚姻:婚姻狀況(1 =已婚,2 =單,3 =其他)
年齡:歲
PAY_0:2005年9月的還款狀態(-1 =正常付款,1 =延遲一個月的付款,2 =延遲兩個月的付款,... 8 =延遲八個月的付款,9 =延遲九個月的付款,以及以上)
PAY_2:2005年8月的還款狀態(與上述相同)
PAY_3:2005年7月的還款狀態(與上述相同)
PAY_4:2005年6月的還款狀態(與上述金額相同)
PAY_5:2005年5月的還款狀態(與上述相同)
PAY_6:2005年4月的還款狀態(與上述相同)
BILL_AMT1:2005年9月的帳單金額(新臺幣)
BILL_AMT2:2005年8月的帳單金額(新臺幣)
BILL_AMT3:2005年7月的帳單金額(新臺幣)
BILL_AMT4:2005年6月的帳單金額(新臺幣)
BILL_AMT5:2005年5月的對帳單金額(新臺幣)
BILL_AMT6:2005年4月的帳單金額(新臺幣)
PAY_AMT1:2005年9月的先前付款金額(新臺幣)
PAY_AMT2:2005年8月的先前付款金額(新臺幣)
PAY_AMT3:2005年7月的先前付款金額(新臺幣)
PAY_AMT4:2005年6月的先前付款金額(新臺幣)
PAY_AMT5:2005年5月的先前付款金額(新臺幣)
PAY_AMT6:2005年4月的先前付款金額(新臺幣)
default.payment.next.month:默認付款(1 =是,0 =否)
SAS 環境:SAS STUDIO大學版
首先對數據進行數據描述,得到大致的數據概況。然後對缺失值處理
然後對數據進行歸一化,這裏用到的是STUDIO 的標準化模塊
使用任務模塊的二元邏輯迴歸
導入相應的預測值,分類變量,以及歸一化完的數值連續變量
使用了默認的建模參數
然後輸出模型結果:
模型信息 | |
---|---|
數據集 | WORK.STDIZE |
響應變量 | default_payment_next_month |
響應水平數 | 2 |
模型 | 二元 Logit |
優化方法 | Fisher 評分法 |
讀取的觀測數 | 30000 |
---|---|
使用的觀測數 | 30000 |
響應概略 | ||
---|---|---|
有序 值 |
default_payment_next_month | 總 頻數 |
1 | 0 | 23364 |
2 | 1 | 6636 |
建模的概率爲 default_payment_next_month='1'。
分類水平信息 | ||||||||
---|---|---|---|---|---|---|---|---|
分類 | 值 | 設計變量 | ||||||
SEX | 1 | 1 | 0 | |||||
2 | 0 | 1 | ||||||
EDUCATION | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 |
1 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | |
2 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | |
3 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | |
4 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | |
5 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | |
6 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | |
MARRIAGE | 0 | 1 | 0 | 0 | 0 | |||
1 | 0 | 1 | 0 | 0 | ||||
2 | 0 | 0 | 1 | 0 | ||||
3 | 0 | 0 | 0 | 1 |
模型收斂狀態 |
---|
滿足收斂準則 (GCONV=1E-8)。 |
模型擬合統計量 | ||
---|---|---|
準則 | 僅截距 | 截距和協變量 |
AIC | 31707.354 | 27889.258 |
SC | 31715.663 | 28146.835 |
-2 Log L | 31705.354 | 27827.258 |
檢驗全局原假設: BETA=0 | |||
---|---|---|---|
檢驗 | 卡方 | 自由度 | Pr > 卡方 |
似然比 | 3878.0967 | 30 | <.0001 |
評分 | 3749.8174 | 30 | <.0001 |
Wald | 3061.8299 | 30 | <.0001 |
3 型效應分析 | |||
---|---|---|---|
效應 | 自由度 | Wald 卡方 |
Pr > 卡方 |
SEX | 1 | 13.4141 | 0.0002 |
EDUCATION | 6 | 41.4162 | <.0001 |
MARRIAGE | 3 | 35.5147 | <.0001 |
Standardized_PAY_0 | 1 | 1063.4129 | <.0001 |
Standardized_PAY_2 | 1 | 16.2970 | <.0001 |
Standardized_PAY_3 | 1 | 9.9461 | 0.0016 |
Standardized_PAY_4 | 1 | 0.8093 | 0.3683 |
Standardized_PAY_5 | 1 | 1.6349 | 0.2010 |
Standardized_PAY_6 | 1 | 0.0968 | 0.7557 |
Standardized_BILL_AM | 1 | 23.4764 | <.0001 |
Standardized_BILL_AM | 1 | 2.5703 | 0.1089 |
Standardized_BILL_AM | 1 | 1.0333 | 0.3094 |
Standardized_BILL_AM | 1 | 0.0108 | 0.9172 |
Standardized_BILL_AM | 1 | 0.2491 | 0.6177 |
Standardized_BILL_AM | 1 | 0.0267 | 0.8701 |
Standardized_PAY_AMT | 1 | 35.0031 | <.0001 |
Standardized_PAY_AMT | 1 | 20.6781 | <.0001 |
Standardized_PAY_AMT | 1 | 2.3634 | 0.1242 |
Standardized_PAY_AMT | 1 | 5.1893 | 0.0227 |
Standardized_PAY_AMT | 1 | 3.2759 | 0.0703 |
Standardized_PAY_AMT | 1 | 2.6011 | 0.1068 |
AGE | 1 | 8.3249 | 0.0039 |
LIMIT_BAL | 1 | 19.6728 | <.0001 |
最大似然估計分析 | ||||||
---|---|---|---|---|---|---|
參數 | 自由度 | 估計 | 標準 誤差 |
Wald 卡方 |
Pr > 卡方 | |
Intercept | 1 | -1.7913 | 0.4332 | 17.0983 | <.0001 | |
SEX | 1 | 1 | 0.1125 | 0.0307 | 13.4141 | 0.0002 |
SEX | 2 | 0 | 0 | . | . | . |
EDUCATION | 0 | 1 | -9.5675 | 85.2395 | 0.0126 | 0.9106 |
EDUCATION | 1 | 1 | 0.3025 | 0.4035 | 0.5619 | 0.4535 |
EDUCATION | 2 | 1 | 0.2179 | 0.4031 | 0.2924 | 0.5887 |
EDUCATION | 3 | 1 | 0.1961 | 0.4038 | 0.2358 | 0.6273 |
EDUCATION | 4 | 1 | -0.8448 | 0.5642 | 2.2418 | 0.1343 |
EDUCATION | 5 | 1 | -1.0607 | 0.4747 | 4.9925 | 0.0255 |
EDUCATION | 6 | 0 | 0 | . | . | . |
MARRIAGE | 0 | 1 | -1.2406 | 0.5329 | 5.4196 | 0.0199 |
MARRIAGE | 1 | 1 | 0.0788 | 0.1373 | 0.3288 | 0.5664 |
MARRIAGE | 2 | 1 | -0.1102 | 0.1388 | 0.6301 | 0.4273 |
MARRIAGE | 3 | 0 | 0 | . | . | . |
Standardized_PAY_0 | 1 | 0.6491 | 0.0199 | 1063.4129 | <.0001 | |
Standardized_PAY_2 | 1 | 0.0976 | 0.0242 | 16.2970 | <.0001 | |
Standardized_PAY_3 | 1 | 0.0854 | 0.0271 | 9.9461 | 0.0016 | |
Standardized_PAY_4 | 1 | 0.0263 | 0.0292 | 0.8093 | 0.3683 | |
Standardized_PAY_5 | 1 | 0.0390 | 0.0305 | 1.6349 | 0.2010 | |
Standardized_PAY_6 | 1 | 0.00793 | 0.0255 | 0.0968 | 0.7557 | |
Standardized_BILL_AM | 1 | -0.4060 | 0.0838 | 23.4764 | <.0001 | |
Standardized_BILL_AM | 1 | 0.1717 | 0.1071 | 2.5703 | 0.1089 | |
Standardized_BILL_AM | 1 | 0.0933 | 0.0918 | 1.0333 | 0.3094 | |
Standardized_BILL_AM | 1 | -0.00904 | 0.0869 | 0.0108 | 0.9172 | |
Standardized_BILL_AM | 1 | 0.0461 | 0.0925 | 0.2491 | 0.6177 | |
Standardized_BILL_AM | 1 | 0.0116 | 0.0711 | 0.0267 | 0.8701 | |
Standardized_PAY_AMT | 1 | -0.2260 | 0.0382 | 35.0031 | <.0001 | |
Standardized_PAY_AMT | 1 | -0.2187 | 0.0481 | 20.6781 | <.0001 | |
Standardized_PAY_AMT | 1 | -0.0465 | 0.0302 | 2.3634 | 0.1242 | |
Standardized_PAY_AMT | 1 | -0.0637 | 0.0280 | 5.1893 | 0.0227 | |
Standardized_PAY_AMT | 1 | -0.0491 | 0.0271 | 3.2759 | 0.0703 | |
Standardized_PAY_AMT | 1 | -0.0372 | 0.0231 | 2.6011 | 0.1068 | |
AGE | 1 | 0.00537 | 0.00186 | 8.3249 | 0.0039 | |
LIMIT_BAL | 1 | -7E-7 | 1.578E-7 | 19.6728 | <.0001 |
優比估計 | |||
---|---|---|---|
效應 | 點估計 | 95% Wald 置信限 |
|
SEX 2-1 | 1.119 | 1.054 | 1.189 |
EDUCATION 6-0 | <0.001 | <0.001 | >999.999 |
EDUCATION 6-1 | 1.353 | 0.614 | 2.985 |
EDUCATION 6-2 | 1.244 | 0.564 | 2.740 |
EDUCATION 6-3 | 1.217 | 0.551 | 2.684 |
EDUCATION 6-4 | 0.430 | 0.142 | 1.298 |
EDUCATION 6-5 | 0.346 | 0.137 | 0.878 |
MARRIAGE 3-0 | 0.289 | 0.102 | 0.822 |
MARRIAGE 3-1 | 1.082 | 0.827 | 1.416 |
MARRIAGE 3-2 | 0.896 | 0.682 | 1.176 |
Standardized_PAY_0 | 1.914 | 1.841 | 1.990 |
Standardized_PAY_2 | 1.103 | 1.052 | 1.156 |
Standardized_PAY_3 | 1.089 | 1.033 | 1.148 |
Standardized_PAY_4 | 1.027 | 0.969 | 1.087 |
Standardized_PAY_5 | 1.040 | 0.979 | 1.104 |
Standardized_PAY_6 | 1.008 | 0.959 | 1.060 |
Standardized_BILL_AM | 0.666 | 0.565 | 0.785 |
Standardized_BILL_AM | 1.187 | 0.963 | 1.465 |
Standardized_BILL_AM | 1.098 | 0.917 | 1.314 |
Standardized_BILL_AM | 0.991 | 0.836 | 1.175 |
Standardized_BILL_AM | 1.047 | 0.874 | 1.255 |
Standardized_BILL_AM | 1.012 | 0.880 | 1.163 |
Standardized_PAY_AMT | 0.798 | 0.740 | 0.860 |
Standardized_PAY_AMT | 0.804 | 0.731 | 0.883 |
Standardized_PAY_AMT | 0.955 | 0.900 | 1.013 |
Standardized_PAY_AMT | 0.938 | 0.888 | 0.991 |
Standardized_PAY_AMT | 0.952 | 0.903 | 1.004 |
Standardized_PAY_AMT | 0.963 | 0.921 | 1.008 |
AGE | 1.005 | 1.002 | 1.009 |
LIMIT_BAL | 1.000 | 1.000 | 1.000 |
預測概率和觀測響應的關聯 | |||
---|---|---|---|
一致部分所佔百分比 | 72.6 | Somers D | 0.452 |
不一致部分所佔百分比 | 27.4 | Gamma | 0.452 |
結值百分比 | 0.0 | Tau-a | 0.156 |
對 | 155043504 | c | 0.726 |