原创 【風控指標】_Monthly loan review 要關注哪些指標

風控政策/策略需要觀測大盤情況,來調整策略,下面簡單的談談一個策略在月初需要關注的風控指標: - 業務總覽 每個月的業務量(不同資產的放款訂單,放款金額,佔比情況) 每個流程的轉化情況(產品中每個環節的活躍轉化留存情況)

原创 【hive】with as語法

公用表表達式(CTE)是從WITH子句中指定的簡單查詢派生的臨時結果集(會把查詢的表數據放到內存中,供其他查詢隨時使用),該子句緊跟在SELECT或INSERT關鍵字之前。CTE僅在單個語句的執行範圍內定義。可以在Hive SEL

原创 Mac下Sublime Text 3 使用

Mac下Sublime Text 2 1. 修改Sublime Text2 默認配置 在菜單欄選擇 Sublime Text->Preferences->Setting-User(注意其中Setting-Default是默認的

原创 【數據準備】_變量分析和隨機抽樣_python &R

1.單變量分析 計算gini值,或者iv或者ks 見另一篇文章 2.多變量分析 計算皮爾遜相關係數 python import matplotlib.pyplot as plt import seaborn as sns dat

原创 【模型指標】ks,gini值,auc的關係

下邊簡單談一下自己的理解: 先說一下ks ks值和ks曲線: 將所有樣本根據分數值從低到高排序(即壞賬率從高到低)均分成10組,分別計算這10組的實際好樣本數、壞樣本數、累積好樣本數、累積壞樣本數、累積好樣本數佔比、累積壞樣本數佔

原创 【pandas】查詢手冊

參考 (1)官網:http://pandas.pydata.org (2)https://bigquant.com/docs/#/other?id=數據透視表 在以下中,我們使用如下縮寫: df:任意的Pandas DataFra

原创 rpart 決策樹

節點和結點的區別:節點爲兩線相交,不爲終點;而結點爲兩線相交爲終點,沒有延伸; 1.分支節點:它指向其他的節點,所以是度不爲0的節點。 vs 葉子結點:度爲0的結點 2.度:結點擁有的子樹數;就是說這個結點下面有幾條分支 3

原创 【numpy】查詢手冊

所有函數見: 函數查詢中文. 函數查詢 以下重點寫常用到的一些函數: 正態分佈 f(x)=12πσexp(−(x−μ)22σ2) f(x)=\frac{1}{2\pi\sqrt σ} exp(− \frac{(x−μ)^2}{2

原创 sublime 快捷鍵

Ctrl+D 選詞 (反覆按快捷鍵,即可繼續向下同時選中下一個相同的文本進行同時編輯) Ctrl+G 跳轉到相應的行 Ctrl+J 合併行(已選擇需要合併的多行時) Ctrl+L 選擇整行(按住-繼續選擇下行) Ctrl+M 光標

原创 【pandas】常用統計指標

1. 分位數 pandas 和 numpy中都有計算分位數的方法,pandas中是quantile,numpy中是percentile 兩個方法其實沒什麼區別,用法上稍微不同,quantile的優點是與pandas中的groupby結

原创 【模型指標】LIFT提升圖

信用模型中的LIFT在模型評估中,我們常用到增益/提升(Gain/Lift)圖來評估模型效果,其中的Lift是“運用該模型”和“未運用該模型”所得結果的比值。以信用評分卡模型的評分結果爲例,我們通常會將打

原创 python解析txt轉爲csv

txt格式爲: 以下解析爲csv import numpy as np import pandas as pd import networkx as nx import matplotlib.pyplot as plt impor

原创 pandas常見報錯

問題1 ’utf-8’ codec can’t decode byte 0xc4 in position 0: invalid continuation byte 解決:加入encoding=‘gbk’ data1=pd.read_c

原创 python 矩陣,列表轉換tolist()

from numpy import * a1 =[[1,2,3],[4,5,6]] #列表 print(‘a1 :’,a1) #(‘a1 :’, [[1, 2, 3], [4, 5, 6]]) a2 = array(a1) #列表

原创 【變量分析】_python &R

1.單變量分析 計算gini值,或者iv或者ks 見另一篇文章 2.多變量分析 計算皮爾遜相關係數 python import matplotlib.pyplot as plt import seaborn as sns data3