原创 2017.07.12回顧 python mysql decimal case when漏掉一種情況 mysql字符串參與算術運算

今天繼續進行新模型實施的工作 1、上午完成了審批金額計算的模塊,主要就是涉及到和之前係數轉換的問題,反正就是個體力活啦,沒什麼新的東西 2、下午主要

原创 2017.06.14回顧 dtype相關 Series平均數 type_of_target

1、Series計算平均數,df[column].mean() 2、上午給同事講了很久的關於驗證四變量模型少掉兩個變量仍具備有效性的證明,這個過程中也被多次打斷 3、講完開始寫昨日總結 4、ndarray只能有一種數據類型,就是其中每個元

原创 2017.06.29回顧

中途出門休假幾天,實際上還挺累的,不擦防曬霜還會被曬黑,每天要走很多路,昨天回來上班第一天,下面進行一下回顧 1、一系列de改進實現工作 2、平臺一些問題反應 3、開會,接近2小時,文檔整理 4、繼續建立新模型,新增自變量,嘗試了一些新逾

原创 2017.07.19回顧

1、今天主要是修改並上線了rolling variable,然後闡述了一些自動化不太便於實現的地方 2、模型通過率方面扯了一會兒,寫了個SQL,基本和每日郵件中的數據吻合 3、上傳了昨天修改的iv工具包 4、下午開會,反正就是站在真理的一

原创 2017.06.21回顧

1、寫了回顧,然後就是檢查裝飾器的寫法,當然我也需要去學習裝飾器的寫法,其實最簡單的理解就是函數某些代碼抽象重用,裝飾器就是帶入被裝飾函數,可以裝飾多層,但高級的用法,我還需要去熟悉一下 2、下午各種工程問題,然後思考了下打合作方臉的方法

原创 2017.06.30回顧

1、工程上一些修改事物 2、增加變量 3、更多變量要求 點贊 收藏 分享 文章舉報 strwolf 發佈了336 篇原創文章 · 獲贊 17 · 訪問量 21萬+ 私信

原创 2017.07.03回顧 matplotlib作兩個y軸圖形

今天主要是解決python繪圖的問題,基本上是完成了一個可以交付的圖形,像這樣 也就是共用一個x軸,有兩個y軸,我參照matplotlib官方的example,寫了個定值的demo,然後結合自己的程序,也了一個變量化的,先看看demof

原创 2017.07.10回顧

1、3E邏輯 2、開會準備,分享 3、上午精神狀態不佳,打瞌睡 4、mysql生產環境SQL以及接口實現思考 5、幫同事debug,過程中也學到一些新東西 df.values是直接取出來一個ndarray,去掉行索引和列名pd.read

原创 2017.07.18回顧

0、昨天晚上更新了iv工具包,對數據集X進行檢測,對於含有缺失值的字段,將拋出錯誤,並指出哪些字段存在缺失值,主要還是用之前寫的find_na_column函數,這個函數主要就是靠pd.isnull來實現,然後如果存在miss_colum

原创 2017.06.15-2016.06.18回顧 loc/iloc/ix dataframe相關 oracle無自增去重 correl

上週最後階段比較忙,主要是忙jd的數據測試的事情還有就是各種新產品的事情,下面回顧一下這段時間的工作。 1、上週四快下班的時候開了一個新產品的會,初

原创 2017.07.14回顧 ipython魔法命令 浮點數定義 GPL 爲什麼要WOE編碼

1、一些小的工程改動 2、建表/增加字段,decimal(9,2)表示一共9位,小數是2位,int(2)不是代表兩位數,仍然可以存儲大數 3、Ipython的console中有一些魔法命令,以%開頭,matplotlib就有一個魔法命令%

原创 2017.07.06-2017.07.07回顧 信息熵的坑 多重共線性實踐

上週最後兩天比較忙,沒來得及寫小結,這裏補充一下 上週還是忙建模的事情,穩定性上進行一些新的探索,週四還面試了幾個人,有些知識不用確實容易忘記,但是有什麼辦法呢,只有一遍一遍去理解,面試別人的時候也不用着急,也不要怕丟人,現場去推理,這樣

原创 2017.07.13回顧 MIC

1、上午主要是做類主產品的新模型決策規則,解決了9F兩個字段缺失用什麼替代的問題,三種方法,用缺省值替代,用0替代,用開發集woe加權替代,用缺省值不合理,因爲缺省值在開發集上有特殊的缺失含義,用0影響整體輸出結果的均值等 ,最後用woe

原创 2017.07.04回顧 dataframe組合 groupby sort to_csv不存index

今天主要是建模的事情,小結一下 1、我使用了6種不同的y定義,然後寫了一個程序去計算平均iv,這個程序中主要是對pandas的回顧 多dataframe的組合,pd.concat((df1,df2,df3,df4,df5,df6),ig

原创 2017.07.05回顧

1、今天他媽的上午又幹了一些沒用的事情,去給運營進行一些解釋,但是也發現自身模型數據存儲的必要性,這個也是急切地打對方臉,現在事情這麼多其實沒必要這麼急切打別人臉,考慮好優先級 2、下午就是決策引擎調整的事情 3、剩餘的時間又開始建模,這