原创 【pandas】[9] pandas loc、iloc

創建一個dataframe import numpy as np import pandas as pd #創建一個Dataframe data=pd.DataFrame(np.arange(16).reshape(4,4),index

原创 【機器學習-模型部署】將已被存儲爲.ml的模型文件,轉化爲pmml文件

需求:將已被存儲爲.ml的模型文件,轉化爲pmml文件   #!/usr/bin/env python #! -*- coding: utf-8 -*- ''' @File: create_pmml_file.py @Author:

原创 【Python】window10 python rarfile

rarfile是第三方庫。需要先安裝rarfile該第三方庫 pip install rarfile   使用rarfile解壓相應的rar文件 import rarfile path = r'C:\Users\zhengruipin

原创 【Python】window10\Linux python unzip 中文亂碼

在zip這個包中,對文件名的 encoding 用的不是 unicode,查看源碼後,zipfile中根據文件 flag 檢測的時候,只支持 cp437 和 utf-8。具體就是查找 zipfile.py 源代碼找到下面的代碼: 第一處:

原创 【風控策略】通過查全率和查準率確定cutoff

相關指標構建     如上。可以根據最後兩列。來制定cutoff。 原則: 1、可以錯殺好人,不容放過壞人的原則。就選擇查全率高的分數區間 2、不要錯殺好人,容忍放過一些壞人的原則。就選擇查準率高的分數區間 tips:如上分數的切分是

原创 【Python】window10 python connect hive

需要在window10下,使用python去連hive,獲取在hive中的數據,然後訓練模型,將模型訓練好後,相關模型結果寫回到hive進行持久化。目的是不讓數據在本地建模環境有存儲!!!   環境: 操作系統 window 10 pyt

原创 【Python】window qt無法使用

緣由: 去客戶現場駐場建模。在window操作系統,python環境沒有,也不能連外網 解決方案: 將公司內部的建模環境C:\ProgramData\Anaconda3。Anaconda3整個目錄拷貝到客戶的機器上面   到客戶的機器上面

原创 【環境】mac安裝graphviz

1、安裝graphviz brew install graphviz   2、測試使用graphviz 文件保存爲zhengruiping_test.dot digraph pic { zhengruiping -> code

原创 【pandas】[5] DataFrame通過drop_duplicates()函數找出重複的行

1、構建測試數據 import pandas as pd df = pd.DataFrame({'k1' : ['a1','a2','a1','b1','b2'], 'k2' : ['c1','d1','c1','c2','d2

原创 【pandas】[4] DataFrame實現sql中row_number() over(partition by column_1 order by column_2)

需求:pandas中能不能實現如sql中一樣的分組排序取值   1、構建測試數據 import pandas as pd df = pd.DataFrame({'k1' : ['a1','a2','a1','b1','b2'],

原创 【pandas】pandas 寫入postgresql 比較快的方法

一種是導入sqlalchemy包,另一種是導入psycopg2包。 具體用法如下(此處以postgre數據庫舉例) postgresql://用戶名:密碼@host:port/db_name engine = create_engin

原创 【Python】python ftplib 解決無法上傳下載中文文件及文件夾

在使用ftplib進行對ftp文件的操作過程中,出現無法上傳下載中文文件及文件夾。   經查看ftplib.py源碼。發現如下:   encoding默認爲"latin-1"   修改方式: 方式一、可以直接修改ftplib.py這個源

原创 【pandas】[8] pandas逐行(iterrows())或逐列(iteritems())處理

1、構建dataframe df = pd.DataFrame([('E146', 100.92, '[-inf ~ -999998.0]'),('E138', 107.92, '[-999998.0 ~ 2]'),('E095', 1

原创 【mac 環境】郵箱密碼修改後,foxmail無法正常接收郵件

原因:郵箱密碼修改,max上的foxmail客戶端無法正常收郵件,網頁版的郵箱正常接收郵件   問題情況: 點擊高級設置   解決方法: 1、登陸網頁版郵箱》設置》POP3/SMTP/IMAP   2、開啓IMAP/SMTP服務

原创 【pandas】[7] Series 判斷每個元素是否爲空

有時候需要對Series中的每個元素進行判斷,然後做下一步邏輯處理   1、Series是數值類型的時候;裏面有空值(np.nan);value_counts()不會統計到空值。判斷時需要使用np.isnan(x) ab = pd.Se