原创 2012美國大選獻金項目數據分析(有史以來最全面)

目錄1. 數據載入與總覽1.1 數據加載1.2 數據集成1.3 數據預覽2. 數據預處理2.1 空值處理2.2 數據變換2.2.1 字典映射進行轉換:黨派分析2.2.2 按照職業或公司分組聚合對贊助總金額進行排序2.2.3 利用函

原创 數據挖掘之空數據處理(有史以來最全面)

目錄缺失值處理常用方式拉格朗日插值法代碼示例 缺失值處理常用方式 均值,中位數,衆數插補法 使用固定值(規定的標準值) 最近鄰插補法 迴歸方法:可以使用線性迴歸或者多項式迴歸(SVR) 插值法:拉格朗日差值和牛頓插值法。 拉格朗日

原创 ssh連接阿里雲,客戶端一段時間沒響應就斷掉的解決辦法也叫保持長連接(有史以來最全面)

目錄修改配置文件 修改配置文件 共計三種方式可以操作 方式一:修改(添加)server端的 /etc/ssh/sshd_config #server每隔60秒發送一次請求給client,然後client響應,從而保持連接 Clie

原创 Jupyter Notebook功能增強從此強大

文章目錄一、更換主題二、Shell命令三、魔法指令四、Notebook 擴展插件五、使用 Qgrid 探索 Dataframes 一、更換主題 這個是一個Python庫需要安裝 pip install jupyterthemes

原创 用戶畫像·用戶流失預測

文章目錄1、爲什麼預測流失2、需求分析3、特徵工程四、算法選擇·邏輯迴歸算法五、代碼走起 1、爲什麼預測流失 每個企業都渴望建立和保持一個忠實的客戶羣,而事實是由於各方面原因不可避免的會流失一些用戶。如果我們根據用戶的活躍度及消費

原创 用戶畫像·用戶性別預測

文章目錄一、爲什麼進行性別預測二、特徵數據選取三、算法選擇四、代碼示例1、使用樸素貝葉斯,進行建模2、使用支持向量機3、使用邏輯斯蒂迴歸 一、爲什麼進行性別預測 用戶註冊時,所填寫的性別,存在大概率的隨意性; 不能完全作爲用戶畫