原创 數據預處理Part5——樣本分佈不均衡

文章目錄解決樣本類別分佈不均衡的問題1. 什麼是樣本分佈不均衡2. 爲什麼會出現樣本分佈不均衡3. 如何解決樣本分佈不均衡?3.1 通過過抽樣和欠採樣解決樣本不均衡3.2 通過正負樣本的懲罰權重解決樣本不均衡3.3 通過組合/集合

原创 數據預處理Part2——數據標準化

文章目錄數據標準化1. 實現歸一化的Max-Min2. 實現中心化和正態分佈的Z-Score3. 用於稀疏數據的MaxAbs4. 針對離羣點的RobustScaler5. 標準化後數據可視化6. 標準化方法選擇 數據標準化 1.

原创 數據預處理Part3——真值轉換

文章目錄真值轉換一、分類數據和順序數據二、運用標誌方法處理分類和順序變量三、代碼實現: 真值轉換 一、分類數據和順序數據 分類數據: 分類數據☞某些數據屬性只能歸於某一類別的非數值型數據。例如性別中的男、女就是分類數據。分類數

原创 機器學習筆記——數據預處理(一)

文章目錄一、數據預處理二、數據清洗1、缺失值處理1.1 丟棄缺失值1.2 補全缺失值1.3 真值轉換1.4 不處理1.5 特徵選擇2、異常值2.1 異常值處理2.2 保留異常數據的情況2.2.1 異常值正常反映了業務運營結果2.2

原创 基於CART樹的銀行貸款風控模型實現

文章目錄代碼實現1. 導包2. 加載數據3. 檢查數據3. 切分測試集和訓練集4. 建模4.1 無參數建模4.2 交叉驗證4.3 網格搜索4.5 模型可視化 代碼實現 1. 導包 [1]:import numpy as np i

原创 LeetCode(Python實現)——Easy部分【Day10】

文章目錄111. 二叉樹的最小深度問題描述:解題思路:代碼實現:112. 路徑總和問題描述:解題思路:代碼實現:118. 楊輝三角問題描述:解題思路:代碼實現: 111. 二叉樹的最小深度 問題描述: 給定一個二叉樹,找出其最小深

原创 LeetCode(Python實現)——Easy部分【Day9】

文章目錄108. 將有序數組轉換爲二叉搜索樹問題描述:解題思路:代碼實現110. 平衡二叉樹問題描述:解題思路:代碼實現 108. 將有序數組轉換爲二叉搜索樹 問題描述: 將一個按照升序排列的有序數組,轉換爲一棵高度平衡二叉搜索樹

原创 LeetCode(Python實現)——Easy部分【Day8】

文章目錄104. 二叉樹的最大深度問題描述:解題思路:代碼實現:107. 二叉樹的層次遍歷 II問題描述:解題思路:代碼實現: 104. 二叉樹的最大深度 問題描述: 給定一個二叉樹,找出其最大深度。 二叉樹的深度爲根節點到最遠

原创 LeetCode(Python實現)——Easy部分【Day7】

文章目錄88. 合併兩個有序數組問題描述:解題思路:代碼實現:100. 相同的樹問題描述:解題思路:代碼實現:101. 對稱二叉樹問題描述:解題思路:代碼實現: 88. 合併兩個有序數組 問題描述: 給你兩個有序整數數組 nums

原创 LeetCode(Python實現)——Easy部分【Day6】

文章目錄69. x 的平方根問題描述:解題思路代碼實現70. 爬樓梯問題描述:解題思路代碼實現83. 刪除排序鏈表中的重複元素問題描述:解題思路代碼實現 69. x 的平方根 問題描述: 實現 int sqrt(int x) 函

原创 機器學習系列——隨機森林(一)

文章目錄一、 隨機森林1. 引入隨機森林算法2. 爲什麼隨機森林的準確率要高於單棵決策樹?3. 袋裝法(bagging)二、sklearn中的隨機森林實現1. 參數1. 1 n_estimators1.2 random_sta

原创 LeetCode(Python實現)——Easy部分【Day5】

文章目錄58. 最後一個單詞的長度問題描述:解題思路:代碼實現:66. 加一問題描述:解題思路:代碼實現:67. 二進制求和問題描述:解題思路:代碼實現: 58. 最後一個單詞的長度 問題描述: 給定一個僅包含大小寫字母和空格 '

原创 爬蟲管理工具CrawlLab環境配置及使用

文章目錄Crawlab一、安裝Docker二、安裝Docker-Compose三、安裝並啓動 Crawlab四、將本地爬蟲上傳到CrawLab Crawlab 基於Golang的分佈式爬蟲管理平臺,支持多種編程語言以及多種爬蟲框架

原创 LeetCode(Python實現)——Easy部分【Day4】

文章目錄28. 移除元素問題描述:解題思路:代碼實現:35. 搜索插入位置問題描述:解題思路:代碼實現:38. 外觀數列問題描述:解題思路代碼實現: 28. 移除元素 問題描述: ··· 實現 strStr() 函數。 給定一個

原创 LeetCode(Python實現)——Easy部分【Day3】

文章目錄26. 合併兩個有序鏈表問題描述:解題思路:代碼實現:27. 移除元素問題描述:解題思路:代碼實現: 26. 合併兩個有序鏈表 問題描述: 給定一個排序數組,你需要在 原地 刪除重複出現的元素,使得每個元素只出現一次,返回