原创 Python 梯度提升樹三大參數設置

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 梯度提升樹 1 提升集成算法:重要參數n_estimators 1. 導入需要的庫,模塊以及數據 import xgboost as xgb from xgboost import

原创 Tableau 第一天Tableau簡介、條形圖與直方圖

此係列博客爲博主本人學習Tableau的過程!!!!! 1 Tableau簡介:Tableau Desktop 是基於斯坦福大學突破性技術的軟件應用程序。它幫助您生動地分析實際存在的任何結構化數據,以在幾分鐘內生成

原创 Python 讓你一遍記住混淆矩陣及衍生指標

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 爲了更好的理解下面的話,推薦閱讀 https://blog.csdn.net/c1z2w3456789/article/details/105247565 (PYthon 教你怎麼

原创 Python 解決線性及非線性SVM決策過程的可視化

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 使用sklearn中的式子來爲可視化我們的決策邊界,支持向量,以及決策邊界平行的兩個超平面。   1. 導入需要的模塊 from sklearn.datasets import m

原创 PYthon 教你怎麼選擇SVM的核函數kernel及案例分析

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 4種核函數的適用場景 接上文可以選在非線性核函數,可以將數據明顯的區別開 clf = SVC(kernel = "rbf").fit(X,y) plt.scatter(X[:,0

原创 Python 聚類算法在矢量量化案例詳解

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客   KMeans算法將一組N個樣本的特徵矩陣X劃分爲K個無交集的簇,直觀上來看是簇是一組一組聚集在一起的數據,在一個簇中的數據就認爲是同一類。簇就是聚類的結果表現。 簇中所有數據的

原创 Python 評分卡之數據預處理(重複值、填補缺失值、異常值與數據不平衡)

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 評分卡之數據預處理:重複值、填補缺失值、異常值與數據不平衡   在銀行借貸場景中,評分卡是一種以分數形式來衡量一個客戶的信用風險大小的手段,它衡量向別人借錢的人(受信人,需要融資的

原创 Python 深入理解邏輯迴歸

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 其數學目的是求解能夠讓模型對數據擬合程度最高的參數 的值,以此構建預測函數 ,然後將特徵矩陣輸入預測函數來計算出邏輯迴歸的結果y。注意,雖然我們熟悉的邏輯迴歸通常被用於處理二分類問

原创 Python 隨機森林6大參數調優(學習曲線與網格搜索)

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 主要從影響隨機森林的參數入手調整隨機森立的預測程度: Python 3.7.3 (default, Apr 24 2019, 15:29:51) [MSC v.1915 64 b

原创 Python 利用隨機森林算法對缺失值填補

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客   導入需要的庫 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklea

原创 R語言 Kmeans聚類、PAM聚類、層次聚類、EM聚類

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 R版本:3.6.1 Kmeans函數:kmeans聚類 pam函數:PAM聚類 hclust函數:層次聚類 cutree函數:層次聚類解 Mclust函數:EM聚類 mclustB

原创 R語言 SVM(線性可分、線性不可分、多分類)

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 R版本:3.6.1 setwd('G:\\R語言\\大三下半年\\數據挖掘:R語言實戰\\') > library("e1071", lib.loc="H:/Program Fil

原创 R語言 K最近鄰算法2

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 R版本:3.6.1 K-最近鄰算法: a.距離: 閔可夫斯基距離、歐式距離、絕對距離、切比雪夫距離、夾角餘弦距離 b.臨近個數: 1-鄰近法:以一個最近距離表示該類別,錯誤率不會高

原创 R語言 支持向量機(class.weights可以對類別的權重進行調整,提高準確度)

  關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 R版本:3.6.1 e1701包:用於支持向量機模型 SVM函數:利用數據構建支持向量機模型   > library('e1071') Warning message: 程輯包

原创 R語言 隨機森林

關注微信公共號:小程在線 關注CSDN博客:程志偉的博客 R版本:3.6.1 randomForest包:提供randomForest()函數用於隨機森林的建立 rflmpute()函數:對數據缺失值進行插補 treesize()函數: