原创 day 4 隨機森林 迴歸填補缺失值

from pprint import pprint from sklearn.ensemble import RandomForestRegressor # 隨機森林迴歸器 from sklearn.impute import Si

原创 day 9.2 邏輯迴歸-案例-評分卡製作

import numpy as np import pandas as pd pd.set_option('display.max_columns', None) from sklearn.linear_model import Lo

原创 day 9.0 邏輯迴歸- 梯度下降

# max_iter 控制步長 # max_iter越大,步長越小,迭代次數大,模型時間長,反之 from sklearn.linear_model import LogisticRegression as LR from sklear

原创 day 5 隨機森林在乳腺癌數據上面的調參

from sklearn.datasets import load_breast_cancer from sklearn.ensemble import RandomForestClassifier from sklearn.model

原创 tensorflow簡單小結

# 連續的值 直接輸出結果 # 二分類 輸出層 做一個sigmoid運算 # 多分類 輸出做一個 softmax 得到概率分佈 # 學習速率(超參數) learning rate(lr): 對梯度進行縮放的參數被稱爲學習速率 # 常

原创 softmax 獨熱編碼

import tensorflow as tf import numpy as np import pandas as pd import matplotlib.pyplot as plt # fashion_mnist = tf.k

原创 找遍全網最簡單的使用git

2、進行基礎配置,作爲 git 的基礎配置,作用是告訴 git 你是誰,你輸入的信息將出現在你創建的提交中,使用下面兩條命令:   git config --global user.name "你的名字或暱稱"   git config

原创 決策樹完成 ---泰坦尼克號生存者預測

import pandas as pd from sklearn.tree import DecisionTreeClassifier import matplotlib.pyplot as plt from sklearn.model

原创 機器學習 sklearn學習 第二天 迴歸樹

from sklearn.datasets import load_boston # 著名波士頓房價數據 from sklearn.model_selection import cross_val_score # 交叉驗證 from

原创 day 8.3 PCA 降噪

from sklearn.datasets import load_digits # 一個蠻好的系統自帶手寫數據集 from sklearn.decomposition import PCA import matplotlib.pyp

原创 萬能  隨機森林迴歸 補缺函數

#####todo  只對一列數據含有缺失,另外的數據都不含缺失值的數據有效 def fill_missing_rf(X, Y, to_fill): """ 使用隨機森林填補一個特徵的缺失值的函數 :param

原创 day 7 特徵選擇

import pandas as pd import numpy as np data = pd.read_csv("digit recognizor.csv") # print(data.head()) x = data.iloc[

原创 pandas 新增sheet,不覆蓋原來已經保存的sheet(親測管用)

#以前的sheet數據很重要,又要新增sheet,很難受,看了一堆帖子沒一個回答在點子上,找到了方法,分享給大家 import openpyxl import pandas as pd weatherfile = "0317.xl

原创 ubuntu jdk的安裝2020年5月16號(附jdk壓縮包)

cd home sudo mkdir /java cd java  sudo mv '/Desktop/jdk-8u221-linux-x64.tar.gz' java sudo tar -zxvf jdk-8u121-linux-x64