原创 day 4 隨機森林 迴歸填補缺失值
from pprint import pprint from sklearn.ensemble import RandomForestRegressor # 隨機森林迴歸器 from sklearn.impute import Si
原创 day 9.2 邏輯迴歸-案例-評分卡製作
import numpy as np import pandas as pd pd.set_option('display.max_columns', None) from sklearn.linear_model import Lo
原创 day 9.0 邏輯迴歸- 梯度下降
# max_iter 控制步長 # max_iter越大,步長越小,迭代次數大,模型時間長,反之 from sklearn.linear_model import LogisticRegression as LR from sklear
原创 day 5 隨機森林在乳腺癌數據上面的調參
from sklearn.datasets import load_breast_cancer from sklearn.ensemble import RandomForestClassifier from sklearn.model
原创 tensorflow簡單小結
# 連續的值 直接輸出結果 # 二分類 輸出層 做一個sigmoid運算 # 多分類 輸出做一個 softmax 得到概率分佈 # 學習速率(超參數) learning rate(lr): 對梯度進行縮放的參數被稱爲學習速率 # 常
原创 softmax 獨熱編碼
import tensorflow as tf import numpy as np import pandas as pd import matplotlib.pyplot as plt # fashion_mnist = tf.k
原创 找遍全網最簡單的使用git
2、進行基礎配置,作爲 git 的基礎配置,作用是告訴 git 你是誰,你輸入的信息將出現在你創建的提交中,使用下面兩條命令: git config --global user.name "你的名字或暱稱" git config
原创 決策樹完成 ---泰坦尼克號生存者預測
import pandas as pd from sklearn.tree import DecisionTreeClassifier import matplotlib.pyplot as plt from sklearn.model
原创 機器學習 sklearn學習 第二天 迴歸樹
from sklearn.datasets import load_boston # 著名波士頓房價數據 from sklearn.model_selection import cross_val_score # 交叉驗證 from
原创 day 8.3 PCA 降噪
from sklearn.datasets import load_digits # 一個蠻好的系統自帶手寫數據集 from sklearn.decomposition import PCA import matplotlib.pyp
原创 萬能 隨機森林迴歸 補缺函數
#####todo 只對一列數據含有缺失,另外的數據都不含缺失值的數據有效 def fill_missing_rf(X, Y, to_fill): """ 使用隨機森林填補一個特徵的缺失值的函數 :param
原创 day 7 特徵選擇
import pandas as pd import numpy as np data = pd.read_csv("digit recognizor.csv") # print(data.head()) x = data.iloc[
原创 pandas 新增sheet,不覆蓋原來已經保存的sheet(親測管用)
#以前的sheet數據很重要,又要新增sheet,很難受,看了一堆帖子沒一個回答在點子上,找到了方法,分享給大家 import openpyxl import pandas as pd weatherfile = "0317.xl
原创 ubuntu jdk的安裝2020年5月16號(附jdk壓縮包)
cd home sudo mkdir /java cd java sudo mv '/Desktop/jdk-8u221-linux-x64.tar.gz' java sudo tar -zxvf jdk-8u121-linux-x64