機器學習3-什麼是好的特徵

好的特徵

本章比較簡單,直接貼代碼和圖片

python代碼

# coding=utf-8

# 什麼是好的特徵(feature)

# 要求判斷狗是灰狗還是拉布拉多
# 現在的數據有2個feature,一個是身高,一個是眼睛的顏色

# 首先說身高
# 灰狗的身高大概在28cm,正負4cm
# 拉布拉多的身高大概在24cm,正負4cm

# 我們來模擬一些隨機數據

import numpy as np
import matplotlib.pyplot as plt

# 生成500個數據
greyhounds = 500
labs = 500

grey_height = 28 + 4 * np.random.randn(greyhounds)
labs_height = 24 + 4 * np.random.randn(labs)

plt.hist([grey_height,labs_height],stacked=True,color=['r','b'])
plt.show();

# 可以看到圖像中間段,這些區間讓我們無法很好的判斷狗的種類
# 所以我們需要更多的特徵





# 由於狗的品種跟狗的眼睛的顏色沒有直接關係,所以"眼睛的顏色"是個"壞"的特徵


報表

藍色爲拉布拉多 紅色爲灰狗

這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章