KMean計算筆記

KMean計算筆記

X, y = make_blobs(n_samples=n_samples, random_state=random_state)
make_blobs函數是爲聚類產生數據集
產生一個數據集和相應的標籤
n_samples:表示數據樣本點個數,默認值100
n_features:表示數據的維度,默認值是2
centers:產生數據的中心點,默認值3
cluster_std:數據集的標準差,浮點數或者浮點數序列,默認值1.0
center_box:中心確定之後的數據邊界,默認值(-10.0, 10.0)
shuffle :洗亂,默認值是True
random_state:官網解釋是隨機生成器的種子

dot()返回的是兩個數組的點積(dot product)

plt.scatter()
plt.scatter(X[:, 0], X[:, 1], c=y_pred)
函數的原型:
matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, data=None, **kwargs)

參數的解釋:

x,y:表示的是大小爲(n,)的數組,也就是我們即將繪製散點圖的數據點

s:是一個實數或者是一個數組大小爲(n,),這個是一個可選的參數。

c:表示的是顏色,也是一個可選項。默認是藍色’b’,表示的是標記的顏色,或者可以是一個表示顏色的字符,或者是一個長度爲n的表示顏色的序列等等,感覺還沒用到過現在不解釋了。但是c不可以是一個單獨的RGB數字,也不可以是一個RGBA的序列。可以是他們的2維數組(只有一行)。

marker:表示的是標記的樣式,默認的是’o’。

cmap:Colormap實體或者是一個colormap的名字,cmap僅僅當c是一個浮點數數組的時候才使用。如果沒有申明就是image.cmap

norm:Normalize實體來將數據亮度轉化到0-1之間,也是隻有c是一個浮點數的數組的時候才使用。如果沒有申明,就是默認爲colors.Normalize。

vmin,vmax:實數,當norm存在的時候忽略。用來進行亮度數據的歸一化。

alpha:實數,0-1之間。

linewidths:也就是標記點的長度。

np.vstack 沿着豎直方向將矩陣堆疊起來
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
res = np.vstack((arr1, arr2))
結果
array([[1, 2, 3],
[4, 5, 6]])

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章