文本相似度分析:
KNN算法:
def knn(k,testdata,traindata,labels):
trainsize=traindata.shape[0]
dif=np.tile(testdata,(trainsize,1))-traindata
dif_2=dif**2
row_sum=dif_2.sum(axis=1)
distance=row_sum**0.5
sorted_distance=distance.argsort()
count={}
for i in range(0,k):
vote=labels[sorted_distance[i]]
count[vote]=count.get(vote,0)+1
count_sort=sorted(count,key=operator.itemgetter(1),reverse=True)
count_sort[0][0]
知識點補充:
(axis 的取值方法:0-->表示行,進行列相加 1---->表示列,進行行相加 也就是 0行列相加,1列行相加)
邏輯迴歸:
決策樹(ID3, C4.5, CART):
聚類算法原理:
bp神經網絡:誤差往前推
激活函數的說明:激活函數詳解--小白入門必備!!
設置PIP源
使用BP神經網絡進行手寫體數字的識別:
關聯規則分析:
apriori原理:
;