原创 基於TF-IDF對文本向量化

##1.TF-IDF原理        TF-IDF(term frequency–inverse document frequency)是一種用於資訊檢索與資訊探勘的常用加權技術。TF-IDF是一種統計方法,用以評估一字詞對於一

原创 如何完全卸載 MySQL

MySQL重新安裝的時候會出現start service 無法啓動的問題,原因是沒有對舊的MySQL完全卸載掉。  下面步驟開始卸載Mysql:   一、普通卸載mysql(只要是卸載軟件就行,如360等),但是不能完全卸載。   二、

原创 基於IF-IDF對文本向量化

1.TF-IDF原理        TF-IDF(term frequency–inverse document frequency)是一種用於資訊檢索與資訊探勘的常用加權技術。TF-IDF是一種統計方法,用以評估一字詞對於一個文件集或一

原创 決策樹&邏輯迴歸

決策樹 決策樹(Decisiontree)一般都是自上而下的來生成的。每個決策或事件(即自然狀態)都可能引出兩個或多個事件,導致不同的結果,把這種決策分支畫成圖形很像一棵樹的枝幹,故稱決策樹。簡單來說:通過對樣本數據的訓練,得到N多