台部落杨之之

原创 weka[2] - J48(一)

原本想一次性寫完關於J48，無奈整個weka關於J48的一套東西太多太多。先從split開始分析~J48是參考的C4.5的決策樹算法。這一個部分和ID3有一些的區別，第一：C4.5使用信息增益率來選特徵，第二：C4.5可以同時處理連續

2020-02-24 11:41:19

原创 weka[1] - ID3算法

我們知道ID3是一個最基本的決策樹算法。他主要是每次根據InfoGain來選取特徵進行分裂，並且沒有進行剪枝。 buildClassifier： public void buildClassifier(Instances data)

2020-02-24 11:41:19

原创 weka[3] - J48(二）

J48（一）中，主要分析了分裂的策略：二叉和多叉這一節，主要看看源碼中，關於剪枝的部分。主要看PruneableClassifierTree。 buildClassify: public void buildClassifier(I

2020-02-24 11:41:19

原创支持向量機通俗導論（理解SVM的三層境界）

支持向量機通俗導論（理解SVM的三層境界）作者：July、pluskid ；致謝：白石、JerryLead 出處：結構之法算法之道blog。（轉自http://blog.csdn.net/v_ju

2018-08-30 22:30:27

原创 Kaggle[1] - Loan Default Prediction - Imperial College London

比賽頁面：http://www.kaggle.com/c/loan-default-prediction。 This competition asks you to determine whether a loan will defau

2018-08-30 22:30:22

原创 kaggel[6] - recommend missing links in a social network

比賽地址：http://www.kaggle.com/c/FacebookRecruiting 數據集很簡單。訓練集(train): 兩列 (source_node, destination_node) ---source follow

2018-08-30 22:30:22

原创 weka[10] - SimpleKmeans

classification的算法還有一些，不過還是打算先進入clustering的階段。後續再回去補。這一篇主要看看kmeans。kmeans是最簡單的一種聚類算法，很清晰的EM思路。他的主要缺陷是聚類個數無法確定(靠人爲設定)，受初

2018-08-30 22:30:22

原创 Kaggle[2] - Predict the click through rate (KDD12 trackl2)

比賽鏈接：http://www.kddcup2012.org/c/kddcup2012-track2 比賽描述： Search advertising has been one of the major revenue sources o

2018-08-30 22:30:22

原创 weka[9] - Naive Bayes

Naive Bayes就不做具體介紹了，很簡單的一個模型。直接看代碼 BuildClassify: // can classifier handle the data? getCapabilities().testWithFai

2018-08-30 22:30:21

原创 weka[11] - DBSCAN

DBSCAN介紹可以看wiki：http://en.wikipedia.org/wiki/DBSCAN 從http://www.cnblogs.com/chaosimple/archive/2013/07/01/3164775.html

2018-08-30 22:30:21

原创 weka[8] - Logistic Regression

Logistic Regression(邏輯迴歸)，在分類算法中應該也算是鼎鼎有名了。作爲GLM的成員之一，他的Link 是一個sigmoid函數。 Ng的machine learning從最大似然角度，給出了cost function，

2018-08-30 22:30:21

176

原创 weka[2] - J48(一)

原创 weka[1] - ID3算法

原创 weka[3] - J48(二）

原创支持向量機通俗導論（理解SVM的三層境界）

原创 Kaggle[1] - Loan Default Prediction - Imperial College London

原创 kaggel[6] - recommend missing links in a social network

原创 weka[10] - SimpleKmeans

原创 Kaggle[2] - Predict the click through rate (KDD12 trackl2)

原创 weka[9] - Naive Bayes

原创 weka[11] - DBSCAN

原创 weka[8] - Logistic Regression

原创關於下階段的安排

原创 weka[7] - Adaboost

原创 Dimension Reduction - feature extraction

原创 Kaggle[4] - Online Product Sales