原创 Keras文檔程序分析 - 1

目錄 多層感知機(MLP)的softmax多分類  關於Momentum 關於Nesterov Accelerated Gradient 基於多層感知器的二分類 類似VGG的卷積神經網絡 關於VGG 關於卷積和池化結果的計算公式 多層感知

原创 深度學習——優化器算法Optimizer詳解(BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam)

在機器學習、深度學習中使用的優化算法除了常見的梯度下降,還有 Adadelta,Adagrad,RMSProp 等幾種優化器,都是什麼呢,又該怎麼選擇呢? 在 Sebastian Ruder 的這篇論文中給出了常用優化器的比較,今天來

原创 分類任務中的非均衡分類問題

在大多數情況下,不同類別的分類代價並不相等,比如某腫瘤是否會導致死亡的應用中。 我們將會考察一種新的分類器性能度量方法,並通過圖像技術來對在上述非均衡問題下不同分類器性能進行可視化處理。 其他分類性能度量指標:正確率、召回率及ROC曲線

原创 AdaBoost元算法 —— 理論

在做重要決定時,大家可能都會考慮吸取多個專家而不是一個人的意見。機器學習也可以採用這種方式,這就是元算法(meta-algorithm)背後的思路。元算法是對其他算法進行組合的一種方式。AdaBoost便是一種最流行的元算法,該方法是機

原创 SVM —— 在複雜數據上應用核函數

對於非線性可分的數據,我們需要使用一種稱爲核函數(kernel)的工具將數據轉換成易於分類器理解的形式。  利用核函數將數據映射到高位空間 對於非線性可分的數據,我們要將數據從一個特徵空間轉換到另一個特徵空間。在新空間下,我們可以很容

原创 SVM —— 利用完整Platt SMO算法加速優化

Platt SMO算法是通過一個外循環來選擇第一個alpha值的,並且其選擇過程會在兩種方式之間進行交替: 一種是在所有數據集上進行單遍掃描 另一種方式則是在非邊界alpha中實現單遍掃描。(所謂非邊界alpha指的是那些不等於邊界0或

原创 AdaBoost 將單層決策樹構建弱分類器組建爲強分類器

基於單層決策樹構建弱分類器 單層決策樹(decision stump)是一種簡單的決策樹,它僅僅基於單個特徵來做決策。由於這棵樹實際上只有一次分裂的過程,因此它實際上就是一個樹樁。 如果想要試着從某個座標軸上選擇一個值(即選擇一條與座標軸

原创 支持向量機SVM

有些人認爲,SVM是最好的現成的分類器,這裏說的“現成”是指分類器不加修改即可直接使用。同時沒這就意味着在數據上應用基本形式的SVM就可以得到抵錯誤率的結果。SVM能夠對訓練集以外的數據點做出很好的分類決策。 SVM有很多實現,這裏只關注

原创 Logistic迴歸示例:從疝氣病預測病馬的死亡率

疝氣病是描述馬胃腸痛的術語。然而這種病並不一定源自馬的腸胃問題,其他問題也可能引發馬疝病。 此外,除了部分指標主觀和難以測量外,該數據還存在一個問題,數據集中的30%的值是缺失的。 準備數據:處理數據中的缺失值 有時候數據相當昂貴,扔掉和

原创 SVM —— SMO算法通俗易懂的解釋

SVM通常用對偶問題來求解,這樣的好處有兩個:1、變量只有N個(N爲訓練集中的樣本個數),原始問題中的變量數量與樣本點的特徵個數相同,當樣本特徵非常多時,求解難度較大。2、可以方便地引入核函數,求解非線性SVM。求解對偶問題,常用的

原创 Logistic迴歸

Logistic迴歸的一般過程 收集數據:採用任意方法收集數據 準備數據:由於需要進行距離計算,因此要求數據類型爲數值型。另外,結構化數據格式最佳 分析數據:採用任意方法對數據進行分析 訓練算法:大部分時間將用於訓練,訓練的目的時爲了找

原创 安卓學習筆記-URL

URL讀取數據: public class MainActivity extends AppCompatActivity{ @Override protected void onCreate(Bundle saved

原创 使用樸素貝葉斯過濾垃圾郵件

準備數據:切分文本 python的split()方法可以切分字符串,它是按照空格對字符串進行劃分,有時不是那麼準確。 In [7]: sentence = 'This is the best book on Python or M.L.

原创 使用樸素貝葉斯分類器從個人廣告中獲取區域傾向

這個例子用來比較兩個城市的人在用詞上是否不同 使用樸素貝葉斯來發現低於相關的用詞 收集數據:從RSS源收集內容,這裏需要對RSS源構建一個接口 準備數據:將文本文件解析成詞條向量 分析數據:檢查詞條確保解析的正確性 訓練算法:訓練樸素貝

原创 決策樹

決策樹是最經常使用的數據挖掘算法。 決策樹的構造 決策樹的一般流程: 收集數據:可以使用任何方法; 準備數據:樹構造算法只適用於標稱型數據,因此數值型數據必須離散化; 分析數據:可以使用任何方法,構造樹完成之後罵我們應該檢查圖形是否符合