Softmax迴歸——識別MINST數據庫

原創

ycheng_sjtu

2020-02-21 10:12

Softmax迴歸就是推廣版本的邏輯迴歸。

只不過邏輯迴歸是個2分類問題，而Softmax是多分類問題，僅此而已。

Softmax迴歸在2分類情況下就蛻化成了邏輯迴歸。

邏輯迴歸的代價函數

考慮到權重衰減，修改一下就是Softmax迴歸的代價函數了

這裏的權重衰減項是必須的，因爲原先的代價函數不是嚴格凸函數，有無窮個極小值。現在加了這個權重衰減項，函數變成了嚴格凸函數。L-BFGS算法可以保證收斂得到全局最優解。

新函數的導數如下

接下來就是編程了，要注意幾個小問題

1.要把以下文件也存入路徑，以便調用：

computeNumericalGradient
loadMNISTImages
loadMNISTLabels
train-images.idx3-ubyte
train-labels.idx1-ubyte
minFunc</span>

2.主程序裏面數據文件的名字需要修改

改爲

train-images.idx3-ubyte/train-labels.idx1-ubyte</span>

3.注意幾個重要矩陣的維數

data：784*60000
theta：10*784
M：10*60000
groundtruth：10*60000</span>

4.善用bsxfun函數，少佔內存，提高速度。

5.注意使用防止數據溢出的處理方式。

6.gred記錄最大概率出現的序號，而不是數值。

7.老生常談，矢量化編程。

下面給出核心代碼：

SoftmaxCost

M=theta*data;%得到加權數據矩陣
M=bsxfun(@minus, M, max(M, [], 1));%防止數據溢出
hypothesis=bsxfun(@rdivide,exp(M),sum(exp(M)));%得到概率矩陣
cost=-(groundTruth(:)'*log(hypothesis(:)))/numCases+lambda/2*sumsqr(theta);%代價函數
thetagrad=-(groundTruth-hypothesis)*data'/numCases+lambda*theta;%梯度函數</span>

SoftmaxPredict

[~,pred]= max(theta*data);%記錄最大概率的序號而不是最大值</span>

Accuracy: 93.272%，可以看出Softmax容易實現，效果也很不錯。

歡迎參與討論並關注本博客和微博以及知乎個人主頁後續內容繼續更新哦~

轉載請您尊重作者的勞動，完整保留上述文字以及文章鏈接，謝謝您的支持！

ycheng_sjtu

發佈了54 篇原創文章 · 獲贊 86 · 訪問量 47萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Softmax迴歸——識別MINST數據庫

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

Theano學習筆記（二）——邏輯迴歸函數解析

隱馬爾科夫模型（HMM）及其實現

Theano學習筆記（三）——圖結構

矢量化編程——以MNIST爲例

句法模式識別（二）-正規文法、上下文無關文法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結