keras 訓練是各種loss 變化情況

原創

2020-06-19 03:28

在使用keras 訓練網絡時，雖然網絡設計好了，數據也加載進去了，但是發現訓練時候總是出現各種各種稀奇古怪的問題。我在這裏就列舉幾個常見的問題。供大家參考一下。當val_loss曲線或val_acc曲線震盪不平滑時的原因可能如下：

1 學習率可能太大

2 batch size太小

3 樣本分佈不均勻

4 缺少加入正則化

大家可以在這幾個方面去進行調整，一步一步的調整，先調整學習率，然後再調整batch size,一般這兩種情況比較多，很容易就可以解決。如果還不行，再考慮一下val 集的數據樣本和訓練集的樣本是不是同樣的分佈。從這幾方面進行考慮。

另外大家要學會從loss和acc的變化來判斷網絡學習的情況。可能的幾種情況如下。

train loss 不斷下降，test loss不斷下降，說明網絡仍在學習;
train loss 不斷下降，test loss趨於不變，說明網絡過擬合;
train loss 趨於不變，test loss不斷下降，說明數據集100%有問題;
train loss 趨於不變，test loss趨於不變，說明學習遇到瓶頸，需要減小學習率或批量數目;
train loss 不斷上升，test loss不斷上升，說明網絡結構設計不當，訓練超參數設置不當，數據集經過清洗等問題。

另外當訓練時出現NAN 時大家看看自己的網絡是不是設計的有問題，網絡設計的是否過大了，導致梯度傳遞時丟失了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

谷歌發佈生態系統RLDS，可在強化學習中生成、共享和使用數據集

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-20 10:53:54

解讀數字化轉型下的數據安全：AI正在開闢新的可能性

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-19 14:03:54

谷歌聯合哈佛大學發佈最新研究，使用NeRF創建360度完整神經場景視頻

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

Martin Anderson

2021-12-16 15:08:50

什麼纔是實現元宇宙的關鍵路徑？

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1}},{"type":"paragraph","attrs":{"indent":0,"nu

2021-12-13 17:08:51

洞察數據庫變革趨勢，亞馬遜雲科技正在憑藉這項技術改變着遊戲規則

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-10 16:53:54

基於英特爾x86平臺構建AI軟件生態系統 | InfoQ《公開課》

直播內容人工智能爲社會各個領域的技術帶來了無限可能，也誕生了很多優秀的應用。在這些應用背後，需要很強的計算性能和優化做支撐，爲其提供準確、及時的結果。在英特爾各代 x86 平臺上，AI 能力是如何進行演進的？AI 生態系統是怎樣的？其中又

InfoQ 中文站

2021-12-10 15:18:59

Rust核心團隊“有毒”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-10 15:08:58

2021 re:Invent ，我們到底該關注哪些發佈？

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1}},{"type":"paragraph","attrs":{"indent":0,"nu

2021-12-09 15:23:56

全球首個知識增強千億大模型來了！2600億參數，代碼將在近期開源

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockq

2021-12-09 13:08:52

2021星空論壇：破局創新，論道數字化轉型

InfoQ 中文站

2021-12-09 12:34:02

視頻精修一幀要花2小時？AI只要5.3毫秒

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

美图影像实验室

2021-12-07 17:58:50

DeepMind新研究登上Nature封面，這一數學難題被AI攻破了

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragr

2021-12-07 14:33:58

蘋果研究人員提出集成反演技術，可從不同機器學習模型中重建訓練數據

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"MI攻擊"}]},{

2021-12-07 10:28:54

DeepMind提出強化學習新方法，可實現人機合作

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-03 08:03:54

華爲雲聯創營元宇宙高峯論壇—技術與文明·探索元宇宙背後的關鍵技術

【直播回放】每一次重大技術革命都會引領人類進入新時代，被喻爲“互聯網終極形態”的元宇宙，將會帶來什麼樣的變化。華爲雲、InfoQ攜手舉辦超前的元宇宙高端論壇，邀請產、學、研、投大咖們對元宇宙展開深入討論與交流。

InfoQ 中文站

2021-12-02 10:18:53

24小時熱門文章

最新文章

最新評論文章