問題描述:對於神經網絡,在訓練集上已經收斂,而測試集上的誤差始終維持在一個很大的值,自始至終都不下降;
可能存在的原因分析:
-
欠擬合
首先排除欠擬合,因爲網絡在訓練集上已經收斂 -
過擬合
如果出現過擬合,應該是訓練 loss 曲線一直下降,而測試 loss 是先下降後上升,排除 -
訓練和測試的輸入不同
測試集和訓練集採用完全相同的預處理方式,排除 -
使用收斂的網絡對訓練集進行測試,發現結果正常,說明模型的保存、網絡測試部分的搭建沒有問題
問題描述:對於神經網絡,在訓練集上已經收斂,而測試集上的誤差始終維持在一個很大的值,自始至終都不下降;
可能存在的原因分析:
欠擬合
首先排除欠擬合,因爲網絡在訓練集上已經收斂
過擬合
如果出現過擬合,應該是訓練 loss 曲線一直下降,而測試 loss 是先下降後上升,排除
訓練和測試的輸入不同
測試集和訓練集採用完全相同的預處理方式,排除
使用收斂的網絡對訓練集進行測試,發現結果正常,說明模型的保存、網絡測試部分的搭建沒有問題