論文筆記——分佈式深度學習框架下基於性能感知的DBS—SGD算法

論文筆記——分佈式深度學習框架下基於性能感知的DBS—SGD算法

分佈式深度學習框架下基於性能感知的DBS—SGD算法

這篇論文裏各個細節都講得特別清楚。

充分考慮了各個客戶端端點的異構性,同時考慮了異步訓練過程中梯度過時得到問題。

對各節點的minibatch進行動態分配,保證了節點間每次迭代更新的時間基本一致,進而降低了節點的平均梯度過時值。

 

分佈式架構中的參數服務器

參數服務器的兩個操作:

  1. sumGradients 接受各個節點計算好的梯度值並進行累加操作
  2. applyUpdate:用計算好的梯度值乘以學習率並更新全局參數

異步更新策略

異步更新中,全局更新過程

Top-k更新策略

參數服務器在收到k個參數後進行更新

 

之前一些論文中已經證明了batch_size的值是對神經網絡性能產生影響的關鍵變量。

文中提出了一種動態調整各個節點batch_size值的方法。提出了DMB-SGD算法。

算法思想:

 


數據集使用MNIST和CIFAR-10

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章