論文筆記——分佈式深度學習框架下基於性能感知的DBS—SGD算法
分佈式深度學習框架下基於性能感知的DBS—SGD算法
這篇論文裏各個細節都講得特別清楚。
充分考慮了各個客戶端端點的異構性,同時考慮了異步訓練過程中梯度過時得到問題。
對各節點的minibatch進行動態分配,保證了節點間每次迭代更新的時間基本一致,進而降低了節點的平均梯度過時值。
分佈式架構中的參數服務器
參數服務器的兩個操作:
- sumGradients 接受各個節點計算好的梯度值並進行累加操作
- applyUpdate:用計算好的梯度值乘以學習率並更新全局參數
異步更新策略
異步更新中,全局更新過程
Top-k更新策略
參數服務器在收到k個參數後進行更新
之前一些論文中已經證明了batch_size的值是對神經網絡性能產生影響的關鍵變量。
文中提出了一種動態調整各個節點batch_size值的方法。提出了DMB-SGD算法。
算法思想:
數據集使用MNIST和CIFAR-10