docker運行pytorch報錯: RuntimeError: Rerunning with num_workers=0 may give better error trace.

使用docker運行Pytorch的時候如果報如下錯誤:

RuntimeError: DataLoader worker (pid 493) is killed by signal: Bus error. Details are lost due to multiprocessing. Rerunning with num_workers=0 may give better error trace.

應該是docker容器的共享內存空間不夠導致的。先把docker當前該保存的狀態保存好後,使用exit退出docker,重新docker run運行相應的鏡像並加上--shm-size參數,例如--shm-size 10G代表使用10G的共享內存。

參考

https://github.com/pytorch/pytorch/issues/2244

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章