CUDA ERROR: device-side assert triggered問題解決思路

這個問題很可能是代碼有問題,先排查錯誤

step1

在environment variable中添加:CUDA_LAUNCH_BLOCKING=1
這樣更容易定位到出現問題的地方

step2

再排查報錯附近的原因,就在報錯附近。

我今天處理NLP,出現該問題的原因是:詞的索引> embedding層詞量

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章