ELECTRA模型跟BERT的區別

綜合分析ELECTRA跟BERT模型的對比

思考:

1.類似GAN模型,但是由於梯度不能從判別模型到生成模型,所以只能綜合兩者的損失值對生成模型進行損失傳遞。

2.生成損失  對生成模型進行傳導

   生成損失+判別損失 對判別模型進行傳導

發佈了358 篇原創文章 · 獲贊 113 · 訪問量 82萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章