pytorch模型訓練步驟

原創

勿在浮沙筑高台LS

2020-06-29 03:42

講解代碼textcnn模型

1.加載conf文件

x = import_module('models.' + model_name)
    config = x.Config(dataset, embedding)

2.加載model，初始化conf裏面值

model = x.Model(config).to(config.device)

3.加載模型訓練

model.train()
optimizer = torch.optim.Adam(model.parameters(), lr=config.learning_rate)

爲何要先聲明是train

https://blog.csdn.net/qq_38410428/article/details/101102075

在eval的時候也要先聲明

def evaluate(config, model, data_iter, test=False):
    model.eval()
    loss_total = 0

4.進行模型訓練

model(trains)對應forward的參數

outputs = model(trains)
model.zero_grad()
loss = F.cross_entropy(outputs, labels)
loss.backward()
# fgm.attack()  # 在embedding上添加對抗擾動
# outputs = model(trains)
# model.zero_grad()
# loss_adv = F.cross_entropy(outputs, labels)
# loss_adv.backward()  # 反向傳播，並在正常的grad基礎上，累加對抗訓練的梯度
# fgm.restore()  # 恢復embedding參數
# # 梯度下降，更新參數
optimizer.step()

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

pytorch 中的梯度計算

最近對pytorch的梯度計算產生了一點興趣，然後現在就總結一下，我看到的幾篇講得挺好的博客。創建帶有grad的tensor input = torch.tensor([1., 2., 3., 4.,], requires_gr

永远的小白虾

2020-07-07 15:03:38

Pytorch批量數據讀取方法詳解: DataLoader

在訓練模型的過程中，我們需要不斷的讀取小批量的數據樣本。Pytorch提供了data包來讀取數據。接下來我將人工生成一些數據，然後使用data包來處理數據。 import torch import numpy as np '''

2020-07-08 04:10:07

subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: java: java

在運行coco計算ImageCaption得分時，出現以下錯誤： subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: 'java': 'java' 原因：

清晨的光明

2020-07-08 02:37:26

Pytorch知識點與問題解決

文|Seraph 01 | 知識點 torcht.is_tensor(a) 判斷是否爲張量 Pytorch GPU環境是否正常測試代碼： import torch flag = torch.cuda.is_available(

2020-07-08 00:56:51

Pytorch: dataloader的一些使用心得

Pytorch: Dataloader的一些使用心得這篇博文不講原理，只講一些使用方法和技巧。所有提供的信息僅供參考，不要當作金科玉律。文章目錄Pytorch: Dataloader的一些使用心得基本程序框架從datalo

2020-07-07 23:40:48

Pytorch|YOWO原理及代碼詳解(二)

Pytorch|YOWO原理及代碼詳解(二) 本博客上接，Pytorch|YOWO原理及代碼詳解(一)，閱前可看。 1.正式訓練 if opt.evaluate: logging('evaluating .

2020-07-07 23:39:48

Pytorch|YOWO原理及代碼詳解(三)

Pytorch|YOWO原理及代碼詳解(三) 本博客上接， Pytorch|YOWO原理及代碼詳解(一)， Pytorch|YOWO原理及代碼詳解(二)，閱前可看。 1. test分析 if opt.evaluate:

2020-07-07 23:39:48

Pytorch|YOWO原理及代碼詳解(一)

Pytorch|YOWO原理及代碼詳解（一）閱前可看：YOWO論文翻譯 YOWO很有趣，使用價值很大，最近剛好需要，所以就研究一下。一直認爲只有把源碼看懂，才知道諸多細節，纔算真正瞭解一個算法。筆者能力有限，博文若有出錯，歡迎指

2020-07-07 23:39:37

Pytorch顯存問題

運行出現錯誤： RuntimeError: CUDA out of memory. Tried to allocate 500.00 MiB (GPU 0; 4.00 GiB total capacity; 204.39 MiB

2020-07-07 17:46:09

Kaggle手寫數字識別（Digit Recognizer）記錄

競賽地址 https://www.kaggle.com/c/digit-recognizer 苦於學了cs231n和pytorch之後沒有東西拿來練手，就去kaggle上找了一個入門競賽，MNIST手寫數字識別，這個比賽把MN

不跑步就等肥

2020-07-07 15:12:31

Pytorch搭建神經網絡基本步驟（文末附pytorch實現AlexNet）

文章參考: http://pytorch123.com/SecondSection/neural_networks/ cs231n assignment2 - http://cs231n.github.io/assignment

不跑步就等肥

2020-07-07 15:12:31

強化學習--Pytorch--DQN擴展以及Policy Gradient網絡結構

DQN改進 DQN算法存在過估計問題，可以採用Double DQN方法來進行補償。兩種方法只在下圖不同，其他地方一致。下圖公式爲 q_target 的輸出值， DQN: Double DQN: Policy Gradient

Chasing中的小强

2020-07-07 11:10:39

強化學習--Pytorch--DDPG

DDPG介紹及其示例 Deep Deterministic Policy Gradient是DeepMind團隊爲Actor-Critic方法打造的升級版本，其實也就是Actor-critic和DQN的融合版本。下面給出示例程序，

Chasing中的小强

2020-07-07 11:10:37

強化學習--Pytorch--DQN

DQN的學習效果還是很驚豔的，首先放上本次實驗的代碼。和官方給出的例子一樣，是託舉平衡杆的問題。給出視頻鏈接：強化學習DQN import torch import torch.nn as nn import torch.nn.

Chasing中的小强

2020-07-07 11:10:37

基本數據：Tensor

文章目錄基本數據：Tensor一、Tensor數據類型二、Tensor的創建與維度查看三、Tensor的組合與分塊四、Tensor的索引五、Tensor的變形基本數據：Tensor Tensor，即張量，是PyTorch中的基本

我是一名好学者

2020-07-07 10:51:10

24小時熱門文章

最新文章

最新評論文章