pytorch 權重weight 與梯度grad 可視化

原創

rainbow_lucky0106

2020-05-26 06:22

查看特定layer的權重以及相應的梯度信息

打印模型
觀察到model下面有module的key，module下面有features的key， features下面有(0)的key，這樣就可以直接打印出weight了
在pdb debug界面輸入p model.module.features[0].weight，就可以看到weight，輸入 p model.module.features[0].weight.grad 就可以查看梯度信息。

中間變量的梯度 : .register_hook

pytorch 爲了節省顯存，在反向傳播的過程中只針對計算圖中的葉子結點(leaf variable)保留了梯度值(gradient)。但對於開發者來說，有時我們希望探測某些中間變量(intermediate variable) 的梯度來驗證我們的實現是否有誤，這個過程就需要用到 tensor的register_hook接口

grads = {}

def save_grad(name):
    def hook(grad):
        grads[name] = grad
    return hook

x = torch.randn(1, requires_grad=True)
y = 3*x
z = y * y

# 爲中間變量註冊梯度保存接口，存儲梯度時名字爲 y。
y.register_hook(save_grad('y'))

# 反向傳播 
z.backward()

# 查看 y 的梯度值
print(grads['y'])

打印網絡回傳梯度

net.named_parameters()
parms.requires_grad 表示該參數是否可學習，是不是frozen的；
parm.grad 打印該參數的梯度值。

net = your_network().cuda()
def train():
	...
	outputs = net(inputs)
    loss = criterion(outputs, targets)
    loss.backward()
	for name, parms in net.named_parameters():	
		print('-->name:', name, '-->grad_requirs:',parms.requires_grad, \
		 ' -->grad_value:',parms.grad)

查看pytorch產生的梯度

[x.grad for x in self.optimizer.param_groups[0]['params']]

資料

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

國內首場 Unstructured Data Meetup 收官！GenAI 如何連接非結構化數據？

近日，國內首場 Unstructured Data Meetup 圓滿收官！本次 Meetup 由向量數據庫領軍者 Zilliz 創辦的，同時還邀請到來自 MOSS & OpenMOSS、螞蟻集團、LangChain 中國社區的技術專

2024-06-06 14:16:06

界面控件DevExpress WinForms的流程圖組件 - 可完美複製Visio功能（二）

DevExpress WinForms的Diagram（流程圖）組件允許您複製Microsoft Visio中的許多功能，並能在下一個Windows Forms項目中引入信息豐富的圖表、流程圖和組織圖。 P.S：DevExpress Win

2024-06-04 12:32:12

暗水印——變換域DCT水印算法（一種通用性強，能有抵禦攻擊的手段）

引言隨着計算機和網絡技術的飛速發展，信息的安全保護問題日益突出。數字圖像、音頻和視頻等多媒體數字產品愈來愈需要一種有效的版權保護方法——水印技術，通常用於保護知識產權、防止未經授權的訪問、作弊等。廣義上可以把水印技術劃分爲四大類：

2024-06-04 12:09:29

爲何都在談低代碼？快速瞭解低代碼技術在 ITSM 中的應用

直達原文：【ITSM系列】爲何都在談低代碼？快速瞭解低代碼技術在ITSM中的應用還記得早期的 Dreamweaver 嗎？爲了提高網頁的開發效率，Dreamweaver 提供了可視化拖拽的能力來生成網頁代碼。可見，低代碼、無代碼的探索和

2024-06-04 02:44:11

數據驅動製造：EMQX ECP 指標監測功能增強生產透明度

邁向未來的工業生產，需要的不僅是自動化，更是智能化。如果工業企業的管理者能夠實時監測每一生產環節的設備運行狀態，每一數據點位情況，洞察和優化每一步生產流程，他們將能夠做出更精準的決策，提高生產效率和產品質量。通過集成先進的指標監測工具，

2024-06-03 22:11:10

Opal 機器學習平臺：愛奇藝數智一體化實踐

01 綜述 Opal 是愛奇藝大數據團隊研發的機器學習平臺，包含特徵生產、樣本構建、模型訓練、模型部署在內的多環節 Bigdata + AI 開發服務，內置多種訓練鏡像、

愛奇藝技術產品團隊

2024-06-01 02:21:16

要得要得！Zabbix Meetup重慶站精彩回顧

Zabbix Meetup 重慶站精彩回顧 5月25日，Zabbix城市行首次來到重慶，這場盛會集合了講師們的經驗心得、案例分享，60多位嘉賓都享受其中，收穫頗豐！感謝Oce

2024-05-31 22:33:02

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

DevExtreme擁有高性能的HTML5 / JavaScript小部件集合*使您可以利用現代Web開發堆棧*包括React*Angular*ASP.NET Core*jQuery*Knockout等*構建交互式的Web應用程序。從Ang

2024-05-31 12:32:20

兒童節變身小小音樂家*用ModelArts製作一張AIGC音樂專輯

本文分享自華爲雲社區《兒童節變身小小音樂家*用ModelArts製作一張AIGC音樂專輯》*作者* 華爲雲社區精選。兒童節*如何給小朋友準備一份特別的禮物* 這份AIGC音樂專輯製作攻略一定要收下一段文字靈感就能編織出一曲悠揚悅耳的旋

2024-05-31 11:04:39

界面控件DevExpress WinForms的流程圖組件 - 可完美複製Visio功能（一）

DevExpress WinForms的Diagram（流程圖）組件允許您複製Microsoft Visio中的許多功能，並能在下一個Windows Forms項目中引入信息豐富的圖表、流程圖和組織圖。 P.S：DevExpress Win

2024-05-29 12:18:43

如何使用前端表格控件實現多數據源整合？

前言作爲表格產品的典型應用場景之一，幾乎所有的行業都會存在類 Excel 報表開發這樣的應用場景，而在這些應用場景中，經常會遇見下面的這些痛點：報表數據往往來自多個不同的數據源，需要報表系統能夠同時連接多個數據源，並融合不同的數據格式

2024-05-29 10:45:31

研發提效：想快速定製一個OLAP應用？你可以這麼做

一、背景在日常項目中，經常能遇到多維度、多指標自由組合分析的OLAP系統建設場景，這類需求往往具有分析關係複雜、開發週期長和數據量大等特點，需要研發投入比較大的精力進行建設。針對OLAP的場景，目前開源界大部分項目都是針對存儲層的

2024-05-28 11:56:16

【終極指南】使用Python可視化分析文本情感傾向

本文分享自華爲雲社區《Python理解文本情感傾向的終極指南》，作者：檸檬味擁抱。情感分析是一種通過自然語言處理技術來識別、提取和量化文本中的情感傾向的方法。Python在這一領域有着豐富的庫和工具，如NLTK、TextBlob和VAD

2024-05-28 10:58:03

京東雲5月產品動態

1.【智算服務】新品上線智算平臺GCS是面向AI創業公司和AI從業者的AI算力生命週期管理和AI應用生命週期管理平臺。平臺提供高性價比算力資源，以及基於大模型的AI應用生態市場。提供全網低價算力、幫您快速上手AIGC應用。 2.【節能寶P

2024-05-27 23:56:00

DevExpress Office File API中文教程 - 如何用OpenAI模型增強Office文檔可訪問性？

DevExpress Office File API是一個專爲C#, VB.NET 和 ASP.NET等開發人員提供的非可視化.NET庫。有了這個庫，不用安裝Microsoft Office，就可以完全自動處理Excel、Word等文檔

2024-05-25 00:20:55

24小時熱門文章

最新文章

最新評論文章