原创 DCGAN的PyTorch實現

DCGAN 1.什麼是GAN GAN是一個框架,讓深度模型可以學習到數據的分佈,從而通過數據的分佈生成新的數據(服從同一分佈)。 其由一個判別器和一個生成器構成,生成器負責生成“仿造數據”,判別器負責判斷“仿造數據”的質量。兩者一

原创 Python入門教程:訓練過程(分類爲例)

Python入門教程:訓練過程(分類爲例) 更多代碼和教程請參看:disanda.github.io 或 https://github.com/disanda 1.數據集操作 Pillow和OpenCV常用於操作圖像 scip

原创 3.cnn實現分類(MNIST數據集)

該模型是tensorflow官方文檔的第二個模型,使用了cnn卷積網絡 該技術源於最早的lenet模型,細分計算過程,算上輸入和輸出,過程可分爲卷積、池化、卷積、池化、全聯接,總共七層。 卷積是用一個卷積核(比二維圖

原创 Python命令行參數設置

Python命令行參數設置(args) 1.sys模塊 通過傳入sys.argv列表,這裏列表元素必須大於等於代碼中設定的長度(長了會截斷),不然會報錯。 import sys def test_for_sys(year, na

原创 淺談torch.nn庫和torch.nn.functional庫(Pytorch)

淺談torch.nn庫和torch.nn.functional庫 這兩個庫很類似,都涵蓋了神經網絡的各層操作,只是用法有點不同, nn下是類實現,nn.functional下是函數實現。 conv1d 在nn下是一個類,一般

原创 pytorch下dataset和dataloader極簡實踐(包括自帶圖片)

數據類 數據集主要是 torch.utils.data類 要實現加載和預處理數據可分爲以下兩個步驟: 1.加載數據集(Dateset) 1.1 自帶數據集(Mnist/FashionMnist等) 加載時需要完成數據格式的轉換

原创 celeba數據集,以及pytorch加載圖片文件夾遇到的坑

1.celeba數據集 這是一個大規模人臉數據集官網 香港中文大學發佈的,提供了百度雲盤的下載,使用很方便。 總共有202,599張圖片,且有圖片的標註(Label)文件。 最常用的是剪裁過的圖片,文件名叫img_align_ce

原创 LSUN數據集

LSUN數據集 簡介 類似ImageNet的大規模數據集,最早出自這篇論文: 《LSUN: Construction of a Large-Scale Image Dataset using Deep Learning with

原创 Pytorch中的卷積與反捲積詳解(conv2d和convTranspose2d)

Pytorch中的卷積與反捲積詳解(conv2d和convTranspose2d) 卷積和反捲積是圖片計算在深度學習中常用的上採樣和下采樣操作。相比其他採樣操作,卷積計算不僅可以保存參數的梯度傳遞(適用用BP),還可以改變圖片的通

原创 數據集規則化(歸一化):transforms.Normalize()

規則化(Normalize) pytorch在加載數據時,常需要歸一化,如 transforms.Normalize((0.5,0.5,0.5),(0.5,0.5,0.5)) 灰度圖是: transforms.Normali

原创 Pytorch的gather()和scatter()

Pytorch的gather()和scatter() 1.gather() gather是取的意思,意爲把某一tensor矩陣按照一個索引序列index取出,組成一個新的矩陣。 gather(input,dim,index) 參數

原创 淺談 benchmark 和 baseline 的理解

benchmark & baseline benchmark ,是基準的意思。而baseline是基準線的意思,兩者有類似的成分,看一下英文解釋: a baseline is a measurement or state at

原创 2.MNIST 最簡單的識別模型

該模型是tensorflow官方文檔首個模型,沒有使用卷積網絡 關鍵是構建一個公式 公式爲y=wx+b,帶有二維像素值的數組(圖片)作爲輸入x,標籤(圖片結果)作爲輸出y 用正向傳播把數據(x,y)帶入訓練,再反

原创 1.MNIST(簡介&可視化)

1.簡介 MNIST 數據集來自美國國家標準與技術研究所, 是NIST(National Institute of Standards and Technology)的縮小版,訓練集 (training set) 由來自 250

原创 cifar10和cifar100(簡介&可視化)

cifar CIFAR數據集是 Visual Dictionary (Teaching computers to recognize objects) 的子集,由三個教授收集,主要來自google和各類搜索引擎的圖片。 備註:ci