原创 pytorch-高級rnn

GRU RNN存在的問題:梯度較容易出現衰減或爆炸(BPTT) ⻔控循環神經⽹絡:捕捉時間序列中時間步距離較⼤的依賴關係 RNN: Ht=ϕ(XtWxh+Ht−1Whh+bh) H_{t} = ϕ(X_{t}W_{xh} + H

原创 pytorch-優化算法進階

11.6 Momentum 在 Section 11.4 中,我們提到,目標函數有關自變量的梯度代表了目標函數在自變量當前位置下降最快的方向。因此,梯度下降也叫作最陡下降(steepest descent)。在每次迭代中,梯度下降

原创 排序算法:堆排序

title: ‘排序算法:堆排序’ date: 2019-12-24 15:09:06 categories: 算法導論 tags: 算法導論 堆排序 堆排序思路是,首先構建一個堆,然後根和葉子節點進行交換,從而達到目

原创 pytorch-詞嵌入基礎

詞嵌入基礎 我們在“循環神經網絡的從零開始實現”一節中使用 one-hot 向量表示單詞,雖然它們構造起來很容易,但通常並不是一個好選擇。一個主要的原因是,one-hot 詞向量無法準確表達不同詞之間的相似度,如我們常常使用的餘弦

原创 pytorch-lenet

course content lenet 模型介紹 lenet 網絡搭建 運用lenet進行圖像識別-fashion-mnist數據集 Convolutional Neural Networks 使用全連接層的侷限性: 圖像

原创 二手車預測:task1:賽題分析

train.csv name - 汽車編碼 regDate - 汽車註冊時間 model - 車型編碼 brand - 品牌 bodyType - 車身類型 fuelType - 燃油類型 gearbox - 變速箱 powe

原创 二手車預測:task2:數據分佈

2.1 EDA目標 EDA的價值主要在於熟悉數據集,瞭解數據集,對數據集進行驗證來確定所獲得數據集可以用於接下來的機器學習或者深度學習使用。 當了解了數據集之後我們下一步就是要去了解變量間的相互關係以及變量與預測值之間的存

原创 使用stratifiedKFold進行分層交叉驗證時候報錯:ValueError: Supported target types are: ('binary', 'multiclass'). Got

ValueError Traceback (most recent call last) <ipython-input-42-2ab744268d80> in <mod

原创 pytorch-文本情感分類

文本情感分類 文本分類是自然語言處理的一個常見任務,它把一段不定長的文本序列變換爲文本的類別。本節關注它的一個子問題:使用文本情感分類來分析文本作者的情緒。這個問題也叫情感分析,並有着廣泛的應用。 同搜索近義詞和類比詞一樣,文本分

原创 pytorch-模型微調

9.2 微調 在前面的一些章節中,我們介紹瞭如何在只有6萬張圖像的Fashion-MNIST訓練數據集上訓練模型。我們還描述了學術界當下使用最廣泛的大規模圖像數據集ImageNet,它有超過1,000萬的圖像和1,000類的物體。

原创 pytorch-數據增強

圖像增廣 在5.6節(深度卷積神經網絡)裏我們提到過,大規模數據集是成功應用深度神經網絡的前提。圖像增廣(image augmentation)技術通過對訓練圖像做一系列隨機改變,來產生相似但又不同的訓練樣本,從而擴大訓練數據集的

原创 pytorch-梯度下降

梯度下降 (Boyd & Vandenberghe, 2004) %matplotlib inline import numpy as np import torch import time from torch import n

原创 pytorch-詞向量進階

詞嵌入進階 在“Word2Vec的實現”一節中,我們在小規模數據集上訓練了一個 Word2Vec 詞嵌入模型,並通過詞向量的餘弦相似度搜索近義詞。雖然 Word2Vec 已經能夠成功地將離散的單詞轉換爲連續的詞向量,並能一定程度上

原创 pytorch-優化與深度學習

優化與深度學習 優化與估計 儘管優化方法可以最小化深度學習中的損失函數值,但本質上優化方法達到的目標與深度學習的目標並不相同。 優化方法目標:訓練集損失函數值 深度學習目標:測試集損失函數值(泛化性) %matplotlib

原创 pytorch- 批量歸一化

批量歸一化(BatchNormalization) 對輸入的標準化(淺層模型) 處理後的任意一個特徵在數據集中所有樣本上的均值爲0、標準差爲1。 標準化處理輸入數據使各個特徵的分佈相近 批量歸一化(深度模型) 利用小批量上的均值和