原创 Stata

Stata能夠提供各種統計功能和強大圖形功能的工具,能夠加載gigabytes of data,仍能快速輕鬆地進行數據操作。 Stata是一種通用統計軟件,具有廣泛的數據管理和計算能力,並且與Excel和SPSS具有相似性。 使用Sta

原创 Linux JDK1.8安裝步驟

①解壓JDK tar -zvxf   ②把jdk配置到系統環境變量中 修改全局變量 vim /etc/profile (vim ~/.bashrc 是修改當前用戶配置文件,只作用於當前用戶) 在最下面添加 export JA

原创 基於Sklearn調用TF-IDF

代碼小練 from sklearn.feature_extraction.text import TfidfVectorizer tfidf = TfidfVectorizer() #語料 corpus = ['我 來 到 北京

原创 理解auto-encoder自編碼神經網絡

      想象這樣一個網絡,輸入是一組全部爲一的向量,目標是一張人臉,經過好多好多輪的訓練。我們只要輸入這個全部唯一的向量就可以得到這張你熟悉的臉。其實這是因爲在訓練的過程中,我們通過不斷地訓練,網絡已經將這張人臉圖片的參數保存起來了

原创 KL散度 & JS散度

KL散度 KL-divergence,KL散度,KL距離,又叫相對熵(relative entropy),衡量兩個概率分佈之間的不同程度,是描述兩個概率分佈P和Q差異的一種方法 就是信息論學的相對熵 最簡單的情況:當KL-diverge

原创 深度學習與神經網絡 之 時間序列表示

      我們之前講的卷積神經網絡CNN所處理的都是2D的圖像、視頻之類的,這種數據的大多具有位置相關性       那麼自然界中除了圖片、視頻數據之外,更多的還有一些類似於序列的數據,例如語音、文字,這些數據都是有一個時間的先後順序

原创 ResNet神經網絡實戰(CIFAR10數據集)

這樣一個單元就是一個Residual block 就是程序中實現的ResBlk 然後在ResNet18中就是堆疊多個Residual block   因爲這裏使用的是CIFAR-10數據集,是32*32的 所以我們這裏的resnet1

原创 深度學習與神經網絡(六)——卷積神經網絡CNN

圖像的色彩存儲的時候是0-255,但我們做deeplearning的時候一般都是在0-1   理解卷積神經網絡的作用 在我們之前說到的在80年代,處理一個需要1.6M的MNIST數據集都很困難 當時的科學家就想了一個辦法 借鑑人眼的機制

原创 python通過setup.py安裝模塊

python安裝模塊不止可以pip install,還有其他的方法,還可以用setup.py 並且有些時候我們發現一些模塊沒有提供pip install 命令和安裝教程 , 只提供了一個setup.py文件   步驟 打開cmd 到達安

原创 Overleaf

Overleaf Overleaf就是在線Latex https://www.overleaf.com/ 註冊要用gmail,126、163等都會提示無效   模板 https://www.overleaf.com/latex/temp

原创 LeNet5神經網絡實戰(CIFAR10數據集)

卷積層 pooling層 卷積層 pooling層 之後是跟一個全連接層相連接 import torch from torch import nn class Lenet5(nn.Module): def __init__(se

原创 深度學習與神經網絡 之 自定義數據集(寶可夢數據集)

自定義寶可夢數據集實戰 Pokemon Dataset   一共收集了5種精靈 皮卡丘、超夢、傑尼龜、小火龍、妙蛙種子   先對數據集進行一下劃分,劃分出train的和test的   自定義數據集需要繼承自 torch.utils.

原创 香港大學CS Msc 面試經歷(20fall)

筆試1h 英文題,一些名詞會有漢字解釋 1、用最少的稱量次數從一堆箱子(質量相同,只有一個箱子質量稍輕)中找出那個質量和其他箱子不同的箱子      ——很明顯的二分,把圖擺上一目瞭然,較少的語言描述也可以更節約時間 2、模擬題    

原创 ResNet 深度殘差網絡 & DenseNet

ResNet         殘差神經網絡,由華人學者何愷明在微軟亞洲研究院時提出       在2014年的時候,深度網絡的層數已經達到了22層,當時的一些學者就肯定會在想,更深層次的網絡結構會帶來更好的效果,而當人們去堆疊更深層次的

原创 在自定義寶可夢數據集上使用resnet18網絡

目錄結構   train validation test   一般來說現在都是用Adam這個優化器,這個優化器算是性能最好的 SGD不能優化的,Adam都能很好的優化 如果沒有特別的要求一般來說都是用Adam這個優化器   tra