原创 CNN卷積層相關計算公式

師兄最近找工作筆試有遇到過~容易忘 作者:機器之心 鏈接:https://www.zhihu.com/question/52668301/answer/131573702 來源:知乎 著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業

原创 信息熵

總結一下自己開始的疑問: 信息量是用來衡量一個事件的不確定性的;一個事件發生的概率越大,不確定性越小,則它所攜帶的信息量就越小。 熵越大,指該事件包含的信息量越大,熵是用來衡量一個系統的混亂程度的,代表一個系統中信息量的總和;信息量總

原创 協方差矩陣的意義

從物理意義上說,就是計算各維度之間的相關性(前提是已經經過白化)。 由於樣本特徵均值白化後爲0,各特徵方差一樣,計算得到的協方差矩陣,其中元素的值越大,則說明對應下標的特徵之間相關性越高。 PCA就是基於這種性質。 對於機器學習領域

原创 dropout和L1,L2正則化的理解筆記

理解dropout from http://blog.csdn.net/stdcoutzyx/article/details/49022443 123 開篇明義,dropout是指在深度學習網絡的訓練過程中,對於神經網絡單元

原创 fine-tuning:利用已有模型訓練其他數據集

看了這篇文章,受益匪淺,對fine-tuning有了好的理解,實驗與理論結合,大佬講的好。http://blog.csdn.net/yj3254/article/details/52704361

原创 GBDT(梯度提升決策樹)

gbdt樹分爲兩種, (1)殘差版本   殘差其實就是真實值和預測值之間的差值,在學習的過程中,首先學習一顆迴歸樹,然後將“真實值-預測值”得到殘差,再把殘差作爲一個學習目標,學習下一棵迴歸樹,依次類推,直到殘差小於某個接近0的閥值或迴歸

原创 深度學習模型——AlexNet

Alex在2012年提出的alexnet網絡結構模型引爆了神經網絡的應用熱潮,並贏得了2012屆圖像識別大賽的冠軍,使得CNN成爲在圖像分類上的核心算法模型。 注:input的圖片如果是3通道,用三維卷積核進行卷積操作,得到的

原创 實現python爬蟲

看到CSDN公衆號推薦的一個貓眼電影前100的爬蟲程序(來自於https://zhuanlan.zhihu.com/p/33819401),實現了下,記錄一下過程:主要分爲3步:1. HTML下載器、2. HTML解析器、3. 數據存儲器

原创 線性判別分析(LDA)

轉載於 http://blog.csdn.net/chlele0105/article/details/13005527       上一節介紹了PCA算法,PCA的目標是希望降維後的數據能夠保持最多的信息,而Discriminant

原创 深度學習解決大規模文本分類問題 - 綜述和實踐

from  https://zhuanlan.zhihu.com/p/25928551 (1)文本預處理 文本分詞 去停用詞 (2)文本表示和特徵提取 文本表示:     文本表示的目的是把文本預處理後的轉換成計算機可理解的方式,

原创 數據處理——白化whitening

白化whitening 原文地址:http://blog.csdn.net/hjimce/article/details/50864602 作者:hjimce 一、相關理論     白化這個詞,可能在深度學習領域比較常遇到,挺

原创 CNN的一些基本知識,以後有需要可以看看

主要是知乎上的一個,機器之心寫的不錯,容易理解。 from https://www.zhihu.com/question/52668301 作者:機器之心 鏈接:https://www.zhihu.com/question/526683

原创 Python中列表list,元祖tuple和numpy中的array區別

1.列表     list是處理一組有序項目的數據結構,即你可以在一個列表中存儲一個序列的項目。列表中的項目。列表中的項目應該包括在方括號中,這樣python就知道你是在指明一個列表。一旦你創建了一個列表,你就可以添加,刪除,或者是搜索列

原创 stacking做CV的一些用法和理解

kaggle上面講stacking的CV: http://blog.kaggle.com/2016/12/27/a-kagglers-guide-to-model-stacking-in-practice/  感覺這種方法是可以減少

原创 看到的一些文本分類的一些問題(評論)

1. 你好 請問textcnn做長文本的話 比如某些類別平均長度已經是1400了,最長上萬字,這時根據最長的做padding,內存佔用會爆炸。。。另外是 長度非常不均勻,比如百分之一的長度幾乎接近0(實際是因爲裏面全是圖片或者視頻),這種