原创 YOLO目標檢測模型原理介紹

YOLO-v1介紹 YOLO是一個端到端的目標檢測算法,不需要預先提取region proposal(RCNN目標檢測系列),通過一個網絡就可以輸出:類別,置信度,座標位置,檢測速度很快,不過,定位精度相對低些,特別是密集型小目標。 YO

原创 YOLO目標檢測模型重新訓練

介紹 YOLO目標檢測快速上手這篇文章我們通過簡短的代碼就實現了一個視頻目標檢測功能。本文將介紹如何使用其他數據集重新訓練YOLO模型,文章將會詳細介紹每一步。 下載數據集 我們將使用Pascal VOC數據集訓練我們的模型,該數據集可以

原创 YOLO目標檢測快速上手

介紹 YOLO是基於深度學習端到端的實時目標檢測系統,YOLO將目標區域預測和目標類別預測整合於單個神經網絡模型中,實現在準確率較高的情況下快速目標檢測與識別,更加適合現場應用環境。本案例,我們快速實現一個視頻目標檢測功能,實現的具體原理

原创 深度學習常見激活函數介紹及代碼實現

作用 深度神經網絡引入非線性單元,使訓練問題不再是一個凸優化問題,雖然我們很難得到最優解,但是可以通過梯度下降去尋找局部最小值。 增強模型的擬合能力,理論上只要有足夠的神經元,一層隱藏層就可以表達任意函數。 性質 可微(多元函數):函數

原创 圖像風格轉移

介紹 什麼是圖像風格遷移,我想圖片比文字更具表現力。上圖中“output image”就是圖像風格遷移後得到的結果。那麼它是如何實現的呢?首先讓我們看下CNN每層學習到了什麼。 如圖所示,CNN網絡最開始會學習到圖像的“紋理”,“邊緣“

原创 深度學習實現自動生成圖片字幕

介紹 本次項目使用深度學習自動生成圖像字幕。如上圖,模型自動生成“The person is riding a surfboard in the ocean”字幕。我們具體該如何實現呢? 如圖所示,我們需要分別使用CNN和RNN模型來實

原创 注意力機制實現機器翻譯

介紹 Attention模型形象的比喻就是“圖像對焦”。 上圖是Encoder-Decoder模型,Decoder中每個單詞生成過程如下: 其中C是“語義編碼C”,f是Decoder的非線性變換函數。由此,我們可以看出生成目標句子的每個

原创 DCGAN(深度卷積對抗網絡)案例

介紹 如圖所示,GAN網絡會同時訓練兩個模型。生成器:負責生成數據(比如:照片);判別器:判別所生成照片的真假。訓練過程中,生成器生成的照片會越來越接近真實照片,直到判別器無法區分照片真假。 DCGAN(深度卷積對抗生成網絡)是GAN的

原创 GRU網絡生成莎士比亞小說

介紹 本文我們將使用GRU網絡來學習莎士比亞小說,模型通過學習可以生成與小說風格相似的文本,如圖所示:雖然有些句子並沒有實際的意思(目前我們的模型是基於概率,並不是理解語義),但是大多數單詞都是有效的,文本結構也與我們訓練的文本相似。由於項

原创 通過遷移學習實現OCT圖像識別

遷移學習 遷移學習就是用別人已經訓練好的模型,如:Inception Model,Resnet Model等,把它當做Pre-trained Model,幫助我們提取特徵。常用方法是去除Pre-trained Model的最後一層,按照自己

原创 使用Keras構建CNN網絡識別森林衛星圖

介紹 本文我們將使用tf.keras構建一個卷積神經網絡,用於識別森林衛星圖。tf.keras是Tensorflow的高階API,具有模塊性,易擴展性,相比Tensorflow的Low-level API可以更快速的實現模型。Pytorch