原创 【工具腳本】讀取VOC格式的標註xml文件,並修改xml中的內容

功能:讀取xml文件,並根據需求修改裏面的內容。 1)修改xml文件中標註框的xmin,xmax,ymin,ymax的座標值,當座標值越界時,對其進行修改。 2)修改xml中filename的值(即標註文件對應圖片的名稱)。 注意:使用p

原创 【視頻行爲識別0】傳統方法:Dense Trajectories(DT)和Improved Dense Trajectories(IDT)算法(ICCV2013)

DT算法論文:"Dense Trajectories and Motion Boundary Descriptors for Action Recognition" iDT算法論文:"Action Recognition with Imp

原创 【視頻行爲識別5】(雙流網絡)Two-stream Convolution Networks for Action Recognition in Videos(2014)

Two-stream Convolution Networks for Action Recognition in Videos 論文鏈接:Two-Stream Convolutional Networks for Action Reco

原创 【視頻行爲識別】3D Convolutional Neural Networks for Human Action Recognition:

3D Convolutional Neural Networks for Human Action Recognition 一個卷積map的某一位置的值是通過卷積上一層的三個連續的幀的同一個位置的局部感受野得到的。 3D CNN架構包含

原创 【視頻行爲識別】C3D:使用3D卷積網絡學習時空特徵(2015)

3D卷積和池化 觀點: 1)只有3D卷積才能保留輸入信號的時間信息,相同的現象適用於2D和3D池化. 2)雖然以前一些時間流網絡採用多個幀作爲輸入,但是由於2D卷積,在第一卷積層之後,時間信息完全消失了。   2D與3D卷積之間的區別:

原创 【CNN】卷積神經網絡中param和FLOPs介紹

卷積神經網絡中param和FLOPs介紹 CNN論文中在比較網絡性能時經常會提到這兩個參數,下面簡單介紹這兩個參數的含義。 Parameters:是指這個網絡中參數的數量(訓練網絡時學習的參數)。這裏的參數一般指的時參數W和b,也就是權

原创 CSDN書籤

tf.Keras.Model類總結 https://blog.csdn.net/qq_30992103/article/details/101034085

原创 Ubuntu創建軟鏈接

創建軟鏈接: ln -s [源文件或目錄] [目標文件或目錄] 例子: #生成軟鏈接,如果需要創建root權限,加上sudo sudo ln -s libcudnn.so.7 libcudnn.so   注意: 1、創建完了可以在目標文

原创 VIM的基本使用

1、vim基本使用 翻頁操作: Ctrl+F(PageDown):下翻一屏 Ctrl+B(PageUp):上翻一屏G:移到緩衝區最後一行 num G:移到緩衝區第num行gg:移到緩衝區第一行 保存退出: (需要在前面加入一個冒號:進入指

原创 【deep learning】train loss與test loss結果分析

train loss與test loss結果分析 train loss 不斷下降,test loss不斷下降,說明網絡仍在學習; train loss 不斷下降,test loss趨於不變,說明網絡過擬合; train loss 趨於不變

原创 【深度學習】關於SSD系列網絡對背景產生誤檢情況的解決辦法

嘗試方法一:直接對誤檢的圖像生成一個空的xml文件。(文件中沒有任何對象) 訓練結果:由於xml文件中沒有任何正樣本對象,所以網絡無法學習到背景信息,使用訓練後的模型測試誤檢的圖像,依然會產生誤檢。(這裏網上有人說即使沒有正樣本,SSD網

原创 【工具腳本】計算caffe網絡卷積層的參數量與計算量。

 使用說明: 1)修改代碼段中python的路徑。 2)運行方式:python cal_params.py /data1/......./deploy.prototxt #how to use? #python python_file.

原创 【Linux】Cat指令用法

 PS:cat指令平時用的最多的主要是在終端查看某個文件。 1.終端打開文件,查看文件內容。 $ cat filename 2.創建一個新文件。 $ cat  >  filename 3.將幾個文件合併爲一個文件。 $cat   file

原创 【深度學習】多尺度的理解

多尺度訓練這個問題應該是可以分爲兩個方面:一個是圖像金字塔,一個是特徵金字塔吧。 1、人臉檢測的MTCNN就是圖像金字塔,使用多種分辨率的圖像送到網絡中識別,時間複雜度自然就很高,畢竟每幅圖都要用多種scale去檢測。 2、像FPN特徵金

原创 【工具腳本】目標檢測中VOC格式數據轉COCO格式數據。親測!無bug!不報錯!

前言:我們在做目標檢測時,有時需要將自己的VOC格式的訓練數據轉換爲COCO格式,這裏提供對應的腳本,親測,不會報錯! 使用說明: 1)voc_clses:設置自己數據集的類別名稱。 2)voc2007xmls:指定VOC格式數據中xml