原创 Ubuntu下CPU/GPU模式YOLOv3代碼運行

YOLO是近幾年物體檢測主要算法之一,2018年已發展到YOLOv3,是目前速度最快的物體檢測算法,詳細內容可查看YOLO主頁。YOLO的主要優勢在於基於純C語言編寫的DarkNet,可查看DarkNet主頁,不需要其他依賴庫,跨平臺能力強

原创 OpenCV開發(1)——OpenCV3.4+Python3.5+Windows10安裝問題解決

OpenCV近幾年功能不斷增強,目標檢測、跟蹤等方面出現了不少新算法。自3.3版開始,火熱的深度神經網絡的功能也加入其中。早期的OpenCV僅支持簡單的視頻播放功能,現在ffmpeg的部分功能也融入進來。爲了驗證新功能的效果,準備在Pyth

原创 京東金融大數據競賽豬臉識別(8)- 識別方法之四

除了softmax層構建的深度網絡,Matlab還有一個簡單的構建數據分類的函數,那就是patternnet,其用法類似。可以直接對圖像特徵數據處理,也可以對圖像集處理。代碼如下: %exam1.m 用訓練圖像特徵構建深度網絡並計算測試圖像

原创 OpenCV開發(2)——神經網絡使用示例

OpenCV3.4的神經網絡功能主要提供了以下三種: ml模塊中的多層感知機(Artificial Neural Networks - Multi-Layer Perceptrons),提供了MLP的創建、訓練、參數設置等函數。如:

原创 FasterRCNN_KERAS多種環境配置組合測試

FasterRCNN是物體檢測主流方法之一,keras版本的FasterRCNN是在2017年6月發佈的,這是核心代碼。其後Anaconda、TensorFlow和Keras都在不斷更新,不同版本的組合可能無法運行該程序。去年和今年小象學院

原创 Ubuntu下YOLOv3代碼運行

YOLO是近幾年物體檢測主要算法之一,2018年已發展到YOLOv3,是目前速度最快的物體檢測算法,詳細內容可查看YOLO主頁。YOLO的主要優勢在於基於純C語言編寫的DarkNet,可查看DarkNet主頁,不需要其他依賴庫,跨平臺能力強

原创 環境配置(近期實測)——Ubuntu16.04+CUDA9.0+tensorflow-gpu填坑記

近幾年深度學習在物體檢測方面出現了許多基於不同框架的網絡模型,不同模型需要不同的版本的Python、TensorFlow、Keras、CUDA、cuDNN以及操作系統。不得不說,要把經典物體檢測網絡的源碼都跑通,單配置環境就要浪費很多時間,

原创 京東金融大數據競賽豬臉識別(2)- 圖像特徵提取之一

圖像識別進入深度學習時代後,特徵提取這個詞的使用頻率明顯下降了。因爲深度網絡已經完成了從圖像輸入到分類結果輸出的全過程,似乎不需要再關心特徵的好壞和特徵提取對於識別結果的影響。不過,不管從算法研究還是工程實現角度看,將特徵提取獨立出來應該更

原创 視頻監控開發(1)——螢石雲硬盤錄像機SDK使用

大約十年前用過海康的硬盤錄像機和SDK進行過二次開發,多年不用了,現在市場變化很大。近幾年網絡攝像頭大量出現,如海爾、小米等品牌。相比早期海康、大華的監控攝像頭,這些網絡攝像頭使用簡單、方便,不需要單獨的錄像機,可通過手機遠程觀看和雲臺控制

原创 Matlab圖像識別/檢索系列(9)—開源工具介紹之圖像識別reco_toolbox

特徵是圖像識別、圖像檢索的關鍵之一。特徵提取對於識別、檢索的效果至關重要,它主要經歷了底層特徵(顏色、紋理、形狀等)提取、局部特徵(SIFT、SURF等)提取、詞頻向量(圖像對圖象集BOW的編碼結果,可以作爲圖像特徵,在局部特徵基礎上進行)

原创 京東金融大數據競賽豬臉識別(9)- 識別方法之五

這裏給出使用深度網絡中間層輸出結果作爲圖像特徵,並構建分類模型和對訓練數據進行識別的代碼。相關內容可參看Matlab圖像識別/檢索系列(7)-10行代碼完成深度學習網絡之取中間層數據作爲特徵。代碼如下: clear trainPath =

原创 視頻流快速處理技術之二——基於數據量波動特性的視頻靜止畫面檢測

靜止畫面是指相對靜止的視頻畫面。主要有以下幾種,測試信號準備時間內播放的彩條、黑屏;現場報道等待過程中對某個場景的拍攝;電視臺開播前播放的固定內容的信號等類似的內容。爲發現這類視頻的規律,選取圖像組頭和圖像頭起始碼作爲標誌,分別統計兩種標誌

原创 高維向量快速檢索方法Locality Sensitive Hashing之一漢明空間和歐式空間實現

1 高維向量檢索問題 高維向量檢索主要解決由數據維數增加所引發檢索速度急劇下降的的問題。高維空間中數據的特點主要包括以下三個方面:(1) 稀疏性。隨着維度增長,數據在空間分佈的稀疏性增強;(2) 空空間現象。對於服從正態分佈的數據集,當維數

原创 京東金融大數據競賽豬臉識別(4)-方法選取

由於可用的特徵提取和分類器構造方法較多,爲了確定選取方法。現在在視頻提取的圖像上進行算法驗證,取這些圖像的一部分進行訓練,剩餘部分進行測試,並進行交叉驗證。找到準確率最高的方法後再將其用於測試集。以reco_toolbox爲例,下面給出方法

原创 視頻流快速處理技術之一——基於幀數據量波動特性的壓縮域視頻快速檢索方法

在進行視頻檢索、檢測等處理時,許多方法需要先提取圖像,然後在圖像序列上進行處理。這些方法處理的數據量很大,導致算法運行速度慢、延時長,不能應用在實時處理的場合。爲加快速度,可在壓縮域直接進行視頻處理。 1 視頻數據及常用視頻特徵 視頻是由分