caffe - faster r-cnn（python）之路

1. faster-rcnn安裝與運行
　下列faster-rcnn的安裝參考github作者給出的教程：https://github.com/rbgirshick/py-faster-rcnn

caffe的安裝參考官網教程（ see：Caffe installation instructions）
note:將makefile.config中這兩行註釋去掉

WITH_PYTHON_LAYER := 1
USE_CUDNN := 1

將Faster R-CNN下載到本地

git clone --recursive https://github.com/rbgirshick/py-faster-rcnn.git

假設下載下來存放的路徑根目錄爲：FRCN_ROOT
編譯Cython模塊

cd $FRCN_ROOT/lib
make

編譯caffe和pycaffe

cd $FRCN_ROOT/caffe-fast-rcnn
make -j8 && make pycaffe

下載pre-computed Faster R-CNN detectors

cd $FRCN_ROOT
./data/scripts/fetch_faster_rcnn_models.sh

安裝成功之後，運行demo.py測試下，可以試下自己的圖片：

cd $FRCN_ROOT
./tools/demo.py

更多參考官方教程：https://github.com/rbgirshick/py-faster-rcnn

2. 文件夾導讀

caffe-fast-rcnn：caffe框架目錄
data：用來存放pretrained模型以及讀取文件的cache緩存，還有一些下載模型的腳本
experiments:存放配置文件以及運行的log文件，另外這個目錄下有scripts，裏面存放end2end和alt_opt兩種訓練方式的腳本
lib：用來存放一些python接口文件，如其下的datasets主要負責數據庫讀取，config負責一些訓練的配置選項
models：裏面存放了三個模型文件，小型網絡ZF，中型網絡VGG_CNN_M_1024以及大型網絡VGG16，根據你的硬件條件來選擇使用哪種網絡，ZF和VGG_CNN_M_1024需要至少3G內存，VGG16需要更多的內存，但不會超過11G
output：這裏存放的是訓練完成後的輸出目錄，這是運行了訓練後纔會出現的目錄
tools：裏面存放的是訓練和測試的Python文件

3. 製作數據集
　 3.1.用標註工具labelImg

安裝：sudo pip install labelImg 
運行：labelImg

　　
　　可以open一張，也可以open dir導入一個文件。利用Create RectBox圈出目標區域，之後對區域進行類別標註。然後利用next image或者prev Image切換下一張或者前一張。標記錯的可以直接點擊後delete,….很簡單，不再詳細介紹。
　　標註之後保存後的形式和VOC中的Annotations文件夾中的格式一樣。
　　

<annotation verified="no">
  <folder>images</folder>
  <filename>00002</filename>
  <path>/home/apple/work/py-faster-rcnn/images/00002.jpg</path>
  <source>
    <database>Unknown</database>
  </source>
  <size>
    <width>500</width>
    <height>375</height>
    <depth>3</depth>
  </size>
  <segmented>0</segmented>
  <object>
    <name>dog</name>
    <pose>Unspecified</pose>
    <truncated>0</truncated>
    <difficult>0</difficult>
    <bndbox>
      <xmin>2</xmin>
      <ymin>2</ymin>
      <xmax>264</xmax>
      <ymax>372</ymax>
    </bndbox>
  </object>
  <object>
    <name>cat</name>
    <pose>Unspecified</pose>
    <truncated>1</truncated>
    <difficult>0</difficult>
    <bndbox>
      <xmin>276</xmin>
      <ymin>82</ymin>
      <xmax>499</xmax>
      <ymax>375</ymax>
    </bndbox>
  </object>
</annotation>

　　參考博客：http://blog.csdn.net/jesse_mx/article/details/53606897　　　　https://bealin.github.io/2016/10/23/Caffe%E5%AD%A6%E4%B9%A0%E7%B3%BB%E5%88%97%E2%80%94%E2%80%946%E4%BD%BF%E7%94%A8Faster-RCNN%E8%BF%9B%E8%A1%8C%E7%9B%AE%E6%A0%87%E6%A3%80%E6%B5%8B/

　2.2.使用自己的程序進行標記

　　目標：對圖像中目標標註bounding box,標籤以下列形式展現：
　　圖片名　目標類別　起始點x座標　ｙ座標　結束點ｘ座標　ｙ座標

00001.jpg car 63 96 180 341
00002.jpg car 85 39 436 330
00003.jpg car 40 43 255 346
00004.jpg car 78 22 433 360
00005.jpg car 147 74 414 370

實現代碼

# -*- coding: utf-8 -*-
import os
import cv2
import numpy as np

# 當鼠標按下時變爲 True
drawing = False
ix,iy = -1,-1
ox,oy = -1,-1
# 創建回調函數
def draw_circle(event,x,y,flags,param):
    global ix,iy,ox,oy,drawing
    # 當按下左鍵是返回起始位置座標
    if event==cv2.EVENT_LBUTTONDOWN:
        drawing=True
        ix,iy = x,y
    # 當鼠標左鍵按下並移動是繪製圖形。 event 可以查看移動, flag 查看是否按下
    elif event==cv2.EVENT_MOUSEMOVE and flags==cv2.EVENT_FLAG_LBUTTON:
         if drawing==True:
                cv2.rectangle(image,(ix,iy),(x,y),(0,255,0),-1)
                ox,oy = x,y
    elif event==cv2.EVENT_LBUTTONUP:
        drawing==False

number = 0
jpg = ".jpg"
Image_Path = "./images"
f_wrect = open('images.txt','a')
for file in os.listdir(Image_Path):
    number = number + 1
    #print(number)
    string_number = '%d'%number
    #print(string_number)
    i = len(string_number)
    #print(i)
    while (5 - i) >  0:
        string_number = '0' + string_number
        i = i + 1
    newname = string_number + jpg
    old_NamePath = os.path.join(Image_Path,file)
    new_NamePath = os.path.join(Image_Path,newname)
    os.rename(old_NamePath,new_NamePath)
    image = cv2.imread(new_NamePath)
    cv2.namedWindow('image')
    cv2.setMouseCallback('image',draw_circle)
    while(1):
        cv2.imshow('image',image)
        #運行代碼，會顯示一張圖片，當按下q鍵時，顯示圖片的窗口被關掉，結束程序。
        if (cv2.waitKey(1)&0xFF==ord('q')):
            print('ok')
            image_rect = newname + ' ceramic '+ '%d'% ix +' '+ '%d'% iy+ ' ' + '%d'% ox + ' ' + '%d'% oy + '\n'
            f_wrect.write(image_rect)
            break
    cv2.destroyWindow('image')

參考博客：http://www.cnblogs.com/YangQiaoblog/p/6782183.html

未完待續。。。。。。。。。。

一些不懂的細碎的知識點，可以參考下列博客：

LRN層作用：http://blog.csdn.net/u014114990/article/details/47662189
POI Pooling層：http://blog.csdn.net/lanran2/article/details/60143861
SmoothL1Loss層：http://blog.csdn.net/xyy19920105/article/details/50421225
numpy.where()：http://blog.csdn.net/lanchunhui/article/details/49489205

    np.where()[0] 表示行的索引，
    np.where()[1] 則表示列的索引

numpy.hstack()函數：http://blog.csdn.net/garfielder007/article/details/51378296
Stack arrays in sequence horizontally (column wise).以列爲主，水平方向上合併數組。
程序實例：

    >>> a = np.array((1,2,3))  
    >>> b = np.array((2,3,4))  
    >>> np.hstack((a,b))  
    array([1, 2, 3, 2, 3, 4])  
    >>> a = np.array([[1],[2],[3]])  
    >>> b = np.array([[2],[3],[4]])  
    >>> np.hstack((a,b))  
    array([[1, 2],  
           [2, 3],  
           [3, 4]])

numpy.random.permulation(arrays):返回矩陣洗牌後的副本，意味着原矩陣不變
numpy.random.shuffle(arrays)：對原數據進行洗牌，卻不返回任何值。

import numpy as np
arrays=np.array([1,2,3,4])
print np.random.permulation(arrays)
print arrays
print np.random.shuffle(arrays)
print arrays

結果：
[4 2 3 1]
[1 2 3 4]#始終不變
None
[1 4 2 3]

np.reshape(arrays,(-1,2))：將數組arrays重新排列成列數爲2的。不管-1在第幾個參數的位置，重新排列時均以行爲主。

[python]代碼示例：
arrays=np.array([1,2,3,4])
print np.reshape(arrays,(-1,2))
print np.reshape(arrays,(-1,4))
print np.reshape(arrays,(2,-1))
print np.reshape(arrays,(4,-1))

結果：
[[1,2],[3,4]]
[[1,2,3,4]]
[[1,2],[3,4]]
[[1],[2],[3],[4]]

caffe - faster r-cnn（python）之路

釘釘打卡速度慢

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

2020-02-23目標檢測中各指標的理解

愛情這檔子事……

因爲心中有愛，所以我們才能走的更遠……

Hibernate工作原理及爲什麼要用？

環境變量path和classpath的區別

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結