【TensorFlow】tf.nn.max_pool實現池化操作

原創

xf__mao

2020-02-21 16:05

max pooling是CNN當中的最大值池化操作，其實用法和卷積很類似

有些地方可以從卷積去參考【TensorFlow】tf.nn.conv2d是怎樣實現卷積的？

`tf.nn.max_pool(value, ksize, strides, padding, name=None)`

參數是四個，和卷積很類似：

第一個參數value：需要池化的輸入，一般池化層接在卷積層後面，所以輸入通常是feature map，依然是[batch, height, width, channels]這樣的shape

第二個參數ksize：池化窗口的大小，取一個四維向量，一般是[1, height, width, 1]，因爲我們不想在batch和channels上做池化，所以這兩個維度設爲了1

第三個參數strides：和卷積類似，窗口在每一個維度上滑動的步長，一般也是[1, stride,stride, 1]

第四個參數padding：和卷積類似，可以取'VALID' 或者'SAME'

返回一個Tensor，類型不變，shape仍然是[batch, height, width, channels]這種形式

示例源碼：

假設有這樣一張圖，雙通道

第一個通道：

第二個通道：

用程序去做最大值池化：

import tensorflow as tf

a=tf.constant([
        [[1.0,2.0,3.0,4.0],
        [5.0,6.0,7.0,8.0],
        [8.0,7.0,6.0,5.0],
        [4.0,3.0,2.0,1.0]],
        [[4.0,3.0,2.0,1.0],
         [8.0,7.0,6.0,5.0],
         [1.0,2.0,3.0,4.0],
         [5.0,6.0,7.0,8.0]]
    ])

a=tf.reshape(a,[1,4,4,2])

pooling=tf.nn.max_pool(a,[1,2,2,1],[1,1,1,1],padding='VALID')
with tf.Session() as sess:
    print("image:")
    image=sess.run(a)
    print (image)
    print("reslut:")
    result=sess.run(pooling)
    print (result)

這裏步長爲1，窗口大小2×2，輸出結果：

image:
[[[[ 1.  2.]
   [ 3.  4.]
   [ 5.  6.]
   [ 7.  8.]]

  [[ 8.  7.]
   [ 6.  5.]
   [ 4.  3.]
   [ 2.  1.]]

  [[ 4.  3.]
   [ 2.  1.]
   [ 8.  7.]
   [ 6.  5.]]

  [[ 1.  2.]
   [ 3.  4.]
   [ 5.  6.]
   [ 7.  8.]]]]
reslut:
[[[[ 8.  7.]
   [ 6.  6.]
   [ 7.  8.]]

  [[ 8.  7.]
   [ 8.  7.]
   [ 8.  7.]]

  [[ 4.  4.]
   [ 8.  7.]
   [ 8.  8.]]]]

池化後的圖就是：

證明了程序的結果是正確的。

我們還可以改變步長

pooling=tf.nn.max_pool(a,[1,2,2,1],[1,2,2,1],padding='VALID')

最後的result就變成：

reslut:
[[[[ 8.  7.]
   [ 7.  8.]]

  [[ 4.  4.]
   [ 8.  8.]]]]

xf__mao

發佈了45 篇原創文章 · 獲贊 387 · 訪問量 84萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【TensorFlow】tf.nn.max_pool實現池化操作

`tf.nn.max_pool(value, ksize, strides, padding, name=None)`

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

2020年上半年數據庫系統工程師考試

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

【深度學習】論文導讀：GoogLeNet模型，Inception結構網絡簡化（Going deeper with convolutions）

Unity中簡單的優化物理系統

【深度學習】論文導讀：google的批正則方法（Batch Normalization: Accelerating Deep Network Training by Reducing...）

Direct3D補充篇：表面緩衝區技術實現動畫的流暢顯示

對於隨機森林的通俗理解

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結