圖像識別中卷積神經網絡“卷積”的作用

原創

2020-06-22 09:25

1、單一的像素點包含的信息是無意義的
2、人在看一個畫面時，不會是一眼就能獲取所有信息的，而是通過聚焦中心，確定感受野，通過不斷調整聚焦中心位置，放大、縮小感受野，從而獲得源源不斷的圖片信息（聚焦中心點和感受野的確定，是要有算法優化的，否則會增加耗時）
3、2中優化的方式是通過對某一聚焦中心點、感受野“卷積”來確定的，是否需要優化，以何種方式優化，在判斷之前就需要確定一個卷積的方式——即卷積核（像素長寬、核數字）
4、人在看東西的時候，是有記憶的，我們瞬間的視野比例大約爲16：9，但是如果有東西超出了這個比例時，我們會進行“追蹤”，比如通過連續的輪廓、色彩等，追蹤後，在我們的記憶中產生了一個完整的物體，我們再對這個物體使用特定的卷積核去進行判斷屬於什麼物體
4、一個畫面一旦進入人類視野時，人類馬上就會調用一種卷積核去判斷，我把它稱爲“初判卷積核”，它的作用就是初步確定，這個物體可能是什麼，然後接下來去調用可能的物體的卷積核去進一步判斷，通過局部掃描的方式，去逐步確認，其間，也是可以根據實時掃描得到的結果更換卷積核的
5、像素點只有組合起來，它纔是有信息量的
6、不論是整體特徵還是局部特徵，都是需要用卷積核去提取的（整體還是局部，只是一個泛的概念，正確的描述應爲卷積核的大小）
7、cnn的缺陷？
8、人眼是基於三維成像的，像素的縱深在某一程度上也輔助了識別，是否能將帶有深度功能的攝像頭採集的深度圖（包含每個像素點距離觀察點的縱深），與RGB圖共同加入訓練？

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

圖像識別中卷積神經網絡“卷積”的作用

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

【今日頭條】頭條官方的推薦機制解碼

python numpy 向下取整，向上取整 np.floor()、np.ceil()

圖像處理中“灰度級數”是什麼？（灰度值）（位深度）（1bit=1位）

圖像變清晰圖像放大提高分辨率提高清晰度

【放置奇兵】tips（神聖傷害）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結