計算機視覺經典書籍推薦

計算機視覺是人工智能的一個分支,主要研究如何使機器“看”的科學,通俗來說就是用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成爲更適合人眼觀察或傳送給儀器檢測的圖像。

無人機技術領域關於計算機視覺的應用也產生了不少優秀案例,如何更好的學習或深入計算機視覺呢?阿木實驗室今天就爲大家推薦一些計算機視覺值得閱讀的經典書籍。

一、綜合篇

1.《計算機視覺:算法與應用》   

 作者:Richard Szeliski

計算機視覺技術的初學者(本科生)提供了廣泛的標準計算機視覺問題的堅實基礎。這本書是由理查德根據他多年在華盛頓大學教授這一課題的經驗編寫的。具體課題包括:成像,圖像處理,特徵檢測、匹配與分割,基於特徵的對齊,基於運動的結構重建,圖像粘貼,計算攝影學,立體對齊,三維重建,基於圖像的繪製和識別等等。作者也提供了計算機視覺算法涉及到的線性代數、數值優化技術、貝葉斯建模與推理。

2.《計算機視覺:一種現代方法》

作者: 福賽斯(David A. Forsyth)/泊斯(Jean Ponce)

本書內容涉及幾何攝像模型、光照和着色、色彩、線性濾波、局部圖像特徵、紋理、立體相對、運動結構、聚類分割、組合與模型擬合、追蹤、配準、平滑表面與骨架、距離數據、圖像分類、對象檢測與識別、基於圖像的建模與渲染、人形研究、圖像搜索與檢索、優化技術等內容。

二、幾何篇

1.《計算機視覺中的多視圖幾何》

作者:Richard Hartley/Andrew Zisserman

用於理解真實世界的三維結構是計算機視覺領域的一個基本問題。內容包括三維幾何與重建所需要的計算相關的幾何原則及物體的代數表達。本書以統一框架的形式給出了場景重建的理論與實現細節。同時作者也提供了詳盡的背景知識、應用和實現算法的解釋。

2.《An Invitation to 3-D Vision》

作者: Yi Ma / Stefano Soatto / Jana Kosecká / S. Shankar Sastry

本書着重講述了計算機視覺中的重要問題:利用線性代數和矩陣理論從一系列二維圖像中重建三維結構和運動。本書的特點是一套基於多幅圖像的研究幾何和重建幾何模型的統一框架,也包括了圖像形成、基本的圖像處理方法以及特徵提取等內容,同時也給出實現視覺算法及系統的操作指南。

3.《計算機視覺:計算理論與算法基礎》 

作者:馬頌德,張正友

本書闡述計算機視覺從信息處理的層次研究視覺信息的認知過程,以及視覺信息處理的計算理論、表達與計算方法。本書系統地介紹了計算機視覺的重要理論與算法,包括圖像特徵提取、攝像機定標、立體視覺、運動視覺(或稱序列圖像分析)、由圖像灰度恢復三維物體形狀的方法、物體建模與識別方法以及距離圖像分析方法等。

三、OpenCV 篇

1.《Learning OpenCV 3》

作者: Adrian Kaehler / Gary Bradski

這本書的重點是教你如何使用opencv庫,也許是首屈一指的開源計算機視覺庫。所有的代碼示例都在C++中,這表明目標受衆是專業的開發人員,他們想學習如何將計算機視覺應用到他們的項目中。

2.《OpenCV 教程》

作者: 劉瑞禎 / 於仕琪

本書是國內第一本全面介紹OpenCV的中文版圖書,對OpenCV開放源代碼計算機視覺庫進行了詳細講解。OpenCV由一系列 C函數和C++類構成,功能涵蓋圖像處理、計算機視覺和模式識別等領域。OpenCV實現了大量通用算法,涉及到圖像處理、結構分析、運動檢測、攝像機定標、三維重建以及機器學習等方面,並有較高的運行效率。書中所有實例均提供C/C++語言的源代碼。

四、圖像處理以及模式識別

1.《數字圖像處理》

作者:岡薩雷斯,阮秋琦(譯)

本書共12章,即緒論、數字圖像基礎、灰度變換與空間濾波、頻率域濾波、圖像復原與重建、彩色圖像處理、小波和多分辨率處理等。

2.《模式識別》 

作者:邊肇琪,張學工

本教材系統地討論了模式識別的基本概念和代表性方法,包括監督模式識別中的貝葉斯決策理論、概率密度函數的估計、線性判別函數、非線性判別函數、近鄰法、特徵選擇與提取的典型方法以及非監督模式識別中的基於模型的方法、混合密度估計、動態聚類方法、分級聚類方法等,並在相應章節包括了人工神經網絡、支持向量機、決策樹與隨機森林、羅傑斯特迴歸、B00sting方法、模糊模式識別等較新進入模式識別領域的內容。整體內容安排力求系統性和實用性,並覆蓋部分當前研究前沿。

3.《模式分類》 

作者:Richard O. Duda

模式識別和場景分析領域奠基性的經典名著。主要講解統計模式識別和結構模式識別,以及許多近25年來的新理論和新方法,其中包括神經網絡、機器學習、數據挖掘、進化計算、不變量理論、隱馬爾可夫模型、統計學習理論和支持向量機等。

五、機器學習篇

1.《Computer Vision: Models, Learning, and Inference》

作者:Simon J.D. Prince

本書介紹瞭解決計算機視覺問題的概率模型學習與推理的方法,講述瞭如何利用訓練數據建立觀察圖像和要估計的內容的聯繫,例如估計三維結構。本書包括概率基礎知識、概率圖模型、圖分割方法、多視覺幾何、相機標定、人臉識別、目標跟蹤等等。書中共介紹了70多種算法。

2.《Pattern Recognition and Machine Learning》 

作者:Christopher Bishop

本書是第一本從貝葉斯的角度講述模式識別,用圖模型的方式描述離散概率分佈的書籍。內容包括:線性迴歸模型、線性分類模型、神經網絡、核方法、稀疏核方法、圖模型、混合模型與期望最大化算法、近似推理、採樣方法、連續隱變量模型等。

3.《深度學習》 

作者:Ian Goodfellow and Yoshua Bengio and Aaron Courville

本書包括三大部分,第一部分介紹了基本的數學工具和機器學習概念,第二部分描述了最著名的深度學習算法,第三部分列舉了深度學習研究前沿的想法及問題。

4.《Generalized Principal Component Analysis》

作者:RenéVidal, Yi Ma, Shankar Sastry

本書介紹了關於從一個或多個子空間或流形產生出來的,可能含有噪聲、大誤差或者異常的高維數據建模的數學理論和計算工作的最新進展,涵蓋了用於子空間估計和分割的最新的代數的、幾何的、統計的計算方法,並且給出了若干在圖像處理、圖像視頻分割、人臉識別與聚類等問題的有趣應用。

微信公衆號關注《阿木實驗室》獲取更多無人機技術乾貨,關注《阿木社區》獲取更多學習課程信息。
社區論壇地址:bbs.amovauto.com 參與討論。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章