機器學習/數據挖掘學習資源

機器學習/數據挖掘學習資源

想學的東西太多,擁有的時間太少,花點時間把要學的資源整理一下,再慢慢來


Python 基礎篇

書籍

  • 《Python for Informatics》: 這是一本python的入門書,淺顯易懂,書也很薄。最重要的是,它是一本開源的書,其pdf版本可以免費下載使用。翻譯版排版很不好,英文原版沒有這個問題。它使用的python版本是python2.x
  • 《Learning Python》(譯名:《Python學習手冊》):這本書是一本翔實的介紹python基礎語法細節的書,很多例子都可以用來作爲練習,習題量較少。它涵蓋了python2.x和python3.x,而且在書中多處進行了對比說明
  • 《Programming Python》(譯名:《Python編程》):與上一本書是同一系列,不過更加偏向Python的實際應用(比如數據庫,圖形界面,網絡編程),分上下兩冊
  • 《Python Pocket Reference》:這本書國內好像沒有譯本,和上兩本屬同一系列,是一本很薄的小冊子,用作語法參考
  • 《Data Structure and Algorithms Using Python》:同學推薦,與python本身的關係可能不大,主要講數據結構和算法,如果看倦了Java/C like類的算法書的可以看看這個

公開課

  • Cousera:密歇根大學的《零基礎 Python 入門》系列課程,部分內容是基於《Python for Informatics》這本書的,可以免費聽每一門課
  • 中國大學MOOC:哈工大的《高級語言程序設計(Python)》,不喜歡英語的可以通過這門課入門,順便學習一下Spyder這個IDE

Python 專項篇

下面所列的課程或書籍不代表比上面的難,只是更專門針對某個方面,需要一定的python基礎(僅僅是一定的python基礎,完全不需要啃完Oreilly那一個系列)

書籍

  • 《Building Machine Learning System With Python》(譯名:《機器學習系統設計》:還沒看,挖個坑,以後再填
  • 《Machine Learning in Action》(譯名:《機器學習實戰》):簡單介紹了一些常用的算法和一些例子的python實現(不是調sklearn包,而是直接實現),不是很詳細,可以作爲大略瞭解某種算法思想的書來看看
  • 《Scipy Lecture Notes》:生動詳細介紹了Numpy,Scipy的基本功能和高級功能,也介紹了一些Scikit-learn等一些包。文檔開源,製作精良,強烈推薦
  • 《Pandas:powerful Python dada analysis toolkit》:python數據分析包pandas的官方文檔,比較實用

機器學習/數據挖掘篇

書籍

  • 《機器學習》——周志華:國內機器學習第一人,目前還沒看這本書,聽過他的講座,還是不錯的
  • 《Pattern Classification》(譯名:《模式分類》):周志華組裏的一位學長推薦的書,數學證明較多,主要偏向模式分類這個具體的方向
  • 《統計學習方法》——李航:另一位大牛學長推薦,目前也還沒看,以後再來填坑

公開課

  • Coursera: 斯坦福大學的《Machine Learning》:五星推薦的入門課程,Prof. Andrew Ng 講得十分生動仔細,不需要太高數學水平,涵蓋了許多機器學習方面的內容。課後作業一定要做,對加深理解很有幫助,有時間還可以再回放一遍,整理一下
  • Coursera: 斯坦福大學的《Probabilistic Graphical Models》:還沒上,以後再填坑
  • Coursera: 伊利諾伊大學香檳分校的《數據挖掘專項課程》:還沒上完,以後再填坑

其他

Stackoverflow : 越來越覺得這個論壇的強大
Quora : 國外的知乎
Scikitlearn:Python機器學習包的官網,有很多例子和大量的API文檔

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章