近年來,人工智能非常火熱,幾乎涉及到了生活中的方方面面:語音識別、人臉檢測、自然語言處理、數據挖掘、推薦系統、遊戲、智能機器人、智能醫療、智慧城市等等。
機器學習算法是人工智能的核心,是使得計算機系統具有智能的根本途徑,賦予計算機推理、學習和解決問題的能力。
可見進入AI領域,機器學習技能就是敲門磚,那麼新手該如何入門機器學習、數據挖掘領域呢?正所謂要想建高樓,得先打好地基,機器學習算法涉及到數學、統計學、概率論、最優化理論等各種知識,希望同學們能靜下心來,多研究學習機器學習的基礎原理,領會機器學習算法的思想,下面強烈推薦三本適合新手入門的書籍!!!
機器學習領域的西瓜書:《機器學習》
作者是機器學習與數據挖掘研究所(LAMDA)所長周志華教授,出版社爲清華大學出版社。
該書詳細講解了機器學習的基礎理論概念,包括:模型選擇和評估、線性模型、決策樹、神經網絡、SVM、貝葉斯分類器、EM算法、集成學習、聚類、降維、概率圖模型(HMM,CRF)等知識點。
該書有一個別名叫《西瓜書》,源於書中多次藉助於西瓜舉例,以便更形象地闡述。《機器學習》是新手入門機器學習領域的必讀書籍,介紹了機器學習領域應用到的各種基礎的機器學習算法及原理,涉及到不少統計、概率論、計算理論、矩陣論、運籌優化等數學推導,建議有一定數學基礎的同學或是機器學習愛好者閱讀。
機器學習的統計學基礎:《統計學習方法》
作者是李航教授,出版社爲清華大學出版社。
該書詳細講解了機器學習的統計學理論,全書分爲監督學習算法和無監督學習算法兩大部分,監督學習部分包括:感知機、K近鄰、樸素貝葉斯、決策樹、logisitic迴歸、SVM、集成學習、EM、HMM、CRF。無監督學習部分包括:聚類、奇異值分解、PCA、LSA(潛在語義分析)、MCMC(馬爾科夫蒙特卡洛法)、LDA(潛在狄利克雷分配)等。該書的數學公式較多,各算法的總結非常到位。讀者可以重點關注各種算法的損失函數、學習訓練方法、預測方法。
該書對每個知識點都詳細闡述,對算法的數學推導過程講解地非常詳細清楚,讓讀者對各種機器學習算法背後設計的統計學、概率論原理有個清楚的理解,收益頗豐。
機器學習的數學基礎:《數學之美》
作者是吳軍博士,出版社爲人民郵電出版社。
該書運用多個淺顯易懂的故事講述了機器學習、自然語言處理領域相關的基礎知識,包括:統計語言模型、中文分詞、HMM、信息論、最大熵模型、貝葉斯網絡、CRF、維特比算法、EM算法、logisit迴歸、大數據等知識。
同時,該書教會讀者如何在實際中運用數學知識化繁爲簡,跳出固有思維,多思考,多創新。