【轉】學習R語言超強資源

#學習 R 的方法


知識和耐心,是成爲強者的唯一方法。

- 通過閱讀來學習。
包括了閱讀經典的教材、代碼、論文、學習公開課。
- 通過牛人來學習。
包括同行的聚會、討論、大牛的博客、微博、twitter、RSS。
- 通過練習來學習。
包括代碼練習題、參加kaggle比賽、解決實際工作中的難題。
- 通過分享來學習。
包括自己寫筆記、寫博客、寫書、翻譯書,和同伴分享交流、培訓新人。


#閱讀清單#


一、初學入門:
《R in Action》
從統計角度入手,分高中低三部分由淺入深的講解了如何用R來實現統計分析。

《The Art of_R Programming》
從程序編寫的角度入手,對R的本身特點進行了清晰的介紹。

《learning R》
這本書沒有單純的講語法,而是和數據分析的流程結合了起來,從數據獲取到數據整理再到分析和報告,有一氣呵成的感覺,此外最後兩章講如何寫穩健的R代碼以及寫包都是非常精彩的。


二、統計進階:
《A Handbook of Statistical Analyses_Using_R》
《Modern Applied Statistics With S》

這兩本書基本上涵蓋了統計的一些高階內容,例如多元分析、多層迴歸模型、薈萃分析、生存分析等內容。案例豐富,公式不多,值得反覆學習參考。


三、科學計算:
《Introduction to Scientific Programming and Simulation Using R》
《Mastering Scientific Computing with R》

除了統計分析外,獨特之處在於使用R來做數值分析,如求根,最優化,數值積分。還包括了一些常見的模擬技術。書後的習題和最後的案例非常有用。


四、數據挖掘:
《Practical Data Science with R》
以R本身的擴展包和函數入手,很有體系的介紹了數據科學的各個方面。

《An Introduction to Statistical Learning》這本書可以說是另一本數據挖掘大作《The Elements of Statistical Learning》的R實現手冊,體系結構基本一致,更強調用R來實現,更難得的地方是提供了很好的習題。

《Data Mining with R Learning with Case Studies》
《Machine Learning for Hackers》

兩本側重於數據挖掘的R書,全是以案例爲線索,示範的代碼量很大。跟一遍下來會有很大的收穫。

《Data Mining explain using R》
用基本函數來實現各種機器學習算法,對理解算法底層很有幫助。

《Data Science in R》
以案例爲主的書,需要一定的數據挖掘基礎。


五、數據繪圖:
《ggplot2 Elegant Graphics for Data Analysis》
ggplot2還有什麼好說的呢,R中最優秀的繪圖包,但由於近期該包升級很快,這書顯得有些過時。好在中文版進行了大幅更新,即將面世。

《R Graphics Cookbook》這本書也是RStudio公司的人出的,似乎是Hadley的學生吧,主要是各種ggplot2包的例子,也包括了用其它包來畫圖,建議通讀一遍。


六、參考手冊:
《R Cookbook》
《R in a Nutshell》

有時候我們需要類似詞典的案頭參考手冊,以方便隨時查閱。又或者可以通讀一遍以查漏補缺。上面兩本書雖然有些厚度,但仍然推薦之。後者的中文版也在翻譯狀態。


七、高級編程:
《R Programming for Bioinformatics》
《software for data analysis programming with R》

如果你是初學者,不要去看上面兩本書。如果你想進階爲專家級R用戶,那你需要精讀它們。前者講解了R少爲人知的一面,例如字符處理、正則表達和XML,還有報錯處理以及與其它語言的交互。後者更是編寫生產級代碼的聖經指南。


《Advanced R programming》Hadley的力作,清楚的講解了R的函數式編程思想和寫R包的各種細節,要邁入R高手,不得不讀。

李艦和肖凱的作品《數據科學中的R語言》(六月份出版)


#閱讀建議#


- 在閱讀時做筆記,以記下一些重點或心得
- 在閱讀代碼時,要在 R 環境中親手鍵入代碼並理解其意義
- 堅持練習,嘗試利用身邊的數據進行應用分析
- 理解擴展包和函數背後的原理(引用論文?glm)


#網絡資源#


- [R語言官方站](http://www.r-project.org/)
- [R-blogger](http://www.r-bloggers.com/)
- [R語言資源彙總](https://github.com/qinwf/awesome-R)
- [R語言搜索引擎](http://www.rseek.org/)
- [R函數在線幫助](http://www.rdocumentation.org/)
- [關於R的問答網站](http://stackoverflow.com/questions/tagged/r)
- [一個入門級的R在線教程](http://tryr.codeschool.com/)
- [交互式的R在線教程](https://www.datacamp.com)
- [統計之都](http://cos.name/)
- [我的博客](http://xccds1977.blogspot.com)
- [美國計算機世界雜誌提供的R語言初學者入門資料](http://www.computerworld.com/s/article/9239625/Beginner_s_guide_to_R_Introduction)
- 各種cheatsheet
http://cran.r-project.org/doc/contrib/Short-refcard.pdf
http://www.rstudio.com/resources/cheatsheets/


#視頻資源#


- [Google Developers' Intro to R](http://www.youtube.com/watch?v=iffR3fWv4xw&list=PLOU2XLYxmsIK9qQfztXeybpHvru-TrqAP)
- [Twotorials](http://www.twotorials.com/)
- [Coursera]
-《真實數據分析師》之R語言系列(http://study.163.com/course/introduction/967017.htm )


#練習清單#


- Euler Project
https://projecteuler.net/


- kaggle
http://www.kaggle.com/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章