前言
書要讀懂,先求不懂。 因爲很多人私信問我大數據應該讀什麼書比較好,所以小編特意找了二十本大數據實戰可依賴的書籍,想要轉職或者深入學習大數據的朋友可以注意了,點贊收藏加轉發,鼓勵一下小編的良苦用心
分享之前我還是要推薦下我自己創建的大數據學習交流Qun531629188
無論是大牛還是想轉行想學習的大學生
小編我都挺歡迎,今天的已經資訊上傳到羣文件,不定期分享乾貨,
包括我自己整理的一份最新的適合2018年學習的大數據教程,歡迎初學和進階中的小夥伴。
1、互聯網大規模數據挖掘與分佈式處理
作者:Jure Leskovec,Anand Rajaraman,Jeffrey David Ullman
譯者:王斌
書號:978-7-115-39525-2
定價:79
頁數:388
暢銷書全新升級,新增影響與同質性、社交媒體推薦和行爲分析等超實用內容
涵蓋解決數據挖掘核心問題所用算法,及實際應用數據挖掘所需知識,理論與實現並重
斯坦福大學數據挖掘方向專家Jure Leskovec、Anand Rajaraman、Jeffrey David Ullman重磅力作
http://www.ituring.com.cn/book/1561
2、數據挖掘導論(完整版)
作者:Jure Leskovec,Anand Rajaraman,Jeffrey David Ullman
譯者:範明 範宏建
書號:978-7-115-24100-9
定價:69
頁數:480
本書全面介紹了數據挖掘的理論和方法,旨在爲讀者提供將數據挖掘應用於實際問題所必需的知識。
本書涵蓋五個主題:數據、分類、關聯分析、聚類和異常檢測。除異常檢測外,每個主題都包含兩章:前面一章講述基本概念、代表性算法和評估技術,後面一章較深入地討論高級概念和算法。目的是使讀者在透徹地理解數據挖掘基礎的同時,還能瞭解更多重要的高級主題。此外,書中還提供了大量示例、圖表和習題。
http://www.ituring.com.cn/book/83
3、數據科學實戰
作者:Cathy O’Neil,Rachel Schutt
譯者:王羣鋒 馮凌秉
書號:978-7-115-38349-5
定價:69
頁數:312
英文原版數據挖掘和算法類暢銷書,隨機模型類No.1
谷歌、微軟、eBay數據科學家通過實際案例分享算法、方法與模型
MIT數學博士後Cathy O’Neil,前谷歌高級統計師、哥倫比亞大學講師Rachel Schutt力作
http://www.ituring.com.cn/book/1193
4、命令行中的數據科學
作者:Jeroen Janssens
譯者:王曉偉 劉峯
書號:978-7-115-39168-1
定價:49
頁數:188
本書講解衆多實用的命令行工具。無論使用Windows、OS X,還是Linux,都可以安裝包含80多個命令行工具的“數據科學工具箱”,迅速創建自己的數據分析環境。
http://www.ituring.com.cn/book/1539
5、重新設計互聯網
作者:徐立冰
書號:978-7-115-31150-4
定價:59.00
頁數:312
“彎曲評論”網站“撥雲見日”系列熱文加量10倍的強烈之書首次完整呈現。
雲計算時代,網絡面臨怎樣的挑戰?大數據之下,網絡設計應着眼何處?虛擬化的最後1000米你該如何衝刺?OpenFlow、FCoE、LISP、FabricPath、VN-Tag、VPLS、VXLAN
……當所有這一切結合到一起,你將面臨怎樣的情形?
是時候,重新設計互聯網。
通過閱讀本書,讀者將清楚地瞭解到如何在雲計算與大數據時代構建安全、可靠、高速與靈活的網絡。
http://www.ituring.com.cn/book/966
5、機器學習入門第一書
作者:杉山將
譯者:許永偉
書號:978-7-115-38802-5
定價:49
頁數:240
最簡單的機器學習入門書,187張圖輕鬆入門
覆蓋機器學習中最經典、用途最廣的算法
提供可執行的Matlab程序代碼
本書用豐富的圖示,從最小二乘法出發,對基於最小二乘法實現的各種機器學習算法進行了詳細的介紹。第Ⅰ部分介紹了機器學習領域的概況;第Ⅱ部分和第Ⅲ部分分別介紹了各種有監督的迴歸算法和分類算法;第Ⅳ部分介紹了各種無監督學習算法;第Ⅴ部分介紹了機器學習領域中的新興算法。書中大部分算法都有相應的MATLAB程序源代碼,可以用來進行簡單的測試。
http://www.ituring.com.cn/book/1371
7、機器學習系統設計
作者:Willi Richert,Luis Pedro Coelho
譯者:劉峯
書號:978-7-115-35682-6
定價:49
頁數:224
微軟Bing核心團隊成員推出
聚焦算法編寫和編程方式
結合大量實例學會解決實際問題
本書將向讀者展示如何從原始數據中發現模式,首先從Python與機器學習的關係講起,再介紹一些庫,然後就開始基於數據集進行比較正式的項目開發了,涉及建模、推薦及改進,以及聲音與圖像處理。通過流行的開源庫,我們可以掌握如何高效處理文本、圖片和聲音。同時,讀者也能掌握如何評估、比較和選擇適用的機器學習技術。
http://www.ituring.com.cn/book/1192
8、機器學習實戰
作者:Peter Harrington
譯者:李銳 李鵬等
書號:978-7-115-31795-7
定價:69
頁數:332
最暢銷機器學習圖書
介紹並實現機器學習的主流算法
面向日常任務的高效實戰內容
全書通過精心編排的實例,切入日常工作任務,摒棄學術化語言,利用高效的可複用Python代碼來闡釋如何處理統計數據,進行數據分析及可視化。通過各種實例,讀者可從中學會機器學習的核心算法,並能將其運用於一些策略性任務中,如分類、預測、推薦。另外,還可用它們來實現一些更高級的功能,如彙總和簡化等。
http://www.ituring.com.cn/book/1021
9、R語言入門
作者:Richard Cotton
譯者:劉軍
書號:978-7-115-35170-8
定價:69
頁:360
語言幽默,通俗易懂
完美講述R 核心組件
示例豐富,快學快用
“這本書讀起來感覺棒極了,示例完整清晰,內容通俗易懂,是目前市面上介紹R核心組件最優秀的圖書之一。”
——Rebecca Smith,TDX 公司分析經理
http://www.ituring.com.cn/book/1187
10、R語言實戰
作者:Robert I. Kabacoff
譯者:高濤 肖楠 陳鋼
書名:978-7-115-29990-1
定價:79
頁數:408
本書從解決實際問題入手,儘量跳脫統計學的理論闡述來討論R語言及其應用,講解清晰透澈,極具實用性。通讀本書,你將全面掌握使用R語言進行數據分析、數據挖掘的技巧,並領略大量探索和展示數據的圖形功能,從而更加高效地進行分析與溝通。
http://www.ituring.com.cn/book/857
11、Hadoop基礎教程
作者:Garry Turkington
譯者:張治起
書號:978-7-115-34133-4
定價:65
頁數:324
本書着重講解如何應用Hadoop和相關技術搭建工作系統並完成任務。本書從Hadoop的基本概念和初始設置入手,講述瞭如何開發Hadoop程序,如何在數據規模增長的時候維持系統運行,涵蓋有效使用Hadoop處理實際問題所需用到的全部知識。
http://www.ituring.com.cn/book/1168
12、Hadoop實戰
作者:Chuck Lam
譯者:韓冀中
書號:978-7-115-26448-0
定價:59
頁數:268
經典暢銷書,廣受讚譽
揭開雲計算的神祕面紗
深入分析,追本溯源
本書分爲3個部分,深入淺出地介紹了Hadoop框架、編寫和運行Hadoop數據處理程序所需的實踐技能及Hadoop之外更大的生態系統。
http://www.ituring.com.cn/book/733
13、Mahout實戰
作者:Sean Owen,Robin Anil等
譯者:韓冀中 吳海星 段菲
書號:978-7-115-34722-0
頁數:340
Apache基金會官方推薦
Mahout核心團隊權威力作
大數據時代機器學習的實戰經典
Mahout作爲Apache的開源機器學習項目,把推薦系統、分類和聚類等領域的核心算法濃縮到了可擴展的現成的庫中。使用Mahout可以在自己的項目中應用亞馬遜、Netflix等公司的機器學習技術。
http://www.ituring.com.cn/book/862
14、Storm源碼分析
作者:李明 王曉鵬
書號:978-7-115-37126-3
定價:79
頁數:484
微軟搜索技術部門高級研發工程師實戰經驗分享
從源代碼的角度深入剖析Storm設計與實現
學習如何實現和高效利用“實時的Hadoop”
“本書從源代碼角度深入淺出地分析了Storm的設計及實現,一方面可以使讀者更好地瞭解並用好Storm技術,另一方面可以讓讀者學習如何設計大規模分佈式系統,相信讀者一定會受益匪淺。”
——於偉,微軟資深開發總監
http://www.ituring.com.cn/book/1507
15、Elasticsearch服務器開發
作者:Rafal Kuc,Marek Rogozinski
譯者:蔡建斌
書號:978-7-115-38032-6
定價:59
頁數:292
Elasticsearch百科全書式著作,用戶權威指南
所有示例和功能基於Elasticsearch服務器1.0版
在雲計算平臺上建立穩定、可靠、方便快速的實時搜索技術
Elasticsearch是一個基於Lucene構建的開源、分佈式、RESTful風格的搜索引擎。它被設計用於雲計算中,具有實時搜索、穩定、快速、安裝使用方便等優點。本書是關於Elasticsearch的百科全書式著作,介紹了Elasticsearch這個優秀的全文檢索和分析引擎從安裝和配置到集羣管理的方方面面知識。
http://www.ituring.com.cn/book/1447
16、Openstack部署實踐
作者:張子凡
書號:978-7-115-34679-7
定價:59
頁數:284
從研究D版以來,我在各個羣中回答了很多新手在OpenStack系統安裝部署方面碰到的各類問題,雖然在博客中公佈了很多,但仍比較零散,我也一直盼望能有一本較爲系統的書給新手提供幫助。看到本書後我非常高興,對於OpenStack初學者和在公司內使用OpenStack部署私有云的系統運維工程師來說,此書將會幫助大家解決很多問題,同時更有助於大家靈活地運用OpenStack系統。
——北京-YZ(博客http://www.xiaoyinzei.com),
KVM虛擬化羣羣主(93146027)
一線高手實踐總結
實例講解使用OpenStack建設企業私有云系統
有效降低企業IT 成本
http://www.ituring.com.cn/book/1356
17、Docker開發實踐
作者:曾金龍,肖新華,劉清
書號:978-7-115-39519-1
定價:59
頁數292
出自國內最強雲加速+ 雲存儲“迅雷雲”團隊
基礎篇:原理、操作全面解析;案例篇:帶你一步步構建複雜應用;高級篇:網絡、安全、API 實戰、kubernetes集羣實戰
“騰訊的互娛的開發節奏,只有Docker跟得上!如果你想你的團隊加快開發速度,那麼我推薦你使用Docker,而本書從基礎、案例到高級話題,都有很全面的覆蓋。”
——易劍,騰訊互動娛樂事業羣高級架構師
http://www.ituring.com.cn/book/1631
18、非技術讀本 《精益數據分析》
作者:Alistair Croll, Benjamin Yoskovitz
書號:978-7-115-37476-9
定價:79
頁數:356
精益系列叢書,《精益創業》作者埃裏克·萊斯主編
本書圍繞精益創業展開討論,融合了精益創業法、客戶開發、商業模式畫布和敏捷/持續集成的精華。本書匯聚了100多位創始人、投資人、內部創業者和創新者的成功創業經驗,呈現了30多個極具價值的案例分析,可以爲各階段的創業者提供行爲準則。
http://www.ituring.com.cn/book/1125
19、非技術讀本《大數據的衝擊》
作者:城田真琴
譯者:周自恆
書號:978-7-115-31787-2
定價:49
頁數:268
本書是日本最暢銷的大數據商業應用指南。書中結合野村綜合研究獨家披露的調查數據,網羅了美國、日本標杆企業與政府的應用案例,總結了大數據的商業模式,以及在大數據應用中需要注意的隱私問題,並就如何爲大數據時代做好準備展開了深入的探討,提出了諸多有益的建議。
http://www.ituring.com.cn/book/1128
20、非技術讀本《有趣的統計》
作者:Bruce Frey
譯者:鄒澍
書號:978-7-115-35621-5
定價:59
頁數:292
本書介紹的實用技巧運用了統計學原理,還借鑑了教育學和心理學上的測量和實驗研究方法。這些技巧可以幫你解決商業、遊戲以及日常生活中的各類問題。利用統計推斷的各種工具,揭開概率的神祕面紗、發現相關性,預測事件。
http://www.ituring.com.cn/book/1094