11本商業智能、數據挖掘相關的書

 

1:《SQL Server 2008商業智能完美解決方案》,對商業智能做了一個概括的介紹。個人看法比較適合於已經熟悉微軟商業智能原理與實現的人閱讀,比如熟悉sql server 2005商業智能實現的人可以瞭解一下2008下的情況。不熟悉的人通過這本書可以瞭解商業智能的基礎理論。涉及到具體的操作,書中雖然有許多截圖,但是不夠詳細,沒法用這本書來學習具體的操作。個人看法這本書要麼再詳細一些,要麼再簡略一些,都會比現在要好。

2:《數據挖掘導論(完整版)》是國外大學的教材,看譯者序許多國內高線也用它作爲教材。因此這本書講原理比較多。比較透徹,充滿了數學符號和公式。詳細講述了分類、關聯分析、聚類分析三種數據挖掘算法的原理。我發現有些數據挖掘的參數在微軟的幫助文檔中沒說明白,看這本書說的比較清楚。我想看的是能指導實際的數據挖掘操作的書,因此對書中的公式基本跳過。只看了看書中講到的算法解決的各種問題及其思路。

3:《數據挖掘原理與應用(第2版)》,講解Excel2007的數據挖掘插件做數據挖掘的部分不錯,後面講數據挖掘的各種算法,詳細列出了各種參數和DMX腳本,但是沒有透徹的講解,給我的感覺就像微軟的bookonline,適合作爲工具書去查閱,但是不適合作爲入門書去閱讀。書的最後部分給出了用.net實現數據挖掘編程的例子,應該還可以實例代碼在實際項目中做參考。

4:《精通sql server 2008程序設計》,全書分了四個部分,第四部分講商業智能。限於篇幅問題在數據挖掘方面只講了一種算法(聚類分析)的實現,如果想了解商業智能與數據挖掘,這本書也不夠實用。

5:《智能Web算法》:所謂智能web,書中是指能根據用戶在網站的行爲作出針對用戶的響應的網站。常見的應用就是推薦系統。另外作者認爲google的搜索也是智能web的例子。

書中討論了Google搜索原理、推薦系統原理、聚類算法、分類算法。本書附有Java實現書中算法的源代碼,書中有不少篇幅是針對源代碼講算法。讀者也可以使用源代碼做測試。當然作者聲明給出的代碼都是經過刻意簡化,目的是爲了讓讀者快速明白算法的基本原理。

感覺本書的翻譯還比較專業,讀起來比較流暢。

值得誇一誇的是本書的印刷用紙。不知道業內名詞,但是書拿在手裏明顯比同體積的書要輕,感覺很舒服。我在amazon.com上買過幾本美國出的書,也是感覺明顯比較輕。

6:《深入淺出數據分析》:深入不夠,淺出做的不錯。適合技術人員與業務人員作爲統計學入門讀物來閱讀

《深入淺出數據分析》是美國O’REILLY出版社的“深入淺出”系列之一。這個系列的特點是花了不少心思琢磨如何讓讀者更舒服地閱讀、記住書中更多內容,書雖然都比較厚,但是插圖非常多。插圖與正文經常混在一起,沒有明顯的界限。讀起來確實比較輕鬆,相對文字多圖少的書來說,也確實更容易記住書中的內容。由於圖多字少,讀起來很快,也能讓人感覺比較有成就感。不過這個系列的書都比較貴。

這本書的主要內容我認爲是統計學入門。不懂技術但是用過excel的人就可以看。講了講統計學的基本概念和貝葉斯統計、直方圖、迴歸、誤差等概念,使用了excel和一個專門的統計工具R做演示。作者比較推薦R。因爲這個工具在統計學應用方面比excel更靈活。是一個開源軟件,還有相關的社區在爲這個軟件不停的增加功能。

7:《可視化數據》專講Process這個軟件的使用,網絡書店對這本書的介紹都提及了這個問題。對這個軟件不感興趣的就不用買了。我買的時候沒注意到網頁上介紹,看的時候才發現。書中充斥着process的代碼。沒有學習和使用process的計劃,因此也就大概翻了翻,看看process解決的問題及其思路。

8:《業務建模與數據挖掘》是05年出版的。與《數據模型資源手冊》捲一捲二同屬機械工業出版社的數據庫技術系列叢書。後者早就賣光了,這本書還有。看來還是比較冷僻。翻譯同樣的比較專業。同樣是偏學術性的。不過作爲專業書來說,公式、圖表偏少。個人看法想研究具體的數據挖掘算法可以看《數據挖掘導論(完整版)》。

9:《數據之美》:概括描述了20個數據挖掘、數據可視化、雲存儲及其他數據處理相關項目

這本書相對來說還算比較新,是從英文版翻譯過來的。英文版2009年出版。中文版2010年10月出版。由20篇相互獨立的文章組成。每篇講一個數據處理相關的項目。不涉及具體的技術細節,僅僅是概括說明原理、思路、過程、結果。

總體來說,閱讀起來有點晦澀。感覺作者基本都明白英文版的意思,不過有些地方中文表達上不夠通順。這在IT業的翻譯書中已經算不錯的組合了,強過中文過關但是不懂技術的情況。

10:《超級數字天才》講數據挖掘給人類帶來的好處。比較詳細,給出了具體的例子和實現的思路。書中列也在使用“數據分析”這個詞,基本也在指“數據挖掘”。書中列舉了數據挖掘在政府政策、教育、醫療等許多方面的實際應用的例子,都比較有意思。想了解數據挖掘的具體應用,可以看看這本書。

書中給我印象比較深刻的是例子中政府與教育行業的數據挖掘應用。一項政策的好壞,一個教育方法的好壞,美國人都試圖用數據說話。

11:《數據分析競爭法》是商務印書館的哈佛經管系列之一,名頭比較大,先看它。不過有些失望。不是給技術人員看的。題目中的數據分析大約是說商業智能中的數據挖掘。作者把企業利用數據挖掘的程度分爲由低到高的五級。全書反覆論述每個級別的方法、工具、流程、對企業的好處,還舉了一些的例子。在我看來這些例子不夠詳細,太籠統。所以我認爲這本書適合於不瞭解商業智能與數據挖掘的管理人員閱讀。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章