讀的一些感想



第一次聽說<<大數據時代>>這本書,是在網上看到的央視搞的一個2013中國好書評選活動推薦的25本“中國好書”的榜單中看到的。然後迅速上豆瓣上查看了一下對該書的評價,一看非常高,再加上央視的推薦是從2013在中國出版的40冊圖書中選出25本,可以說是精華了。果斷定了一本,花了三天時間讀完了。


大數據這個名詞或者說概念從被提出開始,經過短短几年的發展,已經傳的沸沸揚揚了,經常見諸媒體上。好像哪家媒體的科技板塊每天不弄一些這樣的新聞條,它就顯得不夠檔次一樣。這是一個我們耳熟能詳的概念,聽得多了,有時候都顯得有點麻木了。我經常上網看一些分析師的文章,各種分析,我總結了一下大致上都是在微觀層面上說事,而且都是細枝末節的事,直到出現了<<大數據時代>>這本書。<<大數據時代>>不像一般的分析文章的碎碎念,而是從宏觀層面上來分析大數據對我們社會的各個方面的影響,是一本值得閱讀的好書。(有點打廣告的嫌疑好~~哈哈)


從哲學家的角度來看這個世界是物質的世界,從計算機科學家的角度來看這個世界,這個世界是bit的世界,而且發展到現在這個時候,這個世界已經是流動的bit世界了。因此從根本上來說這個世界的本質是數據。物質世界的這種特性,不是一開始就被人們所認識的。工業革命把這個社會分成了兩個階段,第一個階段可以叫做靜止的世界(指工業革命前的世界),第二個階段叫做動態的世界(指工業革命後的世界)。工業革命前,人類的社會積累的數據是有限的,到了動態的社會,隨着電氣化信息化的到來,社會越來越動態,而這種動態加劇了人類生產數據,更重要的是有了相關的技術來記錄這些數據。由此出現了一個大數據的時代。


就像這本書的一篇序言裏講的一樣,大數據的發展核心動力來源於人類測量 記錄 分析世界的渴望。從古至今,人類永遠對未知充滿恐懼,迫切想知道下一刻會發生什麼。而大數據恰恰可以滿足人們這方面的需求,把未來的不確定性通過預測變成“確定性”,然後呈現給人看,至於這個確定性有多大的真實性,我相信技術能解決這個問題,這也就是大數據的價值和未來在社會中的作用,滿足人們對未知渴望瞭解的心理。


文中的一個令人印象深刻的觀點是大數據時代,相關關係將取代因果關係,或者說相關關係更重要,而因果關係已經不那麼重要了。對於此觀點四川電子科技大學教授周濤(中國最年輕的的大學教授,大牛呀~~,有關他的傳奇經歷大家可以網上扒一下)認爲從大處講,放棄對因果性的追求,就是放棄了人類凌駕於計算機智商的智力優勢,是人類自身的放縱和墮落。如果未來某一天機器和計算完全接管了這個世界,那麼這種放棄就是末日之始。因果關係是這個世界存在的一種基礎關係,可以說因爲因果關係的存在,人類才能瞭解這個世界。如果有一天所有的人都不在去探尋這個世界中未發現的因果關係了,完全按照相關關係來分析這個世界,理論上來說不是不可以,而且我相信當數據積累足夠多的時候,相關關係是可以取代因果關係的。我所擔心的是人類過分依賴於相關關係來分析這個世界,放棄以前自己積累的優勢,很有可能造成被機器取代的下場。但是,我們這個世界發展到現在,越來越複雜,需要考慮的因素很多,很多的事情我們必須依賴於機器,我們能做的只是在一些核心的層面上減少對機器的依賴,切勿拋棄對世界因果關係的探索。


關於大數據的一個當下最火的也是被提及最多的一個觀點是:未來我們可以真正實現計劃經濟想做的事。咋一看這個觀點有點懵,說的是什麼呀,我們不是處在一個市場經濟的時代嗎,市場經濟不是優於計劃經濟嗎,回到計劃經濟不是歷史的倒退嗎?我相信很多的讀者看到這個觀點,腦中閃現的可能是這樣的一些疑問。不急,聽我慢慢給你講來。這種觀點的設想是這樣的:利用電子商務平臺積累的無限的用戶消費行爲的習慣的數據,加上大數據的分析技術,利用C2B,真正實現個性化的消費,完全按照用戶的需求來進行社會生產。鐺鐺檔~~,是不是有點計劃經濟的味道了。說實在的當我第一次看到這個觀點的時候,也是感到無比的震撼,太帥氣了。我想說的是:這種時代的到來不是沒有可能,而且又是未來我看好的社會發展方向,前提是配套的設施得到位,像物流呀,大數據分析技術啦等等。


<<大數據時代>>這本書中把大數據這個鏈條分成三個部分,也就是說在未來的商業社會中,有三種的大數據公司:基於技術的公司、基於數據的公司、基於思維的公司。這三個公司會在未來的大數據商業時代共存,而且有可能能是相互依存的。因爲畢竟像google amazon這種有數據、有技術、有大數據思維的公司不是很多,更多的企業不能完全擁有這三樣東西,因此需要的大家的合作。


這本書中着重講了大數據時代的思維變革的重要性。我記得作者舉得一個例子是這樣的:在 2000年的時候,微軟研究中心的米歇爾 ·班科(Michele Banko )和埃裏克·布里爾( Eric Bill)一直在尋求改進 Word程序中語法檢查的方法。但是他們不能確定是努力改進現有的算法、研發新的方法,還是添加更加細膩精緻 的特點更有效。所以,在實施這些措施之前,他們決定往現有的算法中添加更多的數據,看看 會有什麼不同的變化。很多對計算機學習算法的研究都建立在百萬字左右的語料庫基礎上。最 後,他們決定往 4種常見的算法中逐漸添加數據,先是一千萬字,再到一億字,最後到十億。 當數據只有 500萬的時候,有一種簡單的算法表現得很差,但當數據達 10億的時候,它變成 了表現最好的,準確率從原來的 75%提高到了95% 以上。與之相反地,在少量數據情況下運行得 最好的算法,當加入更多的數據時,也會像其他的算法一樣有所提高,但是卻變成了在大量數 據條件下運行得最不好的。它的準確率會從 86%提高到94% 。 後來,班科和布里爾在他們發表的研究論文中寫到, “如此一來,我們得重新衡量一下更多的人力物力是應該消耗在算法發展上還是在語料庫發展上。 ” 有一句叫做:你的思維有多遠,你的未來就有多遠。大數據時代是時候改變我們以前的思維方式了。


關於大數據,當下很多的說法,每個企業都在談論大數據,但是每個企業又不知道怎麼開始幹大數據。我不知道什麼原因,我的感覺是思維的問題。貌似我們現在強調的大數據大數據強調的是數據量的大,而忽略大數據最本質的是數據。大數據是一個宏觀上的概念或者說全局性的概念,它指的是整個社會的數據量在增大,越來越大,我們這個社會越來越變成一個數據的社會,當然不排除單一數據的量很大的情況出現,但是沒有很大很大數據就幹不成事了嗎?來讓我們看一個例子:prada收集在它的店裏顧客試衣的一些信息,看有哪些是人們進了試衣間,然後買了這件衣服的,看又有哪些是進了試衣間沒買走衣服的,然後迅速對沒被買走的衣服進行一些樣式、顏色等方面的修改,再推向市場。記住,大數據的本質在於數據,大隻是它在整個宏觀社會整體上的一個表現。




<<大數據時代>>這本書中內容很多,而且很有深度,講到了大數據時代的思維變革、大數據時代的商業變革、大數據時代的社會管理變革,信息量很多,而且文中列舉了無數經典而又有說服力的例子,非常的漂亮,是一本難得一見的好書。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章