Bingo大戰:決勝大數據時代

必應(Bing)又一次成爲了IT行業的新聞焦點。這次,它以強大的自信發起了一場名爲“必應搜索,全球PK賽”的活動,主要針對谷歌PK搜索結果的質量。

據媒體報道,“第三方獨立調研機構統計結果顯示,中國有75%的參與者首選微軟必應提供的結果”。我抱着對這個結果將信將疑的態度參與了這項測試,也許因爲之前有多年使用Google的緣故。反覆幾次之後,有了比較深入的切身體會。剛開始的時候,我輸入一些普普通通的詞彙,兩者搜索結果的區別不大,勝負難分,僅僅在結果排序上表現出其背後的算法差異。隨着我對一些敏感詞彙和熱點關注的時事話題進行搜索PK的時候,高下可以說立現了。諸多事件,諸多主角,搜索結果都是驚人的一致:必應能夠立即在不引起爭議的前提下,有選擇性地給出有價值的答案,幫助搜索者達到了解事件和人物信息的最終目的,而谷歌則一律拒絕顯示搜索結果(經直接進入谷歌嘗試,結論一致)。無論某×××事件的主角,還是更具時代爭議的重慶人物,等等等等,都是如此。

從這裏我得出結論,無論從算法上,還是對中國市場的瞭解上,必應都勝出一籌。那麼,應該是時候從谷歌移民必應了。討巧的是,把這場活動雙方的首幾位字母連成一個單詞,居然是Bingo!

整個IT行業都在高談闊論大數據,探討大數據帶來的營銷變革,憧憬大數據將要滋生的機器智能,幾乎沒有人回過頭去關注大數據產生的麻煩。如何從浩如煙海的數據海洋中篩掉數據垃圾,尋求自己真正想要的答案,這個問題重新回到搜索引擎這個生活學習工作都無法離身的“傳統”工具上來。微軟資深副總裁張亞勤這樣指出:“大數據要求人們改變對精準性的苛求,轉而追求混雜性;要求人們改變對因果關係的追問,轉而追求相關關係;這種思維的轉變將是革命性的”。

查全率是第一代搜索引擎的競爭關鍵,所以Yahoo和AltaVista成爲了90年代的佼佼者;查準率是第二代搜索引擎的核心任務,所以Google和百度脫穎而出。而在大數據時代,全和準都不是問題了,“價值”這個更加模糊更加人性化的東西成爲了搜索引擎的核心競爭尺度。在大數據的背景下,拋棄直接因果和純粹邏輯,擁抱魚龍混雜的數據結構和縱橫交錯的關係脈絡,是下一代搜索引擎所不得不具備的典型特徵。而這一點,必應讓我們感受到了。還記得微軟幾年前的那個“人立方”嗎?雖說只是一個好玩的東西,但其實背後我看到的恰恰是微軟對大數據的尊重和人類思維模型的不懈探索。

英國經濟學家霍奇遜曾在《現代制度主義經濟學》一書中表達了這樣的觀點,“最大化的進化論,或者說最優行爲的達爾文機制是以理性主義行爲觀爲基礎的”;但“無論從方法論、心理學、社會學和政治學哪個方面來看”,理性主義都陷入了“自相矛盾”,因爲“認知和思維過程的複雜性以及需處理的信息數量,對理性思維來說,都面臨着信息太少和資料太多的矛盾”。需要解釋的是,霍奇遜這裏所講的“資料太多”就是我們今天的大數據,而“信息太少”的“信息”則是指經過有效處理之後的信息,類似於搜索結果。

鮑爾默前不久表示:“微軟數據中心基礎設施中服務器的數量已經超過了100萬臺”。有好事者對此頗有微詞,指責其耗電量驚人,“能夠爲美國2萬3千戶家庭供電”。此觀點實在荒唐,退回到愛迪生時代,說不定足夠給全世界的家庭供電;再上溯到刀耕火種的年代,連電都不用,那麼這個換算出來的家庭數量該是無窮大吧?在我看來,如此海量的服務器恰恰說明微軟爲大數據時代的搜索做足了準備。

另外,凡是參悟人生的人都有體會,自身就是一個小宇宙。機器也是一樣,大數據不僅僅應該包括向外的互聯網,也必須考慮向內的局域網和本地硬盤。記得二十年前,上G就已經稱得上是那個年代的大數據了,而今呢?據我所知,從Windows8.1開始,必應不僅對互聯網數據進行搜索,也同時對本地和局域網內的數據通過整合方式進行搜索,這一點,也是必應比谷歌更尊重用戶、尊重數據的一個側面表現。

作者:瞬雨
自由評論人,經濟觀察家

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章