學會用GOOGLE做research

上一篇提到“沒有輸入就沒有輸出”。過去我們的主要信息來源之一是圖書館。今天互聯網已經後來者居上,成爲比圖書館更爲重要的信息來源之一。互聯網的信息被稱爲“海量”,所以“搜索引擎”就成了最被依賴的工具。

Google是我們這個時代最偉大的產品之一。有了Google,本質上誰都有能力做“research”(研究)——“research”在今天已經不再像許多年前那樣是少數“精英”的專利了。我常常告訴我的學生,“research”其實一點都不神祕;所謂的“research”其實只不過是“search, search, and… REsearch!”在中文裏,“research”除了“研究”之外還可以用另外一個說法來翻譯——“做學問”。中文的“學問”這個詞拆開來是兩個字“學”和“問”。做學問的人一樣要學,一樣要問,只不過他們比別人把“學”和“問”重複更多遍而已。

Google是個可以用來research(做學問)的工具,而國內的百度相對來講,在這方面差了不是一點半點。相對來看Google還是更講原則的一個產品。Google的搜索結果就是搜索結果,贊助商鏈接擺在旁邊;而百度卻爲了賺錢把贊助商鏈接與搜索結果混在一起,並且更進一步,百度把贊助商鏈接放在搜索結果之前。前陣子媒體就有過報道,有一位中年人爲了治療癌症上百度搜索,找了家醫院,最後病情並未得到控制,錢倒是多花了許多。百度的這種做法,直接導致人們無法分辨搜索結果與廣告之間的區別,最終導致錯誤的判斷。“如果提供假藥信息,搜索引擎就是助紂爲虐,謀財害命!”——國家食品藥品監督管理局新聞發言人顏江瑛說(網易新聞2008年9月18日)。

Google的界面非常簡潔,很多人對此相當地推崇。但過分簡潔副作用就是很多人也因此“過分簡單化地使用Google”。然而,想做學問的人,花幾分鐘學學Google的語法是相當值得的;這幾分鐘裏學到的東西用“終生受用”修飾都不過份。

在Google的輸入框裏,所有的空格都被Google理解爲加號(+)。如果你輸入的是【purpose of education】(本文中,【……】中的文字與符號就是指你在Google的輸入框裏輸入的文字與符號),那麼Google返回的文章裏既有“purpose”存在,也有“education”存在,但不一定有“purpose of education”存在。另外,過分常用的、單獨存在沒有意義的詞彙往往被忽略掉,比如冠詞“a”、“the”;介詞“of”、“in”、“on”、“at”、“to”;連詞“and”、“or”、“but”;從屬連詞“that”、“which”、“when”;代詞“my”、“his”、“them”……等等。

如果你想要找含有“purpose of education”這個詞組的文章,那麼你必須輸入【“purpose of education”】。現在的Google已經可以處理utf-8大字符集了,所以,即便你在輸入的時候即便使用的是全角字符(不是半角字符的【”】而是【“】或者【”】)Google也照樣能夠正確處理。比較一下兩種輸入返回的結果:【purpose of education】vs.【“purpose of education”】。再試試【the most important benefit of education】和【“the most important benefit of education”】。這就是引號(“……”)的作用——返回“完整匹配”的結果。

爲了進一步篩選搜索結果,還需要學會另外一個符號——減號(-)。比如,【“the most imporant benefit of education” – “united states”】要求Google返回含有“the most important benefit of education”但不存在“united states”的文章。

另外一個威力無窮的符號是型號(*)。Google支持通配符搜索,即搜索字符串中可以包含星號(*),用來替代任意字符串。比如,【“the most * examples of censorship”】將會返回含有類似“the most outrageous examples of censorship”、“the most brazen examples of censorship”、“the most heinous examples of censorship”、“the most stupidest examples of censorship”、“the most dangerous examples of censorship”、“the most egregious examples of censorship”、“the most prolific examples of censorship”、“the most absurd examples of censorship”……

在網上找例子的時候星號非常有用。比如,想找歷史上“最怎麼樣的”老師的話可以搜索【“most * teachers in history such as”】,或者,想知道國外常見的軟飲料品牌的話就搜索【“* soft drinks such as”】。星號還可以把Google當作搭配辭典使用,比如,想知道proof這個單詞之前可以使用的量詞都有哪些的話,可以搜索【“a * of proofs”】,返回的結果會讓你知道,起碼有這麼幾個:“a set of proofs”,“a variety of proofs”,“a number of proofs”,“a series of proofs”……

還有一個運用相當靈活、經常帶來意外收穫的符號是波浪號(~)。把波浪號(~)加在某個單詞前面,是在告訴Google:除了給出的關鍵字之外,還要搜索與波浪號(~)後面的那個單詞相關的詞彙。比如,搜索【the importance of ~censorship】的結果中包含着“the importance of censorship”,也包含着與censorship相關的另外一個詞彙“propaganda”——“the importance of propaganda”。

再學一個在指定網站中搜索的語法“site:”。比如,【“the purpose of education” site:http://www.time.com/】就是要求Google只返回http://www.time.com這個網站裏的含有“the purpose of education”的文章。

2006年,Google推出了“co-op”服務(自定義搜索引擎)。其中最常用的功能之一就是可以指定Google搜索一個或者若干個指定的網站——相當於前面提到的Google語法“site:”的擴展。比如,我就爲我的學生定製了一個Google cse(customized search engine)——“Search News Media”(在我的網站的導航欄上,有一個“自定義搜索引擎”,點進去也會看到這個cse)。不妨看看在這個自定義搜索引擎上搜索【censorship】返回的結果(GRE/SAT的作文考試中,都有很多關於“censorship”的作文題)。這個cse只搜索以下10個網站:

  • http://www.economist.com/
  • http://www.cnn.com/
  • http://www.time.com/
  • http://nytimes.com/
  • http://www.washingtonpost.com/
  • http://www.usnews.com/
  • http://usatoday.com/
  • http://www.reuters.com/
  • http://www.bbc.co.uk/
  • http://en.wikinews.org/

我還給學生定製過一個專門搜索百科類網站的cse:“Encyclopedia Search”。這個cse只搜索以下7個網站:

  • http://en.wikipedia.org/
  • http://encarta.msn.com/
  • http://knol.google.com/
  • http://www.thecanadianencyclopedia.com/
  • http://en.citizendium.org/
  • http://www.bartleby.com/65/
  • http://www.eb.com/

如果你是Google的註冊用戶(現在幾乎人人都用gmail),那麼你也可以定製類似的cse,並且可以與其他人分享。關於更復雜的應用,只能查看Google CSE的幫助文檔了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章