google搜索技巧

1、搜索引擎忽略的字符以及強制搜索

Google對一些網路上出現頻率極高的英文單詞,如“i”、“com”、“www”等,以及一些符號如“*”、“.”等,作忽略處理。

示例:搜索關於www起源的一些歷史資料。
搜索:“www的歷史 internet”
結果:以下的字詞因爲使用過於頻繁,沒有被列入搜索範圍: www 的. 已搜索有關www的歷史 internet的中文(簡體)網頁。 共約有75,100項查詢結果,這是第1-10項 。 搜索用時0.22秒。

我們看到,搜索“www的歷史 internet”,但搜索引擎把“www”和“的”都省略了。於是上述搜索只搜索了“歷史”和“internet”。這顯然不符合要求。這裏我順便說一點搜索引擎分詞的知識。當我們在搜索“www的歷史”的時候,搜索引擎實際上把這個短語分成三部分,“www”、“的”和“歷史”分別來檢索,這就是搜索引擎的分詞。所以儘管你輸入了連續的“www的歷史”,但搜索引擎還是把這個短語當成三個關鍵字分別檢索。

如果要對忽略的關鍵字進行強制搜索,則需要在該關鍵字前加上明文的“+”號。
搜索:“+www +的歷史 internet”
結果:已搜索有關+www +的歷史 internet的中文(簡體)網頁。 共約有25,000項查詢結果,這是第1-10項 。 搜索用時0.05秒。

另一個強制搜索的方法是把上述的關鍵字用英文雙引號引起來。在上例“”world war I””中,“I”其實也是忽略詞,但因爲被英文雙引號引起來,搜索引擎就強制搜索這一特定短語。

搜索:“"www的歷史" internet”
結果:已搜索有關"www的歷史" internet的中文(簡體)網頁。 共約有7項查詢結果,這是第1-6項 。 搜索用時0.26秒。

我們看到,這一搜索事實上把“www的歷史”作爲完整的一個關鍵字。顯然,包含這樣一個特定短語的網頁並不是很多,不過,每一項都很符合要求。

注意:大部分常用英文符號(如問號,句號,逗號等)無法成爲搜索關鍵字,加強制也不行。


2、對搜索的網站進行限制

“site”表示搜索結果侷限於某個具體網站或者網站頻道,如“www.sina.com.cn”、“edu.sina.com.cn”,或者是某個域名,如“com.cn”、“com”等等。如果是要排除某網站或者域名範圍內的頁面,只需用“-網站/域名”。

示例:搜索中文教育科研網站(edu.cn)上關於搜索引擎技巧的頁面。
搜索:“搜索引擎 技巧 site:edu.cn”
結果:已搜索有關搜索引擎 技巧 site:edu.cn的中文(簡體)網頁。 共約有608項查詢結果,這是第1-10項 。 搜索用時0.05秒。

示例:上著名IT門戶網站ZDNET和CNET搜索一下關於搜索引擎技巧方面的資訊。
搜索:“"search engine" tips site:www.zdnet.com OR site:www.cnet.com”
結果:已在www.zdnet.com內搜索有關"search engine" tips OR site:www.cnet.com的網頁。 共約有1,040項查詢結果,這是第1-10項 。 搜索用時0.09秒。

注意,在這裏Google有個小BUG。“已在www.zdnet.com內搜索…”,其實應該表述成“已在www.zdnet.com和www.cnet.com內搜索…”。

示例:搜索新浪科技頻道中關於搜索引擎技巧的信息。
搜索:“搜索引擎 技巧 site:tech.sina.com.cn”
結果:已在tech.sina.com.cn搜索有關搜索引擎 技巧 的中文(簡體)網頁。 共約有163項查詢結果,這是第1-10項 。 搜索用時0.07秒。

注意:site後的冒號爲英文字符,而且,冒號後不能有空格,否則,“site:”將被作爲一個搜索的關鍵字。此外,網站域名不能有“http://”前綴,也不能有任何“/”的目錄後綴;網站頻道則只侷限於“頻道名.域名”方式,而不能是“域名/頻道名”方式。


3、在某一類文件中查找信息

“filetype:”是Google開發的非常強大實用的一個搜索語法。也就是說,Google不僅能搜索一般的文字頁面,還能對某些二進制文檔進行檢索。目前,Google已經能檢索微軟的Office文檔如.xls、.ppt、.doc,.rtf,WordPerfect文檔,Lotus1-2-3文檔,Adobe的.pdf文檔,ShockWave的.swf文檔(Flash動畫)等。其中最實用的文檔搜索是PDF搜索。PDF是ADOBE公司開發的電子文檔格式,現在已經成爲互聯網的電子化出版標準。目前Google檢索的PDF文檔大約有2500萬左右,大約佔所有索引的二進制文檔數量的80%。PDF文檔通常是一些圖文並茂的綜合性文檔,提供的資訊一般比較集中全面。

示例:搜索幾個資產負債表的Office文檔。
搜索:“資產負債表 filetype:doc OR filetype:xls OR filetype:ppt”
結果:已搜索有關資產負債表 filetype:doc OR filetype:xls OR filetype:ppt的中文(簡體)網頁。 共約有481項查詢結果,這是第1-10項 。 搜索用時0.04秒。

注意,下載的Office文件可能含有宏病毒,謹慎操作。

示例:搜索一些關於搜索引擎知識和技巧方面的PDF文檔
搜索:“"search engine" tips OR tutorial filetype:pdf”
結果:已向英特網搜索"search engine" tips OR tutorial filetype:pdf. 共約有12,600項查詢結果,這是第1-10項 。 搜索用時0.22秒。

我們來看其中的一個結果:

[PDF]Search Engines Tips
文檔類型: PDF/Adobe Acrobat - HTML 版
... http://www.google.com/press/zeitgeist.html See what people are searching on at Google.com
* Search Engine Watch http://searchenginewatch.com/ Some free tips ... 
www.allvertical.com/PromoKits/SearchEngineTips.pdf - 類似網頁

可以看到,Google用[PDF]來標記這是一個PDF的文檔檢索,另外,它還給出了該PDF文檔的HTML版本,該HTML版保留了文檔的文字內容和結構,但沒有圖片。


4、搜索的關鍵字包含在URL鏈接中

“inurl”語法返回的網頁鏈接中包含第一個關鍵字,後面的關鍵字則出現在鏈接中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“MP3”、“GALLARY”等,於是,就可以用INURL語法找到這些相關資源鏈接,然後,用第二個關鍵詞確定是否有某項具體資料。INURL語法和基本搜索語法的最大區別在於,前者通常能提供非常精確的專題資料。

示例:查找MIDI曲“滄海一聲笑”。
搜索:“inurl:midi “滄海一聲笑””
結果:已搜索有關inurl:midi "滄海一聲笑"的中文(簡體)網頁。 共約有27項查詢結果,這是第1-10項 。 搜索用時0.34秒。

注意:“inurl:”後面不能有空格,Google也不對URL符號如“/”進行搜索。例如,Google會把“cgi-bin/phf”中的“/”當成空格處理。

“allinurl”語法返回的網頁的鏈接中包含所有作用關鍵字。這個查詢的關鍵字只集中於網頁的鏈接字符串。

示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現在鏈接中就是“域名/cgi-bin/phf”。
搜索:“allinurl:"cgi-bin" phf +com”
結果:已向英特網搜索allinurl:"cgi-bin" phf +com. 共約有51項查詢結果,這是第1-10項 。 搜索用時0.11秒。


5、搜索結果至少包含多個關鍵字中的任意一個

Google用大寫的“OR”表示邏輯“或”操作。搜索“A OR B”,意思就是說,搜索的網頁中,要麼有A,要麼有B,要麼同時有A和B。在上例中,我們希望搜索結果中最好含有“archie”、“lycos”、“蜘蛛”等關鍵字中的一個或者幾個,這樣可以進一步的精簡搜索結果。

示例:搜索如下網頁,要求必須含有“搜索引擎”和“歷史”,沒有“文化”,可以含有以下關鍵字中人任何一個或者多個:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。
搜索:“搜索引擎 歷史 archie OR 蜘蛛 OR lycos OR yahoo -文化”
結果:已搜索有關搜索引擎 歷史 archie OR 蜘蛛 OR lycos OR yahoo -文化的中文(簡體)網頁。 共約有8,400項查詢結果,這是第1-10項 。 搜索用時0.16秒。

我們看到,搜索結果縮小到8千多項,前20項結果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的歷史發展,就不妨研究一下現在搜索到的結果吧。

注意:“與”操作必須用大寫的“OR”,而不是小寫的“or”。

在上面的例子中,我介紹了搜索引擎最基本的語法“與”“非”和“或”,這三種搜索語法Google分別用“ ”(空格)、“-”和“OR”表示。順着上例的思路,你也可以瞭解到如何縮小搜索範圍,迅速找到目的資訊的一般方法:目標信息一定含有的關鍵字(用“ ”連起來),目標信息不能含有的關鍵字(用“-”去掉),目標信息可能含有的關鍵字(用“OR”連起來)。


6、Logo搜索

Google的圖片搜索功能想必大家都已使用過吧,其強大的圖庫容量和卓越的搜索能力,着實給我們提供了極大的便利。以搜索logo爲例,百度等同行業者就不是它的對手,比如要查找與PC World相關的各種logo,打開Google圖片搜索頁面,輸入關鍵字組合“logo-pcworld”,僅需幾秒鐘,便可以輕鬆找到大量與之對應的logo,到目前爲止,這是其競爭對手根本沒有辦法做到的。




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章