本文是專門給不太會用搜索引擎的小丹丹寫的。“授人以魚不如授人以漁”。
一、關鍵詞的邏輯關係
1. "與"關係
當你在搜索框輸入多個關鍵詞的時候,默認情況下,這些關鍵詞之間是“與”關係。也就是說,某個頁面通常要包含你輸入的所有關鍵詞,這纔會出現在搜索結果中。
2. "或"關係
有些時候,你希望使用“或”關係來組合搜索關鍵詞,那麼,可以用 OR
語法,格式如下:
關鍵詞1 OR 關鍵詞2
請注意:這裏的 OR
一定要大寫。
二、精確搜索
1. 限定關鍵詞的排列
比如你直接在搜索框輸入不帶引號的 安裝純淨windows10圖文教程 ,那麼,搜索到的結果裏面,可能會包含這樣的網頁——在網頁的頭部出現 安裝,在網頁的尾部出現 windows7,兩者相距甚遠。這顯然不是你想要的。(舉的例子不太好,以後想到好的再改)
如果你想明確告訴搜索引擎,這幾個字必須緊挨着,不要拆分,那麼,你可以使用引號的語法 “安裝純淨windows10圖文教程”
請注意:這裏的引號一定要用半角的。
2. 限定搜索的網站
2.1 限定具體的網站域名
有時候,你只想搜索指定網站的內容,可以用 site:
語法。舉例,只搜索CSDN博客的內容:
關鍵詞 site:blog.csdn.net
請注意:site:
之後的部分,不需要寫 http:// 或 https://
2.2 限定具體的網站域名及目錄名
site:
之後的部分,還可以帶目錄名。比如具體某人的博客:
關鍵詞 site:blog.csdn.net/qq_326324545
2.3 部分限定域名
該語法還有如下變形,支持對域名的部分限定。
舉例——只搜索 com 頂級域名:
關鍵詞 site:.com
舉例——只搜索國內的教育網:
關鍵詞 site:.edu.cn
3. 限定搜索的網頁元素
你可以指定讓 Google 只搜索網頁中的特定元素,有如下幾種語法:
3.1 只搜索標題
如下語法,要求 關鍵詞2 必須在標題中,關鍵詞1 可以在任何網頁的地方
關鍵詞1 intitle:關鍵詞2
如下語法,則要求兩個關鍵詞都在標題中
allintitle:關鍵詞1 關鍵詞2
3.2 只搜索網頁正文
語法同上,使用 intext:
和 allintext:
語法。
3.3 只搜索網頁的 URL 網址
語法同上,使用 inurl:
和 allinurl:
語法。
3.4 只搜索網頁中的超鏈接
語法同上,使用 inanchor:
和 allinanchor:
語法。
4. 限定文件格式
可以使用 filetype:
語法告訴 Google 只搜索某些類型的文件格式。
這個語法用來搜電子書或論文比較方便,很適合查找論文。比較常用的文件格式有:pdf、doc、rtf、ppt、xls
舉例——搜索 PDF 文件:
關鍵詞 filetype:pdf
三、模糊搜索
1. 同義詞(波浪號)
緊挨着關鍵詞之前放波浪號 ~
表示搜索同義詞。
有了這個功能,你就不必用 OR
寫一堆關鍵詞。因爲 Google 是足夠聰明的,知道哪些詞彙是近義詞。
舉例:如下語法,既可以搜索到包含 food 的網頁,也可以搜索到包含 nutrition 的網頁
~food
請注意:這裏的波浪號一定要用半角符號。
2. 數字範圍(兩點)
在兩個數字之間放兩個小數點 ..
表示模糊搜索該數字範圍。舉例:
世界盃 2002..2010
也可以僅指定一個數字,未指定的一端爲無窮
請注意:這裏的小數點一定要用半角符號。
3. 通配符(星號)
你可以用星號 *
指代任何一個詞彙。
舉例:比如新浪有如下幾個域名 sina.com.cn、sina.com.hk、sina.com.tw,用如下語法,就可以限定搜索範圍在上述幾個域名
關鍵詞 site:sina.com.*
四、排除某些關鍵詞
緊挨着關鍵詞之前放減號,表示排除該關鍵詞。也就是說,網頁如果包含該關鍵詞,就不會出現在搜索結果中。
舉例:比如你搜索甲骨文
,既找到“考古”方面的頁面,也會找到“Oracle 數據庫”方面的頁面。如果你僅僅想要考古方面的,可以用如下方式排除數據庫相關的結果。
甲骨文 -數據庫
五、括號的使用
如果你需要混用上述幾種語法,就得考慮使用括號——看起來清晰而且不容易搞錯不同語法的優先級。舉例:
關鍵詞1 關鍵詞2 (關鍵詞3 OR 關鍵詞4)
六、Google 的網頁緩存(快照)
搜索引擎的緩存,可以幫你看到已經被刪除的頁面(前提是該頁面被搜索引擎緩存過,寫博客的時候我測試了一下,訪問量低的網頁似乎沒有網頁快照)。不僅如此,網頁快照還支持HTTPS加密,還可以避免訪問有病毒的網站(避免網頁掛馬)。
Google 在緩存網頁的時候,會檢查頁面上是否有惡意代碼。這樣有一個額外的好處——規避網頁上的掛馬。另外,Google 的緩存有兩種:一個是完全版,另一個是純文字版。完全版基本上是頁面的原貌,而純文字版會濾掉網頁的附加元素(JavaScript 腳本、CSS 樣式表)。顯然,“純文字版”比“完全版”更加安全。
如何快速打開某頁面的 Google 緩存?
下面拿iPhone的維基百科頁面舉栗子,第一種方式會打開“完全版”,第二種方式會打開“純文字版”
1. 在搜索框輸入網址
在 Google 的搜索框中輸入:
cache:https://en.wikipedia.org/wiki/IPhone
2. 在地址欄輸入網址
如果你想直接打開“純文字版”,那麼可以在瀏覽器地址欄輸入如下:
https://webcache.googleusercontent.com/search?strip=1&q=cache:
然後把你要看的網址,追加到上述地址後面,變成這樣:
https://webcache.googleusercontent.com/search?strip=1&q=cache:https://en.wikipedia.org/wiki/IPhone
上述網址中的 strip=1
表示“純文字版”,濾掉頁面的附加元素(JavaScript、CSS、等);如果改爲 strip=0
就表示“完全版”,不濾掉頁面的附加元素。
提醒一下,有些網站的功能非常依賴於 JavaScript 和 CSS,用純文字版的緩存,可能會顯示不正常。
七、結尾
上述方法是Google搜索的語法,Baidu搜索就像閹割版,好多功能未實現,目前測試好用的功能有:
加引號限定關鍵詞不可拆分、用site限定具體網站域名、限定關鍵詞位於標題或正文或URL中、限定文件格式、排除某關鍵詞
另外,Baidu做了一個高級搜索,方便小白用戶直接使用,不需要語法:https://www.baidu.com/gaoji/advanced.html