Google搜索的基本語法

本文是專門給不太會用搜索引擎的小丹丹寫的。“授人以魚不如授人以漁”。

一、關鍵詞的邏輯關係

1. "與"關係

當你在搜索框輸入多個關鍵詞的時候,默認情況下,這些關鍵詞之間是“與”關係。也就是說,某個頁面通常要包含你輸入的所有關鍵詞,這纔會出現在搜索結果中。

2. "或"關係

有些時候,你希望使用“或”關係來組合搜索關鍵詞,那麼,可以用 OR 語法,格式如下:

關鍵詞1 OR 關鍵詞2

請注意:這裏的 OR 一定要大寫

二、精確搜索

1. 限定關鍵詞的排列

比如你直接在搜索框輸入不帶引號的 安裝純淨windows10圖文教程 ,那麼,搜索到的結果裏面,可能會包含這樣的網頁——在網頁的頭部出現 安裝,在網頁的尾部出現 windows7,兩者相距甚遠。這顯然不是你想要的。(舉的例子不太好,以後想到好的再改)

如果你想明確告訴搜索引擎,這幾個字必須緊挨着,不要拆分,那麼,你可以使用引號的語法 “安裝純淨windows10圖文教程”

請注意:這裏的引號一定要用半角的。

2. 限定搜索的網站

2.1 限定具體的網站域名

有時候,你只想搜索指定網站的內容,可以用 site: 語法。舉例,只搜索CSDN博客的內容:

關鍵詞 site:blog.csdn.net

請注意:site: 之後的部分,需要寫 http:// 或 https://

2.2 限定具體的網站域名及目錄名

site: 之後的部分,還可以帶目錄名。比如具體某人的博客:

關鍵詞 site:blog.csdn.net/qq_326324545

2.3 部分限定域名

該語法還有如下變形,支持對域名的部分限定。

舉例——只搜索 com 頂級域名:

關鍵詞 site:.com

舉例——只搜索國內的教育網:

關鍵詞 site:.edu.cn

3. 限定搜索的網頁元素

你可以指定讓 Google 只搜索網頁中的特定元素,有如下幾種語法:

3.1 只搜索標題

如下語法,要求 關鍵詞2 必須在標題中,關鍵詞1 可以在任何網頁的地方

關鍵詞1 intitle:關鍵詞2

如下語法,則要求兩個關鍵詞都在標題中

allintitle:關鍵詞1 關鍵詞2

3.2 只搜索網頁正文

語法同上,使用 intext: 和 allintext: 語法。

3.3 只搜索網頁的 URL 網址

語法同上,使用 inurl: 和 allinurl: 語法。

3.4 只搜索網頁中的超鏈接

語法同上,使用 inanchor: 和 allinanchor: 語法。

4. 限定文件格式

可以使用 filetype: 語法告訴 Google 只搜索某些類型的文件格式。
這個語法用來搜電子書或論文比較方便,很適合查找論文。比較常用的文件格式有:pdf、doc、rtf、ppt、xls

舉例——搜索 PDF 文件:

關鍵詞 filetype:pdf

三、模糊搜索

1. 同義詞(波浪號)

緊挨着關鍵詞之前放波浪號 ~ 表示搜索同義詞。
有了這個功能,你就不必用 OR 寫一堆關鍵詞。因爲 Google 是足夠聰明的,知道哪些詞彙是近義詞。
舉例:如下語法,既可以搜索到包含 food 的網頁,也可以搜索到包含 nutrition 的網頁

~food

請注意:這裏的波浪號一定要用半角符號。

2. 數字範圍(兩點)

在兩個數字之間放兩個小數點 .. 表示模糊搜索該數字範圍。舉例:

世界盃 2002..2010 

也可以僅指定一個數字,未指定的一端爲無窮

請注意:這裏的小數點一定要用半角符號。

3. 通配符(星號)

你可以用星號 * 指代任何一個詞彙。

舉例:比如新浪有如下幾個域名 sina.com.cn、sina.com.hk、sina.com.tw,用如下語法,就可以限定搜索範圍在上述幾個域名

關鍵詞 site:sina.com.*

四、排除某些關鍵詞

緊挨着關鍵詞之前放減號,表示排除該關鍵詞。也就是說,網頁如果包含該關鍵詞,就不會出現在搜索結果中。
舉例:比如你搜索甲骨文,既找到“考古”方面的頁面,也會找到“Oracle 數據庫”方面的頁面。如果你僅僅想要考古方面的,可以用如下方式排除數據庫相關的結果。

甲骨文 -數據庫

五、括號的使用

如果你需要混用上述幾種語法,就得考慮使用括號——看起來清晰而且不容易搞錯不同語法的優先級。舉例:

關鍵詞1 關鍵詞2 (關鍵詞3 OR 關鍵詞4)

六、Google 的網頁緩存(快照)

搜索引擎的緩存,可以幫你看到已經被刪除的頁面(前提是該頁面被搜索引擎緩存過,寫博客的時候我測試了一下,訪問量低的網頁似乎沒有網頁快照)。不僅如此,網頁快照還支持HTTPS加密,還可以避免訪問有病毒的網站(避免網頁掛馬)。

Google 在緩存網頁的時候,會檢查頁面上是否有惡意代碼。這樣有一個額外的好處——規避網頁上的掛馬。另外,Google 的緩存有兩種:一個是完全版,另一個是純文字版。完全版基本上是頁面的原貌,而純文字版會濾掉網頁的附加元素(JavaScript 腳本、CSS 樣式表)。顯然,“純文字版”比“完全版”更加安全。

如何快速打開某頁面的 Google 緩存?

下面拿iPhone的維基百科頁面舉栗子,第一種方式會打開“完全版”,第二種方式會打開“純文字版”

1. 在搜索框輸入網址

在 Google 的搜索框中輸入:

cache:https://en.wikipedia.org/wiki/IPhone

2. 在地址欄輸入網址

如果你想直接打開“純文字版”,那麼可以在瀏覽器地址欄輸入如下:

https://webcache.googleusercontent.com/search?strip=1&q=cache:

然後把你要看的網址,追加到上述地址後面,變成這樣:

https://webcache.googleusercontent.com/search?strip=1&q=cache:https://en.wikipedia.org/wiki/IPhone

上述網址中的 strip=1 表示“純文字版”,濾掉頁面的附加元素(JavaScript、CSS、等);如果改爲 strip=0 就表示“完全版”,不濾掉頁面的附加元素。
提醒一下,有些網站的功能非常依賴於 JavaScript 和 CSS,用純文字版的緩存,可能會顯示不正常。

七、結尾

上述方法是Google搜索的語法,Baidu搜索就像閹割版,好多功能未實現,目前測試好用的功能有:

加引號限定關鍵詞不可拆分、用site限定具體網站域名、限定關鍵詞位於標題或正文或URL中、限定文件格式、排除某關鍵詞

另外,Baidu做了一個高級搜索,方便小白用戶直接使用,不需要語法:https://www.baidu.com/gaoji/advanced.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章