簡單瞭解搜索引擎是如何工作的

可百度 多米諾設計  訪問官網查看更多seo搜索營銷乾貨

也可添加本人微信號: duomiluojz  一起交流和學習

在看這篇文章之前,您可以先到搜索引擎搜索 這三個名詞  萬維網、搜索引擎、google 查看維基百科解釋

搜索引擎在萬維網絡出現之前已經存在,那時在主機上的查詢是 ArchieGopher等搜索工具,但是由於互聯網的發展,傳統的方式已經無法滿足於用戶搜索的需求,包括雅虎的分類目錄網站都已無法實現用戶對於數據獲取的需求,智能化搜索引擎的發展是必然的趨勢,它可以在極短時間內反饋給用戶所需要的信息數據,既可以讓優質的數據不被埋沒,更能很大程度上節約用戶的信息獲取成本。

搜索引擎的基本原理就是 爬行-索引-建庫的過程

第一步 爬行: 萬維網給了搜索引擎一個很好的爬行基礎,因爲在萬維網上的鏈接結構將所有公共網頁聯繫在一起,而搜索引擎要做的就是通過爬蟲機器從一組知名的衆所周知的高質量的網站開始,然後訪問每一個網頁上的鏈接,順着這些鏈接的爬行在發現其他的網頁,就這樣以一個樹狀的爬行路徑不斷的發現新的網頁,因爲每一秒鐘都有龐大的數據產生,所以搜索引擎並不是每天試圖爬行整個web網絡。實際上,搜索引擎可以發現有些網頁的重要性不足以出現在搜索引擎中,從而不對這些網頁進行爬行。

第二步 索引: 搜索引擎的爬行器讀取了一個網頁後,下一步就是解析它們的代碼,並將精選部分放到一個龐大的服務器體系中,以方便在查詢時可以實時調用。搜索引擎將這些網頁信息讀取解析分類,建立關鍵詞庫。

第三部 檢索排名:  檢索和排名過程非常重要,搜索引擎根據用戶搜索詞的語義關係,返回與用戶搜索需求最相關的結果,這一過程要遵循兩項原則,第一、僅返回與搜索者查詢相關的結果 第二、按照重要性,考慮網站的相關可信度和權威性來排序。這兩項原則對於seo的影響非常大。

搜索引擎爬行器本身是一個非常龐大的軟件,它們爬行數以萬計的網頁,分析所有頁面的內容和這些網頁相互之間的鏈接關係,然後,將這些數據組織爲一系列的數據庫,能夠在零點幾秒之內相應用戶的搜索查詢,向用戶提交一組最合適的結果。

可訪問原文鏈接:http://www.duomiluo.net/23.html
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章