搜索與排序(一)

搜索引擎的組成:

1、找到一種蒐集文檔的方法,進行文檔搜索。

2、爲網頁建立索引。

3、通過查詢返回一個經過排序的列表。

在組成1中,其實質爲通過一種“可行”的方法,將網頁存儲在指定的位置。

在組成2中,其實質是將網頁信息保存在數據庫中,網頁信息包括:(1)網頁的URL。(2)網頁中的單詞。(3)網頁中單詞的位置。(4)介於文檔之間的鏈接信息:一個文檔與另一個文檔鏈接關係和哪些單詞與鏈接實際相關。

在組成3中,查詢的實質是對已經建立的數據庫進行條件查詢。排序是搜索的精華所在,其排序的實現方式決定了該搜索的效率和搜索引擎的商業前途,排序的方法有兩種:基於內容的排名方法和基於外部回指鏈接排名法。關於這兩種方法的介紹,下次繼續談~~~~

發佈了43 篇原創文章 · 獲贊 12 · 訪問量 8萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章