搜索引擎的發展

定義:

搜索引擎是指根據一定的策略、運用特定的計算機程序蒐集互聯網上的信息,在對信息進行組織和處理後,並將處理後的信息顯示給用戶,是爲用戶提供檢索服務的系統。

簡單的說:

搜索引擎
其實就是指一個:
1.先抓取網頁 
2.再處理網頁
3.然後提供檢索服務的系統

       1990年,加拿大麥吉爾大學(University of McGill)計算機學院的師生開發出Archie。當時,萬維網(World Wide Web)還沒有出現,人們通過FTP來共享交流資源。Archie能定期蒐集並分析FTP服務器上的文件名信息,提供查找分別在各個FTP主機中的文件。用戶必須輸入精確的文件名進行搜索,Archie告訴用戶哪個FTP服務器能下載該文件。雖然Archie蒐集的信息資源不是網頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動蒐集信息資源、建立索引、提供檢索服務。所以,Archie被公認爲現代搜索引擎的鼻祖。

      1994年4月,斯坦福大學的兩名博士生,美籍華人Jerry Yang(楊致遠)和David Filo共同創辦了Yahoo。隨着訪問量和收錄鏈接數的增長,Yahoo目錄開始支持簡單的數據庫搜索。因爲Yahoo!的數據是手工輸入的,所以不能真正被歸爲搜索引擎,事實上只是一個可搜索的目錄。雅虎於2002年12月23日收購inktomi,2003年7月14日收購包括Fast和Altavista在內的Overture,2003年11月,Yahoo全資收購3721公司。

     1994年初,華盛頓大學(University of Washington )的學生Brian Pinkerton開始了他的小項目WebCrawler。1994年4月20日,WebCrawler正式亮相時僅包含來自6000個服務器的內容。WebCrawler是互聯網上第一個支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動取正文的前100個字。 

    1994年7月,卡內基·梅隆大學(Carnegie Mellon University) 的Michael Mauldin將John Leavitt的spider程序接入到其索引程序中,創建了Lycos。除了相關性排序外,Lycos還提供了前綴匹配和字符相近限制,Lycos第一個在搜索結果中使用了網頁自動摘要,而最大的優勢還是它遠勝過其它搜索引擎的數據量。

     1995年,一種新的搜索引擎形式出現了——元搜索引擎。用戶只需提交一次搜索請求,由元搜索引擎負責轉換處理,提交給多個預先選定的獨立搜索引擎,並將從各獨立搜索引擎返回的所有查詢結果,集中起來處理後再返回給用戶。第一個元搜索引擎,是Washington大學碩士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。
      1995年12月,DEC的正式發佈AltaVista。AltaVista是第一個支持自然語言搜索的搜索引擎,第一個實現高級搜索語法的搜索引擎(如AND, OR, NOT等)。用戶可以用AltaVista搜索新聞組(Newsgroups)的內容並從互聯網上獲得文章,還可以搜索圖片名稱中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista最有趣的新功能之一,是搜索有鏈接指向某個URL的所有網站。它在搜索框區域下放了“tips”以幫助用戶更好的表達搜索式,這些小tip經常更新,這樣,在搜索過幾次以後,用戶會看到很多他們可能從來不知道的的有趣功能。這系列功能,逐漸被其它搜索引擎廣泛採用。1997年,AltaVista發佈了一個圖形演示系統LiveTopics,幫助用戶從成千上萬的搜索結果中找到。

     1998年10月之前,Google只是斯坦福大學的一個小項目BackRub。1995年博士生Larry Page開始學習搜索引擎設計,於1997年9月15日註冊了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同參與下,BachRub開始提供Demo。1999年2月,Google完成了從Alpha版到Beta版的蛻變。Google公司則把1998年9月27日認作自己的生日。Google以網頁級別(Pagerank)爲基礎,判斷網頁的重要性,使得搜索結果的相關性大大增強。Google公司的奇客(Geek)文化氛圍、不作惡(Don’t be evil)的理念,爲Google贏得了極高的口碑和品牌美譽。2006年4月,Google宣佈其中文名稱“谷歌”,這是Google第一個在非英語國家起的名字。

    1996年8月,sohu公司成立,製作中文網站分類目錄,曾有“出門找地圖,上網找搜狐”的美譽。隨着互聯網網站的急劇增加,這種人工編輯的分類目錄已經不適應。sohu於2004年8月獨立域名的搜索網站“搜狗”,自稱“第三代搜索引擎”。

     2000年1月,兩位北大校友,超鏈分析專利發明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士後)在北京中關村創立了百度(Baidu)公司。2001年8月發佈Baidu.com搜索引擎Beta版,2001年10月22日正式發佈Baidu搜索引擎,專注於中文搜索。Baidu搜索引擎的其它特色包括:百度快照、網頁預覽/預覽全部網頁、相關搜索詞、錯別字糾正提示、mp3搜索、Flash搜索。2002年3月閃電計劃開始後,技術升級明顯加快。後推出貼吧、知道、地圖、國學、百科等一系列產品,深受網民歡迎。2005年8月5日在納斯達克上市,發行價爲USD 27.00,代號爲BIDU。開盤價USD 66.00,以USD 122.54收盤,漲幅353.85%,創下了5年以來美國股市上市新股當日漲幅最高紀錄。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章