PHP的搜索引擎( RiSearch PHP、Sphinx、PhpDig、 Snoopy、OpenWebSpider、Sphider、Yioop!)

PHP的搜索引擎分爲主要有: RiSearch PHP、Sphinx、PhpDig、 Snoopy、OpenWebSpider、Sphider、Yioop!


RiSearch PHP

RiSearch PHP是一個高效,功能強大的搜索引擎,特別適用於中小型網站。RiSearch PHP非常快,它能夠在不到1秒鐘內搜索5000-10000個頁面。RiSearch是一個索引搜索引擎,這就意味着它先將你的網站做索引並建立一個數 據庫來存儲你網站所有頁面的關鍵詞以便快速搜索。Risearch是全文搜索引擎腳本,它把所有的關鍵詞都編成一個文檔索引除了配置文件裏面的定義排除的 關鍵詞。 RiSearch使用經典的反向索引算法(與大型的搜索引擎相同),這就是爲什麼它會比其它搜索引擎快的原因。

Sphinx

Sphinx是一個基於SQL的全文檢索引擎,可以結合MySQL,PostgreSQL做全文搜索,它可以 提供比數據庫本身更專業的搜索功能,使得應用程序更容易實現專業化的全文檢索。Sphinx特別爲一些腳本語言設計搜索API接口,如 PHP,Python,Perl,Ruby等,同時爲MySQL也設計了一個存儲引擎插件。
Sphinx的特性:

  • 高速索引 (在新款CPU上,近10 MB/秒);
  • 高速搜索 (2-4G的文本量中平均查詢速度不到0.1秒);
  • 高可用性 (單CPU上最大可支持100 GB的文本,100M文檔);
  • 提供良好的相關性排名
  • 支持分佈式搜索;
  • 提供文檔摘要生成;
  • 提供從MySQL內部的插件式存儲引擎上搜索
  • 支持布爾,短語, 和近義詞查詢;
  • 支持每個文檔多個全文檢索域(默認最大32個);
  • 支持每個文檔多屬性;
  • 支持斷詞;
  • 支持單字節編碼與UTF-8編碼;

PhpDig

PhpDig是一個採用PHP開發的Web爬蟲和搜索引擎。通過對動態和靜態頁面進行索引建立一個詞彙表。當搜索查詢時,它將按一定的排序規則顯示包含關鍵字的搜索結果頁面。PhpDig包含一個模板系統並能夠索引PDF,Word,Excel,和PowerPoint文檔。PHPdig適用於專業化更強、層次更深的個性化搜索引擎,利用它打造針對某一領域的垂直搜索引擎是最好的選擇。

 

Snoopy

Snoopy是一個強大的網站內容採集器。提供獲取網頁內容,提交表單等功能。

 

OpenWebSpider

OpenWebSpider是一個開源多線程Web Spider(robot:機器人,crawler:爬蟲)和包含許多有趣功能的搜索引擎。

 

Sphider

Sphider是一個輕量級,採用PHP開發的web spider和搜索引擎,使用mysql來存儲數據。可以利用它來爲自己的網站添加搜索功能。Sphider非常小,易於安裝和修改,已經有數千網站在使用它。

 

Yioop!

Yioop! 是一個 PHP 的搜索引擎,可用於 Web 的一般用途搜索,或者可提供URL搜索以及各種文檔的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps.
Yioop.gif

 


參考鏈接: https://www.php-open.org/op/31/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章