原创 6 November 2009 - Lucene Java 2.9.1 available
This release fixes bugs from 2.9.0, including one serious bug whereby Boole
原创 換個交互方式:twitter
我twitter號: imjl_live_cn即時聊天太過於正式,經常怕騷擾到他人而不敢說。有時候分享東西給對此感興趣的朋友,卻又不知如何做?想找個志
原创 Examples of Searching Social Media
All these run on Lucene or Solr Pioneer in blog searching: Technorati Analy
原创 噢也,,期待已久的solr 1.4 發佈了
下載連接 http://www.apache.org/dyn/closer.cgi/lucene/solr/New Solr 1.4 features
原创 已知關鍵詞的快速索引
關鍵詞已知的情況下,快速索引。給定:1300個關鍵詞,在1000條信息中比較,將對應的關鍵詞和記錄id記錄下來。分析:簡單測試,將1300個關鍵詞放入
原创 關於全文檢索系統設計我的思考
全文搜索大體分爲:數據採集,索引,搜索。我認爲最重要的是搜索效果,大體表現在準確性,搜索結果排序,穩定,速度。準確和分詞相關,排序是如何讓最適合的結果
原创 新聞之主題相似計算
新聞轉載非常多,搜索新聞時常常碰到,結果裏有很多相似新聞出現在一個頁面,影響用戶查看。我這裏說個主題(也就是新聞題目)相似計算。分析:新聞主題大多是經
原创 新開一博客
因爲這裏不太穩定,,所以在baidu http://hi.baidu.com/imjl_cn/blog/ 新開一個,做備用。兩邊同時發,博文
原创 有償提供全文檢索服務(只針對lucene,solr)
簡單的全文搜索,那麼可以看下 [url=http://lucene.apache.org/solr/]solr[/url],能自己解決最好想要做下一個
原创 Contrived FieldCache Load Test: Lucene 2.4 VS Lucene 2.9
轉載:http://www.lucidimagination.com/blog/2009/09/22/contrived-fieldcache-loa
原创 我也成無業遊民了
紀 念 下 這 個 有 意 義 的 一 天 :D :D :D :D
原创 iphone 從3.0升級到3.1(帶越獄)
[b]只適合無鎖版[/b]我iphone是3.0+越獄。。。想要升級到3.1+越獄之前準備了,itunes最新版,3.1固件下載到本地,但是沒有安裝今
原创 這兩天都幹嘛了
聽朋友們說51job要多刷新簡歷,於是我在待業第二天就寫了簡歷,開始還能每天刷,後來隔幾天刷,現在懶得刷。-------------至今點擊率爲0.
原创 safari 我的常用快捷鍵
cmd爲蘋果鍵關閉tab cmd+w退出safari cmd+qtab切換
原创 如何選擇中文分詞
目前全文搜索用到的中文分詞,大都是開源和自己開發相應的算法很多,到底選哪個來寫,各有各的看法。我分享下我做過的供大家參考沒用過詞性的中文分詞,因爲我的業務用不到。用過的大部分開源的中文分詞,主要是基於字典對