原创 Lucene一(開篇:lucene整體學習路線和初體驗)

  lucene是一個全文檢索框架,用於快速的搜索全文信息。學習它就是圍繞着索引、分詞、搜索、以及一些高級的搜索、評分、排序等功能進行學習,該博客圍繞3.5版本來進行學習。首先從一個簡單的實例開始: 建立索引的步驟:1、創建Directo

原创 Lucene四(Luke工具的使用)

  Luke工具可以用來查看索引文件的所有信息,是Lucene開發必備的工具之一,Luke的版本一定要和項目所使用的Lucene的版本一致才能打開Lucene創建的索引文件。 Luke工具的使用: 雙擊lukeall-3.5.0.jar打

原创 Lucene三(索引加權)

  在建立索引的時候,爲指定的Document對象加權會增加該文檔的評分,使其在搜索結果中靠前。使用Document對象的setBoost方法可以爲索引加權,代碼如下: 先來測試一下不加權時索引的搜索結果,需要一個search方法: pu

原创 RHEL一(管理文件、通配符、特殊符號)

  在開始Linux之前,先在Linux中安裝一個輸入法(ibus),使用yum命令: yum list ibus*可以查看已裝和未裝的哪些ibus相關輸入法,使用yum install ibus-libpinyin.x86_64  -y

原创 RHEL三(輸入輸出重定向、管道符)

輸出信息包括正確信息和錯誤信息。標準的輸出設備:顯示器,標準輸入設備:鍵盤,掃描儀等。 使用命令 ll /dev/std*可以查看輸入輸出設備:   lrwxrwxrwx. 1 root root 15 Jul 23 10:48 /dev

原创 RHEL四(管理本地用戶和組以及本地密碼策略)

在linux中,用戶可以分爲幾類:超級用戶、系統用戶、普通用戶。超級用戶uid=0,系統用戶在rhel5和rhel6中uid=1-499,rhel7中,uid=1-200表示系統自帶用戶,201-999表示其他系統用戶,普通用戶在rhel

原创 RHEL二(獲取幫助)

linux中獲取幫助的命令有whatis,help,man,info,也可以從/usr/share/doc中查看,也可以在官網doc.redhat.com查看幫助 whatis 使用: [root@desktop0 content]#

原创 Lucene五(添加日期和數字類型索引)

  日期和數字類型索引可以使用NumericField對象來添加,建立索引、搜索、測試的代碼如下: public class IndexUtil {private String[] ids = {"1","2","3","4","5","

原创 RHEL五(文件訪問權限)

Linux文件服務器權限:基本權限、特殊權限、隱藏權限、高級權限,這裏先說前三者權限 基本權限 [root@desktop0 ~]# ll -rw-------. 1 root root 8619 May  7  2014 anacond

原创 Lucene二(域選項、文檔基本信息、索引的增刪改查)

  先來看看域選項,域選項分爲域存儲選項和域索引選項,該選項是在爲Document添加Field的時候,對該Field的描述。域存儲選項即Field.Store.*   *等於YES時表示會把這個域中的內容完全存儲到索引文件中,方便進行還

原创 Lucene七(搜索)

通過代碼詳細講解Lucene3.5的各種搜索功能,包括TermQuery精確匹配,TermRangeQuery範圍匹配,NumericRangeQuery數字類型的範圍匹配,PrefixQuery按前綴匹配,WildcardQuery通配

原创 RHEL十二(安裝和更新軟件包)

軟件安裝分爲:二進制,rpm,src rpm,yum,源代碼編譯,其他系統。使用最多的都是rpm包,事實上rpm已經成爲行業的標準 RPM(RedHat Package Manager)是紅帽軟件包管理工具。可以在網上看到有些包以.rpm

原创 RHEL二十(管理SELINUX的安全性)

SELinux通過MAC方式來管理程序,即以程序爲主體來管理權限,目標:爲主體將要訪問的文件,策略:策略決定主體能否訪問指定的文件。 安全上下文:主體和目標的安全上下文必須一致才能夠順利存取。 getenforce查看SELinux的工作

原创 RHEL十四(使用虛擬化系統)

本章只講解Linux單機版虛擬化KVM。使用KVM虛擬化需要CPU支持虛擬化才行,cpu有兩種類型,Intel和AMD,查看Intel cpu是否支持虛擬化:grep vmx /proc/cpuinfo,查看AMD cpu是否支持虛擬化使

原创 Lucene六(IndexReader的設計)

IndexReader和IndexWriter的打開是非常消耗資源的,一般我們在項目中都將IndexReader設計爲單例,有的項目中將IndexWriter也設計爲單例。由於將IndexReader設計爲單例,所以IndexReader