solr客戶端查詢語法

1、常用查詢參數說明 
    q - 查詢字符串,必須的。 
    fl - 指定返回那些字段內容,用逗號或空格分隔多個。 
    start - 返回第一條記錄在完整找到結果中的偏移位置,0開始,一般分頁用。 
    rows - 指定返回結果最多有多少條記錄,配合start來實現分頁。 
    sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(inStock desc, price asc)表示先 “inStock” 降序, 再 “price” 升序,默認是相關性降序。 
    wt - (writer type)指定輸出格式,可以有 xml, json, php, phps, 後面 solr 1.3增加的,要用通知我們,因爲默認沒有打開。 
    fq - (filter query)過慮查詢,作用:在q查詢符合結果中同時是fq查詢符合的,例如:q=mm&fq=date_time:[20081001 TO 20091031],找關鍵字mm,並且date_time是20081001到20091031之間的。官方文檔:http://wiki.apache.org/solr/CommonQueryParameters 
    不常用 
    q.op - 覆蓋schema.xml的defaultOperator(有空格時用"AND"還是用"OR"操作邏輯),一般默認指定  “OR”
    df - 默認的查詢字段,一般默認指定 
    qt - (query type)指定那個類型來處理查詢請求,一般不用指定,默認是standard。 
    其它 
    indent - 返回的結果是否縮進,默認關閉,用 indent=true|on 開啓,一般調試json,php,phps,ruby輸出纔有必要用這個參數。 
    version - 查詢語法的版本,建議不使用它,由服務器指定默認值。
   
    solrconfig.xml的配置實例
查詢配置(以上參數項都可以配置到該配置文件)
<requestHandler name="/select" class="solr.SearchHandler">
     <lst name="defaults">
       <str name="echoParams">explicit</str>
       <int name="rows">10</int>

       <str name="defType">edismax</str>   //使用的是solr 擴展的查詢解析器

      <str name="q.alt">*:*</str>
      <str name="fq">sell_price:[1 TO *]</str>
      <str name="hl">true</str>
      <str name="hl.fl">room_name</str>
           <str name="bf">sum(product(termfreq(room_status,"dzz"),1.2),1)</str> //額外的評分字段,這個是可以影響score的打分的
      <str name="pf">  //要查詢的字段
            room_name house_code room_code zr_house_code hire_commissioner_name broker_name rating_address resblock_name district_name subway_station_name subway_line_name
      </str>
      <str name="qf"> //各自段分配的權重
            room_name^5 house_code room_code zr_house_code  hire_commissioner_name broker_name rating_address resblock_name^2 district_name subway_station_name subway_line_name
      </str>
     </lst>
</requestHandler>

另外schema.xml的defaultOperator參數是個很重要的參數,默認是“OR”,意思是要查詢的關鍵詞做完分詞後的詞做 “OR”連接,然後再做查詢,而“AND”呢,要至少全包含要搜索的關鍵詞纔行。

2、Solr的檢索運算符
     “:” 指定字段查指定值,如返回所有值*:*²
     “?”²表示單個任意字符的通配
     “*” 表示多個任意字符的通配(不能在檢索的項開始使用*或者?符號)²
     “~”²表示模糊檢索,如檢索拼寫類似於”roam”的項這樣寫:roam~將找到形如foam和roams的單詞;roam~0.8,檢索返回相似度在0.8以上的記錄。
    ²鄰近檢索,如檢索相隔10個單詞的”apache”和”jakarta”,”jakarta apache”~10
     “^”²控制相關度檢索,如檢索jakarta apache,同時希望去讓”jakarta”的相關度更加好,那麼在其後加上”^”符號和增量值,即jakarta^4 apache
     布爾操作符AND、||²
     布爾操作符OR、²&&
     布爾操作符NOT、!、-²(排除操作符不能單獨與項使用構成查詢)
     “+” 存在操作符,要求符號”+”後的項必須在文檔相應的域中存在²
     ( ) 用於構成子查詢²
    ² [] 包含範圍檢索,如檢索某時間段記錄,包含頭尾,date:[200707 TO 200710]
     {}²不包含範圍檢索,如檢索某時間段記錄,不包含頭尾
    date:{200707 TO 200710}
     " 轉義操作符,特殊字符包括+ -² && || ! ( ) { } [ ] ^ ” ~ * ? : "
    
非空數據的查詢 比如:fq=fcode:['' TO *] 查詢fcode非空的數據

取反實例:fq=!fstate:1

3、facet查詢

分類統計 facet 
    q=*:*&facet=true&facet.field=cat&facet.field=inStock  //按cat  inStock進行分類統計
   
    q=ipod&facet=true&facet.query=price:[0 TO 100]&facet.query=price:[100 TO *]  //區間統計 價格在0-100 和100-無窮大的

--solr的分組查詢(facet)
http://IP:port/solr/room/select?rows=0&q=bizcircle_code:XXXXXX&facet=on
&facet.field=resblock_id&facet.field=resblock_name&facet.limit=3   //同一個bizcircle_code下的 前三個resblock 各自的文檔數量


在做solr查詢的時候,solr提供了很多參數來擴展它自身的強大功能!以下是使用頻率最高的一些參數! 

 

1、常用 

q - 查詢字符串,這個是必須的。如果查詢所有*:* ,根據指定字段查詢(Name:張三 AND Address:北京

fq - (filter query)過慮查詢,作用:在q查詢符合結果中同時是fq查詢符合的,例如:q=Name:張三&fq=CreateDate:[20081001 TO 20091031],找關鍵字mm,並且CreateDate是20081001

fl - 指定返回那些字段內容,用逗號或空格分隔多個。 

start - 返回第一條記錄在完整找到結果中的偏移位置,0開始,一般分頁用。 

rows - 指定返回結果最多有多少條記錄,配合start來實現分頁。 

sort - 排序,格式:sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例:(score desc, price asc)表示先 “score” 降序, 再 “price” 升序,默認是相關性降序。 

wt - (writer type)指定輸出格式,可以有 xmljsonphpphps。 

fl表示索引顯示那些field( *表示所有field,如果想查詢指定字段用逗號或空格隔開(如:Name,SKU,ShortDescription或Name SKU ShortDescription【注:字段是嚴格區分大小寫的)) 

q.op 表示q 中 查詢語句的 各條件的邏輯操作 AND(與) OR(或) 

hl 是否高亮 ,如hl=true

hl.fl 高亮field ,hl.fl=Name,SKU

hl.snippets :默認是1,這裏設置爲3個片段

hl.simple.pre 高亮前面的格式 

hl.simple.post 高亮後面的格式 

facet 是否啓動統計 

facet.field  統計field 

【注:以上是比較常用的參數,當然具體的參數使用還是多看Solr官方的技術文檔以及一些大神的博文日誌,這裏只是拋磚引玉】

 

二、 Solr運算符

1. “:” 指定字段查指定值,如返回所有值*:*

2. “?” 表示單個任意字符的通配

3. “*” 表示多個任意字符的通配(不能在檢索的項開始使用*或者?符號)

4. “~” 表示模糊檢索,如檢索拼寫類似於”roam”的項這樣寫:roam~將找到形如foam和roams的單詞;roam~0.8,檢索返回相似度在0.8以上的記錄。

5. 鄰近檢索,如檢索相隔10個單詞的”apache”和”jakarta”,”jakarta apache”~10

6. “^” 控制相關度檢索,如檢索jakarta apache,同時希望去讓”jakarta”的相關度更加好,那麼在其後加上”^”符號和增量值,即jakarta^4 apache

7. 布爾操作符AND、||

8. 布爾操作符OR、&&

9. 布爾操作符NOT、!、- (排除操作符不能單獨與項使用構成查詢)
10. “+” 存在操作符,要求符號”+”後的項必須在文檔相應的域中存在
11. ( ) 用於構成子查詢
12. [] 包含範圍檢索,如檢索某時間段記錄,包含頭尾,date:[200707 TO 200710]
13. {} 不包含範圍檢索,如檢索某時間段記錄,不包含頭尾
date:{200707 TO 200710}
14. / 轉義操作符,特殊字符包括+ - && || ! ( ) { } [ ] ^ ” ~ * ? : /

 注:①“+”和”-“表示對單個查詢單元的修飾,and 、or 、 not 是對兩個查詢單元是否做交集或者做差集還是取反的操作的符號

   比如:AB:china +AB:america ,表示的是AB:china忽略不計可有可無,必須滿足第二個條件纔是對的,而不是你所認爲的必須滿足這兩個搜索條件

   如果輸入:AB:china AND AB:america ,解析出來的結果是兩個條件同時滿足,即+AB:china AND +AB:america或+AB:china +AB:america

  總而言之,查詢語法:  修飾符 字段名:查詢關鍵詞 AND/OR/NOT 修飾符 字段名:查詢關鍵詞

三、 Solr查詢語法

1.最普通的查詢,比如查詢姓張的人( Name:張),如果是精準性搜索相當於SQL SERVER中的LIKE搜索這需要帶引號(""),比如查詢含有北京的(Address:"北京")

2.多條件查詢,注:如果是針對單個字段進行搜索的可以用(Name:搜索條件加運算符(OR、AND、NOT) Name:搜索條件),比如模糊查詢( Name:張 OR Name:李 )單個字段多條件搜索不建議這樣寫,一般建議是在單個字段裏進行條件篩選,如( Name:張 OR 李),多個字段查詢(Name:張 + Address:北京 

3.排序,比如根據姓名升序(Name asc),降序(Name desc


facet使用的參考例子

引用別人的一篇博客:http://martin3000.iteye.com/blog/1330106

http://www.blogjava.net/conans/articles/379556.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章