Lucene/solr的評分公式


1. lucene 評分公式

評分公式中,對大多數因子的控制和實現都是通過Similarity抽象類的子類完成的。lucene默認使用DefaultSimilarity類。如果要詳細瞭解的話可以直接看lucene源代碼Similarity和DefaultSimilarity類。



3. dismax/edismax評分公式

3.1 dismax介紹:

What’s a “DisMax” ?

使用solr時可以在solrconfig.xml的<requestHandler name="search">結點中增加defType的設置:

<requestHandler name="search" class="solr.SearchHandler" default="true">
	<lst name="defaults">
		<str name="defType">edismax</str>	<!--增加這一行-->
	</lst>
</requesHandler>



3.2 solr使用edismax時的評分公式

solr管理頁面查詢時增加參數debugQuery=true即可啓用debug信息,可以清楚的看到在查詢多個域時評分規則如下:

下面借用用python的對齊方式來展示計算規則:
score = max plus 0.1 times others of:
	value1 = field1 weight,product of:
		queryWeight, product of:
			boost
			idf
			queryNorm
		fieldWeight, product of:
			tf(termFreq)
			idf
			fieldNorm
	
	...
	valuen = fieldn weight(計算方法同上)


假設有field1,field2,且field1 weight > field2 weight(即value1 > value2), 那麼score = value1 plus 0.1 times value2(即score = value1 + 0.1 * value2)

其中field weight時lucene的評分公式計算出來的,可以看出跟lucene用explain query顯示的格式一樣。

4.評分相關的Solr FAQ




以上內容是基於當前solr4.4版本的~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章