P@n
前 n 個結果的準確度, P指的是Precision. 如果用分別表示第 i 個結果相關、不相關, 則
在評測系統的 P@n 時, 對每個查詢的結果計算P@n, 取這些值的平均值作爲系統的P@n.
參考:
MAP
Average Precision(AP): P@n的一個平均, 計算方式如下:
其中R是預定義的. 在評測系統的AP時, 對每個查詢的結果計算AP, 取這些值的平均值作爲系統的AP.
Mean Average Precision (MAP): 在評價一個系統的性能, 有時會用不同主題的查詢進行檢索, 評價系統的整體性能. 在第t類查詢, 系統的AP記作的話, MAP計算方式如下:
參考
MRR
Mean Reciprocal Rank (MRR). 對每個查詢, 記它第一個相關的結果排在位置, 即rank爲, 則Reciprocal Rank(RR)得分計作.
對所有query的RR取平均, 即爲MRR:
DCG和NDCG
Discounted Cumulative Gain (DCG): 指的, Cumulative爲將所有的結果累加起來, Discounted指給排在後面的結果加一個折扣係數, 排序位置越考後, 折扣係數越小.
DCG@N的計算方式如下
其中指每條結果的收益(Gain), 指折扣係數, 排序位置越考後, 折扣係數越小, 常用的是.
一種常用的形式如下:
Normalized Discounted Cumulative Gain (NDCG): 對於不同query, DCG的量級可能不同, 比如一個query對應的文檔相關性都較差, 另一個query對應的文檔都很好, 這樣評價指標就會偏向第二個query. Normalized指將一個query對應的文檔所有排序中最大的DCG求出來, 不妨計作, 則
舉例來說, query下有4個文檔, 相關性分別爲1 2 3 0
. 則最好的排序是 3 2 1 0
, 在這種排序情況下計算出來的DCG就是IDCG.