F1 score,micro F1score,macro F1score 的定義

本篇博客可能會繼續更新

最近在文獻中經常看到precesion,recall，常常忘記了他們的定義，在加上今天又看到評價多標籤分類任務性能的度量方法micro F1score和macro F2score。決定再把F1 score一併加進來把定義寫清楚，忘記了再來看看。

F1score

F1score(以下簡稱F1)是用來評價二元分類器的度量，它的計算方法如下：
$F1\;=\;\frac2{{\displaystyle\frac1{precision}}+{\displaystyle\frac1{recall}}}=2\frac{precision\times recall}{precison+recall}$
F1是用來衡量二維分類的，那形容多元分類器的性能用什麼呢？micro F1score,和macro F2score則是用來衡量多元分類器的性能。

macro F1score

假設對於一個多分類問題，有三個類，分別記爲1、2、3，

TPi是指分類i的True Positive；
FPi是指分類i的False Positive；
TNi是指分類i的True Negative；
FNi是指分類i的False Negative。

我們分別計算每個類的精度(precision)
${\text{precision}}_i=\frac{TP_i}{TP_i+FP_i}$
macro 精度就是所有分類的精度平均值
${\text{precision}}_{ma}=\frac{{\text{precision}}_1+{\text{precision}}_2+{\text{precision}}_3}3$
同樣，每個類的recall計算爲
${recall}_i\;=\frac{TP_i}{TP_i+FN_i}$
macro 召回就是所有分類的召回平均值
${\text{recall}}_{ma}=\frac{{\text{recall}}_1+{\text{recall}}_2+{\text{recall}}_3}3$
套用F1score的計算方法,macro F1score就是
$macro\;F1score_i=2\frac{precision_{ma}\times recall_{ma}}{precision_{ma}+recall_{ma}}$

micro F1score

假設對於一個多分類問題，有三個類，分別記爲1、2、3，

TPi是指分類i的True Positive；
FPi是指分類i的False Positive；
TNi是指分類i的True Negative；
FNi是指分類i的False Negative。
接下來，我們來算micro precision
${\text{precision}}_{mi}=\frac{TP_1+TP_2+TP_3}{TP_1+FP_1+TP_2+FP_2+TP_3+FP_3}$
相應的micro recall則是
${\text{recall}}_{mi}=\frac{TP_1+TP_2+TP_3}{TP_1+FN_1+TP_2+FN_2+TP_3+FN_3}$
則micro F1score爲
$micro\;F1score=2\frac{{\text{recall}}_{mi}\times{\text{precision}}_{mi}}{{\text{recall}}_{mi}+{\text{precision}}_{mi}}$

總結

如果各個類的分佈不均衡的話，使用micro F1score比macro F1score 比較好，顯然macro F1score沒有考慮各個類的數量大小

參考
該網址一位答主的回答，我搬運過來

變量命名好難啊

發佈了33 篇原創文章 · 獲贊 6 · 訪問量 1萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

F1 score,micro F1score,macro F1score 的定義

本篇博客可能會繼續更新

F1score

macro F1score

micro F1score

總結

公司剛入職了一名 Java 中級開發，短短 4 行代碼居然湊齊了 3 個 bug！我哭了~~

Nginx R31 doc-13-Limiting Access to Proxied HTTP Resources 訪問限流

中外程序員到底有啥區別？

Python數據分析與挖掘實戰（5章）

python包：pandas

C++文件/流

一、什麼是Docker

二、Docker 組件

揹包九講一 01揹包

今天！通義靈碼在北京、成都、杭州三城開講啦

music transformer：generating music with long-term structure

理解Python中的defaultdict

pytorch學習筆記(3) 動態調整學習率和如何提取CNN中間層的輸出

Keras 1 和 Keras 2 模型結構不兼容ValueError Improper config format {'l2' 9

C++_Primer學習筆記（1）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結