項目反應理論(item response theory)是屬於心理學中認知診斷常用的一種理論,即根據被測試者針對某個問題的答案來對被測者的認知狀況進行估計。“項目”實質就是測試題,“反應”就是被測者的答案。也有學者稱項目反應理論也是機器學習中的一個類別,即根據被測者對測試題的反應來判定被測者所屬的類別。
1、 項目特徵曲線
項目特徵曲線可用來描述項目(問題)難度與區分度,即項目的難度與區分度是項目的兩個維度。下圖展示了一個典型的項目(問題)特徵曲線。
圖中,橫座標表示能力值,縱座標表示做出該題的概率。顯然,能力值越低做出該題的概率越小,能力值越高做出該題的概率越大。
一個項目的難度可以分爲
[很容易,容易,中等,難,很難]
五個層次
一個項目的區分度可以分爲[很低,低,中等,高,很高]
五個層次
因此,每一個項目都有25種可能的曲線
上圖中的項目特徵曲線表示中等的難度與中等的區分度,類似地還有中等難度高區分度的曲線等等,詳見item response theory。
2、項目特徵曲線模型
如何用一個數學表達式來表示項目特徵曲線是項目特徵曲線建模需要考慮的問題。目前主要有三種模型,這三種模型本質上都屬於Logistic。
2.1 Logistic模型
- b:代表項目難度係數,理論上可以取(-
∞ ,+∞ ),典型值在[-3,3]之間 - a:代表項目區分度係數,理論上可以取(-
∞ ,+∞ ),典型值在[-2.8,2.8]之間 θ :代表能力值
2.2 Rasch模型
Rasch是Logistic模型的一種情況,也稱爲一個參數的Logistic模型。當Logistic模型中項目區分度a的值爲1時,即爲Rasch模型。
- b:代表項目難度係數,理論上可以取(-
∞ ,+∞ ),典型值在[-3,3]之間 θ :代表能力值
2.3 三參數模型
- b:代表項目難度係數,理論上可以取(-
∞ ,+∞ ),典型值在[-3,3]之間 - a:代表項目區分度係數,理論上可以取(-
∞ ,+∞ ),典型值在[-2.8,2.8]之間 - c:代表猜測參數,猜測參數取值範圍是[0,1],典型值通常超過0.35
θ :代表能力值
注意:猜測係數與個人能力值無關,也就是高能力與低能力值的被測試者有相同的概率通過猜測答對題目。