個案: 每一個個體|記錄
變量: 屬性
誤差:隨機誤差(找不到原因) 系統誤差(有規律)
信度: 同樣方法重複測量同一對象結果一致性
效度: 與真實結果的相似性。
不同點
-
研究對象不同
信度:答卷者 效度:組卷人 -
研究角度不同
信度:測量的質量效度:問卷的質量
-
數值大小不同
- 問卷效度<問卷信度
- 效度的最大值≤信度的平方根
- 效度高,信度一定高;信度高,效度不一定高
正態分佈
- M± 1SD: 68%
- M± 1.96SD: 95%
- M± 2.58SD: 99%
偏度: 數據的傾斜(下圖爲右偏)
峯度: 有多高
自由度: 可以自由變化的未知數,X+Y+Z=0,自由度爲2,兩個數確定下來,第三個未知數自動確定
對於樣本量爲N的數據,它的自由度天然就是N-1個。因爲它存在一個均值,這就是限制它的條件。
自由度=變量個數(樣本量)N-限制條件
假設檢驗
判斷標準: 顯著性水平( significance level)-α一常用標準5%、1%和0.1%
p值(p- value): 即虛無假設事實上成立,但我們計算出的結果卻錯誤判斷虛無假設不成立的概率
用p值與α進行比校,以此判斷結果。
深入理解p值
這個東西困擾我好久了,我只會比較但不理解含義。
p值代表真實樣本數據中小概率事件發生的偶然性,當偶然性不大的時候就可以認爲原假設錯誤,比如豬肉場宣稱自己的豬肉都是5kg,你買了100塊豬肉發現均值不是5kg,而是4kg,原假設就是豬肉是5kg,備則假設是豬肉不是5kg。p值就是豬肉不是5kg出現的偶然性。現在你固定顯著性水平是5%,即只要偶然性低於5%,就可以拒絕原假設,因爲偶然性越低代表豬肉不是5kg的普遍性越高。下面置信區間是什麼意思呢,還是豬肉,如果你買的100塊豬肉的平均值是4kg,標準誤差是1kg,那麼你置信區間是(4±1)*95%概率的分位數。還是豬肉,如果你買的100塊豬肉的平均值是4kg,標準誤差是1kg,那麼你置信區間是(4±1)*95%概率的分位數。