選擇性偏差

選擇性偏差又被稱爲選擇效應，社會科學研究中是指在對個體、羣體或數據分析中，樣本無法體現出總體的代表性特徵。

選擇性的偏差會導致我們對政策效應的識別出現偏誤，因爲我們簡單地拿實驗組平均值和對照組平均值對比會出現的問題，組間的簡單平均值的差=實際的政策效果+選擇性偏差。

例子一：美國平價醫療法案，該法案核心思想即鼓勵大家自己出錢購買醫療保險。此方案對醫療保險的刺激作用很大，因爲不買的話就相當於出錢請別人看病。如此鉅額投入的背後，美國人的身體也並不見得比其他國家的人健康，比如肥胖問題。那麼醫療保險的購買到底對於健康會不會有促進作用呢？
早期的研究是基於美國醫療保險問卷，但與自然科學實驗不同的是，在這項社會科學實驗中，我們可以看到參保人本人的身體健康狀況，卻無法得知如果“一模一樣”的人不參加保險，那麼身體健康會如何。即真正實現“蘋果和蘋果比”，“橘子和橘子比”。很多時候可能只是拿“蘋果和橘子比”。這顯然稱不上”其他變量一致“。
在觀察問卷數據時，會發現參與保險的人，似乎普遍學歷較高。這意味着更自制，保持相對較好的生活習慣，不容易吸菸，更看重身體等。這些原因實際已經解釋了大部分爲什麼實驗者的平均值會高於對照組。

例子二：小明健康初始值3，從南方到北京讀大學，被告知每年200元獲得醫保，看病報銷一大部分。小明心想自己身體不好，北方又冷可能會常生病，於是購買醫保，購買後健康值變爲4。小紅健康初始值5，從大東北到北京上學，同樣的被告知醫保事宜。小紅身體本來就不錯，北京又比較暖和，就不購買醫保，健康值仍然是5。
如果只看數據，不購買醫保健康值5，購買了醫保健康值4，很容易得出購買醫保會讓健康值降低的反事實結論。這也體現了選擇性誤差：身體不好的人會更傾向於購買醫保。

例子一中選擇性偏差導致我們“高估”醫保效果，例子二中選擇性偏差導致我們“低估”醫保效果。這說明很多時候即使我們有很好的控制變量幫助我們控制一些潛在的因素，也不能確保我們看不到的因素會不會產生新的選擇性偏差。這樣就會使得我們在判斷政策效果時，無法保證"Ceteris Paribus"的條件。

對於解決這個問題，最簡單和可靠的方法就是：隨機實驗。如果有一個上帝在隨機地拋硬幣，告訴你你到底是選擇接受保險還是不受，那就不存在這樣的選擇偏差的問題了。即選擇偏差的問題在於具備一定特質的人會主動選擇去成爲某種類別。但是如果無法主動選擇，而是由上帝隨機地擲硬幣來決定你的選擇，那就不存在偏差的問題了（顥卿，2019）。

同時對選擇選擇性偏差的關注，可以澄清以下5個認知問題（臧雷振和陳鵬，2015）：
第一，選擇性偏差是否會高估因果關係？
由上面的例子可以看出，可能低估，也可能高估

第二，選擇性偏差是否是一種誤差？

參考資料：
1.顥卿在真知灼見的分享

我正在「真知拙見KnowledgeHot」和朋友們討論有趣的話題，你⼀起來吧？
https://t.zsxq.com/n2zjyBe
2.臧雷振,陳鵬.選擇性偏差問題及其識別[J].世界經濟與政治,2015(04):137-153+159-160.

離散時間：一階差分

MySQL入門（一）：MySQL 安裝與數據庫基礎

關於學術新媒體精選站

動態規劃

兩期經濟模型

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結