必威电竞|足球世界杯竞猜平台

辛普森悖論
來源:互聯網

辛普森悖論(Simpson’s 悖論)是統計學的一種現象,即在研究兩種變量的相關性時,分別對其進行分組研究,在分組比較中占優勢的一方,在總體評價中卻并不占優勢。辛普森悖論以英國統計學家愛德華·辛普森(Edward Simpson)的名字而命名。

辛普森悖論最早可追溯至英國統計學家卡爾·皮爾遜(Karl Pearson),他在1899年證明連續變量之間的邊際關聯和部分關聯可能不同,從而產生虛假的相關性。1903年,英國統計學家喬治·烏德尼·尤爾(George Udny Yule)指出分類變量關聯悖論的存在;1951年,愛德華·辛普森則在論文中正式解釋這一悖論,因此辛普森悖論也被稱為尤爾-辛普森效應(Yule-Simpson effect)。

辛普森悖論可以看作為分組不當造成理解混亂的典型案例。辛普森悖論表明因果推論在非實驗研究中,可能存在不受控制甚至未觀察到的變量,這些變量會消除或逆轉在兩個變量之間觀察到的關聯。

理論說明

實例

“校長,不好了,有很多男生在校門口抗議,他們說今年研究所女生錄取率42%是男生21%的兩倍,我們學校遴選學生有性別歧視”,校長滿臉疑惑的問秘書:“我不是特別交代,今年要盡量提升男生錄取率以免落人口實嗎?”

秘書趕緊回答說:“確實有交代下去,我剛剛也查過,的確是有注意到,今年法學院錄取率是男性75%,女性只有49%;而商學院錄取率是男性10%,女性為5%。二個學院都是男生錄取率比較高,校長這是我作的調查報告。”

“秘書,你知道為什么個別錄取率男皆大于女,但是總體錄取率男卻遠小于女嗎?”

此例這就是統計上著名的辛普森悖論(Simpson's 悖論)

前提

上面例子說明,簡單的將分組資料相加匯總,是不一定能反映真實情況的。就上述例子錄取率與性別來說,導致辛普森悖論有兩個前提。

(1) 兩個分組的錄取率相差很大,就是說法學院錄取率9.2%很低,而商學院53.3%卻很高,另一方面,兩種性別的申請者分布比重卻相反,女生偏愛申請商學院,故商學院女生申請比率占83.3%,相反男生偏愛申請法學院,因此法學院女生申請比率只占0.833%。結果在數量上來說,錄取率低的法學院,因為女生申請為數少,所以不錄取的女生相對很少。而錄取率很高的商學院雖然錄取了很多男生,但是申請者卻不多。使得最后匯總的時候,女生在數量上反而占優勢。

(2) 性別并非是錄取率高低的唯一因素,甚至可能是毫無影響的,至于在湖北經濟學院法商學院中出現的比率差可能是屬于隨機事件,又或者是其他因素作用,譬如學生入學成績卻剛好出現這種錄取比例,使人牽強地誤認為這是由性別差異而造成的。

管理應用

辛普森悖論就像是欲比賽100場籃球以總勝率評價好壞,于是有人專找高手挑戰20 場而勝1場,另外80場找平手挑戰而勝40場,結果勝率41%,另一人則專挑高手挑戰80場而勝8場,而剩下20場平手打個全勝,結果勝率為28%,比 41%小很多,但仔細觀察挑戰對象,后者明顯較有實力。

量與質是不等價的,無奈的是量比質來得容易量測,所以人們總是習慣用量來評定好壞,而此數據卻不是重要的。除了質與量的迷思之外,辛普森悖論的另外一個啟示是:如果我們在人生的抉擇上選擇了一條比較難走的路,就得要有可能不被賞識的領悟,所以這算是懷才不遇這個成語在統計上的詮釋。

參考資料 >

.Britannica.2023-12-22

..2023-12-22

..2023-12-22

生活家百科家居網