“幸存者偏差”(Survivorship bias),也稱生存者偏差或存活者偏差,是指在統計過程中,無意間將經過非特定篩選的樣本作為研究重點,忽略了樣本背后隱藏的關鍵信息,最終得出的結論與實際情況存在巨大差距。
幸存者偏差的概念源自美國哥倫比亞大學統計學教授瓦爾德(Abraham Wald)于1941年研究的飛機防護問題。其產生的原因是人們在觀察和統計時,往往更容易注意和搜集到成功案例,而容易忽略無法統計的失敗案例。
幸存者偏差現象是一種常見的邏輯謬誤,廣泛存在于日常生活中,也被廣泛存在于學界各領域。在統計、金融、社會、生物研究等領域都有應用。實踐證明,那些被忽視的信息往往十分重要,并且會直接影響結論的正確性。
起源
幸存者偏差的概念源自二戰時期美國軍隊統計作戰飛機受損情況的真實故事。1941年,第二次世界大戰中,美國哥倫比亞大學統計學教授沃德(Abraham Wald)應軍方要求,利用其在統計方面的專業知識,提供關于《飛機應該如何加強防護,才能降低被炮火擊落的幾率》的建議。沃德教授對聯軍的轟炸機受到攻擊后返回營地的數據進行研究后發現:機翼是最容易被擊中的位置,機尾則是最少被擊中的位置。
美國海軍指揮官據此提出應該加強機翼的防護,但統計學專家沃德教授指出,應該強化的是機尾,因為飛機各部位的中彈概率應該是相同的。被多次擊中機翼的戰略轟炸機,似乎還是能夠安全返航,而發動機部位的彈孔明顯偏少,只能說明被擊中引擎的飛機大多沒有返航。軍方最終采納了教授的建議,然后盟軍被擊落的戰機迅速減少。實踐證明,教授的意見是正確的。這就是有名的“飛機防護”案例。
這個例子很好地說明了幸存者偏差的問題,即軍方只看到幸存下來的飛機,而未能反映飛機受損的真實情況,看不見的彈痕卻最致命。
對于“飛機防護”案例,沃德教授認為:
(1)統計的樣本,只涵蓋平安返回的戰略轟炸機;
(2)被多次擊中機翼的轟炸機,似乎還是能夠安全返航;
(3)機尾很少發現彈孔的原因并非是機尾不易被擊中,而是因為機尾被擊中的飛機早已無法返航,寥寥幾架返航的飛機都依賴相同的救命稻草——機尾尚好。
由此,幸存者偏差被用來指當獲取信息的渠道僅來自于幸存者時,那么信息的真實性與實際情況存在偏差。
來自失敗者的信息很難獲取,其中有兩個原因:其一是“死無對證”,比如因被擊落而未能平安返航的戰機;其二是“沉默的大多數”,比如未進醫院的糖尿病患者或未發病人群。
基本概念
幸存者偏差是指僅從幸存者中獲取數據進行統計,導致結論與實際情況存在偏差的情況。
這是一種常見的邏輯謬誤,即只能看到經過某種篩選而產生的結果,而沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息。這個謬誤產生的原因是當觀測者獲取資訊時,只看到了幸存者,而忽略了死者或“沉默的數據”,導致資訊存在與實際情況不同的偏差。
幸存者偏差本質上是一種取樣偏差,有效的取樣應該是完備且隨機的。如果觀測者只關注成功者而忽略失敗者,就會做出錯誤的判斷,甚至得出荒唐的結論。
相關理論
回歸分析是一種重要的統計分析方法,在使用回歸模型對因變量進行估計時,需要考慮輸入回歸方程的自變量取值是否屬于樣本所在的總體范疇,即回歸方程有適用的邊界。例如,動態統計圖視頻“全球GDP數據動態排行,其后半部分2018-2099年數據則是根據已有歷史數據建立的模型預測而來。但是,幾十年后的時間不一定適合這個模型,預測參考價值不大。
統計學中研究的對象的全體稱為總體。對于這些對象,研究者可能只關心其中的一些指標。例如,學生有很多特征,如身高、體重、學號、年齡、血壓、籍貫等,但研究中可能只關注學生的身高和體重。身高和體重是一系列數據,它們具有一定的規律性,比如服從正態分布。因此,總體的含義包括三個方面:研究對象的全體、一系列數據以及服從某種概率分布。
為了研究總體的某些特征,就需要從總體中抽取一部分作為樣本。這就要求樣本具有代表性,也就是說可以通過樣本來推斷整個總體的特征。因此,選取樣本的方法非常重要。在統計學中,常用的方法是簡單隨機抽樣,這意味著每個個體被抽到的機會都是相等的。這樣選取的樣本不僅具有獨立性,而且與總體的分布完全相同。
為了確保樣本具有代表性,不能只看到幸存者的數據資料,還需要考慮遇難者的數據資料,并綜合考慮各種情況。只有這樣才能保證結論的正確性。
典型案例
柏克森悖論
美國醫生伯克森(Berkson)對所在醫院中糖尿病患者和膽囊炎患者做統計時發現,糖尿病患者同時患膽囊炎的人數較少,而非糖尿病患者的膽囊炎發病率相對較高。這似乎說明糖尿病患者可以免受膽囊炎的折磨,但深入研究卻無法證明糖尿病能對膽囊炎起到有效的防護作用。和絕大多數人生活中的錯覺一樣,柏克松醫生忽略掉的是那些沒有住院的多數,以及入住其他醫院的患者,從而掉進了“幸存者偏差”陷阱。
讀書無用論
在中國存在部分一種普遍現象,一些在學生時代學習好的人畢業后掙錢沒有不好好學習的人多,于是很多人就得出“讀書無用”的結論。但是這種結論忽略了“沒好好學習的人也混得好”只是個例,中國人口基數太大,這部分人口的絕對數量很多,但卻忽略了絕大多數的不讀書者生活艱辛和讀書者更容易改善生活的事實。新中國成立以來,出現過三次“讀書無用論”的思潮。第一次是在文革后期,學校停課,知識分子成為批斗的對象。第二次出現在改革開放初期的80年代末和90年代初,許多人進入個體戶行列而勤勞致富,而教授、醫生、教師、公務員、工程師等依然在單位拿著固定工資,收入差距十分明顯。2013年前后,“讀書無用論”從農村出現,高昂的學費和大學畢業后找不到工作等問題令許多農村青年放棄高考,在一些農村學校,放棄高考的學生高達三成。
股票市場
股票市場指數表現強勁并不意味著所有股票都表現良好。市場指數通常是由表現良好的股票組成的,而表現不佳的股票則被剔除。因此,市場指數可能會對歷史收益進行過高估計。投資領域中,成功的投資者常常談論他們的經驗和方法,但觀眾和讀者往往忽略了一個事實:采用相同經驗和方法卻失敗的人沒有機會被曝光。這種幸存者偏差現象可能導致以下結果:(1)成功者聲名顯赫,失敗者默默無聞,由于媒體大量渲染,觀眾或追隨者會高估成功的概率;(2)由于條件限制或心理因素,成功者難以保持理性和客觀,容易夸大自己的能力,忽視時機、地點、人物等因素,削弱對風險的認識。例如,在股票市場中,短期投資賺大錢的人不在少數,每逢牛市或大漲行情還會催生許多“股神”,投資者很容易看到某人在股市穩定地賺了幾千萬,但忽略了在追逐股市的道路上有成千上萬的失敗者,而且能持續投資3年以上的投資者并不多,那些賠錢的人大多會默默離開,不會對外提及自己的虧損。由于互聯網的渲染,潛意識中讓投資者覺得在股市中取得成功很容易,導致更多的投資者去模仿,但大部分人無法幸存。
貓墜樓
1987年發表在《美國獸醫協會雜志》(Journal Of American Veterinary Medical Association)上的一項研究觀察了132只貓,這些貓平均摔落5.5層樓后仍然幸存下來。根據研究,如果沒有及時接受緊急獸醫護理,其中三分之一的貓可能會喪生。有趣的是,從七層樓以下墜落的貓通常比從更高樓層摔落的貓受傷更嚴重。有人提出了一種可能的解釋是,貓在跌落到大約五層樓時會矯正自己的姿勢,達到終端速度后會放松,因此從六層樓或更高處墜落的貓受傷程度會減輕。1996年,《The Straight Dope》報紙專欄提出了另一種可能的解釋,即幸存者偏差。與受傷的貓相比,在跌落中死亡的貓不太可能被帶到獸醫那里,所以該主題的研究中沒有報告許多從較高建筑物墜落時死亡的貓。
熱帶植物
熱帶藤本植物(Tropical vines)和藤本植物(lianas)通常被認為是樹木的大型寄生蟲,它們會降低宿主樹的存活率。觀察發現,在耐蔭、重木、生長緩慢的樹種中,受藤本植物侵擾的樹木比例較高,而對光照要求高、樹木較輕且生長迅速的樹種通常不會有藤本植物。這些觀察結果導致人們認為藤本植物對耐蔭物種有更強的負面影響。然而,進一步調查顯示,藤本植物對要求光照的快速生長樹種造成的危害更大,藤本植物的侵擾顯著降低了這些樹木的存活率。因此,這些植物的觀察樣本偏向于那些幸存且沒有藤本植物的樣本。由于幸存者偏差的存在,樹冠上存在藤本植物的樣本呈現出傾斜的情況。
鍵盤俠時代
互聯網的幸存者偏差體現在旁觀者和參與者在觀察和評論的過程中,往往傾向于認同“幸存者”的經驗而非“未能幸存者”的經驗。這種邏輯謬誤的本質實則是一種簡化論。例如,當與論對"大學畢業生求職到底有多難"進行討論時,很多人會傾向于相信那些在求職中取得成功的人的觀點,在心理和情感上更傾向于相信"不難"。再如,當有人發言說如今職場性騷擾現象嚴重,很多人也會傾向于用自己"從未被性騷擾過"這樣的經驗,來駁斥上述說法。
影響
幸存者偏差相關的風險可能會導致對現實的扭曲認知,從而導致錯誤的結論和決策。因為忽視了不成功的案例,就可能會導致低估風險,高估成功的機會,并采取錯誤的假設或策略。為了避免這種偏見,要同時關注幸存者和非幸存者,并分析結果的整體分布,而不僅僅是極端的分布。
個體影響
幸存者偏差普遍存在,對決策具有深刻影響。這種偏差通常與金融決策、創業、賭博和醫學研究相關。在這些領域做決策時,決策者如果無法考慮到成功和失敗因素,幸存者偏差就會深刻影響個人的認知和判斷。沒有足夠數據做出理性決策,個人就無法為自己做出最佳選擇。
系統影響
歷史敘事
在對歷史的影響以及理解上來看。根據不同學派、不同呈現方式和不同的史料,就可能產生偏見。對某些群體及其歷史上的成功過于關注,淡化其他人的歷史。一些階級就可能利用這種幸存者偏差,讓群眾產生錯誤的歷史觀和世界觀,例如英雄史觀、種族主義等。
流行病學
幸存者偏差在疾病診斷也是普遍存在的,特別是與診斷后的生存率有關。被醫治后生存情況較好的患者通常是那些年齡、先前健康狀況和體能水平低風險的患者。健康狀況較差的患者并非總能存活,他們的死亡就不計入生存率的計算,這就意味著生存率計算中的患者被相對健康的個體所不成比例地代表。由于那些在被診斷后不久去世或在正式診斷前就去世的個體沒有計入生存率計算中,生存結果被夸大。例如,在COVID-19大流行期間,生存率成為一個重要問題。許多流行病學家和醫生認為,一些國家或地區公開的計算結果并不能提供完整的數據。未經COVID-19測試就死亡的患者不被視為病毒死亡人數的一部分,這可能會扭曲生存率。在全球范圍內,許多國家和他們的醫療系統在進行測試方面存在問題,導致從該疾病產生的數據可能存在幸存者偏差。
產品營銷
大部分營銷活動都涉及到推薦——這是消費者非常重視的數據。觀測者經常想知道產品是否有效,所以觀測者可能會查閱廣告中呈現的“臨床試驗”和獨立資助的研究。然而,這種研究結果數字背后可能有被隱藏的數據,換句話說,產品的研究可能無法反映完整的情況。當觀測者沒有意識到研究的全部參數時,就很容易產生偏見。例如,樣本大小、是否有人退出研究、樣本使用產品的時長等,這些問題對于確定其有效性都很重要。
人工智能
人工智能是一個不斷發展的領域,廣泛使用可能導致多家公司推出下一個重大進展,過快地推出軟件可能會導致忽視一些被隱藏的問題。具體而言,觀測者可能沒有考慮到,在他獲得完善系統之前的多次失敗,從而低估人工智能的局限性,這導致在決策或研究中被人工智能誤導。
對關鍵事物的判斷影響
選擇偏差
只關注已經存活成功的人或物,而忽略了那些已失敗或已死亡的人或物。這樣會導致我們只能看到成功者的成功因素,卻無法了解失敗者的失敗原因。
抽樣偏差
只對已成功的樣本進行調查或研究,忽略了失敗樣本的存在。這樣可能會導致樣本的代表性不夠,結論不能得到充分驗證。
數據收集偏差
只收集已成功的數據或信息,而忽略了失敗的數據或信息。這樣會導致我們無法得到全面的數據或信息,難以做出客觀準確的分析和判斷。
在企業決策中的影響
樣本偏移
只針對特定的成功樣本做出推論或決策,而忽略了潛在風險或失敗樣本的存在。這樣會導致決策偏差,可能會帶來財務或事業的損失。
過度依賴成功記錄
企業決策者容易過度依賴那些已經成功生存下來的企業或基金的業績數據。他們可能會忽視那些已經失敗或破產的企業的數據,從而導致對成功企業的真正原因和成功的必要條件有所誤解。
忽視失敗的可能性
幸存者偏差會使企業決策者忽視失敗的可能性。他們可能傾向于相信過去的成功記錄是長期可持續的,并忽視了失敗的風險。這可能導致決策者對投資決策過于樂觀,從而忽視了潛在的風險和不確定性。
誤解行業或市場情況
幸存者偏差使企業決策者只看到那些生存下來的企業或基金的成功案例,而忽視了其他已經失敗的公司的經驗教訓。這可能導致他們對整個行業或市場的真實情況有所誤解,缺乏對失敗因素的全面認識。
避免幸存者偏差的對策
提高樣本代表性
幸存者偏差的主要原因是樣本代表性問題。提高樣本的代表性有助于規避幸存者偏差。需要注意到"沉默數據"的存在,合理取樣是基于對總體的正確認識。忽視"沉默數據"會導致抽樣偏誤,降低樣本的代表性,從而得出有偏差的結論。只有意識到"沉默數據"的存在,才能選擇具有代表性的樣本,準確反映事物的本質特征,得出正確結論。在現實中,不是所有的"沉默數據"都能被發現,樣本代表性有時難以顯著提升。這時可以使用權重調整方法,通過給不同數據賦予不同的權重,調整各類數據在樣本中所發揮的作用,以提高樣本的代表性,避免幸存者偏差陷阱。對于易收集、看得見的"顯性數據",可以賦予較低的權重;而對于難以收集、看不見的"沉默數據",可以賦予較高權重,避免陷入幸存者偏差。改善思維模式、深化對隨機性的認識以及確定合理的預期值也有助于避免幸存者偏差。為了避免思維模式固化,觀察者應采取兼容并蓄的態度看待問題,并拓寬信息渠道和擴大信息量。保持獨立思考能力,不被他人所謂的"經驗"所蒙蔽。正確認識隨機性,不僅憑少數個體得出結論,而是建立在大量觀察基礎之上。在評價事物時,應采取一致的評價標準,不偏袒某一方面。
對事物進行概率分析
對統計學知識的透徹理解可以提升對幸存者偏差的感知能力。統計方法在各個領域中發揮作用,幫助人們揭示事物背后的規律。假設每個事件都是相互獨立且具有相同的概率分布。這使得我們可以計算出事件發生的概率。使用統計方法來分析數據,如計算均值、方差、標準差等,以及運用概率分布來預測和量化事件發生的可能性。熟練掌握統計學理論和方法有助于避免包括幸存者偏差在內的陷阱和錯誤。作為一種不可忽視的統計現象,熟悉幸存者偏差的內涵、了解其產生原因,并采取有針對性的對策措施,能夠有效規避幸存者偏差,獲得更客觀準確的認知和決策。
評價
“作為一種思維方式,幸存者偏差的破壞力是巨大的。要消除幸存者偏差,必須長期地、有意識地在制度設計和大眾教育中融入平等主義的精神,沒有捷徑可走。”——清華大學新聞與傳播學院副教授常江
“當你成為'獲勝'團隊的一員時,幸存者偏見會變得特別有害。即使你的成功源于純粹的巧合,你也會發現與其他獲獎者的相似之處,并試圖將這些標記為“成功因素”。然而,如果你曾經去過失敗的個人和公司的墓地,你會發現它的租戶擁有許多與你的成功相同的特征。——“解構經濟”博士、瑞士作家、企業家Rolf Dobelli
“大多數人對運氣有一種幸存者偏見。當奇妙的事情發生時,當準備遇到機會并取得出色的結果時,我們會想:多么幸運!但是我們通常不會承認所有事情只是......失敗了。所有準備都一無所獲的時候。”——Netflix的聯合創始人兼第一任首席執行官Marc Randolph
“倒閉餐館的墓地非常安靜。當然,在這種致命的環境中沒有失敗的少數人是非常成功的,因為只有最優秀和非常幸運的人才能生存下來。你剩下的只是超級成功,日復一日地看著它們,當你真正看到你應該避免它的證據時,你可能會認為這是一項偉大的業務。”——《黑天鵝》(The Black Swan)作者Nassim Taleb
“一個行之有效的愚蠢決定,事后看來會成為一個聰明的決定。像微軟、谷歌或蘋果公司這樣的偉大公司做對的事情就像機翼上有彈孔的飛機一樣。那些在遭受巨大破壞后一路燒毀的公司從記憶中消失了。”——《思考快與慢》(Thinking Fast and Slow)作者Daniel Kahneman
“技巧會讓你在賭桌上下更多的賭注,但這并不是成功的保證……因此,當心成功者的建議。”——谷歌工程師Barnaby James
參考資料 >
Do cats always land unharmed on their feet, no matter how far they fall?. Wayback Machine.2023-10-24
【心知識】第82期:幸存者偏差.微信公眾平臺.2025-08-05
“幸存者偏差”怎樣影響農資“價值認知”?.中國供銷合作網.2025-07-29
【心知識】第82期:幸存者偏差.微信公眾平臺.2025-08-05
“讀書無用論”卷土重來?.人民網.2023-11-13
幸存者偏差(股市).雪球.2023-11-13
一只貓從多高的地方墜落并存活下來?.Science Focus.2023-12-16
Highrise Syndrome in Cats.PetPlace.2023-10-24
Falling Cats. Wayback Machine .2023-10-24
Survivorship Bias.The Decision Lab.2023-11-14
Quotable Quote.goodreads.2023-10-24
Marc Randolph Quotes.BrainyQuote.2023-10-24
Survivorship Bias .David McRaney.2023-10-24