必威电竞|足球世界杯竞猜平台

負(fù)二項分布
來源:互聯(lián)網(wǎng)

負(fù)二項分布是統(tǒng)計學(xué)上一種離散概率分布。滿足以下條件的稱為負(fù)二項分布:實驗包含一系列獨立的實驗每個實驗都有成功、失敗兩種結(jié)果,成功的概率是恒定的,實驗持續(xù)到r次成功,r為正整數(shù)。

簡介

滿足以下條件的稱為負(fù)二項分布

1.實驗包含一系列獨立的實驗。

2.每個實驗都有成功、失敗兩種結(jié)果。

3.成功的概率是恒定的。

4.實驗持續(xù)到r次成功,r可以為任意正數(shù)

當(dāng)r是整數(shù)時,負(fù)二項分布又稱布萊士·帕斯卡分布(布萊士·帕斯卡分布),其概率密度函數(shù)為(其中一種形式,兩種形式對比看下文):

它表示,已知一個事件在伯努利試驗中每次的出現(xiàn)概率是p,在一連串伯努利試驗中,一件事件剛好在第r+k次試驗出現(xiàn)第r次的概率。

定義

假設(shè)有一組獨立的伯努利數(shù)列,每次實驗有兩種結(jié)果“成功”和“失敗”。每次實驗的成功概率是p,失敗的概率是1-p。我們得到一組數(shù)列,直到預(yù)定的失敗數(shù)發(fā)生r次。那么結(jié)果為“成功”的隨機(jī)數(shù)X會服從負(fù)二項分布(或布萊士·帕斯卡)分布:

X~NB(r;P)

我們在現(xiàn)實生活中也常有應(yīng)用,成功和失敗的結(jié)果可能或者可能不是我們平時所認(rèn)認(rèn)為的“好”與“壞”。假設(shè)我們把負(fù)二項分布用在一臺設(shè)備在故障前正常運行的天數(shù)的模型,這種情況下,設(shè)備一天運行正常,記為結(jié)果“成功”,反之故障的話結(jié)果為“失敗”。如果我們把負(fù)二項分析用在動作員嘗試射門得分前的嘗試次數(shù)模型,這種情況下,每次不成功的嘗試在模型里為“成功”,并且得分記為“失敗”。如果我們拋硬幣,負(fù)二項分布可以把頭像一面作為“成功”來記數(shù),在我們提到失敗的結(jié)果之前。在下面的概率密度函數(shù)里,P是成功的概率,1-p是失敗的概率。

負(fù)二項分布的概率密度函數(shù)為:

這里的括號里的數(shù)為二項分布的系數(shù),并且等于

該數(shù)可以按下面的格式表示,也正是解釋了“負(fù)二項”的名字的由來:

為了理解上面的概率密度函數(shù),因為k+r次重復(fù)試驗的結(jié)果假設(shè)是獨立的,需要注意每個特定的k作為成功和r失敗的數(shù)列為(1-p)p。因為第r個失敗是最后發(fā)生的,所以需要k+r-1次重復(fù)實驗中有k次成功的。上面的二項分布系數(shù),正好它的組合長度為k+r-1。

遞推公式為

舉例

舉例說,若我們擲子,擲到一即視為成功。則每次擲骰的成功率是1/6。要擲出三次一,所需的擲骰次數(shù)屬于集合{3,4,5,6,...}。擲到三次一的擲骰次數(shù)是負(fù)二項分布的隨機(jī)變量。要在第三次擲骰時,擲到第三次一,則之前兩次都要擲到一,其概率為(1/6)。注意擲骰是伯努利試驗,之前的結(jié)果不影響隨后的結(jié)果,即每次實驗為獨立隨機(jī)實驗。若要在第四次擲骰時,擲到第三次一,則之前三次之中要有剛好兩次擲到一,在三次擲骰中擲到2次1的概率為:

第四次擲骰要擲到一,所以要將前面的概率再乘(1/6)。

期望

參數(shù)為(r,p)的負(fù)二項分布的數(shù)列k+r的期望是r/(1-p)。為了更直觀的觀察,想象上面的實驗進(jìn)行了許多次,也就是說,進(jìn)行特定的實驗直到r個失敗出現(xiàn),然后另外的一個特定的實驗,然后是另外的實驗,等等。寫下每次實驗的這些嘗試的次數(shù):a,b,c…并且把a(bǔ)+b+c+…=N。現(xiàn)在我們對失敗的預(yù)期為N(1-p)。我們說實驗重復(fù)了n次,并且總共有有nr個失敗。所以我們估計nr=N(1-p),所以N/n=r/(1-p)。注意N/n僅僅是平均每個實驗的嘗試次數(shù)。這就是我們所說的“期望”。每次實驗的平均成功的嘗試次數(shù)為N/n-r,期望值等于r/(1-p)-r=rp/(1-p)。

實數(shù)r的延伸

把負(fù)二項分布的定義延伸到到的參數(shù)r。盡管很難想象一個非整數(shù)的失敗次數(shù),我們?nèi)匀豢梢酝ㄟ^概率密度函數(shù)在形式上定義這個分布。

就像之前,我們說X服從負(fù)二項分布(或者波利亞分布),如果它有一個如下所示的概率密度函數(shù):

這里r是一個正實數(shù)。通過乘法公式二項分布系數(shù)可以重新定義,并且可以重新寫成gamma分布的公式。

注意二項分布序列和上面的內(nèi)容里,0≤p≤1.

因此,概率密度函數(shù)的項實際上可以合并成一項。

替代公式

有一些書里的負(fù)二項分布的公式定義可能和這里的有一些小區(qū)別。最常見的變化就是:

X是實驗總次數(shù),得到r個失敗的嘗試。不僅僅是成功的次數(shù)。因此,實驗總次數(shù)等于失敗數(shù)加成功數(shù),這個不同于這里定義的X。

為了把公式換這種定義進(jìn)行轉(zhuǎn)換,把k用k-r代替,并且從均值、中位數(shù),或者眾數(shù)中減去r。為了將按本節(jié)定義的負(fù)二項分布的公式轉(zhuǎn)換成本文里的公式,需要用k+r代替k,并且在均值,中位數(shù),眾數(shù)中加上r。

這個可能比上面的版本看起來更像二項分布,注意二項分布的參數(shù)是按順序減少的:最后一個失敗必然在最后發(fā)生,所以其它的事件有更少的可利用的位置,在計算順序可能性時。

注意這里的負(fù)二項分布的定義沒有推廣到正實數(shù)r。

P表示失敗的概率,不是成功的。為了把公式進(jìn)行轉(zhuǎn)換,每個地方用1-p代替p。X定義為失敗次數(shù),而不是成功的,這里的定義X為失敗的,但P是成功的,和前面X表示成功但P表示失敗概率的情況用同樣的公式。但是失敗和成功的描述是一致的,并且和前面的進(jìn)行替換。

這兩個替代公式可能會同時使用,比如X表示總次數(shù),P表示失敗次數(shù)。

負(fù)二項回歸,分布是在均值m項里就定義了,并且和線性回歸或者其它的一般線性回歸的解釋變量相關(guān)。概率密度函數(shù)變?yōu)?/p>

方差可以寫成m+m/r,參數(shù)r參考離散參數(shù),形狀參數(shù),集中系數(shù),或者非均勻或者集中參數(shù)。集中參數(shù)特別常用于生態(tài)學(xué)用來描述獨立微生物。減少聚集參數(shù)r到0,與增加微生物聚集相一致。0到正無窮的增加相當(dāng)于沒有聚合,可以被描述成泊松分布。一些負(fù)二項回歸使用r的倒數(shù)并且當(dāng)作分散度參數(shù)。

有時候分布使用均值u和方差σ來參數(shù)化分布,這種情況下:

事件

在r為整數(shù)的特定情況下,負(fù)二項分布也可以稱作帕斯卡分布。它是在獨立重復(fù)的伯努利實驗中成功和失敗的數(shù)目的概率分布。因為k+r次概率為p的成功的伯努利實驗可以得到最后一次為失敗的k次成功和r次失敗的概率。換句話說,負(fù)二項分布為成功概率為p的伯努利過程中第r次失敗前的成功次數(shù)的概率分布。一個伯努利過程是離散的過程。因此,實驗次數(shù),失敗、成功次數(shù)都是整數(shù)。

參考資料 >

生活家百科家居網(wǎng)