在概率論和統(tǒng)計(jì)學(xué)中,概率質(zhì)量函數(shù)(probability 質(zhì)量 函數(shù),簡(jiǎn)寫作pmf)是離散隨機(jī)變量在各特定取值上的概率。有時(shí)它也被稱為離散密度函數(shù)。概率質(zhì)量函數(shù)通常是定義離散概率分布的主要方法,并且此類函數(shù)存在于其定義域是離散的標(biāo)量變量或多元隨機(jī)變量。具有最大概率質(zhì)量的隨機(jī)變量的值稱為眾數(shù)。
數(shù)學(xué)定義
概率質(zhì)量函數(shù)和概率密度函數(shù)不同之處在于:概率質(zhì)量函數(shù)是對(duì)離散隨機(jī)變量定義的,本身代表該值的概率;概率密度函數(shù)是對(duì)連續(xù)隨機(jī)變量定義的,本身不是概率,只有對(duì)連續(xù)隨機(jī)變量的概率密度函數(shù)在某區(qū)間內(nèi)進(jìn)行積分后才是概率。
假設(shè)X是一個(gè)定義在可數(shù)樣本空間S上的離散隨機(jī)變量,則其概率質(zhì)量函數(shù)為
注意這在所有實(shí)數(shù)上,包括那些X不可能等于的實(shí)數(shù)值上,都定義了 。在那些X不可能等于的實(shí)數(shù)值上,取值為,取為0)。
離散隨機(jī)變量概率質(zhì)量函數(shù)的不連續(xù)性決定了其累積分布函數(shù)也不連續(xù)。
例子
概率質(zhì)量函數(shù)可以定義在任何離散隨機(jī)變量上,包括常數(shù)分布,二項(xiàng)分布(包括Bernoulli分布),負(fù)二項(xiàng)分布,西莫恩·泊松分布,幾何分布以及超幾何分布隨機(jī)變量上。
有限
存在三個(gè)相關(guān)的主要分布,伯努利分布、二項(xiàng)式分布、和幾何分布。
伯努利分布
伯努利分布:ber(p),用于對(duì)只有兩種可能結(jié)果的實(shí)驗(yàn)進(jìn)行建模。這兩個(gè)結(jié)果通常編碼為1和0。
一個(gè)伯努利分布的例子是拋硬幣。假設(shè)X是拋硬幣的結(jié)果,反面取值為0,正面取值為1。則在狀態(tài)空間{0, 1}(這是一個(gè)雅各布·伯努利(Bernoulli)隨機(jī)變量)中,X = x的概率是0.5,所以概率質(zhì)量函數(shù)是
無(wú)限
以下呈指數(shù)下降的分布是具有無(wú)限數(shù)量可能結(jié)果的分布示例——所有正整數(shù):
盡管可能的結(jié)果有無(wú)限多,但總概率質(zhì)量為 1/2 + 1/4 + 1/8 +? = 1,滿足概率分布的單位總概率要求。
多變量情況
兩個(gè)或多個(gè)離散隨機(jī)變量具有聯(lián)合概率質(zhì)量函數(shù),它給出了隨機(jī)變量的每個(gè)可能的實(shí)現(xiàn)組合的概率。
參考資料 >