均勻分布(英文:Uniform 廣義函數(shù)),亦稱一致分布,又稱等概率分布。均勻分布的隨機(jī)變量在確定的區(qū)間中,所取得每個(gè)值具有等可能性,它是一種常見的連續(xù)型隨機(jī)變量的分布。
均勻分布的歷史與等可能性思想的形成密不可分。概率論概念的形成最早可見于16世紀(jì),概率是一個(gè)事件發(fā)生,一種情況出現(xiàn)的可能性大小的數(shù)量指標(biāo),介于與之間。1657年,數(shù)學(xué)家克里斯蒂安·惠更斯(英文:Huygens)出版的概率論著作《機(jī)遇的規(guī)律》中,從關(guān)于公平賭博的值的一條公理出發(fā),推出了關(guān)于“期望”的3條定理,并可在書中前幾個(gè)命題見到等可能性的思想。后來,1713年著名數(shù)學(xué)家雅各布·伯努利(英文:Jacob Bernoulli)所著《推測術(shù)》一書出版,書中把古典概率中“等可能性”的思想推廣到主觀概率的場合,當(dāng)沒有任何理由可以認(rèn)為眾多可能性中的某一個(gè)或某一些比其他可能性更具優(yōu)勢時(shí),應(yīng)給予這些可能性以同等的主觀概率。如某個(gè)未知量取值區(qū)間在之內(nèi),取區(qū)間內(nèi)任一值有同等的可能性,即取內(nèi)的均勻分布為的主觀概率分布,被稱為“同等無知原則”,在數(shù)理統(tǒng)計(jì)學(xué)史上有著重要的意義。
均勻分布有幾個(gè)基本性質(zhì),包括數(shù)學(xué)期望,方差等數(shù)字特征。它與其他常見的連續(xù)型分布有著重要的聯(lián)系,如正態(tài)分布、韋布爾分布、指數(shù)分布、貝塔分布等。若增加隨機(jī)變量的個(gè)數(shù),均勻分布還可推廣至多維。同時(shí),它作為一種重要的統(tǒng)計(jì)工具不僅能處理一些現(xiàn)實(shí)生活的問題,如候車問題等,還可以廣泛地應(yīng)用于遺傳學(xué)、計(jì)算機(jī)等其他科學(xué)領(lǐng)域,如在現(xiàn)代計(jì)算機(jī)技術(shù)中,均勻分布是蒙特卡洛方法的理論依據(jù),并且在數(shù)值計(jì)算中,定點(diǎn)計(jì)算的舍入誤差可作為均勻分布的隨機(jī)變量。
歷史
1657年,數(shù)學(xué)家克里斯蒂安·惠更斯出版了概率論著作《機(jī)遇的規(guī)律》,書中從關(guān)于公平賭博的值的一條公理出發(fā),推出關(guān)于“期望”(這是惠更斯首先引進(jìn)的術(shù)語)的3條定理。惠更斯基于這些定理并利用遞推法等工具解決了當(dāng)時(shí)一些機(jī)遇博弈的問題。《機(jī)遇的規(guī)律》中的3條定理加上11個(gè)問題,被稱為惠更斯的14個(gè)命題,其中的前兩個(gè)命題描述如下:
從上述命題中,已可見到等可能性的思想。
后來,1713年數(shù)學(xué)家雅各布·伯努利所著《推測術(shù)》出版,書中伯努利把古典概率中“等可能性”的思想推廣到主觀概率的場合,當(dāng)沒有任何理由可以認(rèn)為眾多可能性中的某一個(gè)或某一些比其他可能性更具優(yōu)勢時(shí),應(yīng)給予這些可能性以同等的主觀概率。如某個(gè)未知量取值區(qū)間在之內(nèi),取區(qū)間內(nèi)任一值有同等的可能性,即取內(nèi)的均勻分布為的主觀概率分布原則,被稱為“同等無知原則”,在數(shù)理統(tǒng)計(jì)學(xué)史上有著重要的意義。
定義
均勻分布是一種常見的連續(xù)型隨機(jī)變量分布,即隨機(jī)變量在確定的區(qū)間中,所取得每個(gè)值具有等可能性的分布。
若是兩個(gè)有限數(shù),且隨機(jī)變量的密度函數(shù)為: 則稱服從上的均勻分布,記為
特別地,當(dāng)時(shí),稱為標(biāo)準(zhǔn)均勻分布。
均勻分布的分布函數(shù)為:
均勻分布反映的一切可能值充滿整個(gè)有限區(qū)間,并且在該區(qū)間內(nèi)的任一點(diǎn)有相同的分布密度,即分布密度在區(qū)間上為常量。在數(shù)值計(jì)算中,擬在小數(shù)點(diǎn)后第位上進(jìn)行四舍五入,若用表示舍入誤差,則服從區(qū)間上的均勻分布。
舉例
設(shè)隨機(jī)變量服從上的均勻分布,現(xiàn)對進(jìn)行次獨(dú)立觀測,試求至少有次觀測值大于的概率。
解:設(shè)隨機(jī)變量是次獨(dú)立觀測中觀測值大于的次數(shù),則其中
由知的密度函數(shù)為
所以
于是可得
答:至少有次觀測值大于的概率為
性質(zhì)
性質(zhì)1
數(shù)學(xué)期望定義:設(shè)連續(xù)隨機(jī)變量的密度函數(shù)為,若,則稱為的數(shù)學(xué)期望,或稱為該分布的數(shù)學(xué)期望,簡稱期望或均值。若不收斂,則稱的數(shù)學(xué)期望不存在。
均勻分布的數(shù)學(xué)期望:
性質(zhì)2
方差定義:若隨機(jī)變量的數(shù)學(xué)期望存在,稱偏差平方的數(shù)學(xué)期望為隨機(jī)變量(或相應(yīng)分布)的方差,記為
性質(zhì)2 均勻分布的方差:
性質(zhì)3
隨機(jī)變量的分布函數(shù)連續(xù),且嚴(yán)格單調(diào)增加,則
性質(zhì)4
即若則反之,若則
相關(guān)概念
正態(tài)分布
正態(tài)分布(normal 廣義函數(shù))亦稱常態(tài)分布、誤差分布、高斯分布。
定義:若隨機(jī)變量取不超過實(shí)數(shù)的值的事件概率為
式中為實(shí)參數(shù),且,則的分布稱為(一維)正態(tài)分布,簡記為
密度函數(shù):
實(shí)參數(shù)分別是正態(tài)分布的數(shù)學(xué)期望和方差,所以正態(tài)分布是由其數(shù)學(xué)期望和方差唯一確定的。
當(dāng)時(shí),正態(tài)分布,即,稱為標(biāo)準(zhǔn)正態(tài)分布。
與均勻分布的關(guān)系:
其中獨(dú)立同服從均勻分布
韋布爾分布
定義:若隨機(jī)變量的分布密度為,則稱服從韋布爾分布(Weibull 廣義函數(shù))。
其中稱為形狀參數(shù),稱為位置參數(shù),稱為尺度參數(shù),其分布函數(shù)為:
與均勻分布的關(guān)系:隨機(jī)變量服從韋布爾分布的充分必要條件為:,其中服從均勻分布
指數(shù)分布
指數(shù)分布(exponentialdistribution)是韋布爾分布的特殊情況,即分布密度中的韋布爾分布。
定義:若隨機(jī)變量的密度函數(shù)為,其中參數(shù)為正的常數(shù),則稱服從指數(shù)分布,相應(yīng)的分布函數(shù)為:
與均勻分布的關(guān)系:隨機(jī)變量服從指數(shù)分布的充分必要條件為:,其中服從均勻分布
貝塔分布
定義:若隨機(jī)變量的分布密度為
其中,是伽馬函數(shù),為分布參數(shù)。由于的形式與貝塔函數(shù)的積分表示有密切聯(lián)系,故稱服從貝塔分布。它的數(shù)學(xué)期望為,方差為
與均勻分布的關(guān)系:隨機(jī)變量服從貝塔分布的充分必要條件為:,其中
獨(dú)立同服從均勻分布
相關(guān)定理
均勻分布的相關(guān)定理
伯努利分布的定義:設(shè)隨機(jī)變量只可能取和兩個(gè)值,且分布律為和,則稱隨機(jī)變量服從伯努利分布(或兩點(diǎn)分布,分布)。
均勻分布的相關(guān)定理:任一概率空間上的隨機(jī)變量服從上的均勻分布的充要條件為:
存在上的隨機(jī)變量序列獨(dú)立同伯努利分布,且可以表示成無窮級數(shù)的形式。
相關(guān)定理的應(yīng)用
均勻分布可應(yīng)用于產(chǎn)生上服從均勻分布的隨機(jī)數(shù)。
例如,要產(chǎn)生一個(gè)服從均勻分布上的隨機(jī)數(shù),可以先產(chǎn)生個(gè)服從雅各布·伯努利分布的隨機(jī)數(shù),各,隨后代入公式,即,計(jì)算即可得。
對任一概率空間上的隨機(jī)變量總存在上的獨(dú)立隨機(jī)變量序列使得同分布。
(證明過程略,見參考資料)
相關(guān)推廣
聯(lián)合密度函數(shù)的定義:給定二維連續(xù)型隨機(jī)變量,如果存在一個(gè)定義域?yàn)檎麄€(gè)平面的二元非負(fù)實(shí)值函數(shù),使得的分布函數(shù)可以表達(dá)成:
,那么稱為連續(xù)型隨機(jī)變量的(概率)密度函數(shù)(或分布),或者稱為隨機(jī)變量與的聯(lián)合(概率)密度函數(shù)(或聯(lián)合分布)。
二維均勻分布
設(shè)為平面上的有界區(qū)域,其面積為,二維連續(xù)型隨機(jī)變量的概率密度為
,則稱服從區(qū)域上的均勻分布。
若在區(qū)域上服從均勻分布,則對于任一平面區(qū)域,有
其中為平面區(qū)域與的公共部分的面積。
特別地,對于內(nèi)任何子區(qū)域,有
n維均勻分布
設(shè)為中的一個(gè)有界區(qū)域,其度量(平面的為面積,空間的為體積等)為,如果維隨機(jī)變量的聯(lián)合密度函數(shù)為:
,則稱服從區(qū)域上的維均勻分布。
統(tǒng)計(jì)推斷
參數(shù)估計(jì)是統(tǒng)計(jì)學(xué)的重要概念之一,運(yùn)用從總體抽取的隨機(jī)樣本對總體分布中的未知參數(shù)值做出估計(jì),可以將均勻分布等統(tǒng)計(jì)模型應(yīng)用于實(shí)踐,是一種重要的統(tǒng)計(jì)推斷方法。
矩估計(jì)
矩估計(jì)的定義:設(shè)總體具有概率分布函數(shù)其中是未知參數(shù)。若取自總體的一個(gè)樣本的階矩存在,則稱為的函數(shù)。
而階樣本矩為
再令
即可得到包含個(gè)未知參數(shù)的個(gè)方程,此方程組的解就可作為總體參數(shù)的估計(jì)量,這種估計(jì)稱為矩估計(jì)。
均勻分布的矩估計(jì):設(shè)總體服從區(qū)間上的均勻分布,是總體的樣本,可得未知參數(shù)的矩估計(jì)量為:
最大似然估計(jì)
最大似然估計(jì)的定義:設(shè)總體的概率函數(shù)為其中是一個(gè)未知參數(shù)或幾個(gè)未知參數(shù)組成的參數(shù)向量,是參數(shù)空間,是來自該總體的樣本,將樣本的聯(lián)合概率函數(shù)看成的函數(shù),記為稱為似然函數(shù)。如果某統(tǒng)計(jì)量滿足則稱為參數(shù)的最大似然估計(jì)量,這種估計(jì)稱為最大似然估計(jì)。
均勻分布的最大似然估計(jì):設(shè)總體服從區(qū)間上的均勻分布,是總體的樣本,可得未知參數(shù)的最大似然估計(jì)量為:
區(qū)間估計(jì)
區(qū)間估計(jì)的定義:設(shè)是總體的分布函數(shù),是變元,是參數(shù)。給定了一個(gè)概率數(shù)值,再由樣本確定兩個(gè)參數(shù)值及,使得對于給定值,滿足,則隨機(jī)區(qū)間稱為參數(shù)的置信區(qū)間或區(qū)間估計(jì)。
均勻分布的區(qū)間估計(jì):設(shè)總體服從區(qū)間上的均勻分布,為來自總體的容量為的一個(gè)簡單隨機(jī)樣本,次序統(tǒng)計(jì)量為通過計(jì)算可得參數(shù)的置信水平為的置信區(qū)間為其中,
應(yīng)用
現(xiàn)實(shí)生活
均勻分布因其各種結(jié)果發(fā)生的可能性相同,因此可以用來模擬現(xiàn)實(shí)生活中很多未知分布的問題,如候車問題。
若某班公交車的發(fā)車間隔為分鐘,不考慮中途路況的影響,則該公交到達(dá)車站的間隔為分鐘。在等車問題下,要考慮某個(gè)乘客甲到達(dá)車站后,等候公交車的平均等候時(shí)間,就需要用到均勻分布對其等候時(shí)間的分布進(jìn)行建模。
解:由于并不知道公交車究竟是上一輛剛剛離開(需要等候分鐘)還是下一輛即將到來(需要等待0分鐘),可得下一趟公交車的到來時(shí)間服從上的均勻分布,即該乘客需要等候時(shí)間的概率為進(jìn)一步計(jì)算可得到等候時(shí)間的期望為
遺傳學(xué)
在遺傳學(xué)上,人們經(jīng)常研究數(shù)量性狀,即在世代遺傳中呈連續(xù)性變異的性狀的規(guī)律性。數(shù)量遺傳學(xué)包括統(tǒng)計(jì)遺傳學(xué)和群體遺傳學(xué)兩部分,統(tǒng)計(jì)遺傳學(xué)主要研究數(shù)量性狀的遺傳和變異,研究各遺傳參數(shù)之間的關(guān)系及其估算方法,所應(yīng)用的方法是概率和統(tǒng)計(jì)學(xué)的基本方法。
利用計(jì)算機(jī)可進(jìn)行群體遺傳的計(jì)算和遺傳過程的模擬,原理是利用計(jì)算機(jī)所提供的隨機(jī)函數(shù)模擬自然界中的各種隨機(jī)現(xiàn)象,結(jié)合生物規(guī)律,產(chǎn)生模擬數(shù)據(jù),模擬生命科學(xué)中的隨機(jī)現(xiàn)象。所謂的隨機(jī)函數(shù)的數(shù)值介于之間,每次產(chǎn)生的隨機(jī)數(shù)均勻分布,且各不相同。
在群體很小時(shí),等位基因頻率會發(fā)生隨機(jī)波動(dòng)的現(xiàn)象,即產(chǎn)生遺傳漂變,會導(dǎo)致某基因座的基因固定(即基因頻率為)或丟失(即基因頻率為)。遺傳漂變來源于兩個(gè)隨機(jī)過程的發(fā)生,即親代個(gè)體基因型的確定和子代基因型的確定。
計(jì)算機(jī)科學(xué)
均勻分布在現(xiàn)代計(jì)算技術(shù)中有著重要的應(yīng)用,比較常見的應(yīng)用方法有如下幾種。
在舍入誤差中的應(yīng)用
由于數(shù)字計(jì)算機(jī)的字長有限,舍入誤差的分析在用于計(jì)算機(jī)解題時(shí)是必要的,在計(jì)算機(jī)的數(shù)值計(jì)算中,定點(diǎn)計(jì)算的舍入誤差,可以作為均勻分布的隨機(jī)變量。
蒙特卡羅方法
蒙特卡羅(Monte Carlo)方法是計(jì)算機(jī)計(jì)算中的一個(gè)重要方法,其理論依據(jù)是均勻分布的性質(zhì)之一,是基于隨機(jī)數(shù)序列抽樣的一種模擬計(jì)算方法,它不僅可以模擬自然界真實(shí)存在的隨機(jī)過程的統(tǒng)計(jì)規(guī)律,還可以通過構(gòu)建概率模型來模擬確定性問題。
參考資料 >