《概率論和數(shù)理統(tǒng)計》是高等院校理工類、經(jīng)管類的重要課程之一。主要包括概率論的基本概念、隨機變量及其概率分布、數(shù)字特征、大數(shù)定律與中心極限定理、統(tǒng)計量及其概率分布、參數(shù)估計和假設(shè)檢驗、回歸分析、方差分析、馬爾科夫鏈等內(nèi)容。在考研數(shù)學(xué)中的比重大約占22%左右。
內(nèi)容簡介
主要內(nèi)容包括:概率論的基本概念、隨機變量及其概率分布、數(shù)字特征、大數(shù)定律與中心極限定理、統(tǒng)計量及其概率分布、參數(shù)估計和假設(shè)檢驗、回歸分析、方差分析、馬爾科夫鏈等內(nèi)容。
課程描述
概率論與數(shù)理統(tǒng)計是數(shù)學(xué)的一個有特色且又十分活躍的分支,一方面,它有別開生面的研究課題,有自己獨特的概念和方法,內(nèi)容豐富,結(jié)果深刻;另一方面,它與其他學(xué)科又有緊密的聯(lián)系,是近代數(shù)學(xué)的重要組成部分。由于它近年來突飛猛進(jìn)的發(fā)展與應(yīng)用的廣泛性,目前已發(fā)展成為一門獨立的一級學(xué)科。概率論與數(shù)理統(tǒng)計的理論與方法已廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、軍事和科學(xué)技術(shù)中,如預(yù)測和濾波應(yīng)用于空間技術(shù)和自動控制,時間序列分析應(yīng)用于石油勘測和經(jīng)濟管理,馬爾科夫過程與點過程統(tǒng)計分析應(yīng)用于地震預(yù)測等,同時他又向基礎(chǔ)學(xué)科、工科學(xué)科滲透,與其他學(xué)科相結(jié)合發(fā)展成為邊緣學(xué)科,這是概率論與數(shù)理統(tǒng)計發(fā)展的一個新趨勢。 (孔繁亮)
考研介紹
題型總結(jié)
目前,大部分同學(xué)開始了概率論和數(shù)理統(tǒng)計學(xué)的復(fù)習(xí),本文主要想對同學(xué)們近期的復(fù)習(xí)做一個簡單的指導(dǎo)。概率論與數(shù)理統(tǒng)計初步主要考查考生對研究隨機現(xiàn)象規(guī)律性的基本概念、基本理論和基本方法的理解,以及運用概率統(tǒng)計方法分析和解決實際問題的能力。常有的題型有:填空題、選擇題、計算題和證明題,試題的主要類型有:
(1)確定事件間的關(guān)系,進(jìn)行事件的運算;
(2)利用事件的關(guān)系進(jìn)行概率計算;
(3)利用概率的性質(zhì)證明概率等式或計算概率;
(4)有關(guān)古典概型、幾何概型的概率計算;
(5)利用加法公式、條件概率公式、乘法公式、全概率公式和貝葉斯定理計算概率;
(6)有關(guān)事件獨立性的證明和計算概率;
(7)有關(guān)獨重復(fù)試驗及雅各布·伯努利概率型的計算;
(8)利用隨機變量的分布函數(shù)、概率分布和概率密度的定義、性質(zhì)確定其中的未知常數(shù)或計算概率;
(9)由給定的試驗求隨機變量的分布;
(10)利用常見的概率分布(例如(0-1)分布、二項分布、泊松分布、幾何分布、均勻分布、指數(shù)分布、正態(tài)分布等計算概率;
(11)求隨機變量函數(shù)的分布(12)確定二維隨機變量的分布;
(13)利用二維均勻分布和正態(tài)分布計算概率;
(14)求二維隨機變量的邊緣分布、條件分布;
(15)判斷隨機變量的獨立性和計算概率;
(16)求兩個獨立隨機變量函數(shù)的分布;
(17)利用隨機變量的數(shù)學(xué)期望、方差的定義、性質(zhì)、公式,或利用常見隨機變量的數(shù)學(xué)期望、方差求隨機變量的數(shù)學(xué)期望、方差;
(18)求隨機變量函數(shù)的數(shù)學(xué)期望;
(19)求兩個隨機變量的協(xié)方差、相關(guān)系數(shù)并判斷相關(guān)性;
(20)求隨機變量的矩和協(xié)方差矩陣;
(21)利用切比雪夫總和不等式推證概率不等式;
(22)利用中心極限定理進(jìn)行概率的近似計算;
(23)利用t分布、χ2分布、F分布的定義、性質(zhì)推證統(tǒng)計量的分布、性質(zhì);
(24)推證某些統(tǒng)計量(特別是正態(tài)總體統(tǒng)計量)的分布;
(25)計算統(tǒng)計量的概率;
(26)求總體分布中未知參數(shù)的矩估計量和極大似然估計量;
(27)判斷估計量的無偏性、有效性和一致性;
(28)求單個或兩個正態(tài)總體參數(shù)的置信區(qū)間;
(29)對單個或兩個正態(tài)總體參數(shù)假設(shè)進(jìn)行顯著性檢驗;
(30)利用χ2檢驗法對總體分布假設(shè)進(jìn)行檢驗。
這一部分主要考查概率論與數(shù)理統(tǒng)計的基本概念、基本性質(zhì)和基本理論,考查基本方法的應(yīng)用。對歷年的考題進(jìn)行分析,可以看出概率論與數(shù)理統(tǒng)計的試題,即使是填空題和選擇題,只考單一知識點的試題很少,大多數(shù)試題是考查考生的理解能力和綜合應(yīng)用能力。要求考生能靈活地運用所學(xué)的知識,建立起正確的概率模型,綜合運用極限、連續(xù)函數(shù)、導(dǎo)數(shù)、極值、積分、反常積分以及級數(shù)等知識去解決問題。
在解答這部分考題時,考生易犯的錯誤有:
(1)概念不清,弄不清事件之間的關(guān)系和事件的結(jié)構(gòu);
(2)對試驗分析錯誤,概率模型搞錯;
(3)計算概率的公式運用不當(dāng);
(4)不能熟練地運用獨立性去證明和計算;
(5)不能熟練掌握和運用常用的概率分布及其數(shù)字特征;
(6)不能正確應(yīng)用有關(guān)的定義、公式和性質(zhì)進(jìn)行綜合分析、運算和證明。
專業(yè)輪廓
在自然界和人類的日常生活中,隨機現(xiàn)象非常普遍,比如每期福利彩票的中獎號碼。概率論是根據(jù)大量同類隨機現(xiàn)象的統(tǒng)計規(guī)律,對隨機現(xiàn)象出現(xiàn)某一結(jié)果的可能性作出一種客觀的科學(xué)判斷,對這種出現(xiàn)的可能性作出一種客觀的科學(xué)判斷,并作出數(shù)量上的描述;比較這些可能性的大小。數(shù)理統(tǒng)計學(xué)是應(yīng)用概率的理論研究大量隨機現(xiàn)象的規(guī)律性,對通過科學(xué)安排的一定數(shù)量的實驗所得到的統(tǒng)計方法給出嚴(yán)格的理論證明,并判定各種方法應(yīng)用的條件以及方法、公式、結(jié)論的可靠程度和局限性,使人們能從一組樣本判定是否能以相當(dāng)大的概率來保證某一判斷是正確的,并可以控制發(fā)生錯誤的概率。
過來人說
[關(guān)鍵詞] 研究熱點
羅燕(2007級概率論與數(shù)理統(tǒng)計碩士研究生):現(xiàn)在應(yīng)用統(tǒng)計方向的研究越來越熱了,應(yīng)用統(tǒng)計更貼近生活,所以越來越被各行各業(yè)注重。但是我們不要忘了統(tǒng)計的基礎(chǔ)是概率。概率方面的研究仍然值得重視。
宋高陽(2007級概率論與數(shù)理統(tǒng)計碩士研究生):統(tǒng)計學(xué)主要方向有隨機理論、數(shù)據(jù)分析、金融統(tǒng)計等,就現(xiàn)在的情況來看,數(shù)據(jù)分析和數(shù)據(jù)挖掘會比較熱門,因為應(yīng)用的范圍更廣一些。如果研究生畢業(yè)之后選擇工作,應(yīng)用性較強的學(xué)科是最好的選擇。
[關(guān)鍵詞] 建議
宋高陽(2007級概率論與數(shù)理統(tǒng)計碩士研究生):國內(nèi)許多高校將統(tǒng)計學(xué)和金融學(xué)劃歸為一類,成立金融與統(tǒng)計學(xué)院或者直接統(tǒng)計學(xué)劃歸為經(jīng)濟系。這非常好理解,因為經(jīng)濟學(xué)和金融學(xué)都是以統(tǒng)計為基本方法的。但作為數(shù)學(xué)二級學(xué)科的統(tǒng)計學(xué)的范疇卻和金融統(tǒng)計相去甚遠(yuǎn),學(xué)術(shù)成分也更高一些。統(tǒng)計學(xué)以概率論為基礎(chǔ),理論性更強,對隨機過程、概率極限、回歸分析等基礎(chǔ)知識的要求也更高。其實,統(tǒng)計學(xué)也不僅僅只是在金融學(xué)方面才有用武之地,回到開篇提到的“生物統(tǒng)計學(xué)”,就是當(dāng)仁不讓的熱門“頭牌”,這就要考生在報考時注意自己選擇的到底是經(jīng)濟學(xué)院的統(tǒng)計學(xué),還是數(shù)學(xué)系的統(tǒng)計學(xué)。
跨考院校推薦
北京師范大學(xué)的概率論研究群體歷經(jīng)三代人,已有40年的傳統(tǒng)和積累,擁有陳木法、李增滬、張余輝、王鳳雨等著名的專家學(xué)者。這一研究群體被國際上的兩個主要數(shù)學(xué)評論雜志譽為“馬氏過程的中國學(xué)派”或“北京學(xué)派”。主要研究方向有交互作用粒子系統(tǒng)、隨機分析、測度值馬氏過程等。概率論和數(shù)理統(tǒng)計學(xué)學(xué)科實力較強的院校還有南開大學(xué)、中南大學(xué)、東北師范大學(xué)、武漢大學(xué)、華中科技大學(xué)、中國科學(xué)技術(shù)大學(xué)等。
數(shù)學(xué)這棵大樹歷經(jīng)多年的發(fā)展已經(jīng)枝繁葉茂。一般重點大學(xué)的數(shù)學(xué)系都會有數(shù)十位甚至上百位教授或講師,每位的研究方向都不一樣,它們彼此的差異就好比達(dá)芬奇的雞蛋,再加上與各種學(xué)科的交叉和發(fā)展,又產(chǎn)生了更多的新分支方向。也正因為這樣,數(shù)學(xué)這門學(xué)科才會如此豐富多姿。
怎樣學(xué)“概率論與數(shù)理統(tǒng)計”
“概率論與數(shù)理統(tǒng)計”是理工科大學(xué)生的一門必修課程,也是報考碩士研究生時數(shù)學(xué)試卷中重要內(nèi)容之一[數(shù)學(xué)一和數(shù)學(xué)三都是占22%(概率論)]。由于該學(xué)科與生活實踐和科學(xué)試驗有著緊密的聯(lián)系,是許多新發(fā)展的前沿學(xué)科(如控制論、信息論、可靠性理論、人工智慧等)的基礎(chǔ),因此學(xué)好這一學(xué)科是十分重要的。
首先我們從歷屆考研成績進(jìn)行分析,觀察一下高等數(shù)學(xué)與概率統(tǒng)計之間有什么差異其一是概率統(tǒng)計的平均得分率往往低于高等數(shù)學(xué)平均得分率。其二高等數(shù)學(xué)的得分分布呈兩頭小中間大現(xiàn)象,即低分和高分比例小,而中間分?jǐn)?shù)段比例大,而概率統(tǒng)計的得分率卻是低分多,中間分?jǐn)?shù)少,高分較多的現(xiàn)象。為什么會發(fā)生上述差異?經(jīng)分析發(fā)現(xiàn)雖然高等數(shù)學(xué)與概率統(tǒng)計同屬數(shù)學(xué)學(xué)科,但各有自己的特點. 高等數(shù)學(xué)主要是通過學(xué)習(xí)極限、導(dǎo)數(shù)和積分等知識解決有關(guān)(一維或多維)函數(shù)的有關(guān)性質(zhì)和圖象的問題, 它與中學(xué)的數(shù)學(xué)有著密切聯(lián)系而且有著相同的思想方法和解題思路。因而在概念上理解比較容易接受(當(dāng)然也有比較抽象的內(nèi)容如中值定理等).另一方面由于涉及許多具體初等函數(shù),在求導(dǎo)數(shù)和積分時有許多計算上的技巧,需要大量練習(xí)以熟練掌握這些技巧,因而部分學(xué)生即使概念不十分清楚,但仍能正確解答相當(dāng)多的試題,在考研中得到一定的成績。
而在“概率論與數(shù)理統(tǒng)計”的學(xué)習(xí)中更注重的是概念的理解,而這正是廣大學(xué)生所疏忽的,在考研復(fù)習(xí)時幾乎有近一半以上學(xué)生對“什么是隨機變量”、“為什么要引進(jìn)隨機變量”仍說不清楚。對于涉及隨機變量的獨立,不相關(guān)等概念更是無從著手,這一方面是因為高等數(shù)學(xué)處理的是“確定”的事件。如函數(shù)y=f(x),當(dāng)x確定后y有確定的值與之對應(yīng)。而概率論中隨機變量X在抽樣前是不確定的,我們只能由隨機試驗確定它落在某一區(qū)域中的概率,要建立用“不確定性”的思維方法往往比較困難,如果套用確定性的思維方法就會出錯。由于基本概念沒有搞懂,即使是十分簡單的題目也難以得分。從而造成低分多的現(xiàn)象。另一方面由于概率論中涉及的計算技巧不多,除了古典概型,幾何概型和計算二維隨機變量的函數(shù)分布時如何確定積分上、下限有一些計算的難點,其他的只是數(shù)值或者積分、偏導(dǎo)數(shù)的計算。因而如果概念清楚,那么解題往往很順利且易得到正確答案,這正是高分較多的原因。
根據(jù)上面分析,啟示我們不能把高等數(shù)學(xué)的學(xué)習(xí)方法照搬到“概率統(tǒng)計”的學(xué)習(xí)上來,而應(yīng)按照概率統(tǒng)計自身的特點提出學(xué)習(xí)方法,才能取得“事半功倍”的效果。下面我們分別對“概率論”和“數(shù)理統(tǒng)計學(xué)”的學(xué)習(xí)方法提出一些建議。
一、學(xué)習(xí)“概率論”要注意以下幾個要點
1. 在學(xué)習(xí)“概率論”的過程中要抓住對概念的引入和背景的理解,例如為什么要引進(jìn)“隨機變量”這一概念。這實際上是一個抽象過程。正如小學(xué)生最初學(xué)數(shù)學(xué)時總是一個蘋果加2個蘋果等于3個蘋果,然后抽象為1+2=3.對于具體的隨機試驗中的具體隨機事件,可以計算其概率,但這畢竟是局部的,孤立的,能否將不同隨機試驗的不同樣本空間予以統(tǒng)一,并對整個隨機試驗進(jìn)行刻畫。隨機變量X(即從樣本空間到實軸的單值實函數(shù))的引進(jìn)使原先不同隨機試驗的隨機事件的概率都可轉(zhuǎn)化為隨機變量落在某一實數(shù)集合B的概率,不同的隨機試驗可由不同的隨機變量來刻畫. 此外若對一切實數(shù)集合B,知道P(X∈B). 那么隨機試驗的任一隨機事件的概率也就完全確定了。所以我們只須求出隨機變量X的分布P(X∈B). 就對隨機試驗進(jìn)行了全面的刻畫。它的研究成了概率論的研究中心課題。故而隨機變量的引入是概率論發(fā)展歷史中的一個重要里程碑。類似地,概率公理化定義的引進(jìn),分布函數(shù)、離散型和連續(xù)型隨機變量的分類,隨機變量的數(shù)學(xué)特征等概念的引進(jìn)都有明確的背景,在學(xué)習(xí)中要深入理解體會。
2. 在學(xué)習(xí)“概率論”過程中對于引入概念的內(nèi)涵和相互間的聯(lián)系和差異要仔細(xì)推敲,例如隨機變量概念的內(nèi)涵有哪些意義:它是一個從樣本空間到實軸的單值實函數(shù)X(w),但它不同于一般的函數(shù),首先它的定義域是樣本空間,不同隨機試驗有不同的樣本空間。而它的取值是不確定的,
隨著試驗結(jié)果的不同可取不同值,但是它取某一區(qū)間的概率又能根據(jù)隨機試驗予以確定的,而我們關(guān)心的通常只是它的取值范圍,即對于實軸上任一B,計算概率P(X∈B),即隨機變量X的分布。只有理解了隨機變量的內(nèi)涵,下面的概念如分布函數(shù)等等才能真正理解。又如隨機事件的互不相容和相互獨立兩個概念通常會混淆,前者是事件的運算性質(zhì),后者是事件的概率性質(zhì),但它們又有一定聯(lián)系,如果P(A)·P(B)>0,則A,B獨立則一定相容。類似地,如隨機變量的獨立和不相關(guān)等概念的聯(lián)系與差異一定要真正搞懂。
3. 搞懂了概率論中的各個概念,一般具體的計算都是不難的,如F(x)=P(X≤x),EX,DX等按定義都易求得。計算中的難點有古典概型和幾何概型的概率計算,二維隨機變量的邊緣分布fx(x)=∫-∞∞ f(x,y)dy,事件B的概率P((X,Y)∈B)=∫∫Bf(x,y)dxdy,卷積公式等的計算,它們形式上很簡單,但是由于f(x,y)通常是分段函數(shù),真正的積分限并不再是(-∞,∞)或B,這時如何正確確定事實上的積分限就成了正確解題的關(guān)鍵,要切實掌握。
4. 概率論中也有許多習(xí)題,在解題過程中不要為解題而解題,而應(yīng)理解題目所涉及的概念及解題的目的,至于具體計算中的某些技巧基本上在高等數(shù)學(xué)中都已學(xué)過。因此概率論學(xué)習(xí)的關(guān)鍵不在于做許多習(xí)題,而要把精力放在理解不同題型涉及的概念及解題的思路上去。這樣往往能“事半功倍”。
二、學(xué)習(xí)“數(shù)理統(tǒng)計學(xué)”要注意以下幾個要點
1. 由于數(shù)理統(tǒng)計是一門實用性極強的學(xué)科,在學(xué)習(xí)中要緊扣它的實際背景,理解統(tǒng)計方法的直觀含義。了解數(shù)理統(tǒng)計能解決哪些實際問題。對如何處理抽樣數(shù)據(jù),并根據(jù)處理的結(jié)果作出合理的統(tǒng)計推斷,該結(jié)論的可靠性有多少要有一個總體的思維框架,這樣,學(xué)起來就不會枯燥而且容易記憶。例如估計未知分布的數(shù)學(xué)期望,就要考慮到① 如何尋求合適的估計量的途徑,②如何比較多個估計量的優(yōu)劣?這樣,針對①按不同的統(tǒng)計思想可推出矩估計和極大似然估計,而針對②又可分為無偏估計、有效估計、相合估計,因為不同的估計名稱有著不同的含義,一個具體估計量可以滿足上面的每一個,也可能不滿足。掌握了尋求估計的統(tǒng)計思想,具體尋求估計的步驟往往是“套路子”的,并不困難,然而如果沒有從根本上理解,僅死背套路子往往會出現(xiàn)各種錯誤。
2. 許多同學(xué)在學(xué)習(xí)數(shù)理統(tǒng)計學(xué)過程中往往抱怨公式太多,置信區(qū)間,假設(shè)檢驗表格多而且記不住。事實上概括起來只有八個公式需要記憶,而且它們之間有著緊密聯(lián)系,并不難記,而區(qū)間估計和假設(shè)檢驗中只是這八個公式的不同運用而已,關(guān)鍵在于理解區(qū)間估計和假設(shè)檢驗的統(tǒng)計意義,在理解基礎(chǔ)上靈活運用這八個公式,完全沒有必要死記硬背。
產(chǎn)生和發(fā)展
(陳希孺訪談)
記者:陳希孺院士,請你談?wù)?a href="/hebeideji/7182134860164792353.html">概率論與數(shù)理統(tǒng)計學(xué)學(xué)科的誕生和發(fā)展情況。
陳希孺院士:先從數(shù)理統(tǒng)計學(xué)開始,數(shù)理統(tǒng)計學(xué)是研究收集數(shù)據(jù)、分析數(shù)據(jù)并據(jù)以對所研究的問題作出一定的結(jié)論的科學(xué)和藝術(shù)。數(shù)理統(tǒng)計學(xué)所考察的數(shù)據(jù)都帶有隨機性(偶然性)的誤差。這給根據(jù)這種數(shù)據(jù)所作出的結(jié)論帶來了一種不確定性,其量化要借助于概率論的概念和方法。數(shù)理統(tǒng)計學(xué)與概率論這兩個學(xué)科的密切聯(lián)系,正是基于這一點。
統(tǒng)計學(xué)起源于收集數(shù)據(jù)的活動,小至個人的事情,大至治理一個國家,都有必要收集種種有關(guān)的數(shù)據(jù),如在我國古代典籍中,就有不少關(guān)于戶口、錢糧、兵役、地震、水災(zāi)和旱災(zāi)等等的記載。現(xiàn)今各國都設(shè)有統(tǒng)計局或相當(dāng)?shù)臋C構(gòu)。當(dāng)然,單是收集、記錄數(shù)據(jù)這種活動本身并不能等同于統(tǒng)計學(xué)這門科學(xué)的建立,需要對收集來的數(shù)據(jù)進(jìn)行排比、整理,用精煉和醒目的形式表達(dá),在這個基礎(chǔ)上對所研究的事物進(jìn)行定量或定性估計、描述和解釋,并預(yù)測其在未來可能的發(fā)展?fàn)顩r。例如根據(jù)人口普查或抽樣調(diào)查的資料對我國人口狀況進(jìn)行描述,根據(jù)適當(dāng)?shù)某闃诱{(diào)查結(jié)果,對受教育年限與收入的關(guān)系,對某種生活習(xí)慣與嗜好(如吸煙)與健康的關(guān)系作定量的評估。根據(jù)以往一般時間某項或某些經(jīng)濟指標(biāo)的變化情況,預(yù)測其在未來一般時間的走向等,做這些事情的理論與方法,才能構(gòu)成一門學(xué)問——數(shù)理統(tǒng)計學(xué)的內(nèi)容。
這樣的統(tǒng)計學(xué)始于何時?恐怕難于找到一個明顯的、大家公認(rèn)的起點。一種受到某些著名學(xué)者支持的觀點認(rèn)為,英國學(xué)者葛朗特在1662年發(fā)表的著作《關(guān)于死亡公報的自然和政治觀察》,標(biāo)志著這門學(xué)科的誕生。中世紀(jì)歐洲流行黑死病,死亡的人不少。自1604年起,倫敦教會每周發(fā)表一次“死亡公報”,記錄該周內(nèi)死亡的人的姓名、年齡、性別、死因。以后還包括該周的出生情況——依據(jù)受洗的人的名單,這基本上可以反映出生的情況。幾十年來,積累了很多資料,葛朗特是第一個對這一龐大的資料加以整理和利用的人,他原是一個小店主的兒子,后來子承父業(yè),靠自學(xué)成才。他因這一部著作被選入當(dāng)年成立的英國皇家學(xué)會,反映學(xué)術(shù)界對他這一著作的承認(rèn)和重視。
這是一本篇幅很小的著作,主要內(nèi)容為8個表,從今天的觀點看,這只是一種例行的數(shù)據(jù)整理工作,但在當(dāng)時則是有原創(chuàng)性的科研成果,其中所提出的一些概念,在某種程度上可以說沿用至今,如數(shù)據(jù)簡約(大量的、雜亂無章的數(shù)據(jù),須注過整理、約化,才能突出其中所包含的信息)、頻率穩(wěn)定性(一定的事件,如“生男”、“生女”,在較長時期中有一個基本穩(wěn)定的比率,這是進(jìn)行統(tǒng)計性推斷的基礎(chǔ))、數(shù)據(jù)糾錯、生命表(反映人群中壽命分布的情況,至今仍是保險與精算的基礎(chǔ)概念)等。
葛朗特的方法被他同時代的政治經(jīng)濟學(xué)家佩蒂引進(jìn)到社會經(jīng)濟問題的研究中,他提倡在這類問題的研究中不能尚空談,要讓實際數(shù)據(jù)說話,他的工作總結(jié)在他去世后于1690年出版的《政治算術(shù)》一書中。
當(dāng)然,也應(yīng)當(dāng)指出,他們的工作還停留在描述性的階段,不是現(xiàn)代意義下的數(shù)理統(tǒng)計學(xué),那時,概率論尚處在萌芽的階段,不足以給數(shù)理統(tǒng)計學(xué)的發(fā)展提供充分的理論支持,但不能由此否定他們工作的重大意義,作為現(xiàn)代數(shù)理統(tǒng)計學(xué)發(fā)展的幾個源頭之一,他們以及后續(xù)學(xué)者在人口、社會、經(jīng)濟等領(lǐng)域的工作,特別是比利時天文學(xué)家兼統(tǒng)計學(xué)家朗伯·阿道夫·雅克·凱特勒19世紀(jì)的工作,對促成現(xiàn)代數(shù)理統(tǒng)計學(xué)的誕生起了很大的作用。
數(shù)理統(tǒng)計學(xué)的另一個重要源頭來自天文和大地測量學(xué)中的誤差分析問題。早期,測量工具的精度不高,人們希望通過多次量測獲取更多的數(shù)據(jù),以便得到對量測對象的精度更高的估計值。量測誤差有隨機性,適合于用概率論即統(tǒng)計的方法處理,遠(yuǎn)至伽利略·伽利萊就做過這方面的工作,他對測量誤差的形態(tài)作了一般性的描述,法國大數(shù)學(xué)家皮埃爾-西蒙·拉普拉斯曾對這個問題進(jìn)行了長時間的研究,現(xiàn)今概率論中著名的“拉普拉斯分布”,即是他在這研究中的一個產(chǎn)物,這方面最著名且影響深遠(yuǎn)的研究成果有二:一是法國數(shù)學(xué)家兼天文家阿德利昂·瑪利·埃·勒讓德19世紀(jì)初(1805)在研究慧星軌道計算時發(fā)明的“最小二乘法”,他在估計過巴黎的經(jīng)線長這一工作中,曾使用這個方法。現(xiàn)今著作中把這一方法的發(fā)明歸功于高斯,但高斯使用這一方法最早見諸文字是1809年,比勒讓德晚。一種現(xiàn)在逐步取得公認(rèn)——這項發(fā)明系由二人獨立做出,看來是比較妥當(dāng)?shù)摹A硗庖粋€重要成果是德國大學(xué)者高斯1809年在研究行星繞日運動時提出用正態(tài)分布刻畫測量誤差的分布。正態(tài)分布也常稱為高斯分布,其曲線是鐘形,極象頤和園中玉帶橋那樣的形狀,故有時又稱為“鐘形曲線”,它反映了這樣一種極普通的情況:天下形形色色的事物中,“兩頭小,中間大”的居多,如人的身高,太高太矮的都不多,而居于中間者占多數(shù)——當(dāng)然,這只是一個極粗略的描述,要作出準(zhǔn)確的描述,須動用高等數(shù)學(xué)的知識。正是其數(shù)學(xué)上的特性成為其廣泛應(yīng)用的根據(jù)。
正態(tài)分布在數(shù)理統(tǒng)計學(xué)中占有極重要的地位,現(xiàn)今仍在常用的許多統(tǒng)計方法,就是建立在“所研究的量具有或近似地具有正態(tài)分布”這個假定的基礎(chǔ)上,而經(jīng)驗和理論(概率論中所謂“中心極限定理”)都表明這個假定的現(xiàn)實性,現(xiàn)實世界許多現(xiàn)象看來是雜亂無章的,如不同的人有不同的身高、體重。大批生產(chǎn)的產(chǎn)品,其質(zhì)量指標(biāo)各有差異。看來毫無規(guī)則,但它們在總體上服從正態(tài)分布。這一點,顯示在紛亂中有一種秩序存在,提出正態(tài)分布的高斯,一生在多個領(lǐng)域里面有不少重大的貢獻(xiàn),但在德國10馬克的有高斯圖像的銀行券上,單只畫出了正態(tài)曲線,以此可以看出人們對他這一貢獻(xiàn)評價之高。
20世紀(jì)以前數(shù)理統(tǒng)計學(xué)發(fā)展的一個重要成果,是19世紀(jì)后期由英國遺傳學(xué)家兼統(tǒng)計學(xué)家高爾頓發(fā)起,并經(jīng)現(xiàn)代統(tǒng)計學(xué)的奠基人之一K·皮爾遜和其他一些英國學(xué)者所發(fā)展的統(tǒng)計相關(guān)與回歸理論。所謂統(tǒng)計相關(guān),是指一種非決定性的關(guān)系如人的身高X與體重Y,存在一種大致的關(guān)系,表現(xiàn)在X大(小)時,Y也傾向于大(小),但非決定性的:由X并不能決定Y。現(xiàn)實生活中和各種科技領(lǐng)域中,這種例子很多,如受教育年限與收入的關(guān)系,經(jīng)濟發(fā)展水平與人口增長速度的關(guān)系等,都是屬于這種性質(zhì),統(tǒng)計相關(guān)的理論把這種關(guān)系的程度加以量化,而統(tǒng)計回歸則是把有統(tǒng)計相關(guān)的變量,如上文的身高X和體重Y的關(guān)系的形式作近似的估計,稱為回歸方程,現(xiàn)實世界中的現(xiàn)象往往涉及眾多變量,它們之間有錯綜復(fù)雜的關(guān)系,且許多屬于非決定性質(zhì),相關(guān)回歸理論的發(fā)明,提供了一種通過實際觀察去對這種關(guān)系進(jìn)行定量研究的工具,有著重大的認(rèn)識和實用意義。
到20世紀(jì)初年,由于上述幾個方面的發(fā)展,數(shù)理統(tǒng)計學(xué)已積累了很豐富的成果——在此因篇幅關(guān)系,我們不能詳盡無遺地一一列舉有關(guān)的重要成果,如抽樣調(diào)查的理論和方法方面的進(jìn)展,但是直到這時為止,我們還不能說現(xiàn)代意義下的數(shù)理統(tǒng)計學(xué)已經(jīng)建立起來,其主要標(biāo)志之一就是這門學(xué)問還缺乏一個統(tǒng)一的理論框架,這個任務(wù)在20世紀(jì)上半葉得以完成,狹義一點說可界定在1921——1938年,起主要作用的是幾位大師級的人物,特別是英國的費歇爾·K·皮爾遜,發(fā)展統(tǒng)計假設(shè)檢驗理論的奈曼與E·皮爾遜和提出統(tǒng)計決策函數(shù)理論的瓦爾德等。我國已故著名統(tǒng)計學(xué)家許寶(1910——1970)在這項工作中也卓有建樹。
自第二次世界大戰(zhàn)結(jié)束迄今,數(shù)理統(tǒng)計學(xué)有了迅猛的發(fā)展,主要有以下三方面的原因:一是數(shù)理統(tǒng)計學(xué)理論框架的建立以及概率論和數(shù)學(xué)工具的進(jìn)展,為統(tǒng)計理論在面上和向縱深的發(fā)展打開了門徑和提供了手段,許多在早期比較粗略的理論和方法,在理論上得到了完善與深入,并不斷提出新的研究課題;二是實用上的需要,不斷提出了復(fù)雜的問題與模型,吸引了學(xué)者們的研究興趣;三是電子計算機的發(fā)明與普及應(yīng)用,一方面提供了必要的計算工具——統(tǒng)計方法的實施往往涉及大量數(shù)據(jù)的處理與運算,用人力無法在合理的時間內(nèi)完成,所以在早年,一些統(tǒng)計方法人們雖然知道,但很少付諸實用,就因為是人力所難及。計算機的出現(xiàn)解決了這個問題。而賦予統(tǒng)計方法以現(xiàn)實的生命力。同時,計算機對促進(jìn)統(tǒng)計理論研究也有助益,統(tǒng)計模擬是其表現(xiàn)之一,在承認(rèn)上述成就的同時,不少統(tǒng)計學(xué)家也指出這一時期發(fā)展中出現(xiàn)的一些問題或偏向,其中主要的一點是,數(shù)理統(tǒng)計學(xué)理論研究中的“數(shù)學(xué)化”氣味愈來愈重,相當(dāng)一部分研究工作停留在數(shù)學(xué)的層面,早期那種理論研究與現(xiàn)實問題密切結(jié)合的優(yōu)良傳統(tǒng)有所淡化,一些學(xué)者還提出了補救的建議,對未來統(tǒng)計學(xué)發(fā)展的方向進(jìn)行探討。同時,現(xiàn)實問題愈來愈涉及到大量的,結(jié)構(gòu)復(fù)雜的數(shù)據(jù),按現(xiàn)行的數(shù)理統(tǒng)計學(xué)規(guī)范去處理,顯得力所不及,需要一些帶有根本性創(chuàng)新的思路,使統(tǒng)計學(xué)的發(fā)展登上一個新的臺階,以適應(yīng)應(yīng)用上的需要,考慮這一背景,有的統(tǒng)計學(xué)家樂觀地認(rèn)為數(shù)理統(tǒng)計學(xué)正面臨一個新的突破。
在上面講述數(shù)理統(tǒng)計學(xué)的發(fā)展?fàn)顩r時,我們著重在實際需要所起的促進(jìn)作用方面,由于概率論的概念和方法是數(shù)理統(tǒng)計學(xué)的理論基礎(chǔ),概率論的進(jìn)展也必然對數(shù)理統(tǒng)計學(xué)的發(fā)展起促進(jìn)作用。
概率,又稱幾率,或然率,指一種不確定的情況出現(xiàn)可能性的大小,例如,投擲一個硬幣,“出現(xiàn)國徽”(國徽一面朝上)是一個不確定的情況。因為投擲前,我們無法確定所指情況(“出現(xiàn)國徽”)發(fā)生與否,若硬幣是均勻的且投擲有充分的高度,則兩面的出現(xiàn)機會均等,我們說“出現(xiàn)國徽”的概率是1/2;同時,投擲一個均勻子,“出現(xiàn)4點”的概率是1/6,除了這些以及類似的簡單情況外,概率的計算不容易,往往需要一些理論上的假定,在現(xiàn)實生活中則往往用經(jīng)驗的方法確定概率,例如某地區(qū)有N人,查得其中患某種疾病者有M人,則稱該地區(qū)的人患該種疾病的概率為M/N,這事實上是使用統(tǒng)計方法對發(fā)病概率的一個估計。
概率的概念起源于中世紀(jì)以來的歐洲流行的用骰子賭博,這一點不難理解,某種情況出現(xiàn)可能性的大小要能夠體察并引起研究的興趣,必須滿足兩個條件:一是該情況可以在多次重復(fù)中被觀察其發(fā)生與否(在多次重復(fù)下出現(xiàn)較頻繁的情況有更大的概率),一是該情況發(fā)生與否與當(dāng)事人的利益有關(guān)或為其興趣關(guān)注之所在,用骰子賭博滿足這些條件。
當(dāng)時有一個“分賭本問題”曾引起熱烈的討論,并經(jīng)歷了長達(dá)一百多年才得到正確的解決。在這過程中孕育了概率論一些重要的基本概念,舉該問題的一個簡單情況:甲、乙二人賭博,各出賭注30元,共60元,每局甲、乙勝的機會均等,都是1/2。約定:誰先勝滿3局則他贏得全部賭注60元,現(xiàn)已賭完3局,甲2勝1負(fù),而因故中斷賭情,問這60元賭注該如何分給2人,才算公平,初看覺得應(yīng)按2:1分配,即甲得40元,乙得20元,還有人提出了一些另外的解法,結(jié)果都不正確,正確的分法應(yīng)考慮到如在這基礎(chǔ)上繼續(xù)賭下去,甲、乙最終獲勝的機會如何,至多再賭2局即可分出勝負(fù),這2局有4種可能結(jié)果:甲甲、甲乙、乙甲、乙乙。前3種情況都是甲最后取勝,只有最后一種情況才是乙取勝,二者之比為3:1,故賭注的公平分配應(yīng)按3:1的比例,即甲得45元,乙15元。
當(dāng)時的一些學(xué)者,如克里斯蒂安·惠更斯、巴斯噶、皮耶·德·費瑪等人,對這類賭情問題進(jìn)行了許多研究,有的出版了著作,如惠更斯的一本著作曾長期在歐洲作為概率論的教科書,這些研究使原始的概率和有關(guān)概念得到發(fā)展和深化。不過,在這個概率論的草創(chuàng)階段,最重要的里程碑是雅各布·伯努利的著作《推測術(shù)》。在他死后的1713年發(fā)表,這部著作除了總結(jié)前人關(guān)于賭情的概率問題的成果并有所提高外,還有一個極重要的內(nèi)容,即如今以他的名字命名的“大數(shù)律”,大數(shù)律是關(guān)于(算術(shù))平均值的定理,算術(shù)平均值,即若干個數(shù)X1、X2……Xn之和除以n,是最常用的一種統(tǒng)計方法,人們經(jīng)常使用并深信不疑。但其理論根據(jù)何在,并不易講清楚,就是伯努利的大數(shù)律要回答的問題,在某種程度上可以說,這個大數(shù)律是整個概率論最基本的規(guī)律之一,也是數(shù)理統(tǒng)計學(xué)的理論基石。
概率論雖發(fā)端于賭博,但很快在現(xiàn)實生活中找到多方面的應(yīng)用,首先是在人口、保險精算等方面,在其發(fā)展過程中出現(xiàn)了若干里程碑的《機遇的原理》,其第三版發(fā)表于1756年,法國大數(shù)學(xué)家皮埃爾-西蒙·拉普拉斯的《分析概率論》,發(fā)表于1812年,1933年蘇聯(lián)教學(xué)家安德雷·柯爾莫哥洛夫完成了概率論的公理體系,在幾條簡潔的公理之下,發(fā)展出概率論整座的宏偉建筑,有如在歐幾里得公理體系之下發(fā)展出整部幾何。自那以來,概率論成長為現(xiàn)代數(shù)學(xué)的一個重要分支,使用了許多深刻和抽象的數(shù)學(xué)理論,在其影響下,數(shù)理統(tǒng)計學(xué)的理論也日益向深化的方向發(fā)展。
學(xué)科歷史
三四百年前在歐洲許多國家,貴族之間盛行賭博之風(fēng)。擲骰子是他們常用的一種賭博方式。因骰子的形狀為小立方體,當(dāng)它被擲到桌面上時,每個面向上的可能性是相等的,即出現(xiàn)1點至6點中任何一個點數(shù)的可能性是相等的。有的參賭者就想:如果同時擲兩顆骰子,則點數(shù)之和為9與點數(shù)之和為10,哪種情況出現(xiàn)的可能性較大?
17世紀(jì)中葉,法國有一位熱衷于擲骰子游戲的貴族德·梅耳,發(fā)現(xiàn)了這樣的事實:將一枚骰子連擲四次至少出現(xiàn)一個六點的機會比較多,而同時將兩枚骰子擲24次,至少出現(xiàn)一次雙六的機會卻很少。
這是什么原因呢?后人稱此為著名的德·梅耳問題。又有人提出了“分賭注問題”:
兩個人決定賭若干局,事先約定誰先贏得6局便算贏家。如果在一個人贏3局,另一人贏4局時因故終止賭博,應(yīng)如何分賭本?
諸如此類的需要計算可能性大小的賭博問題提出了不少,但他們自己無法給出答案。
數(shù)學(xué)家們“參與”賭博。參賭者將他們遇到的上述問題請教當(dāng)時法國數(shù)學(xué)家帕斯卡,帕斯卡接受了這些問題,他沒有立即回答,而把它交給另一位法國數(shù)學(xué)家皮耶·德·費瑪。他們頻頻通信,互相交流,圍繞著賭博中的數(shù)學(xué)問題開始了深入細(xì)致的研究。這些問題后來被來到巴黎的荷蘭科學(xué)家克里斯蒂安·惠更斯獲悉,回荷蘭后,他獨立地進(jìn)行研究。
帕斯卡和費爾馬一邊親自做賭博實驗,一邊仔細(xì)分析計算賭博中出現(xiàn)的各種問題,終于完整地解決了“分賭注問題”,并將此題的解法向更一般的情況推廣,從而建立了概率論的一個基本概念——數(shù)學(xué)期望,這是描述隨機變量取值的平均水平的一個量。而惠更斯經(jīng)過多年的潛心研究,解決了擲骰子中的一些數(shù)學(xué)問題。1657年,他將自己的研究成果寫成了專著《論擲骰子游戲中的計算》。這本書迄今為止被認(rèn)為是概率論中最早的論著。因此可以說早期概率論的真正創(chuàng)立者是帕斯卡、皮耶·德·費瑪和克里斯蒂安·惠更斯。這一時期被稱為組合概率時期,計算各種古典概率。
在他們之后,對概率論這一學(xué)科做出貢獻(xiàn)的是瑞士數(shù)學(xué)家族——貝努利家族的幾位成員。雅可布·貝努利在前人研究的基礎(chǔ)上,繼續(xù)分析賭博中的其他問題,給出了“賭徒輸光問題”的詳盡解法,并證明了被稱為“大數(shù)定律”的一個定理,這是研究等可能性事件的古典概率論中的極其重要的結(jié)果。大數(shù)定律證明的發(fā)現(xiàn)過程是極其困難的,他做了大量的實驗計算,首先猜想到這一事實,然后為了完善這一猜想的證明,雅可布花了20年的時光。雅可布將他的全部心血傾注到這一數(shù)學(xué)研究之中,從中他發(fā)展了不少新方法,取得了許多新成果,終于將此定理證實。
1713年,雅可布的著作《猜度術(shù)》出版。遺憾的是在他的大作問世之時,雅可布已謝世8年之久。圣彼得堡悖論是數(shù)學(xué)家丹尼爾·伯努利(Daniel Bernoulli)的表兄尼古拉·伯努利(Nicola Bernoulli)在1738提出的一個概率期望值悖論,它來自于一種擲幣游戲,即圣彼得堡游戲(表1)。設(shè)定擲出正面或者反面為成功,游戲者如果第一次投擲成功,得獎金2元,游戲結(jié)束;第一次若不成功,繼續(xù)投擲,第二次成功得獎金4元,游戲結(jié)束;這樣,游戲者如果投擲不成功就反復(fù)繼續(xù)投擲,直到成功,游戲結(jié)束。如果第n次投擲成功,得獎金2元,游戲結(jié)束。。問在賭博開始前甲應(yīng)付給乙多少盧布才有權(quán)參加賭博而不致虧損乙方?
尼古拉同時代的許多數(shù)學(xué)家研究了這個問題,并給出了一些不同的解法。但其結(jié)果是很奇特的,所付的款數(shù)竟為無限大。即不管甲事先拿出多少錢給乙,只要賭博不斷地進(jìn)行,乙肯定是要賠錢的。
隨著18、19世紀(jì)科學(xué)的發(fā)展,人們注意到某些生物、物理和社會現(xiàn)象與機會游戲相似,從而由機會游戲起源的概率論被應(yīng)用到這些領(lǐng)域中,同時也大大推動了概率論本身的發(fā)展。
法國數(shù)學(xué)家皮埃爾-西蒙·拉普拉斯將古典概率論向近代概率論進(jìn)行推進(jìn),他首先明確給出了概率的古典定義,并在概率論中引入了更有力的數(shù)學(xué)分析工具,將概率論推向一個新的發(fā)展階段。他還證明了“亞伯拉罕·棣莫弗——拉普拉斯定理”,把棣莫弗的結(jié)論推廣到一般場合,還建立了觀測誤差理論和最小二乘法。拉普拉斯于1812年出版了他的著作《分析的概率理論》,這是一部繼往開來的作品。這時候人們最想知道的就是概率論是否會有更大的應(yīng)用價值?是否能有更大的發(fā)展成為嚴(yán)謹(jǐn)?shù)膶W(xué)科。
概率論在20世紀(jì)再度迅速地發(fā)展起來,則是由于科學(xué)技術(shù)發(fā)展的迫切需要而產(chǎn)生的。1906年,俄羅斯數(shù)學(xué)家馬爾科夫提出了所謂“馬爾科夫鏈”的數(shù)學(xué)模型。1934年,蘇聯(lián)數(shù)學(xué)家亞歷山大·辛欽又提出一種在時間中均勻進(jìn)行著的平穩(wěn)過程理論。
如何把概率論建立在嚴(yán)格的邏輯基礎(chǔ)上,這是從概率誕生時起人們就關(guān)注的問題,這些年來,好多數(shù)學(xué)家進(jìn)行過嘗試,終因條件不成熟,一直拖了三百年才得以解決。
20世紀(jì)初完成的勒貝格測度與積分理論及隨后發(fā)展的抽象測度和積分理論,為概率公理體系的建立奠定了基礎(chǔ)。在這種背景下安德雷·柯爾莫哥洛夫1933年在他的《概率論基礎(chǔ)》一書中首次給出了概率的測度論式定義和一套嚴(yán)密的公理體系。他的公理化方法成為現(xiàn)代概率論的基礎(chǔ),使概率論成為嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)分支。
現(xiàn)在,概率論與以它作為基礎(chǔ)的數(shù)理統(tǒng)計學(xué)學(xué)科一起,在自然科學(xué),社會科學(xué),工程技術(shù),軍事科學(xué)及工農(nóng)業(yè)生產(chǎn)等諸多領(lǐng)域中都起著不可或缺的作用。
直觀地說,衛(wèi)星上天,導(dǎo)彈巡航,飛機制造,宇宙飛船遨游太空等都有概率論的一份功勞;及時準(zhǔn)確的天氣預(yù)報,海洋探險,考古研究等更離不開概率論與數(shù)理統(tǒng)計;電子技術(shù)發(fā)展,影視文化的進(jìn)步,人口普查及教育等同概率論與數(shù)理統(tǒng)計也是密不可分的。
根據(jù)概率論中用投針試驗估計π值的思想產(chǎn)生的蒙特卡洛方法,是一種建立在概率論與數(shù)理統(tǒng)計基礎(chǔ)上的計算方法。借助于電子計算機這一工具,使這種方法在核物理、表面物理、電子學(xué)、生物學(xué)、高分子化學(xué)等學(xué)科的研究中起著重要的作用。
概率論作為理論嚴(yán)謹(jǐn),應(yīng)用廣泛的數(shù)學(xué)分支正日益受到人們的重視,并將隨著科學(xué)技術(shù)的發(fā)展而得到發(fā)展。
實際應(yīng)用
概率統(tǒng)計理論與方法的應(yīng)用幾乎遍及所有科學(xué)技術(shù)領(lǐng)域、工農(nóng)業(yè)生產(chǎn)和國民經(jīng)濟的各個部門中.
例如:1.氣象、水文、地震預(yù)報、人口控制及預(yù)測都與概率論緊密相關(guān);
2.產(chǎn)品的抽樣驗收,新研制的藥品能否在臨床中應(yīng)用,均需要用到 假設(shè)檢驗;
3.尋求最佳生產(chǎn)方案要進(jìn)行實驗設(shè)計和數(shù)據(jù)處理;
4.電子系統(tǒng)的設(shè)計, 火箭衛(wèi)星的研制與發(fā)射都離不開可靠性估計;
5.處理通信問題, 需要研究信息論
6.探討太陽黑子的變化規(guī)律時,時間序列分析方法非常有用;
7.研究化學(xué)反應(yīng)的時間率,要以馬爾可夫過程來描述;
8.在生物學(xué)中研究群體的增長問題時提出了生滅型隨機模型,傳染病流行問題要用到多變量非線性生滅過程;
9.許多服務(wù)系統(tǒng),如電話通信、船舶裝卸、機器維修、病人候診、存貨控制、可用一類概率模型來描述,其涉及到的知識就是排隊論。
目前,概率統(tǒng)計理論進(jìn)入其他自然科學(xué)領(lǐng)域的趨勢還在不斷發(fā)展。在社會科學(xué)領(lǐng)域 ,特別是經(jīng)濟學(xué)中研究最優(yōu)決策和經(jīng)濟的穩(wěn)定增長等問題,都大量采用 概率統(tǒng)計方法。法國數(shù)學(xué)家皮埃爾-西蒙·拉普拉斯(Laplace)說對了:“生活中最重要的問題 , 其中絕大多數(shù)在實質(zhì)上只是概率的問題.”英國的邏輯學(xué)家和經(jīng)濟學(xué)家威廉姆·杰文斯曾對概率論大加贊美:“概率論是生活真正的領(lǐng)路人,如果沒有對概率的某種估計, 那么我們就寸步難行,無所作為。
參考資料 >
概率論與數(shù)理統(tǒng)計.豆瓣讀書.2018-10-14