必威电竞|足球世界杯竞猜平台

樣本方差
來源:互聯網

先求出總體各單位變量值與其算術平均數離差的平方,然后再對此變量取平均數,就叫做樣本方差。樣本方差用來表示一列數的變異程度。樣本均值又叫樣本均數。即為樣本的均值。

均值是指在一組數據中所有數據之和再除以數據的個數。

簡介

先求出總體各單位變量值與其算術平均數的離差的平方,然后再對此變量取平均數,就叫做樣本方差。

在許多實際情況下,人口的真實差異事先是不知道的,必須以某種方式計算。當處理非常大的人口時,不可能對人口中的每個物體進行計數,因此必須對人口樣本進行計算。樣本方差也可以應用于從該分布的樣本的連續分布的方差的估計。

無偏性

我們從一個樣本取n個值,其中,并根據這個樣本估計方差。直接取樣本數據的方差給出平均偏差的平均值:

這里,表示樣本均值

由于 是隨機選擇的,所以 和 是隨機變量。他們的預期值可以通過從群體中的大小為n的所有可能樣本 的集合進行平均來評估。對于,有

因此 給出了基于因子 的人口方差的估計值。被稱為偏樣本方差。糾正該偏差之后形成無偏樣本方差:

估計值可以簡單地稱為樣本方差。同樣的證明也適用于從連續概率分布中抽取的樣本。

例如,個樣本觀測值值為則樣本均值= ,樣本方差 。樣本方差是常用的統計量之一,是描述一組數據變異程度或分散程度大小的指標。

實際上,樣本方差可以理解成是對所給總體方差的一個無偏估計。。

的使用稱為貝塞爾校正(Bessel's correction),也用于樣本協方差和樣本標準差(方差平方根)。平方根是一個凹函數,因此引入負偏差(由Jensen不等式),這取決于分布,因此校正樣本標準偏差(使用貝塞爾校正)有偏差。標準偏差的無偏估計是一個技術上涉及的問題,盡管對于使用術語的正態分布,形成無偏估計。

無偏樣本方差是函數的U統計量,這意味著它是通過對群體的兩個樣本統計平均得到的。

分布

作為隨機變量的函數,樣本方差本身就是一個隨機變量,研究其分布是很自然的。在是來自正態分布的獨立觀察的情況下,Cochran定理表明s服從卡方分布

所以可求;

如果獨立同分布,但不一定是正態分布,那么

如果大數定律的條件對于平方觀測值同樣適用,則是的一致估計量??梢钥闯?,估計的方差趨于零。在Kenney and Keeping(1951:164),Rose和Smith(2002:264)和Weisstein(n.d.)中給出了漸近等效的公式。

正態總體的樣本均值和樣本方差相互獨立。

參考資料 >

生活家百科家居網