集中趨勢又稱“數據的中心位置”、“集中量數”等。它是一組數據的代表值。集中趨勢的概念就是平均數的概念,它能夠對總體的某一特征具有代表性,表明所研究的輿論現象在一定時間、空間條件下的共同性質和一般水平。就變量數列而言,由于整個變量數列是以平均數為中心而上下波動的,所以平均數反映了總體分布的集中趨勢,它是表明總體分布的一個重要特征值。根據變量數列的平均數,就可以了解所研究總體的集中趨勢和一般特征。集中趨勢是用來描述輿論現象的重要統計分析指標,常用的有平均數、中位數和眾數等,它們在不同類型的分布數列中有不同的測定方法。
測定方法
取得集中趨勢代表值的方法有兩種:數值平均數和位置平均數。
數值平均數
從總體各單位變量值中抽象出具有一般水平的量,這個量不是各個單位的具體變量值,但又要反映總體各單位的一般水平,這種平均數稱為數值平均數。數值平均數有算術平均數、調和平均數、幾何平均數等形式。
算術平均數:算術平均數就是觀察值的總和除以觀察值個數的商,是集中趨勢測定中最重要的一種,它是所有平均數中應用最廣泛的平均數。算術平均數分為簡單算術平均數和加權算術平均數。
調和平均數可以看成是變量χ的倒數的算術平均數的倒數,故有時也被稱為“倒數平均數”。調和平均數分為簡單調和平均數和加權調和平均數。
簡單調和平均數計算:
加權調和平均數計算:
幾何平均數:幾何平均數也稱幾何均值,是n個變量值乘積的n次方根。根據統計資料的不同,幾何平均數也有簡單幾何平均數和加權幾何平均數之分。
簡單幾何平均數的計算:
加權幾何平均數的計算:
位置平均數
位置平均數就是根據總體中處于特殊位置上的個別單位或部分單位的標志值來確定的代表值,它對于整個總體來說,具有非常直觀的代表性,因此,常用來反映分布的集中趨勢。常用的有眾數、中位數。
眾數——是總體中出現次數最多的變量值,在實際工作中有時有它的特殊用途。
中位數——將數據按大小順序排列起來,形成一個數列,居于數列中間位置的那個數據就是中位數。
定義
在統計學中,集中趨勢(central tendency)或中央趨勢,在口語上也經常被稱為平均,表示一個機率分布的中間值。最常見的幾種集中趨勢包括算數平均數、中位數及眾數。集中趨勢可以由有限的數組(如一群樣本)中或理論上的機率分配(如正態分布)中求得。有些人使用集中趨勢(或集中性)這個詞匯以表示“數量化的資料之中央值的趨勢”。在這種意義下,我們可以利用資料的離散程度(例如標準差或四分差等相似的統計量)判別其集中趨勢的程度。
集中趨勢(central tendency)一詞于1920年代后期出現。
關系
在指數分配exp(λ)中,期望值為而中位數為,二者并不一致。
在左右對稱的機率分布中,不同的集中趨勢統計量有相同結果,但在偏度遠離0時則可能不一致。在單峰型的機率分布(unimodal probability 廣義函數)中,平均數(μ)、中位數(ν)與眾數(θ)的關系。
參考資料 >