來源:互聯網
用連續曲線近似地刻畫或比擬平面上離散點組,以表示坐標之間函數關系的一種數據處理方法。用解析表達式逼近離散數據的一種方法。在科學實驗或社會活動中,通過實驗或觀測得到變量x與y的一組數據對(xi,yi)(i=1,2,…m),其中各xi是彼此不同的。人們希望用一類與數據的背景材料規律相適應的解析表達式,y=f(x,c)來反映變量x與y之間的依賴關系,即在一定意義下“最佳”地逼近或擬合已知數據。f(x,c)常稱作擬合模型,式中c=(c1,c2,…cn)是一些待定參數。
概念
為了明確解釋變量和隨機誤差各產生的效應是多少,統計學上把數據點與它在回歸直線上相應位置的差異稱為殘差,把每個殘差平方之后加起來稱為殘差平方和,它表示隨機誤差的效應。一組數據的殘差平方越小,其擬合程度越好。
計算
按定義應為?:等精度測量和非等精度測量。
性質
1?:只有常數項沒有其他解釋變量的回歸方程的RSS和TSS相等,其決定系數為0。
2:?增加解釋變量必然導致RSS減小。因此,如果想降低RSS,只要在回歸方程中盡可能地加入解釋變量就能達到目的。
3;?包含常數項全部解釋變量的個數K等于樣本數n時,RSS為0,決定系數為1。
F檢驗和t檢驗之間的關系
在一些場合t檢驗不僅可以進行雙側檢驗,也可以進行單側檢驗。而F檢驗沒有單側和雙側的區別。當進行雙側檢驗的時候兩種檢驗的P值相同。
分布
參考資料 >