『壹』 spss中,標准化是干什麼用的
標准化就是把某列變數的原來的值轉化為標准分,其公式為 (原值-變數均值)/標准誤,標准誤=變數標准差/根號n,n為變數包含的個案數。標准化後,數據服從以0為均值,1為標准差的標准正態分布。
我們為什麼要這么做,一般是為了統一數據單位,比如你的一列變數是以米為單位,一列以厘米為單位,我要檢驗這兩列變數的差異,但這兩列變數不可以直接進行加減乘除運算,因為單位不同,你用1米減去1厘米得出的值沒有意義,你把兩列變數都標准化後,單位統一為1個標准差,數據就可以相互運算了
『貳』 用SPSS做主成分分析一定要將原始數據標准化嗎為什麼
不需要的,對數據標准化的目的是為了統一變數的單位(單位不同的變數間不宜直接進行統計分析,標准化使得所有變數的單位統一為sd),我們用SPSS做主成分分析的時候,默認使用變數的相關矩陣進行運算,相關系數本來就是一個標准化的統計量,也就是說主成分分析的過程已經包含了標准化的過程,沒有必要再專門給數據做一次標准化處理。