① 數據預處理應該在數據集成之前還是之後進行
數據預處理是在數據收集完成之後進行的。
數據預處理(data preprocessing)是指在主要的處理以前對數據進行的一些處理。如對大部分地球物理面積性觀測數據在進行轉換或增強處理之前,首先將不規則分布的測網經過插值轉換為規則網的處理,以利於計算機的運算。
數據審核的內容
1.准確性審核。主要是從數據的真實性與精確性角度檢查資料,其審核的重點是檢查調查過程中所發生的誤差。
2.適用性審核。主要是根據數據的用途,檢查數據解釋說明問題的程度。具體包括數據與調查主題、與目標總體的界定、與調查項目的解釋等是否匹配。
3.及時性審核。主要是檢查數據是否按照規定時間報送,如未按規定時間報送,就需要檢查未及時報送的原因。
4.一致性審核。主要是檢查數據在不同地區或國家、在不同的時間段是否具有可比性。
② 什麼是數據預處理(在數據倉庫中的概念)
數據預處理:就是指在數據進入數據倉庫之前,對數據進行清洗轉換裝載。