① 数据预处理应该在数据集成之前还是之后进行
数据预处理是在数据收集完成之后进行的。
数据预处理(data preprocessing)是指在主要的处理以前对数据进行的一些处理。如对大部分地球物理面积性观测数据在进行转换或增强处理之前,首先将不规则分布的测网经过插值转换为规则网的处理,以利于计算机的运算。
数据审核的内容
1.准确性审核。主要是从数据的真实性与精确性角度检查资料,其审核的重点是检查调查过程中所发生的误差。
2.适用性审核。主要是根据数据的用途,检查数据解释说明问题的程度。具体包括数据与调查主题、与目标总体的界定、与调查项目的解释等是否匹配。
3.及时性审核。主要是检查数据是否按照规定时间报送,如未按规定时间报送,就需要检查未及时报送的原因。
4.一致性审核。主要是检查数据在不同地区或国家、在不同的时间段是否具有可比性。
② 什么是数据预处理(在数据仓库中的概念)
数据预处理:就是指在数据进入数据仓库之前,对数据进行清洗转换装载。