㈠ 如何用正交实验分析数据
正交实验方法之所以能得到科技工作者的重视并在实践中得到广泛的应用,其原因不仅在于能使实验的次数减少,而且能够用相应的分析方法对实验结果进行处理,并得出许多有价值的结论。通常对实验结果采用的分析方法有两种: 一是极差分析法,二是方差分析法。
( 1) 极差分析法
下面以表 5. 3 为例讨论 L9( 34) 正交实验结果的极差分析方法。极差指的是各列中各水平对应的实验指标平均值的最大值与最小值之差。从表 5. 3 的计算结果可知,用极差法分析正交实验结果可得出以下几个结论:
1) 在实验范围内,各列对实验指标的影响从大到小的排列。某列的极差最大,表示该列的数值在实验范围内变化时,使实验指标数值的变化最大。所以各列对实验指标的影响从大到小的排列,就是各列极差 R 的数值从大到小的排列。
2) 实验指标随各因素的变化趋势。为了能更直观地看到变化趋势,常将计算结果绘制成图。
3) 使实验指标最好的适宜的操作条件 ( 适宜的因素水平搭配) 。
4) 可对所得结论和进一步的研究方向进行讨论。
从表 5. 3 所列 9 次实验数据中进行两两比较是不行的,因为它们的实验条件完全不同,没有可比性。然而,把这 9 次实验结果适当组合起来就具有一定的可比性,这就是正交设计的综合比较性。
( 2) 方差分析法
方差分析是数理统计的基本方法之一,通常用来研究不同生产技术条件或生产工艺对实验结果有无显著影响,计算方法如下:
表 5. 3 L9( 34) 正交实验结果计算
注: Ⅰj—第 j 列 “1”水平所对应的实验指标的数值之和;
Ⅱj—第 j 列 “2”水平所对应的实验指标的数值之和;
Ⅲj—第 j 列 “3”水平所对应的实验指标的数值之和;
kj—第 j 列同一水平出现的次数,等于实验的次数除以第 j 列的水平数;
Ⅰj/ kj—第 j 列 “1”水平所对应的实验指标的平均值;
Ⅱj/ kj—第 j 列 “2”水平所对应的实验指标的平均值;
Ⅲj/ kj—第 j 列 “3”水平所对应的实验指标的平均值;
Rj—第 j 列的极差,Rj= max { Ⅰj/ kj,Ⅱj/ kj… } - min { Ⅰj/ kj,Ⅱj/ kj… } 。
实验指标的加和值 ,实验指标的平均值 ,仍以表 5. 3 第 j 列为例:
1) Ⅰj———第 j 列 “1”水平所对应的实验指标的数值之和。
2) Ⅱj———第 j 列 “2”水平所对应的实验指标的数值之和。
3) ……
4) kj———第 j 列同一水平出现的次数,等于实验的次数除以第 j 列的水平数。
5) Ⅰj/ kj———第 j 列 “1”水平所对应的实验指标的平均值。
6) Ⅱj/ kj———第 j 列 “2”水平所对应的实验指标的平均值。
7) ……
以上 7 项的计算方法同极差法 ( 见表 5. 3) 。
8) 偏差平方和
高铝粉煤灰特性及其在合成莫来石和堇青石中的应用
9) fj———自由度,fj= 第 j 列的水平数 - 1。
10) Vj———方差,Vj= Sj/ fj。
11) Ve———误差列的方差,Ve= Se/ fe。式中,e 为正交表的误差列。
12) Fj———方差之比,Fj= Vj/ Ve。
13) 查 F 分布数值表 ( F 分布数值表请查阅有关参考书) 做显著性检验。
14) 总的偏差平方和 。
15) 总的偏差平方和等于各列的偏差平方和之和。即 ,m 为正交表的列数。
若误差列由 3 个单列组成,则误差列的偏差平方和 Se等于 3 个单列的偏差平方和之和,即有:
Se= Se1+ Se2+ Se3
或 Se= S总+ S''
其中 S'' 为安排有因素或交互作用的各列的偏差平方和之和。
与极差分析法相比,方差分析法可以多得出一个结论,即各列对实验指标的影响是否显著、在什么水平上显著。
在数理统计上,显著性检验是一个很重要的问题。显著性检验强调实验在分析每列对指标影响中所起的作用。如果某列对指标影响不显著,那么讨论实验指标随它的变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时对应的实验指标的数值在以某种 “规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将影响不显著的交互作用列与原来的 “误差列”合并起来,组成新的 “误差列”,重新检验各列的显著性。
㈡ 科研常用的实验数据分析
科研探索之旅:深入解析常用实验数据分析方法
在科研探索的征途中,数据分析是每一步稳健前行的关键环节。掌握正确的方法,能揭示隐藏在数据背后的真相。让我们一起揭秘科研人员手中的六把数据分析利剑:聚类分析、因子分析、相关分析、对应分析、回归分析,以及方差分析。
1. 聚类分析 - 数据的自然分类
聚类分析,就像自然界的生物分类,是将数据对象按照相似性分门别类的过程。它不预设类别,而是从数据中寻找内在结构,每个簇内的对象相似度极高,而簇与簇间差异显著。不同的研究者可能会基于不同的方法得出各异的分类结果,但都是从数据中挖掘潜在的秩序。
2. 因子分析 - 数据中的核心驱动
因子分析是探索变量间共性因子的科学探索,旨在简化决策过程。众多方法如重心法、影像分析,甚至主成分分析,都是以揭示数据间的复杂关系为目标。在社会学研究中,这一工具经常被用来揭示变量间的深层次联系。
3. 相关分析 - 现象之间的纽带
相关分析揭示现象间的相互影响,如身高与体重,施肥量与产量。它是非决定性的,但提供了度量关系强度的工具,帮助我们理解现象之间的微妙联系。
4. 对应分析 - 定性变量的联系揭示者
对应分析,这个名字本身就暗示了它对定性变量交互表的洞察力。它揭示了类别间的差异和对应关系,将复杂的数据结构简化为易于理解的低维度图形。
5. 回归分析 - 预测与理解的桥梁
回归分析是研究变量之间定量关系的强大工具,无论是单一因素(一元回归)还是多因素(多元回归),线性还是非线性,它都能揭示变量间的动态关联,为预测和理解提供依据。
6. 方差分析 - 控制变量影响的检验器
方差分析,如同科学家的精密天平,用来测量随机与控制变量对数据波动的影响。通过分析方差,我们能识别出那些对结果有显著影响的因素,确保研究结果的可靠性和有效性。
掌握这些数据分析方法,科研人员便能在海量数据中游刃有余,提炼出关键信息,推动科研成果的卓越呈现。每一次分析,都是一次对科学真理的探索,让我们在数据海洋中找寻知识的宝藏。