单因素方差分析结果怎么描述
的有关信息介绍如下:当您有一个类别因子和一个连续响应并且想要确定两个或多个组的总体均值是否存在差异时,可使用单因子方差。
如果经检验,发现至少有一组存在差异,请使用单因子方差分析中的比较对话框来标识存在显著差异的组对。
某化学工程师想要比较4种油漆混料的硬度。每种油漆混料取6份样品涂到一小块金属上,待金属块凝固后再测量每种样品的硬度。
为了检验均值是否相等,并评估均值对之间的差分,分析师配合使用单因子方差分析和多重比较。
录入样本数据,喷漆 vs 硬度。
选择统计>方差分析>单因子。
选择所有因子水平的响应数据位于同一列中。
在响应中,输入硬度。
在因子中,输入油漆。
单击比较按钮,然后选择Tukey。
在每个对话框中单击确定。
单因子方差分析:硬度 与 油漆。
Minitab结果如下图:
确定组均值之间的差分在统计意义上是否显著
要确定均值之间的任何差值在统计意义上是否显著,请将 p 值与显著性水平进行比较以评估原假设。
原假设声明总体均值均相等。
通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。
显著性水平 0.05 指示在实际上不存在差异时得出存在差异的风险为 5%。
P 值 ≤ α:一些均值之间的差值在统计意义上显著
如果 p 值小于或等于显著性水平,则否定原假设并得出并非所有总体均值都相等的结论。使用您的专业知识可以确定差值实际上是否显著。有关更多信息,请转到统计显著性和实际显著性。
P 值 > α:均值之间的差值在统计意义上不显著
如果 p 值大于显著性水平,则您没有足够的证据否定原假设(总体均值相等)。请确认检验具有足够的功效来检测在实际意义上显著的差值。有关更多信息,请转到增加假设检验的功效。
主要结果:P 值
在这些结果中,原假设表明 4 种不同的油漆的平均硬度值相等。
因为 p 值小于显著性水平 0.05,您可以否定原假设并得出部分油漆的均值不同的结论。
检查组均值
使用区间图可显示每个组的均值和置信区间。
区间图显示如下内容:
*每个点号都代表样本均值。
*每个区间针对组均值具有 95% 的置信区间。组均值位于组的置信区间内的置信度为 95%。
在区间图中,混料 2 具有最低均值,混料 4 具有最高均值。
从图形中不能确定任何差分是否在统计意义上显著。
要确定统计显著性,请评估均值差分的置信区间。
比较组均值
如果单因子方差分析 p 值小于显著性水平,您将知道部分组均值是不同的,但组对的情况并非如此。
针对均值差分使用分组信息表和检验可确定特定组对之间的均值差分是否在统计意义上显著,并且根据差异程度进行估计。
分组信息表
使用分组信息表可快速确定任何组对之间的均值差值在统计意义上是否显著。
不共享字母的组存在显著差异。
均值差分检验
使用置信区间可确定差分的可能范围并确定差分是否具有实际显著性。表格会显示均值对之间差分的一组置信区间。均值差分的区间图会显示相同的信息。
不包含零的置信区间表示统计意义显著的均值差分。
根据您选择的比较方法,表格会比较不同的组对并显示下列置信区间类型之一。
*单个置信水平
在多次反复执行研究的情况下,单个置信区间包含一对组均值间实际差分的次数的百分比。
*整体置信水平
在多次反复执行研究的情况下,一组置信区间包含所有组比较值之间实际差分的次数的百分比。
在执行多重比较时,控制整体置信水平尤其重要。如果您没有控制同步置信水平,则至少有一个置信区间不包含实际差分的概率会随着比较次数的增加而提高。
主要结果:均值、分组
在这些结果中,表显示组 A 包含混料 1、3 和 4,组 B 包含混料 1、2 和 3。
混料 1 和混料 3 处于两个组中。共享一个字母的均值之间的差分在统计意义上不显著。
混料 2 和混料 4 不共享一个字母,这表明混料 4 的均值比混料 2 的均值明显高很多。
主要结果:整体置信水平 95% CI,单个置信水平
在 Tukey 结果中,图形和会话窗口输出中的置信区间指示如下内容:
*混料 2 和 4 的均值之间差分的置信区间为 3.11 到 15.89。此范围不包含零,表明这些差分在统计意义上显著。
*其余均值对的置信区间都包含零,表明这些差分统计意义并不显著。
*95% 的整体置信水平表明所有置信区间包含实际差分的置信度可能是 95%。
*该表指示单个置信水平为 98.89%。此结果表明每单个区间包含特定组均值对之间实际差值的置信度为 98.89%。每种比较的单个置信水平会针对所有六种比较产生 95% 的整体置信水平。
确定模型与数据拟合的程度
要确定模型与数据的拟合优度,请检查模型汇总表中的拟合优度统计量。
S
使用 S 可评估模型描述响应值的程度。
S 以响应变量的单位进行度量,它表示数据值与拟合值的距离。S 值越低,模型描述响应的程度越高。但是,自身低 S 值并不表明模型符合模型假设。您应检查残差图来验证假设。
R-sq
R2是由模型解释的响应中的变异百分比。R2值越高,模型拟合数据的优度越高。R2始终介于 0% 和 100% 之间。
高 R2值表示模型不符合模型假设。您应检查残差图来验证假设。
R-Sq(预测)
使用预测的 R2可确定模型对新观测值的响应进行预测的程度。具有较大预测 R2值的模型的预测能力也较出色。
实质上小于 R2的预测的 R2可能表明模型过度拟合。在向总体中添加不太重要的影响项的情况下,可能会发生过度拟合模型。模型针对样本数据而定制,因此可能对于总体预测不太有效。
在比较模型方面,预测的 R2还可能比调整的 R2更有效,因为它是用模型计算中未包含的观测值计算得出的。
主要结果:S、R-sq、R-sq(预测)
在这些结果中,因子对响应中 47.44% 的变异给出了解释。S 表示数据点和拟合值之间的标准差约为 3.95 个单位。
确定模型是否符合分析的假设条件
使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。
残差与拟合值图
使用残差与拟合值图可验证残差随机分布和具有常量方差的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。
在此残差图与拟合图中,点随机散落在图上。没有组看起来具有明显不同的变化,并且没有明显的异常值。
残差与顺序图
使用残差与顺序图可验证残差独立于其他残差的假设。当以时序显示时,独立残差不显示趋势或模式。点中的模式可能表明,彼此相近的残差可能相关联,因此并不独立。理想情况下,图中的残差应围绕中心线随机分布:在此残差与顺序图中,残差似乎会围绕中心线随机衰减。
残差的正态概率图
使用残差正态概率图可验证残差呈正态分布的假设。残差的正态概率图应该大致为一条直线。
下表中的模式可能表示该模型不满足模型假设。
在此正态概率图中,残差通常看起来是一条直线。从残差图与拟合图中,您可以看到四个组中的每一个都具有六个观测值。由于此设计不符合样本数量规则,所以满足正态假设很重要,因而检验结果是可靠的。