2×2析因设计资料的方分析_A

古人学问无遗力,少壮工夫老始成。

析因设计实例 3×2析因设计析因设计实例 3×2析因设计


析因设计实例 3×2析因设计


析因设计实例 3×2析因设计


纸上得来终觉浅,绝知此事要躬行。

——陆游(冬夜读书示子聿)

本文系公众号推文 SPSS-2x2析因设计资料方分析 ,摘抄整理,以备后观。

本文案例分析结果为两因素无交互作用,若存在交互作用,则分析流程稍有区别。

析因设计分析条件:

实例:

孙振球主编的《医学统计学》第4版,例11-1,将20只家兔随机等分4组,每组5只进行损伤后的缝合实验,欲比较不同缝合方法及缝合后时间对轴突通过率的影响,试做析因设计的方分析,数据见表1。(表2、3分别为总体均数表达和方分析计算公式)

估计边界均值

轮廓图可将因素之间交互作用可视化,若直线平行,表示无交互作用。

重点:

由于本研究Mod,Time两因素交互作用无统计学意义,将交互项删除,分析两因素的主效应。

具体作为:

模型 > 设定(模型导入Time, Mod) > 主效应

结论:尚不能认为两种缝合方法对神经轴突通过率有影响。

参考文献:

第十三章 实验设计与方分析

统计研究分实验性研究和观测性研究。前者需要控制无关变量,通过实验产生我们需要的数据,后者往往通过抽样调查等方式获得。

本章介绍三种类型的实验设计:完全随机化设计、随机化区组设计和析因实验。

例子:供水过滤系统的部件组装方法有A、B和C。问题:哪种方法使每周产量多。

在这个实验中,装备方法是 变量 或 因子(factor) 。对应三种方法,所以这个实验有三个处理,每个 处理(treatment) 对应一种装配方法。并且是 单因子实验(single-factor experiment) ,因为只涉及装配方法一个因子。也可以有多因子,因子分定性和定量的。

该实验对应三个总体:三个总体分别使用A、B和C其中一种方法。每个总体的 因变量 或 响应变量 是每周装配的过滤系统的数量。

实验目的:确定三个总体的因变量是否相同。

设我们抽取三名工人组成一个随机样本,三名工人构成 实验单元 ,下面将使用 完全随机化设计(compley randomized design) ,要求每种方法随机给其中一个工人,这里相当于工有 种分配方法。( 随机化的概念是所有实验设计的一个重要原则 )

上述方法,每个装配方法只能得到一个因变量的 测度 ,但是我们可以随机抽15个人,每种方法随机分5人。这样就得到了更多因变量的 测度 。这个过程叫。( 的过程是实验设计的另一个重要原则。 )

通过收集数据得到

应用方分析需要三个定:

样本均值彼此接近,则越支持 ,反之支持

如果原设( )成立,我们利用样本均值之间地变异性 的一个估计。则所有样本都来自同一个总体。这些样本均值 同样服从正态分布,且均值为 ,方为 。

回到过滤系统的例子中,我们设 , , 都来自同一个总体(样本容量相同), 抽样分布的均值的估计值为: , 抽样分布的方 的估计可以由三个样本均值的方给出 。

再由 解得 因为 是用 作为估计量,所以这里得 也是估计量。

所得的结果 称作 的处理间估计。

上述都是基于 为真的情形,如果 为,且均值全不相同,则三个抽样分布来自三个总体。于是 会比较大,从而使得 的处理间估计也变得较大。

当我们从每个总体抽取一个随机样本时,每个样本方都给出了 的一个无偏估计,我们将 的个别估计组合或合并成一个总体估计。这种方法得到值称作 的合并估计或处理内估计。因为这里的每个样本方给出的 的估计仅以每个样本内部的变异为依据。

的处理内估计

我们看到 的处理间估计(260)远大于处理内估计(28.33),比值为9.18。

当原设为真,处理间估计方法才是总体方 的一个好的估计量,

当原设为,处理间估计将高估总体方 。

不过这两种情形下,处理内估计都是总方 的一个好的估计量。因此原设为真,两估计量接近,比值接近1;如果原设为,则处理间估计将大于处理内估计,比值也会比较大。

总结 :

ANOVA背后的逻辑是以共同总体方 的两个的估计量为基础,即处理间估计和处理内估计。通过比较两个估计量,来确定总体均值是否相等。

完全随机化实验设计中,如何用方分析来检验k个总体均值是否相等:

我们称处理间估计的 为 均方处理(mean square due to treatments, MSTR)

式中分子称作 处理平方和 (sum of squares due to treatments, SSTR)。分母k-1表示与SSTR相联系的自由度。

均方处理 :

若 为真,则MSTR给出了 的一个无偏估计。但 为时,则MSTR就不是 的无偏估计,会高估总体方

回到例子:

对 的处理内估计称作 均方误 (mean square due to error,MSE)

分子称作 误平方和 (sum of squares due to error,SSE)

均方误 :

我们注意到:MSE是以每个处理内部的变异性为依据,它不受原设是否为真的影响。因此,MSE永远给出 的一个无偏估计

回到例子:

如果原设 为真,则MSTR和MSE给出的 的两个的无偏估计量。 的两个的估计量纸的抽样分布服从 分布。

k个总体均值相等的检验统计量:

检验统计量服从分子自由度为k-1,分母自由度为 的F分布(ANOVA的定要得到满足)

回到生产过滤系统的例子:在 的显著水平下,进行设实验,我们计算得到 ,分子自由度为2,分母自由度为12.

当然也可以用 临界值法 ,当 时,F的临界值是3.8853<9.18。所以也拒绝

总结 :

前面的计算结果,可以使用 方分析表 或 ANOVA表 表示出来。一个完全随机化实验设计的ANOVA表的一般形式如下:

总平方和SST的计算公式:

且:

我们可以吧SST看作“处理平方和”与“误平方和”的和。且自由度 也可由对应的SSTR和SSE的自由度加起来。

方分析可以被看作将总平方和及其自由度 分解 成它们对应的来源(处理与误)的一个过程。

例子:NCP公司对工厂员工的生产意识进行考试,共有3个工厂,每个工厂抽取6人。成绩如下:

总结 :

方分析只能告诉我们k个总体均值是否相等,但是具体哪些总体相等,哪些不相等,我们需要用 多重比较方法 在成对的总体均值之间进行统计比较。

在方分析钟拒绝了 ,在这种情况下Fisher的小显著性异(least significant difference,)方法可以用来确定哪些均值存在异。

检验统计量:

拒绝法则:

p-值法:如果 p-值 ,则拒绝

临界值法:如果 或者 ,则拒绝

其中 是自由度为 时,t分布的上侧面积为 的t值。

我们令 ,判断总体1(方法A)和总体2(方法B)的均值是否存在异。

经过excel计算,t=-1.19,自由度为12时,的下侧面积为0.1285,双侧加起来即为p-值=0.2571>0.05所以,我们拒绝原设,认为方法1和方法2的均值不相等。

基于检验统计量 的Fisher的方法 :

检验统计量:

显著水平 下的拒绝法则:如果 ,则拒绝

其中:

在过滤系统的例子中,通过计算得到

计算后,我们可以把三个总体的样本均值计算出来,比如总体1和总体3的样本均值为62-52=10>7.34,这就意味着我们拒绝认为总体1和总体3均值相等。

Fisher的方法的两个总体均值之的置信区间估计

其中 是自由度为 时,t分布的上侧面积为 的t值。

如果置信区间包含数值0,则不能拒绝两个总体均值相等的原设。如果不包含则拒绝 。

Fisher的方法被称为保护性或限制性检验,这是因为只有当我们首先找到一个用于方分析的显著的F值时,才能使用检验。

第Ⅰ类错误概率 和 实验方式的第Ⅰ类错误概率

我们都是用 的显著水平,对每个检验来说犯 为0.05,我们把这个概率称作 比较方式的第Ⅰ类错误概率 ,表示单个的两两比较相联系的显著性水平。

在三次检验中至少有一次犯第Ⅰ类错误的概率为 ,我们称这个概率为 实验方式的第Ⅰ类错误概率 ,记作

当总体较多时,实验方式的第Ⅰ类错误概率就会比较大。

如何控制 呢?-使用Bonferrani修正方法

设我们想要检验C个成对的两两比较( )

我们令 ,例如针对5个总体,10种比较,想让实验方式的第Ⅰ类错误概率为0.05,则

但是一类错误和二类错误是成反比的,所以如何去权衡是个问题。也有其他方法,如Turkey方法、Duncan多重区域检验等,哪种更优有争议。

有时外部因素(实验中没有考虑到的因素)引起MSE变大时,F将会变小。让我们误以为处理间没有异,但是事实上是存在的。

本节将会介绍 随机化区组设计(randomized block design) 的实验设计。这个方法主要是通过消除MSE来自外部的变异,来达到控制变异外部来源的目的。

举例:探究不同工作系统是否产生不同的压力。现有3种设计方案,我们要探究不同方案之间有多大异。

管理者希望个人的变异性是MSE项的主要贡献者,将个人异分离出来的一种办法是使用随机化区组设计。随机化区组需要的一个单样本,分别在三个工作站接受检验。即工作站是影响因子,是区组。(后面简称工作站为系统A、B和C)

每个个体都需要接受三次检验,检验顺序也需要是随机的。值是工作压力的度量。

随机化区组设计的ANOVA方法,要求我们将总平方和(SST)分解成:处理平方和(SSTR)、区组平方和(SSBL)和误平方和(SSE)。

随机化区组设计,主要功能就是通过划分区组,将个人的异从MSE中剔除。

步骤:

计算得到:

上述的例子是完全区组设计,即每个区组都要做k个处理。对应不完全区组设计,即某些(不是全部)处理被用于每个区组(如每个人都完成了系统A和B的检验,只有个别人完成了系统C的检验)

注释 :

由于有b个区组,使得自由度减少了b-1,所以随机化区组设计的误自由度小雨完全随机化设计的误自由度。如果n很小,因为误自由度的减少,区组的潜在影响可能被掩盖;当n很大时,这种影响被小化了。

有时,我们需要得到一个以上变量或因子的统计结论。 析因实验(factorial experiment) 是一种实验设计。

举例:GMAT考试(商学院研究生考试),分数在200~800之间。现在有3种GMAT辅导课程。考生本科来自3种类型的院校。对应有9种处理组合,每个处理组合容量为2,意味着有两个 。

从种类型学校,每个学校取6人,分三组,随机分配到一个辅导课程。

我们希望得到的:

两因子析因实验的ANOVA方法要求我们将总平方和(SST)分为四个部分:因子A的平方和(SSA)、因子B的平方和(SSB)、交互作用的平方和(SSAB)、误平方和(SSE)。

得到计算结果:

一般中型到大型的析因实验中涉及大量计算,需要用计算机。

综上,

链接: 提取码: 333c 这段内容后打开百度网盘手机App,作更方便哦

实验设计法的析因设计

区组设计主要用于农业的单因素实验,而析因设计既能用于农业实验,又能用于工业和其他技术科学实验,其目的是了解因素对某项指标的影响。例如,某项产品质量受原料、加工温度、加工时间等因素的影响。若原料有三个产地:上海、天津和锦州,把产地作为一个因素,则它们是这个因素的3个水平。若可选的加工温度是80℃、90℃、100℃和105℃,加工时间是5分钟和7分钟,则加工温度和加工时间这两个因素分别有4个水平和2个水平。问题是要了解在这些因素的不同水平组合之下,产品质量是否有显著性异,并进一步确定这样一种水平组合,使产品质量。析因设计就是将全部因素的水平组合起来做实验,使得既能估计各个因素的主效应,又能估计因素之间的交互作用。所谓主效应,是指同一因素各水平之间的异;交互作用是指一个因素的效应因另一因素的水平的改变而起的变化。前例中有3个因素,它们分别有3、4、2个水平,把它们组合起来共有3×4×2=24个水平组合,称为3×4×2型实验。若这3个因素分别以A、B、C表示,则从这个实验可以算出3个主效应A、B、C;3个二因素交互作用A×B、A×C、B×C以及一个三因素交互作用A×B×C。 主效应和交互作用统称效应,三因素或更多因素的交互作用统称为高阶交互作用。

关于析因设计和被试内设计的问题!!

唔,析因设计其实充其量不是一种设计方法,而是一种数据处理的方法,一般用在多因素设计检验交互作用,但是交互作用的效应边缘显著的时候,才会用到析因分析。

被试内设计和被试间设计从根本上来看,是根据实验目的不同分类的,但是从现象上来看,是实验流程上的不同。

心理学实验要求一个被试进行一个任务,我们通过测量一些反应指标,比如行为学指标或者生理学指标,来推测某个心理现象的过程。那么如果我们的实验目的,是探求同一个人在不同条件下的心理过程有何不同,那我们就需要用到被试内设计,让一个被试进行多个TRIAL,来比对某一个被试前后TRIAL的反应的异。如果我们的实验目的是要探求某个心理过程的普遍性,那就要用被试间设计,让多个被试做同一个任务,来观察是否存在普遍性,即是否个体异在这个心理过程中不显著。这个是被试内设计和被试间设计的主要出发思路。

但是被试内设计必然会涉及到一个叫练习效应的东西,即某个任务,被试做了很多次之后,发现了其中的规律,那么我们在这个时候测量到的指标就会有偏。所以在练习效应特别明显的实验中,即便我们想测量个体内部心理过程在不同水平上的不同变化,也要采用被试间设计来摈除练习效应的影响。这种时候经常会采用混合设计,即实验中既有被试内设计也有被试间设计。比如我整个实验有100个TRIAL,有30个被试。但是这个实验的联系效应在做到第30个TRIAL的时候就会出现,那我可以让每个被试做30个TRIAL,这530个TRIAL在整体100个里面是随机抽取的,每个被试做的TRIAL终加起来出现的次数比例都是一致的。这样就叫混合设计。

同样的,被试间设计有时候会碰到需要被试数量太大,而找不到被试的问题。这种时候只要实验的练习效应不是特别明显,也可以采用混合设计,以此来减少所需要的被试数量。例子同上。

所以析因分析和被试间设计、被试内设计根本不是同一个领域里的概念,换言之,他们是按照不同的标准分类的,你要说有交叉重叠的话,也可以说有,因为被试内设计和被试间设计是从具体实验作的过程上来分类的,而析因设计要求必须有两个或者以上的变量,你要做多因素分析的时候,交互效应边缘显著的时候才会用到。如果一开始直接就设交互效应边缘显著,那么在设计的时候可以直接直接设计成析因的方式,这种就叫析因设计,但是在心理学实验中并不常用,元分析的时候会用到析因分析而已。

也就是说,不管是被试内设计还是被试间设计,都是不管有多少个因素的。一个自变量可以,多个自变量也可以。只不过在多个自变量的实验中,自变量之间的交互效应边缘显著的时候,就要用到析因分析来处理数据了。

另外,从变量的角度来分类,实验也可以分成单因素设计和多因素设计。单因素设计一般探讨的是相关和因果,多因素设计一般探讨的是因素与因素之间的交互作用。

具体的解释和细节,你可以去搜一下“心理学研究方法”,那里会更详细的讲到这些。

希望我的回答能帮到你。

转载 如何看待22析因设计中的交互效应问题?

在自变量B的两个水平上,自变量A从A1到A2的变化引起的因变量的变化趋势一致,只是变化幅度不一致。这里的交互效应掩盖了自变量A在自变量B不同水平上的效应量的异。很明显,在B1上平上,A的效应量大于其在B2水平上的效应量。图d,图a:交互效应显著,A的主效应也显著,这时A的效应方向可能会被交互效应歪曲。在a图中,A的变化在B1的水平上引起了因变量的显著变化,但在B2水平上却未引起因变量的变化,这就是说A的变化不是在任何情况下都会引起因变量的变化的,它依赖于自变量B的水平;在d图中,虽然A的变化在B的两个水平上都引起了因变量的明显变化,但是变化的方向正好相反,从其主效应看,A的水平提高可以促进因变量分数的提高,但实际情况是,当A在B1水平上提高时,反而会导致因变量分数的下降。所以在这种情况下,显著的交互效应掩盖或歪曲了自变量A的作用机制:它在B的不同水平上效应量是不同的。图c、e、f:交互效应显著,A的主效应却不显著,实际上是交互效应掩盖了A的效应。我们从这些图示中可以明显看到A的效应,但方分析结果却会显示A的主效应不显著,这是因为A在B的两个水平上的效应方向相反,计算A的主效应时A1和A2的异量被掩盖在了平均过程中。 所以,如何依据自变量主效应和其与其它自变量的交互效应来进行结果分析呢?这一点很简单:当方分析结果显示A的主效应及A与其它自变量的交互效应都不显著时,则说明A的效应真的不明显;当方分析的结果显示A的主效应不显著但A与其它自变量的交互效应显著时,则说明A其实是对因变量有明显作用的,即A的效应其实是存在的,只不过其效应的大小和方向依赖于其它自变量的不同水平。-----就是主效应和与其它自变量的交互效应都要看。应该记住,一个因子的主效应是对其在另外一个因子所有不同水平下观测分数的平均而得到的,而这种平均的结果可能很难准确地反映每种具体实验处理的效应。“总之,交互效应可能会掩盖或歪曲两个因子中任何一个因子的主效应。因此,只要是交互效应达到了统计学上的显著性水平,你在就主效应问题作出结论前都要仔细考察具体的数据变化。