ANalysis Of VAriance (ANOVA) 分散分析
注意,虽然ANOVA叫analysis of variance(分散分析)但它其实比较的是平均值。
(from here)
根据教材,ANOVA用来分析interval/ratio数据的,3个以上样本的平均值有无差异。
那么为什么比较3个以上的样本,不用t-test两两比较,而要用ANOVA方法来比较呢?
比如A,B,C三个样本,彼此之间的t-test的p-value都是0.05,那么3个样本之间至少有一对之间存在有统计意义的差的概率(p-value)为:1-(1-0.05)*(1-0.05)*(1-0.05)=0.142625。
在R里有函数aov、anova和oneway.test三个函数,这篇文章和这篇文章说的都比较清楚。
比如,有下面4组数据,分析他们的平均值有无差异:
Pr(>F)=0.02708,小于0.05说明有统计学意义上的差异。
用oneway.test来做可以得到同样的结果
- * 2つの平均値の相違を検討するにはt検定を用いるが、 3つ以上の平均値の相違を検討する場合にはANOVAを用いる。
*分散分析には2つ以上の変数間の相違を、全体的または同時に、さらに変数を組み合わせて検討する。
*全体的な相違が認められた場合、どこに相違があるのかも検討する。
↓ | すべての群を比較するのではなく、要因による効果を検定する。 従って、どの群とどの群の平均値が有意差があるかはわからない。→多重比較検定 |
↓ | 分散を分析するのではなく、分散を用いて、多群の平均値を分析する検定法である。 |
↓ | 分散分析には、要因分散分析と反復測定分散分析とがある。 |
↓ | 要因が2つ以上ある場合は、主効果だけではなく、複数の要因による交互作用を検定する。 |
↓ | 個々のデータを変動させている要因を分解し、分散分析表を作成して検定する。 |
↓ | 要因変動と誤差変動から、F値をもとめる。 |
↓ | F値は、フィッシャーのイニシャルである。 |
根据教材,ANOVA用来分析interval/ratio数据的,3个以上样本的平均值有无差异。
那么为什么比较3个以上的样本,不用t-test两两比较,而要用ANOVA方法来比较呢?
比如A,B,C三个样本,彼此之间的t-test的p-value都是0.05,那么3个样本之间至少有一对之间存在有统计意义的差的概率(p-value)为:1-(1-0.05)*(1-0.05)*(1-0.05)=0.142625。
在R里有函数aov、anova和oneway.test三个函数,这篇文章和这篇文章说的都比较清楚。
比如,有下面4组数据,分析他们的平均值有无差异:
A组 | 56, 48, 72, 60, 55 |
B组 | 60, 62, 76, 84 |
C组 | 78, 53, 62, 44, 90, 57 |
D组 | 77, 72, 83, 81, 91, 83 |
> vx=c(56, 48, 72, 60, 55, 60, 62, 76, 84, 78, 53, 62, 44, 90, 57, 77, 72, 83, 81, 91, 83)
> fx=factor(rep(c("A", "B", "C", "D"), c(5, 4, 6, 6)))
> anova(aov(vx~fx))
Analysis of Variance Table
Response: vx
Df Sum Sq Mean Sq F value Pr(>F)
fx 3 1629.2 543.06 3.9141 0.02708 *
Residuals 17 2358.6 138.74
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
用oneway.test来做可以得到同样的结果
> oneway.test(vx~fx, var.equal=T)
One-way analysis of means
data: vx and fx
F = 3.9141, num df = 3, denom df = 17, p-value =0.02708
0 Comments:
Post a Comment
<< Home