俺的学习笔记

Sunday, December 2, 2018

ANalysis Of VAriance (ANOVA) 分散分析

注意,虽然ANOVA叫analysis of variance(分散分析)但它其实比较的是平均值
     2つの平均値の相違を検討するにはt検定を用いるが、 3つ以上の平均値の相違を検討する場合にはANOVAを用いる
    分散分析には2つ以上の変数間の相違を、全体的または同時に、さらに変数を組み合わせて検討する。
    全体的な相違が認められた場合、どこに相違があるのかも検討する。
 すべての群を比較するのではなく、要因による効果を検定する。
 従って、どの群とどの群の平均値が有意差があるかはわからない。→多重比較検定
 ↓分散を分析するのではなく、分散を用いて、多群の平均値を分析する検定法である。
 分散分析には、要因分散分析反復測定分散分析とがある。
 要因が2つ以上ある場合は、主効果だけではなく、複数の要因による交互作用を検定する。
 個々のデータを変動させている要因を分解し、分散分析表を作成して検定する。
 要因変動誤差変動から、F値をもとめる。
 ↓F値は、フィッシャーのイニシャルである。
(from here)
根据教材,ANOVA用来分析interval/ratio数据的,3个以上样本平均值有无差异。
那么为什么比较3个以上的样本,不用t-test两两比较,而要用ANOVA方法来比较呢?
比如A,B,C三个样本,彼此之间的t-test的p-value都是0.05,那么3个样本之间至少有一对之间存在有统计意义的差的概率(p-value)为:1-(1-0.05)*(1-0.05)*(1-0.05)=0.142625。

在R里有函数aov、anova和oneway.test三个函数,这篇文章这篇文章说的都比较清楚。
比如,有下面4组数据,分析他们的平均值有无差异:
A组56, 48, 72, 60, 55
B组60, 62, 76, 84
C组78, 53, 62, 44, 90, 57
D组77, 72, 83, 81, 91, 83
vx=c(56, 48, 72, 60, 55, 60, 62, 76, 84, 78, 53, 62, 44, 90, 57, 77, 72, 83, 81, 91, 83)
fx=factor(rep(c("A", "B", "C", "D"), c(5, 4, 6, 6)))
anova(aov(vx~fx))
Analysis of Variance Table

Response: vx
          Df Sum Sq Mean Sq F value Pr(>F)
fx        3  1629.2 543.06 3.9141 0.02708 *
Residuals 17 2358.6 138.74
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>
Pr(>F)=0.02708,小于0.05说明有统计学意义上的差异。
用oneway.test来做可以得到同样的结果
oneway.test(vx~fx, var.equal=T)

  One-way analysis of means

data: vx and fx
F = 3.9141, num df = 3, denom df = 17, p-value =0.02708

Labels: , ,

0 Comments:

Post a Comment

<< Home