俺的学习笔记

Friday, November 9, 2018

One Sample T-Test

The one sample t-test is a statistical procedure used to determine whether a sample of observations could have been generated by a process with a specific mean.
なるほど、one sample t-testというのは、一つのサンプルの平均値は定められた値に等しいかどうかを判断するための仮説検証方法ですね。
例えば、ある製品ラインで製造された製品の厚さは0.5mmであるかどうかを検証する場合、one sample t-testを用います。
統計学的に言うと、one sample t-testは下記のHypothesisを検証します。
null hypothesis
H0: μ = m0
The null hypothesis (H0) assumes that the difference between the true mean (μ) and the comparison value (m0) is equal to zero.
alternative hypothesis
H1: μ ≠ m0    (two-tailed)
The two-tailed alternative hypothesis (H1) assumes that the difference between the true mean (μ) and the comparison value (m0) is not equal to zero.

H1: μ > m0    (upper-tailed)
The upper-tailed alternative hypothesis (H1) assumes that the true mean (μ) of the sample is greater than the comparison value (m0).

H1: μ < m0    (lower-tailed)
The lower-tailed alternative hypothesis (H1) assumes that the true mean (μ) of the sample is less than the comparison value (m0).
これからp値を計算し、hypothesisが成立するかどうかを判断します。
p > 0.05 →H0 is TRUE (accept)
p0.05 →H0 is FALSE (reject)
詳しくは下記のURLを参照します。
p値の意味を理解することがとても重要です。
Statistical significance is determined by looking at the p-value. The p-value gives the probability of observing the test results under the null hypothesis. The lower the p-value, the lower the probability of obtaining a result like the one that was observed if the null hypothesis was true. Thus, a low p-value indicates decreased support for the null hypothesis.
つまり、p値はnull仮説が成立する確率になります。

Rに、T-testを行う関数があり、簡単にテストできます。
Rで平均値5.1の正規分布の乱数を作り、サンプルとして使い平均値5.0に等しいかどうかを判断します。
H0:μ=5.0
H1:μ≠5.0
作ったデータの分布はこうなります。
これで明らかに平均値は5.0に等しくないですが、RでT-Testを使って判断します。
> x=rnorm(1000,mean=5.1, sd=0.01) #generate normal distribution random number
> boxplot(x) #plot the data
> hist(x) #histgram
> t.test(x,mu=5.0, alternative = "two.sided") # T-test

    One Sample t-test

data: x
t = 314.06, df = 999, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 5
95 percent confidence interval:
5.099745 5.100999
sample estimates:
mean of x
5.100372
上記の場合、p値は2.2e-16であり、0.05よりはるかに小さく、H0は拒否されます。つまり平均値は5.0ではありません。
注意:alternative hypothesis: true mean is not equal to 5を書いてありますが、それは結論ではなく、Hypothesisを記述するだけで、判断はp-valueを使ってユーザー自分で行います。
https://www.statisticssolutions.com/manova-analysis-one-sample-t-test/
下記URLで”標本数が 100 を超える場合、標準正規分布の特徴を使った z 検定が使われ、標本数が少ないときに限り t 検定が使われていた”と言われています。
http://www.ner.takushoku-u.ac.jp/masano/class_material/waseda/keiryo/6_t_test1.html

Labels: , ,

0 Comments:

Post a Comment

<< Home