ยท Econometrics ยท 2 min read
Two sample T-test example
``` r dental = read.csv("data/dental.csv") boxplot(resp~treatment,data=dental,col='red') boxplot(log(resp)~treatment,data=dental) var.test(resp~treatment,data=dental) variance equality test var.te...
dental = read.csv("data/dental.csv")
boxplot(resp~treatment,data=dental,col='red')
boxplot(log(resp)~treatment,data=dental)
var.test(resp~treatment,data=dental) # variance equality test
var.test(log(resp)~treatment,data=dental) # variance equality test, log-normal
t.test(resp~treatment,data=dental) # Welch test
t.test(log(resp)~treatment,var.equal=TRUE,data=dental) # pooled variance test
regout=lm(log(resp)~treatment,data=dental)
shapiro.test(resid(regout))ํต๊ณํ์์ ๋ ๋ณ์์ ํ๊ท ๊ฐ์ด ๊ฐ์์ง ์์๋ณด๋ ๋ฐฉ๋ฒ์ ๋ช ๊ฐ์ง๋ก ๋๋ ๋ณผ ์ ์๋ค.
- ๋์ผํ ์คํ ๋์์ ํน์ ๋ณ์ ๊ฐ์ด ๋ณํ๋์ง ํ์ธํ๋ ๊ฒฝ์ฐ, ๋ ๋ณ์์ ์ฐจ๋ฅผ T-test ํด๋ณด๋ฉด ๋ฐ๋ก ๊ฒฐ๊ณผ๋ฅผ ์ ์ ์๋ค. ์๋ฅผ ๋ค์ด, ์ด๋ค ๋ค์ด์ดํธ ํ๋ก๊ทธ๋จ์ ์คํํ ๊ฐ ๊ฐ์ธ์ ๋ชธ๋ฌด๊ฒ ๋ณํ๋ฅผ ๋ณด๋ ๊ฒฝ์ฐ๊ฐ ์ด์ ์ํ๋ค. (Paired sample)
- ๋์ผํ ๋ถ์ฐ์ ๊ฐ๋ ๊ฒฝ์ฐ (Pooled variance)
- ์๋ก ๋ค๋ฅธ ๋ถ์ฐ์ ๊ฐ๋ ๊ฒฝ์ฐ (Welch test) 2์ 3์ ๊ฒฝ์ฐ๋ฅผ Variance Equality Test๋ฅผ ํตํด ํ์ธํ ์ ์๋ค. ๊ทธ์ ์์ ๋ฐ์คํ๋กฏ์ ํตํด ์๊ฐ์ ์ผ๋ก ํ์ธํด ๋ณผ ์๋ ์๊ฒ ๋ค. ์ ๋ฐ์ดํฐ๋ ์๋ฌผํ ์คํ ์ค ๋ฐํ ๋ฆฌ์ ๋ฐฐ์์์ ์ถ์ถํ ๋ฐํ ๋ฆฌ์์ ์๋ฅผ ๊ธฐ๋กํ ๊ฒ์ด๊ณ ๋ฐํ ๋ฆฌ์ ์๋ ์ผ๋ฐ์ ์ผ๋ก ์ง์์ ์ผ๋ก ์ฆ๊ฐํ๋ ๊ฒ์ผ๋ก ์๋ ค์ ธ ์๋ค. ๋ฐ๋ผ์ Log ๋ณํ์ ํตํด ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๊ฒ ๋๋ฏ๋ก log-normal distribution์ด๋ผ๊ณ ํ๋ค. Two sample t-test๋ฅผ ์ํํ๊ธฐ ์ํด ๋ชจ์ง๋จ์ด ์ ๊ท๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋์ง ๋ณด๊ธฐ์ํด Regression์ ์ํํ ํ ์์ฐจํญ์ ๋ํด Shapiro test๋ฅผ ์ํํ์๋ค.
Share: