가설검정
조사하고자 하는 현상
수학적으로 표현할 수 있는, 구체적인 가설로 설정
가설을 입증할 실험 및 관찰 수행
결과를 효과적으로 요약할 수 있는 값으로 표현
보다 구체적으로,
1) 귀무가설, 대립가설 설정
2) 실험 및 관찰 계획 수행
3) 실험 및 관찰을 요약
4) 요약된 값이 귀무가설이 참이라 가정했을 때 쉽게 발생할 수 있는지 조사
5) 귀무가설 하에 발생하기 힘들다면, 귀무가설 기각(reject), 발생할 수 있는 값이면 귀무가설 채택(accept)
귀무가설 (H0): 실험이나 관찰을 통해서 기각하고싶은 기존의 가설
대립가설 (Ha): 실험이나 관찰을 통해서 주장하고 싶은 새로운 이론
단측검정 vs. 양측검정
예를들어
H0 : 2010년 중학생의 평균 키는 170cm 이다
Ha1 : 2010년 중학생의 평균 키는 170cm보다 크다
Ha2 : 2010년 중학생의 평균 키는 170cm 과 차이가 있다.
라 해보면
단측검정
Ha1을 봤을 때, μ < 170cm 일 가능성이 전혀 없다면 μ > 170cm인 경우만을 생각해도 되겠지.
이것이 단측검정이고, 이렇게 하면 귀무가설을 기각할 가능성이 높아짐. 즉 검정력이 높아짐. (power)
양측검정
Ha2를 봤을 때, μa != μb가 되는데 이 경우는 μa < μb 랑 μa > μb 두 경우를 모두 고려해야함
귀무가설을 통과하기 조금 더 까다롭게됨.
검정통계량 (test statistic)
가설 검정에 사용하는 표본의 통계량을 적은 수의 통계값으로 요약한 것을 검정통계량이라고 함
z통계량, t통계량, x^2통계량, F통계량 등등
참조블로그: http://math7.tistory.com/84유의수준 (level of significance)
어느정도 드문 현상을 유의하다고 볼 것인지? 보통 5%로 설정함.
유의확률 (p-value)
실험이나 관찰에서 나온 검정통계량이 귀무가설을 지지하는 정도.
p가 작을수록 귀무가설을 기각하는거죠.
정확히는, H0가 참이라고 할 때 주어진 데이터가 참일 확률.
검정력과 표본 수(power and sample size)
표본수가 커지면 작은 차이라도 기각할 가능성이 커지는데,
이를 귀무가설이 잘못되었을 때 기각할 수 있는 확률, 즉 검정력(power)가 커진다고 함
표본수가 작아지면 유의하지 않은 결과가 나올 가능성이 높아짐.
p-value는 false-positive가 일어날 확률을 의미한다.(type1 error) 즉 귀무가설이 거짓일 때, 데이터가 귀무가설을 지지한다고 결정할 확률을 결정한다는 것. 보통 5%로 설정함. 대부분의 실험에서 p-value 만을 가지고 검정 마침
power 검정은 false-negative가 일어날 확률을 의미한다. (type 2 error) 즉 귀무가설이 참일 때, 표본 데이터가 귀무가설을 기각한다고 나올 확률인 것이다. 표본 수가 적어질 수록 이 같은 오류를 범할 확률이 커지므로 샘플 사이즈에 따라 이와 같은 검정을 수행할 필요가 있다. 보통 20%로 설정.
보통 전수조사가 불가능하니 표본조사를 해서 모집단의 성질을 추론하게 되니
표본이 모집단을 대표할 수 있도록 하는것이 관건