가설검정


조사하고자 하는 현상

수학적으로 표현할 수 있는, 구체적인 가설로 설정

가설을 입증할 실험 및 관찰 수행

결과를 효과적으로 요약할 수 있는 값으로 표현


보다 구체적으로,


1) 귀무가설, 대립가설 설정

2) 실험 및 관찰 계획 수행

3) 실험 및 관찰을 요약

4) 요약된 값이 귀무가설이 참이라 가정했을 때 쉽게 발생할 수 있는지 조사

5) 귀무가설 하에 발생하기 힘들다면, 귀무가설 기각(reject), 발생할 수 있는 값이면 귀무가설 채택(accept)



귀무가설 (H0): 실험이나 관찰을 통해서 기각하고싶은 기존의 가설

대립가설 (Ha): 실험이나 관찰을 통해서 주장하고 싶은 새로운 이론



단측검정 vs. 양측검정


예를들어 

H0 : 2010년 중학생의 평균 키는 170cm 이다

Ha1 : 2010년 중학생의 평균 키는 170cm보다 크다 

Ha2 : 2010년 중학생의 평균 키는 170cm 과 차이가 있다.


라 해보면


단측검정


Ha1을 봤을 때, μ < 170cm 일 가능성이 전혀 없다면 μ > 170cm인 경우만을 생각해도 되겠지.

이것이 단측검정이고, 이렇게 하면 귀무가설을 기각할 가능성이 높아짐. 즉 검정력이 높아짐. (power)



양측검정

Ha2를 봤을 때, μa != μb가 되는데 이 경우는 μa < μb 랑 μa > μb 두 경우를 모두 고려해야함

귀무가설을 통과하기 조금 더 까다롭게됨. 



검정통계량 (test statistic)

가설 검정에 사용하는 표본의 통계량을 적은 수의 통계값으로 요약한 것을 검정통계량이라고 함

z통계량, t통계량, x^2통계량, F통계량 등등

참조블로그:  http://math7.tistory.com/84



유의수준 (level of significance)

어느정도 드문 현상을 유의하다고 볼 것인지? 보통 5%로 설정함. 



유의확률 (p-value)

실험이나 관찰에서 나온 검정통계량이 귀무가설을 지지하는 정도. 

p가 작을수록 귀무가설을 기각하는거죠. 

정확히는, H0가 참이라고 할 때 주어진 데이터가 참일 확률. 




검정력과 표본 수(power and sample size)

표본수가 커지면 작은 차이라도 기각할 가능성이 커지는데,

이를 귀무가설이 잘못되었을 때 기각할 수 있는 확률, 즉 검정력(power)가 커진다고 함

표본수가 작아지면 유의하지 않은 결과가 나올 가능성이 높아짐.




p-value는 false-positive가 일어날 확률을 의미한다.(type1 error) 즉 귀무가설이 거짓일 때, 데이터가 귀무가설을 지지한다고 결정할 확률을 결정한다는 것. 보통 5%로 설정함. 대부분의 실험에서 p-value 만을 가지고 검정 마침


power 검정은 false-negative가 일어날 확률을 의미한다. (type 2 error) 즉 귀무가설이 참일 때, 표본 데이터가 귀무가설을 기각한다고 나올 확률인 것이다. 표본 수가 적어질 수록 이 같은 오류를 범할 확률이 커지므로 샘플 사이즈에 따라 이와 같은 검정을 수행할 필요가 있다. 보통 20%로 설정. 




보통 전수조사가 불가능하니 표본조사를 해서 모집단의 성질을 추론하게 되니 

표본이 모집단을 대표할 수 있도록 하는것이 관건



Posted by 영선님
,