본문 바로가기

Statistics

[통계] 기초부터 차근차근 - 영가설, 대립가설, 유의확률, p-value

✍ 데이터 분석에서 활용하기 위한 통계를 공부합니다.

 

🙌 혹시나 잘못된 정보가 있다면 댓글로 알려주시면 감사하겠습니다. :)

 


영가설(귀무가설)

🔸 특별한 증거가 없으면 참으로 추정되는 가설

🔸 검정을 통해 영가설을 기각하고 싶어 함

🔸 H0 으로 표기

 

✅ 대립가설

🔸 특별한 증거가 없으면 거짓으로 추정되는 가설

🔸 우리가 궁금한 가설

🔸
H1 또는 Ha로 표기

 

 

✅ 유의확률, p-value

 

이미지 출처 - 위키백과

유의확률은 영가설(귀무가설)이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률

...

너무 어렵죠? 

즉, 유의확률 p-value가 작을수록 대립가설을 채택하게 됩니다.

보통 p-value가 0.05, 0.01보다 작으면 대립가설을 채택합니다.

 


예시 1


🔸 영가설: 대한민국 성인 남성의 키는 160cm일 것이다. 

🔸 대립가설: 대한민국 성인 남성의 키는 160cm 이상일 것이다. 

🔸 관측한 대한민국 성인 남성의 키의 평균은 175cm, 표준편차는 1cm이다. 


예시 출처: 패스트캠퍼스

이미지 출처 - 패스트 캠퍼스

 

영가설로 대한민국 성인 남성의 평균 키는 160cm 일 것이라 했지만 실제로 데이터를 수집하여 관측해보니 성인 남성 키의 평균은 175cm 이었기 때문에 영가설을 기각하고 대립가설을 채택합니다. 

 

하지만, 영가설이 기각되었다고 해서 대립가설이 반드시 참은 아닙니다.

 

 예시 2


🔸 영가설: 대한민국 성인 남성의 키는 여성의 키와 같을 것이다.

🔸 대립가설: 대한민국 성인 남성의 키는 여성보다 작을 것이다.

 

위의 예시는 상식으로 생각해보면 당연히 영가설과 대립가설을 모두 기각해야 한다고 떠올릴 수 있지만,

실제 데이터 분석에서는 데이터가 어떻게 생겼는지 파악 해야하기 때문에 가설을 잘못 세우면 분석의 길을 잃을 수도 있겠네요... 😂