✍ 데이터 분석에서 활용하기 위한 통계를 공부합니다.
🙌 혹시나 잘못된 정보가 있다면 댓글로 알려주시면 감사하겠습니다. :)
✅ 영가설(귀무가설)
🔸 특별한 증거가 없으면 참으로 추정되는 가설 🔸 검정을 통해 영가설을 기각하고 싶어 함 |
✅ 대립가설
🔸 특별한 증거가 없으면 거짓으로 추정되는 가설 |
✅ 유의확률, p-value
유의확률은 영가설(귀무가설)이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률
...
너무 어렵죠?
즉, 유의확률 p-value가 작을수록 대립가설을 채택하게 됩니다.
보통 p-value가 0.05, 0.01보다 작으면 대립가설을 채택합니다.
✅ 예시 1
🔸 대립가설: 대한민국 성인 남성의 키는 160cm 이상일 것이다. 🔸 관측한 대한민국 성인 남성의 키의 평균은 175cm, 표준편차는 1cm이다. |
예시 출처: 패스트캠퍼스
영가설로 대한민국 성인 남성의 평균 키는 160cm 일 것이라 했지만 실제로 데이터를 수집하여 관측해보니 성인 남성 키의 평균은 175cm 이었기 때문에 영가설을 기각하고 대립가설을 채택합니다.
하지만, 영가설이 기각되었다고 해서 대립가설이 반드시 참은 아닙니다.
✅ 예시 2
🔸 대립가설: 대한민국 성인 남성의 키는 여성보다 작을 것이다. |
위의 예시는 상식으로 생각해보면 당연히 영가설과 대립가설을 모두 기각해야 한다고 떠올릴 수 있지만,
실제 데이터 분석에서는 데이터가 어떻게 생겼는지 파악 해야하기 때문에 가설을 잘못 세우면 분석의 길을 잃을 수도 있겠네요... 😂
'Statistics' 카테고리의 다른 글
[통계] 기초부터 차근차근 - 가중산술평균 (0) | 2021.03.01 |
---|---|
[통계] 기초부터 차근차근 - 백분위수, 사분위수 (0) | 2021.02.26 |
[통계] 기초부터 차근차근 - 확률 분포, 이산 확률 변수, 연속 확률 변수 (0) | 2021.02.24 |