본문 바로가기

Statistics

[통계] 기초부터 차근차근 - 백분위수, 사분위수

✍ 데이터 분석에서 활용하기 위한 통계를 공부합니다.

 

🙌 혹시나 잘못된 정보가 있다면 댓글로 알려주시면 감사하겠습니다. :)


 백분위수

데이터를 오름차순으로 나열했을 때 백분율로 나타낸 특정 위치의 값

가장 작은 것을 0, 가장 큰 것을 100으로 한다.
100개의 값을 가진 어떤 자료의 20 백분위수는 그 자료의 값들 중 20번째로 작은 값을 뜻한다.
50 백분위수는 
중앙값과 같다.

 

 사분위수


데이터를 
오름차순으로 나열했을 때 4등분 위치의 값

이미지 출처 - 링크(클릭)


그렇다면, 데이터 분석에서 이를 어떻게 활용할까요?


✍ 주어진 데이터의 분포를 파악하는데 이용합니다.


✍ 보통 사분위수를 이용해 박스플롯을 그리고 이상치를 제거합니다.