유일한 값 확인: dataframe.series.unique()
유일한 값 개수 확인: dataframe.series.nunique()
1
2
3
4
|
pp(cp.item_name.unique())
pp('======================'*4)
pp(cp.item_name.nunique())
# pp(len(cp.item_name.unique()))
|
cs |
결과 >
위와 같이 unique() 실행 결과는 데이터프레임 중 item_name의 유일한 값들이 어떤 것이 있는지 보여주고,
nuique()는 유일한 값들의 개수를 알려준다.
유일한 데이터 종류 및 개수 확인: dataframe.series.value_counts()
cp.item_name.value_counts()
value_counts()를 이용하면 unique한 값과 결과 값의 개수까지 알려준다.
응용
- 우리 가게에서 TOP10 메뉴는 무엇인가?
cp.item_name.value_counts()[:10]
바로 앞선 코드에서 [:10]만 추가하면 해당 코드의 상위 10개만 출력할 수 있다.
이는 0부터 9까지 출력하는 것으로, 인덱스 번호가 0부터 시작하기에 가능하다.
'Python > 간단 문법' 카테고리의 다른 글
[Python] 데이터프레임의 Null 비율 알아보기 - 문자열 포매팅 (0) | 2021.01.19 |
---|---|
[Python] 그룹별 최대, 최소, 평균, 합계 한 번에 구하기 - agg() 함수 (0) | 2021.01.13 |
[Python] 파이차트를 이용해 시각화하기 (0) | 2021.01.12 |