Python pandas에서 groupby를 집계할 때, agg()를 이용하면 다수의 함수를 한번에 적용할 수 있습니다.
문법은 아래와 같습니다.
변수 = dataframe.groupby('column').column.agg(['mean', 'min', 'max', 'sum'])
아래 코드는 대륙별(그룹핑) spirit_servings(지정칼럼)의 평균, 최소, 최대, 합계를 구합니다.
result = drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max', 'sum'])
result.head()
결과>
변수로 따로 선언한 후, agg() 함수를 적용해도 됩니다.
function_list = ['size', 'std', 'mean', 'min', 'max', 'sum'] #size: 데이터 크기, std:표준편차
result = drinks.groupby('continent').spirit_servings.agg(function_list)
result.head()
결과>
참고:
1. youtu.be/FbOyPug1nEs [[이것이 데이터 분석이다 with 파이썬_06] 국가별 음주 데이터 분석하기(1)]
2. https://rfriend.tistory.com/392 [R, Python 분석과 프로그래밍의 친구 (by R Friend)]
'Python > 간단 문법' 카테고리의 다른 글
[Python] 데이터프레임의 Null 비율 알아보기 - 문자열 포매팅 (0) | 2021.01.19 |
---|---|
[Python] 파이차트를 이용해 시각화하기 (0) | 2021.01.12 |
[Python] 유일한 값 확인, 유일한 값의 개수세기 - unique(), nunique(), value_counts() (0) | 2021.01.11 |