데이터 탐색 과정 중 하나인 Null 값의 비율을 알아볼 수 있는 for문을 알아보도록 하겠습니다.
for col in session.columns:
msg = 'column: {:>10}\t Percent of NaN Value: {:.2f}%'.format(col, 100 * (session[col].isnull().sum() / session[col].shape[0]))
print(msg)
코드가 정말 길지만 하나하나 알아보도록 하겠습니다!
1) df.columns : 데이터프레임의 컬럼만 가져오기
2) {:>10}\t : 오른쪽 정렬 및 탭하기
3) {:.2f}% : 소수점 두번째 자리까지 나타내기
4) .format() : 문자열 포매팅
5) df[col] : 시리즈(하나의 열 또는 행) 가져오기
6) df[col].isnull().sum() : 시리즈(여기선 하나의 컬럼) 중 null의 합 구하기
7) df[col].shape(0) : 시리즈(여기선 하나의 컬럼)의 크기 구하기
결과>
노란색 박스 = 각 컬럼
주황색 박스 = null 값 비율
저는 여기서 {:>10}의 기능을 처음 알게 됐습니다. ㅎㅎ;;
이렇게 메시지를 출력하는 경우 정렬하는 기능이 정말 중요한데 말이죠.
그럼 다음에 만나요!
'Python > 간단 문법' 카테고리의 다른 글
[Python] 그룹별 최대, 최소, 평균, 합계 한 번에 구하기 - agg() 함수 (0) | 2021.01.13 |
---|---|
[Python] 파이차트를 이용해 시각화하기 (0) | 2021.01.12 |
[Python] 유일한 값 확인, 유일한 값의 개수세기 - unique(), nunique(), value_counts() (0) | 2021.01.11 |