본문 바로가기

Python/간단 문법

[Python] 데이터프레임의 Null 비율 알아보기 - 문자열 포매팅

데이터 탐색 과정 중 하나인 Null 값의 비율을 알아볼 수 있는 for문을 알아보도록 하겠습니다.

 

for col in session.columns:
    msg = 'column: {:>10}\t Percent of NaN Value: {:.2f}%'.format(col, 100 * (session[col].isnull().sum() / session[col].shape[0]))
    print(msg)

 

코드가 정말 길지만 하나하나 알아보도록 하겠습니다!

 

1) df.columns : 데이터프레임의 컬럼만 가져오기

2) {:>10}\t : 오른쪽 정렬 및 탭하기

3) {:.2f}% : 소수점 두번째 자리까지 나타내기

4) .format() : 문자열 포매팅

5) df[col] : 시리즈(하나의 열 또는 행) 가져오기

6) df[col].isnull().sum() : 시리즈(여기선 하나의 컬럼) 중 null의 합 구하기

7) df[col].shape(0) : 시리즈(여기선 하나의 컬럼)의 크기 구하기

 

결과>

노란색 박스 = 각 컬럼

주황색 박스 = null 값 비율

 

저는 여기서 {:>10}의 기능을 처음 알게 됐습니다. ㅎㅎ;;

이렇게 메시지를 출력하는 경우 정렬하는 기능이 정말 중요한데 말이죠.

 

그럼 다음에 만나요!