본문 바로가기

Python/간단 문법

(4)
[Python] 데이터프레임의 Null 비율 알아보기 - 문자열 포매팅 데이터 탐색 과정 중 하나인 Null 값의 비율을 알아볼 수 있는 for문을 알아보도록 하겠습니다. for col in session.columns: msg = 'column: {:>10}\t Percent of NaN Value: {:.2f}%'.format(col, 100 * (session[col].isnull().sum() / session[col].shape[0])) print(msg) 코드가 정말 길지만 하나하나 알아보도록 하겠습니다! 1) df.columns : 데이터프레임의 컬럼만 가져오기 2) {:>10}\t : 오른쪽 정렬 및 탭하기 3) {:.2f}% : 소수점 두번째 자리까지 나타내기 4) .format() : 문자열 포매팅 5) df[col] : 시리즈(하나의 열 또는 행) 가져오..
[Python] 그룹별 최대, 최소, 평균, 합계 한 번에 구하기 - agg() 함수 Python pandas에서 groupby를 집계할 때, agg()를 이용하면 다수의 함수를 한번에 적용할 수 있습니다. 문법은 아래와 같습니다. 변수 = dataframe.groupby('column').column.agg(['mean', 'min', 'max', 'sum']) 아래 코드는 대륙별(그룹핑) spirit_servings(지정칼럼)의 평균, 최소, 최대, 합계를 구합니다. result = drinks.groupby('continent').spirit_servings.agg(['mean', 'min', 'max', 'sum']) result.head() 결과> 변수로 따로 선언한 후, agg() 함수를 적용해도 됩니다. function_list = ['size', 'std', 'mean', ..
[Python] 파이차트를 이용해 시각화하기 matplotlib을 이용해 파이차트로 시각화하기 위해서 무조건 필요한 코드가 있습니다. 파이차트에 나타낼 수치와 라벨입니다. 당연하지만 시각화 방법이 많기에 쉽게 혼동될 수 있습니다. (그건 바로 저...) labels = drinks['continent'].value_counts().index.tolist() ratio = drinks['continent'].value_counts().values.tolist() explode = (0, 0, 0, 0, 0, 0) #조각이 갈라지는 것 표현 plt.pie(ratio, explode=explode, labels=labels, autopct='%.0f%%', shadow=True) plt.title('Chart of continent ratio') plt..
[Python] 유일한 값 확인, 유일한 값의 개수세기 - unique(), nunique(), value_counts() 유일한 값 확인: dataframe.series.unique() 유일한 값 개수 확인: dataframe.series.nunique() 1 2 3 4 pp(cp.item_name.unique()) pp('======================'*4) pp(cp.item_name.nunique()) # pp(len(cp.item_name.unique())) cs 결과 > 위와 같이 unique() 실행 결과는 데이터프레임 중 item_name의 유일한 값들이 어떤 것이 있는지 보여주고, nuique()는 유일한 값들의 개수를 알려준다. 유일한 데이터 종류 및 개수 확인: dataframe.series.value_counts() cp.item_name.value_counts() value_counts()를..