pandas_profiling은 함수 하나로 손쉽게 데이터를 확인할 수 있어 유용합니다. colab에는 이 패키지가 이미 설치돼 있습니다. 하지만 해당 패키지를 사용하려고 하니 에러가 발생합니다. 오늘은 colab에서 pandas_profiling을 사용하는 경우, 에러가 났을 때 어떻게 하면 되는지 알아보겠습니다.
1. pandas_profiling 사용하기
pandas_profiling은 ProfileReport 함수를 이용해서 사용합니다. 아래와 같이 코드를 실행하면 보고서를 볼 수 있습니다.
from pandas_profiling import ProfileReport
profile = ProfileReport(df)
profile.to_notebook_iframe()
하지만 colab에서 실행하면 아래와 같은 에러가 발생하고 동작하지 않습니다.
TypeError: concat() got an unexpected keyword argument 'join_axes'
2. colab에서 pandas_profiling 사용하기
위 에러는 pandas_profiling 버전이 맞지 않기 때문에 발생한 것입니다. 우선 해당 패키지의 버전을 업그레이드합니다.
pip install --upgrade pandas-profiling
이제 다시 위의 코드를 실행하면, 아래와 같은 에러가 발생합니다.
OSError: '/usr/local/lib/python3.7/dist-packages/pandas_profiling/pandas_profiling.mplstyle' not found in the style library and input is not a valid URL or path; see `style.available` for list of available styles
이를 해결하기 위해서는 colab 런타임을 재시작합니다. 상단의 [런타임]-[런타임 다시 시작] 메뉴를 이용해도 되고, Ctrl+M 을 입력해도 됩니다.
이제 코드를 실행하면 정상적으로 보고서를 볼 수 있습니다.
오늘은 이렇게 코랩(colab)에서 pandas_profiling 실행하는 방법에 대해서 알아보았습니다. pandas_profiling은 손쉽게 데이터를 확인할 수 있어 유용합니다. colab에서 사용 시 문제가 발생했을 때 도움이 됐기를 바랍니다.
파이썬 데이터 분석 학습, 활용해야 실력이 늡니다!
코딩과 데이터 분석을 배우려는 사람들이 많습니다. 전공자가 아니어도 자기계발의 목적으로 관심을 가집니다. 하지만 비전공자가 단순한 자기계발 정도의 목적으로 없는 시간을 쪼개 배우기
aplab.tistory.com
'데이터 > 데이터 분석' 카테고리의 다른 글
판다스 데이터프레임 칼럼 추가하는 2가지 방법과 장단점은?! (0) | 2022.06.17 |
---|---|
한국수출입통계를 파이썬으로 bar chart 그리기 (0) | 2022.06.17 |
yellow brick, ElbowVisualizer AttributeError?! (0) | 2022.05.25 |
파이썬 데이터 분석, EDA를 도와주는 패키지-sweetviz! (0) | 2022.05.03 |
파이썬 plotly 그래프 웹페이지, 블로그에 올리는 방법은?! (0) | 2022.04.28 |
파이썬 그래프 그리기, 동적으로 움직이는 그래프 그리는 방법은?! (0) | 2022.04.27 |
파이썬 대화형 그래프 쉽게 그리기, plotly express 이용 방법은?! (0) | 2022.04.26 |
파이썬 판다스 데이터 프레임 만들기 5가지 방법과 추천방법은?! (0) | 2022.04.24 |