pandas_profiling은 함수 하나로 손쉽게 데이터를 확인할 수 있어 유용합니다. colab에는 이 패키지가 이미 설치돼 있습니다. 하지만 해당 패키지를 사용하려고 하니 에러가 발생합니다. 오늘은 colab에서 pandas_profiling을 사용하는 경우, 에러가 났을 때 어떻게 하면 되는지 알아보겠습니다.

 

 

1. pandas_profiling 사용하기

pandas_profiling은 ProfileReport 함수를 이용해서 사용합니다. 아래와 같이 코드를 실행하면 보고서를 볼 수 있습니다.

 

from pandas_profiling import ProfileReport
profile = ProfileReport(df)
profile.to_notebook_iframe()



하지만 colab에서 실행하면 아래와 같은 에러가 발생하고 동작하지 않습니다.

 

TypeError: concat() got an unexpected keyword argument 'join_axes'

 

 

2. colab에서 pandas_profiling 사용하기

위 에러는 pandas_profiling 버전이 맞지 않기 때문에 발생한 것입니다. 우선 해당 패키지의 버전을 업그레이드합니다.

 

pip install --upgrade pandas-profiling

 

 

이제 다시 위의 코드를 실행하면, 아래와 같은 에러가 발생합니다.

 

OSError: '/usr/local/lib/python3.7/dist-packages/pandas_profiling/pandas_profiling.mplstyle' not found in the style library and input is not a valid URL or path; see `style.available` for list of available styles

 


이를 해결하기 위해서는 colab 런타임을 재시작합니다. 상단의 [런타임]-[런타임 다시 시작] 메뉴를 이용해도 되고, Ctrl+M 을 입력해도  됩니다.

 


이제 코드를 실행하면 정상적으로 보고서를 볼 수 있습니다.

 

 

pandas-profiling-실행결과
pandas-profiling-화면-일부

 

 

오늘은 이렇게 코랩(colab)에서 pandas_profiling 실행하는 방법에 대해서 알아보았습니다. pandas_profiling은 손쉽게 데이터를 확인할 수 있어 유용합니다. colab에서 사용 시 문제가 발생했을 때 도움이 됐기를 바랍니다.

 

파이썬 데이터 분석 학습, 활용해야 실력이 늡니다!

코딩과 데이터 분석을 배우려는 사람들이 많습니다. 전공자가 아니어도 자기계발의 목적으로 관심을 가집니다. 하지만 비전공자가 단순한 자기계발 정도의 목적으로 없는 시간을 쪼개 배우기

aplab.tistory.com

 

  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기