파이썬으로 데이터 분석을 하는 사람들이 늘어나고 있습니다. 최근에 파이참 이용자를 대상으로 한 조사에서도 이와 같은 사실을 알 수 있었습니다. 데이터 분석에서 빼놓을 수 없는 것 중에 하나가 데이터 시각화입니다. 파이썬에는 여러 가지 시각화 패키지가 있습니다. 각각 장단점이 있기 때문에 어느 것이 절대적으로 좋다고 말하기는 어렵습니다. 오늘은 파이썬 데이터 시각화 분석 패키지 BEST5에 대해서 알아보겠습니다.

 

 

필자가 접해본 시간과 패키지를 기준으로 아래와 같이 다섯 가지를 골라봤습니다.

 

 

1. matplotlib

matplotlib는 가장 처음에 접하게 되는 시각화 패키지가 아닐까 싶습니다. 다양한 그래프로 그릴 수 있고 익숙하면 어렵지는 않지만, 분석에 사용하기에는 조금 불편합니다. 그래도 원하는 모든 그래프를 그릴 수 있다는 것이 장점이 있습니다. 동적인 차트에서 애니메이션까지 할 수 있는 범위가 넓지요. 하지만, 데이터 분석에는 이를 래핑 한 seaborn이 사용하기 더 좋습니다.

 

 

 

2. seaborn

R에는 대표적인 그래프 모듈로 ggplot2가 있습니다. ggplot2는 데이터 분석을 하기에 좋은 문법을 가지고 있습니다. matplotlib을 사용하면서 문법에 대한 아쉬움이 있었습니다. seaborn은 matplotlib보다 쉬운 문법을 가지고 있습니다. 사용하기에 더 편리하고 데이터 분석에 더 용이하지요.

 

 

3. plotly

plotly는 인터랙티브한 그래프를 그리기에 가장 좋은 패키지입니다. D3라는 웹 기반의 자바스크립트를 이용하기 때문에, 그래프가 웹에서 그려집니다. 주피터 노트북을 사용한다면 이는 큰 제한사항은 아닌가 싶습니다. 기본적으로 인터랙티브 한 그래프가 그려지기 때문에, 프레젠테이션을 하기에도 데이터를 살펴보기에도 좋습니다. plotly express는 문법도 더 쉬워져서 사용하기 편리합니다.

 

 

4. bokeh

bokeh는 웹기반의 인터랙티브 한 그래프로 그릴 수 있는 패키지입니다. 필자는 책에서만 봤고 사용해 보지는 못했습니다. plotly를 사용한다면, 굳이 사용할 필요성을 못 느끼게 되는 패키지입니다. 하지만 대화형 그래프를 그릴 때 자주 거론되는 패키지 중의 하나입니다.

 

 

5. plotnine

시간은 없고 할 일은 많습니다. 목적이 같다면 여러 가지를 배우는 것보다 하나를 배우고 싶습니다. R에서 ggplot2를 사용해봤다면 도전해봄직한 패키지입니다. 단점은 ggplot2와  문법이 거의 유사하지만, 일부 예외가 존재한다는 점입니다.

 

오늘은 이렇게 파이썬 데이터 시각화 패키지 베스트 5에 대해서 알아보았습니다. 파이썬은 데이터 관련된 패키지가 많이 있으며 시각화도 예외는 아닙니다. 이외에도 다른 다양한 시각화 패키지가 있습니다. 자신에게 가장 적합하고 편리한 패키지를 찾아 사용하는 것이 좋겠습니다.


필자는 그 중에서도 씨본(seaborn)과 플랏트리(plotly)를 먼저 사용해보길 추천합니다. 특히 plotly는 대화형 그래프를 그리는 것이 가능하고, 최근에는 plotly.express를 이용하면 훨씬 쉬운 문법으로 차트를 그릴 수 있기 때문에 편리합니다.

 

파이썬 데이터 분석 학습, 활용해야 실력이 늡니다!

코딩과 데이터 분석을 배우려는 사람들이 많습니다. 전공자가 아니어도 자기계발의 목적으로 관심을 가집니다. 하지만 비전공자가 단순한 자기계발 정도의 목적으로 없는 시간을 쪼개 배우기

aplab.tistory.com

 

  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기