파이썬으로 데이터 분석을 하는 사람들이 늘어나고 있습니다. 최근에 파이참 이용자를 대상으로 한 조사에서도 이와 같은 사실을 알 수 있었습니다. 데이터 분석에서 빼놓을 수 없는 것 중에 하나가 데이터 시각화입니다. 파이썬에는 여러 가지 시각화 패키지가 있습니다. 각각 장단점이 있기 때문에 어느 것이 절대적으로 좋다고 말하기는 어렵습니다. 오늘은 파이썬 데이터 시각화 분석 패키지 BEST5에 대해서 알아보겠습니다.
필자가 접해본 시간과 패키지를 기준으로 아래와 같이 다섯 가지를 골라봤습니다.
1. matplotlib
matplotlib는 가장 처음에 접하게 되는 시각화 패키지가 아닐까 싶습니다. 다양한 그래프로 그릴 수 있고 익숙하면 어렵지는 않지만, 분석에 사용하기에는 조금 불편합니다. 그래도 원하는 모든 그래프를 그릴 수 있다는 것이 장점이 있습니다. 동적인 차트에서 애니메이션까지 할 수 있는 범위가 넓지요. 하지만, 데이터 분석에는 이를 래핑 한 seaborn이 사용하기 더 좋습니다.
2. seaborn
R에는 대표적인 그래프 모듈로 ggplot2가 있습니다. ggplot2는 데이터 분석을 하기에 좋은 문법을 가지고 있습니다. matplotlib을 사용하면서 문법에 대한 아쉬움이 있었습니다. seaborn은 matplotlib보다 쉬운 문법을 가지고 있습니다. 사용하기에 더 편리하고 데이터 분석에 더 용이하지요.
3. plotly
plotly는 인터랙티브한 그래프를 그리기에 가장 좋은 패키지입니다. D3라는 웹 기반의 자바스크립트를 이용하기 때문에, 그래프가 웹에서 그려집니다. 주피터 노트북을 사용한다면 이는 큰 제한사항은 아닌가 싶습니다. 기본적으로 인터랙티브 한 그래프가 그려지기 때문에, 프레젠테이션을 하기에도 데이터를 살펴보기에도 좋습니다. plotly express는 문법도 더 쉬워져서 사용하기 편리합니다.
4. bokeh
bokeh는 웹기반의 인터랙티브 한 그래프로 그릴 수 있는 패키지입니다. 필자는 책에서만 봤고 사용해 보지는 못했습니다. plotly를 사용한다면, 굳이 사용할 필요성을 못 느끼게 되는 패키지입니다. 하지만 대화형 그래프를 그릴 때 자주 거론되는 패키지 중의 하나입니다.
5. plotnine
시간은 없고 할 일은 많습니다. 목적이 같다면 여러 가지를 배우는 것보다 하나를 배우고 싶습니다. R에서 ggplot2를 사용해봤다면 도전해봄직한 패키지입니다. 단점은 ggplot2와 문법이 거의 유사하지만, 일부 예외가 존재한다는 점입니다.
오늘은 이렇게 파이썬 데이터 시각화 패키지 베스트 5에 대해서 알아보았습니다. 파이썬은 데이터 관련된 패키지가 많이 있으며 시각화도 예외는 아닙니다. 이외에도 다른 다양한 시각화 패키지가 있습니다. 자신에게 가장 적합하고 편리한 패키지를 찾아 사용하는 것이 좋겠습니다.
필자는 그 중에서도 씨본(seaborn)과 플랏트리(plotly)를 먼저 사용해보길 추천합니다. 특히 plotly는 대화형 그래프를 그리는 것이 가능하고, 최근에는 plotly.express를 이용하면 훨씬 쉬운 문법으로 차트를 그릴 수 있기 때문에 편리합니다.
'데이터 > 데이터 분석' 카테고리의 다른 글
프롭테크 의미는 무엇이고, 어떤 기업들이 있나요? (0) | 2022.02.03 |
---|---|
내가 정리해 본 분석 과제 발굴 프로세스 및 방법은?! (0) | 2022.02.02 |
파이썬 MySQL 연동 및 사용법은?! (0) | 2022.01.29 |
파이썬 seaborn 그래프 그리기-막대그래프,캣플랏,히트맵,페어플랏 등 (0) | 2022.01.25 |
파이썬 회귀분석 하는 방법 알아보기 (0) | 2022.01.23 |
파이썬 seaborn 그래프 그리기-박스플랏, 히스토그램, 카운트플랏, 산점도, 라인그래프 (0) | 2022.01.22 |
파이썬 움직이는 동적 차트(시각화) 그리는 방법은?! (0) | 2022.01.21 |
파이썬 회귀선 seaborn 패키지로 쉽게 그리는 방법은?! (0) | 2022.01.21 |