사람은 눈으로 보지 못하는 것을 이해하고 생각하는 것을 어려워 한다. 그래서 우주로 로켓을 쏘고, AI를 개발하는 요즘에도 땅속이 어떻게 돌아가는지는 잘 모른다고 한다. 그런 의미에서 호킹 박사는 참 대단한 것 같다.

아무튼 SAS나 엑셀에서는 데이터셋이 어떻게 구성되어 있는지 눈으로 볼 수 있지만, 파이썬으로는 이게 좀 불편하다. 물론 head나 tail 명령어를 통해서 일부 내용을 확인하거나, 텍스트로 다운 받아서 볼 수도 있지만 굉장히 불편하다.

그래서 오늘은 파이참에서 판다스 데이터프레임(dafaframe)을 조회할 수 있는 방법에 대해서 알아보려고 한다.

 

 

판다스 데이터프레임 조회하기

 

 

참고로 데이터프레임은 pandas패키지에서 사용하는 데이터 구조로 행과 열로 이루어진 데이터셋이다. 조회하는 방법은 생각보다 간단하다. 우선 파이참에서 간단한 코드를 만들어 보자.

 

# coding=utf-8

import numpy as np
import pandas as pd

df=pd.DataFrame(np.random.randn(50,10))

 


random으로 50행, 10열의 데이터프레임을 만들었다

데이터 프레임을 조회하기 위해서는, 파이참 상담의 Run 메뉴로 실행하지 말고 아래 python Console을 이용해야 한다. Run메뉴는 실행이 끝나면 파이썬이 종료되기 때문에 데이터 프레임을 조회할 수 없다.


 

파이썬 콘솔

 

 

아래 Python Console을 클릭하면 ipython이 실행된다. 여기서 위에 edit창에서 코드를 입력하고 한줄씩 실행할 수 있다. 코드에 커서를 놓거나 선택하고 alt+shift+E를 입력하면 아래 Console에서 해당 구문이 실행된다.

 

 

파이썬 콘솔창 실행

 

 

데이터 프레임 조회는 아래 안경의 모양의 Show Variables을 클릭하면 그러면 현재 있는 변수들의 값들이 주욱 나온다. 데이터 프레임은 상병 모양의 아이콘으로 되어 있는데, 여기서 마우스 오른쪽 버튼을 클릭해보자. 중간에 보면 View as DataFrame이라는 메뉴가 있다. 이 메뉴를 클릭하면 데이터 프레임을 엑셀처럼 볼 수 있다.

 

 

데이터프레임에서 우클릭후 "View as DataFrame"을 선택하면 된다

 

 

DataFrame을 조회한 모습

 

 

오늘은 이렇게 파이참으로 datafrmae을 엑셀처럼 조회하는 방법에 대해서 알아보았다. DataView탭을 이용해서 쉽게 확인할 수 있었다.

데이터를 전처리하는 방법에는 여러가지가 있지만, 갈수록 SQL이 편리하다는 생각이 든다. 파이참에서도 SQL을 사용할 수 있다. 자세한 내용은 다음 포스팅에서 다뤄보도록 하겠다.

  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기