판다스 데이터 프레임에는 편집을 쉽게 할 수 있게 도와주는 여러 가지 기능의 함수가 있습니다. 이런 함수를 이용하지 않더라도 원하는 형태로 편집할 수 있지만, 많이 귀찮아집니다. 데이터 프레임의 칼럼 이름을 변경하는 것도 그러한 일 중 하나인데요. 오늘은 판다스 데이터프레임의 칼럼 이름을 쉽게 변경하는 방법에 대해서 차례대로 알아보겠습니다.
데이터프레임 이름을 변경하는 방법을 설명하기 위해 코스피 200 데이터를 이용하고자 합니다. 아래 사이트에 코스피 200 종목 데이터가 게시돼 있습니다. read_html함수를 이용하면 쉽게 데이터 프레임으로 가져올 수 있습니다.
import pandas as pd
df= pd.read_html('https://stock.infoking.site/kospi200info/')[0]
1. rename 함수
데이터프레임 칼럼 이름을 변경하는 가장 일반적인 방법입니다. 기존 칼럼명과 바꿀 칼럼명을 딕셔너리 자료형으로 입력합니다. 함수에 columns로 키워드를 입력해야 하는 것을 주의해야 합니다.
df.rename(columns={'종목명':'nm'}, inplace=True)
2. add_prefix 함수
칼럼명 앞에 특정 문자를 공통적으로 넣고 싶을 때 사용합니다. 예를 들어 칼럼명 앞에 c1_를 붙이고 싶다면 아래와 같이 실행합니다.
df.add_prefix('c1_')
3. add_suffix 함수
칼럼명 뒤에 특정 문자를 넣고 싶다면, add_suffix함수를 이용합니다. 참고로 suffix는 접미어라는 뜻입니다.
df.add_suffix('c1_')
4. 리스트 이용하기
columns에 원하는 칼럼명을 리스트 자료형으로 넣으면, 칼럼 이름이 전부 바뀝니다. 이 때는 리스트의 길이가 칼럼의 길이와 같아야 합니다. 리스트를 만들 때, 기존 칼럼 이름을 기준으로 comprehension 문법으로 작성하면 쉽게 원하는 형태로 칼럼명을 바꿀 수 있습니다.
df.columns = ['no', 'nm', 'cla', 'cur', 'tot_am', 'PER', 'PBR', 'sale', 'income', 'netincome' ]
5. map함수 이용하기
칼럼명에 map함수를 이용할 수 있습니다. map함수의 입력파라미터로 함수를 넣어주면, 함수를 적용한 결과가 칼럼 이름이 됩니다. 예를 들어 칼럼이름을 모두 대문자로 바꾸고 싶다면 아래와 같이 입력하면 됩니다.
df.colums.map(str.upper)
오늘은 이렇게 판다스 데이터프레임 칼럼 이름을 변경하는 5가지 방법에 대해서 알아보았습니다. 바꾸고자 하는 방법이 복잡하면, 함수를 만들고 map함수를 이용하는 것이 좋겠습니다. 그 외에는 여러 가지 방법이 있으니, 상황에 가장 잘 맞는 방법을 이용하기 바랍니다.
'데이터 > 데이터 분석' 카테고리의 다른 글
의료 데이터 수집 및 조회 가능한 사이트 알아보기 (0) | 2022.04.05 |
---|---|
파이썬 판다스 groupby 여러개 기준으로 쉽게 요약하는 방법은?! (0) | 2022.04.04 |
파이썬 판다스 데이터프레임 출력, 모든 데이터 확인하는 3가지 방법 (0) | 2022.04.03 |
파이썬 히트맵 그리는 손쉬운 2가지 방법 (0) | 2022.03.28 |
K-Means 클러스터링 군집 개수 정하는 방법은?! (0) | 2022.02.09 |
파이썬 numpy 기초 사용법, ndArray 이용 벡터연산하기! (0) | 2022.02.04 |
프롭테크 의미는 무엇이고, 어떤 기업들이 있나요? (0) | 2022.02.03 |
내가 정리해 본 분석 과제 발굴 프로세스 및 방법은?! (0) | 2022.02.02 |