join 함수는 자주 사용하지는 않지만 굉장히 유용합니다. 동일한 이름의 함수명을 서로 비교해서 정리하면, 쉽게 기억하고 활용할 수 있습니다. 오늘은 파이썬 문자열 join과 판다스 join 함수를 비교해서 알아보겠습니다.

 


1. 문자열 join 함수

리스트의 문자열을 결합할 때 join함수를 사용합니다. 문자열 사이에 결합하고 싶은 문자열을 입력하고, 리스트를 입력파라미터로 넣습니다.

 

"".join(temp_lst)


join함수를 사용하는 방법은 이전에 다루었으니 참고하시기 바랍니다.

 

 

 

2. 판다스 join 함수

판다스에서는 2개 이상의 데이터셋을 결합할 때 join함수를 사용합니다. 판다스에서 데이터셋을 결합하는 함수는 concat, join, merge가 있는데요. 저는 merge를 많이 사용하지만 join을 이용하면 더 편리하게 데이터를 결합할 수 있습니다.

 

1) 여러 개의 데이터셋을 결합할 수 있습니다.

merge는 하나의 데이터셋만 결합할 수 있지만, join함수는 여러 개를 리스트 형태로 넣어서 결합이 가능합니다.

 

df.join(df_lst)

 


2) merge 함수와 차이

조인 방법은 left가 기본입니다. merge함수는 inner가 기본 옵션입니다.

index를 기준으로 결합하고, 다른 칼럼명을 이용하고 싶다면 on에 칼럼명을 입력합니다. merge함수는 동일한 칼럼명을 자동으로 찾아서 데이터를 결합니다.

sort=True로 입력하면, 데이터를 결합한 후 key를 기준으로 정렬할 수 있습니다.

lsuffix, rsuffix에 값을 입력하면, 칼럼명이 중복될 때 변경된 칼럼명으로 유지할 수 있습니다.

 


상황에 따라 join함수로 더 편리하게 작업할 수 있습니다.

 


오늘은 이렇게 파이썬 문자열 join과 판다스 join 함수에 대해 알아보았습니다. 둘 다 데이터를 결합하다는데서 공통점이 있습니다. 판다스 join함수도 알아두면 유용하게 사용이 가능합니다.

  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기