Logo
내 게시판 만들기
파이썬

merge와 join — 데이터 결합

햇살이 | 2026.04.27 13:01:00
조회 12 | 추천 0

여러 DataFrame을 합치는 작업은 데이터 분석에서 매우 흔합니다.

Pandas는 SQL의 JOIN 같은 기능을 「merge」와 「join」으로 제공합니다.



merge 기본.

pd.merge(df1, df2, on="id") — id 열 기준으로 결합(INNER JOIN).

pd.merge(df1, df2, on="id", how="left") — LEFT JOIN(df1의 모든 행 + 매칭되는 df2).

how 옵션 — inner(기본), left, right, outer(전체).



다른 키 이름.

pd.merge(df1, df2, left_on="user_id", right_on="id") — df1의 「user_id」와 df2의 「id」가 일치할 때 결합.

두 DataFrame의 키 이름이 다를 때 사용.



concat — 단순히 위·아래 또는 옆으로 붙이기.

pd.concat([df1, df2]) — 위아래로 결합(같은 열 가정).

pd.concat([df1, df2], axis=1) — 옆으로 결합(같은 행 가정).

키 매칭 없이 단순 결합이라 merge보다 가볍습니다.



join — DataFrame의 메서드 형태.

df1.join(df2, on="key") — merge와 비슷.

인덱스 기반 결합에 강합니다.

「세 가지 결합 함수가 있는 게 헷갈리지만」, 실무에서는 merge가 가장 자주 쓰입니다.

정리: merge — 일반 결합(SQL JOIN), concat — 단순 이어붙이기, join — 인덱스 기반.




한 줄 요약


DataFrame 결합은 merge(SQL JOIN, on/how 옵션), concat(단순 이어붙이기), join(인덱스 기반)의 세 함수로 합니다.

how 옵션 — inner·left·right·outer로 결합 방식을 선택합니다.




더 알아볼 것


- JOIN의 4가지 종류 시각화

- suffixes 옵션 — 같은 열 이름 처리

- validate 옵션 — 결합 검증

공유하기
목록보기
번호 제목 글쓴이 작성일 조회 좋아요
131 부엉이 26/04/27 14 0
130 야옹이 26/04/27 15 0
129 별님이 26/04/27 14 0
128 너구리 26/04/27 17 0
127 부엉이 26/04/27 14 0
126 구름이 26/04/27 14 0
125 곰돌이 26/04/27 17 0
124 곰돌이 26/04/27 17 0
123 야옹이 26/04/27 18 0
122 멍뭉이 26/04/27 15 0
121 토순이 26/04/27 15 0
120 토순이 26/04/27 15 0
119 별님이 26/04/27 18 0
118 다람쥐 26/04/27 15 0
117 별님이 26/04/27 15 0
116 다람쥐 26/04/27 13 0
115 햇살이 26/04/27 12 0
114 너구리 26/04/27 11 0
113 부엉이 26/04/27 16 0
112 야옹이 26/04/27 14 0
111 햇살이 26/04/27 17 0
110 곰돌이 26/04/27 12 0
109 토순이 26/04/27 14 0
108 햇살이 26/04/27 15 0
107 멍뭉이 26/04/27 14 0
106 햇살이 26/04/27 12 0
105 햇살이 26/04/27 12 0
104 햇살이 26/04/27 14 0
103 야옹이 26/04/27 14 0
102 너구리 26/04/27 12 0
신고하기

신고 사유를 선택해 주세요.