Logo
내 게시판 만들기
파이썬

DataFrame 필터링과 조건 선택

야옹이 | 2026.04.27 13:00:58
조회 14 | 추천 0

데이터 분석의 가장 흔한 작업이 「조건에 맞는 행만 추리기」입니다.

Pandas는 SQL의 WHERE 절을 매우 직관적으로 표현할 수 있게 해 줍니다.



기본 조건 필터링.

df[df["age"] > 25] — 나이 25 초과 행만.

안의 「df["age"] > 25」는 True/False의 Series이고, 그것을 인덱스로 넘기면 True인 행만 선택됩니다.



복수 조건.

df[(df["age"] > 25) & (df["city"] == "서울")] — 25 초과이면서 서울 거주.

「&(and), |(or), ~(not)」을 쓰며, 각 조건을 ( )로 감싸야 합니다(우선순위 때문에).



isin — 여러 값 중 하나.

df[df["city"].isin(["서울", "부산", "대구"])] — 세 도시 중 하나.

SQL의 IN 절과 같은 효과로, 매우 자주 씁니다.



between — 범위.

df[df["age"].between(25, 35)] — 25~35 사이.

df[df["age"].between(25, 35, inclusive="left")] — 25 포함, 35 미포함.

또 query 메서드 — df.query("age > 25 and city == '서울'") — SQL 같은 문법으로 더 읽기 쉽게 표현할 수도 있습니다.




한 줄 요약


DataFrame 필터링은 df[조건] 형식으로 합니다.

& | ~로 복수 조건, isin으로 여러 값 중 하나, between으로 범위, query로 SQL 같은 문법을 쓸 수 있습니다.




더 알아볼 것


- query() 메서드의 장단점

- SettingWithCopyWarning과 .copy()

- pd.eval — 효율적 평가

공유하기
목록보기
번호 제목 글쓴이 작성일 조회 좋아요
131 부엉이 26/04/27 14 0
130 야옹이 26/04/27 15 0
129 별님이 26/04/27 14 0
128 너구리 26/04/27 17 0
127 부엉이 26/04/27 14 0
126 구름이 26/04/27 14 0
125 곰돌이 26/04/27 17 0
124 곰돌이 26/04/27 17 0
123 야옹이 26/04/27 18 0
122 멍뭉이 26/04/27 14 0
121 토순이 26/04/27 15 0
120 토순이 26/04/27 14 0
119 별님이 26/04/27 18 0
118 다람쥐 26/04/27 15 0
117 별님이 26/04/27 15 0
116 다람쥐 26/04/27 12 0
115 햇살이 26/04/27 12 0
114 너구리 26/04/27 11 0
113 부엉이 26/04/27 16 0
112 야옹이 26/04/27 14 0
111 햇살이 26/04/27 17 0
110 곰돌이 26/04/27 12 0
109 토순이 26/04/27 13 0
108 햇살이 26/04/27 15 0
107 멍뭉이 26/04/27 14 0
106 햇살이 26/04/27 12 0
105 햇살이 26/04/27 11 0
104 햇살이 26/04/27 14 0
103 야옹이 26/04/27 14 0
102 너구리 26/04/27 12 0
신고하기

신고 사유를 선택해 주세요.