csv 모듈 — CSV 파일 처리

너구리 | 2026.04.27 06:24:43

조회 12 | 추천 0

CSV(Comma-Separated Values)는 가장 흔한 데이터 교환 형식입니다.

엑셀·구글 시트·데이터베이스가 모두 CSV를 주고받으며, 파이썬의 csv 모듈로 표준적으로 처리할 수 있습니다.

기본 읽기.

import csv.

with open("data.csv", encoding="utf-8") as f: reader = csv.reader(f); for row in reader: print(row).

각 row는 문자열 리스트입니다.

딕셔너리로 읽기.

csv.DictReader는 첫 줄을 헤더로 인식해 각 row를 딕셔너리로 만들어 줍니다.

for row in csv.DictReader(f): print(row["name"], row["age"]).

컬럼 이름으로 접근할 수 있어 코드가 훨씬 명료합니다.

쓰기.

with open("out.csv", "w", encoding="utf-8", newline="") as f: writer = csv.writer(f); writer.writerow(["name", "age"]); writer.writerows([["홍", 30], ["김", 25]]).

newline=""이 중요합니다 — 안 쓰면 윈도우에서 빈 줄이 생기는 함정.

한국어 CSV의 함정.

엑셀로 만든 CSV는 종종 「cp949」 인코딩이고, 구글 시트는 「utf-8」, 일부는 「utf-8-sig」(BOM 포함).

인코딩이 안 맞으면 한글이 깨집니다.

보통 utf-8로 시도해 보고 실패하면 cp949·utf-8-sig를 차례로 시도합니다.

또 본격적인 데이터 분석에는 csv 모듈보다 pandas의 pd.read_csv가 훨씬 강력합니다.

한 줄 요약

csv 모듈은 CSV 파일 읽기·쓰기를 표준화합니다.

DictReader로 컬럼 이름 접근, newline="" 옵션으로 빈 줄 함정 회피, 한국어는 utf-8/cp949 인코딩 주의가 필요합니다.

더 알아볼 것

- pandas.read_csv — 데이터 분석의 표준

- CSV 방언(dialect) 옵션

- Excel 파일은 openpyxl·pandas

번호	제목	글쓴이	작성일	조회
101	Pandas 기초 — Series와 DataFrame	별님이	26/04/27	12
100	NumPy 수학·통계 함수	부엉이	26/04/27	11
99	NumPy 브로드캐스팅 — 다른 모양의 배열 연산	다람쥐	26/04/27	14
98	NumPy 인덱싱과 슬라이싱	야옹이	26/04/27	15
97	NumPy 배열 만들기 — array, zeros, arange, linspace	구름이	26/04/27	18
96	NumPy — 데이터 과학의 토대	곰돌이	26/04/27	15
95	unittest — 표준 테스트 프레임워크	부엉이	26/04/27	9
94	configparser — INI 설정 파일	햇살이	26/04/27	9
93	decimal — 정확한 십진수 계산	멍뭉이	26/04/27	9
92	copy — 깊은 복사와 얕은 복사	별님이	26/04/27	12
91	queue — 스레드 안전 큐	다람쥐	26/04/27	10
90	multiprocessing — 진짜 병렬 처리	부엉이	26/04/27	25
89	threading — 스레드로 병렬 처리	구름이	26/04/27	8
88	socket — 네트워크 통신의 기초	토순이	26/04/27	13
87	http 모듈 — 저수준 HTTP	토순이	26/04/27	10
86	urllib — URL과 웹 요청 (표준)	햇살이	26/04/27	10
85	tempfile — 임시 파일·디렉토리	구름이	26/04/27	12
84	shutil — 파일·디렉토리 고수준 작업	햇살이	26/04/27	13
83	pickle — 파이썬 객체 직렬화	야옹이	26/04/27	16
82	csv 모듈 — CSV 파일 처리	너구리	26/04/27	12
81	math와 statistics 모듈	햇살이	26/04/27	8
80	random — 무작위 숫자·선택	토순이	26/04/27	26
79	subprocess — 외부 프로그램 실행	다람쥐	26/04/27	12
78	argparse — 명령줄 인자 깔끔하게	야옹이	26/04/27	9
77	sys 모듈 — 인터프리터 정보와 제어	부엉이	26/04/27	10
76	os 모듈 — 운영체제와 대화하기	별님이	26/04/27	10
75	파이썬다움(Pythonic)이란	햇살이	26/04/27	14
74	EAFP — 「하고 나서 사과하기」 스타일	곰돌이	26/04/27	9
73	덕 타이핑(duck typing)	구름이	26/04/27	12
72	__slots__ — 메모리 절약	햇살이	26/04/27	6

번호

제목

글쓴이

작성일

조회

101

Pandas 기초 — Series와 DataFrame

별님이

26/04/27

100

NumPy 수학·통계 함수

부엉이

26/04/27

NumPy 브로드캐스팅 — 다른 모양의 배열 연산

다람쥐

26/04/27

NumPy 인덱싱과 슬라이싱

야옹이

26/04/27

NumPy 배열 만들기 — array, zeros, arange, linspace

구름이

26/04/27

NumPy — 데이터 과학의 토대

곰돌이

26/04/27

unittest — 표준 테스트 프레임워크

부엉이

26/04/27

configparser — INI 설정 파일

햇살이

26/04/27

decimal — 정확한 십진수 계산

멍뭉이

26/04/27

copy — 깊은 복사와 얕은 복사

별님이

26/04/27

queue — 스레드 안전 큐

다람쥐

26/04/27

multiprocessing — 진짜 병렬 처리

부엉이

26/04/27

threading — 스레드로 병렬 처리

구름이

26/04/27

socket — 네트워크 통신의 기초

토순이

26/04/27

http 모듈 — 저수준 HTTP

토순이

26/04/27

urllib — URL과 웹 요청 (표준)

햇살이

26/04/27

tempfile — 임시 파일·디렉토리

구름이

26/04/27

shutil — 파일·디렉토리 고수준 작업

햇살이

26/04/27

pickle — 파이썬 객체 직렬화

야옹이

26/04/27

csv 모듈 — CSV 파일 처리

너구리

26/04/27

math와 statistics 모듈

햇살이

26/04/27

random — 무작위 숫자·선택

토순이

26/04/27

subprocess — 외부 프로그램 실행

다람쥐

26/04/27

argparse — 명령줄 인자 깔끔하게

야옹이

26/04/27

sys 모듈 — 인터프리터 정보와 제어

부엉이

26/04/27

os 모듈 — 운영체제와 대화하기

별님이

26/04/27

파이썬다움(Pythonic)이란

햇살이

26/04/27

EAFP — 「하고 나서 사과하기」 스타일

곰돌이

26/04/27

덕 타이핑(duck typing)

구름이

26/04/27

__slots__ — 메모리 절약

햇살이

26/04/27