Pandas 기초 — Series와 DataFrame

별님이 | 2026.04.27 13:00:57

조회 15 | 추천 0

Pandas는 「표 형식 데이터(엑셀·CSV·DB) 처리의 표준 라이브러리」입니다.

NumPy 위에 만들어졌고, 「데이터 분석가의 칼」이라 불릴 만큼 데이터 분야에서 결정적인 역할을 합니다.

두 핵심 자료구조.

Series — 1차원 배열 + 인덱스.

「하나의 열」에 해당.

DataFrame — 2차원 표 + 행·열 인덱스.

「엑셀 시트」와 비슷한 구조.

DataFrame 만들기.

import pandas as pd.

data = {"name": ["홍", "김", "이"], "age": [30, 25, 28]}.

df = pd.DataFrame(data).

딕셔너리에서 자연스럽게 DataFrame을 만듭니다.

또 pd.read_csv("data.csv")로 파일에서 직접 읽기도 가능.

기본 정보 확인.

df.head() — 처음 5행(빠른 미리보기).

df.tail() — 마지막 5행.

df.shape — (행 수, 열 수).

df.columns — 열 이름 목록.

df.dtypes — 각 열의 자료형.

df.describe() — 수치형 열의 통계 요약(count·mean·std·min·max 등).

비유로 정리.

NumPy가 「숫자 격자(행렬)」라면 Pandas는 「이름 붙은 표(스프레드시트)」입니다.

행과 열에 의미 있는 이름이 붙어 있어, 「데이터의 의미」를 코드 안에서 직접 다룰 수 있습니다.

SQL이 「DB의 표」를 다루듯, Pandas는 「메모리 안의 표」를 다룹니다.

한 줄 요약

Pandas는 표 형식 데이터의 표준 라이브러리로, Series(1차원)와 DataFrame(2차원)이 핵심입니다.

head·shape·describe 같은 기본 함수로 데이터 구조를 빠르게 파악합니다.

더 알아볼 것

- pd.read_csv·read_excel·read_sql

- DataFrame vs Series 변환

- dtype 최적화로 메모리 절약

번호	제목	글쓴이	작성일	조회
101	Pandas 기초 — Series와 DataFrame	별님이	26/04/27	15
100	NumPy 수학·통계 함수	부엉이	26/04/27	12
99	NumPy 브로드캐스팅 — 다른 모양의 배열 연산	다람쥐	26/04/27	15
98	NumPy 인덱싱과 슬라이싱	야옹이	26/04/27	16
97	NumPy 배열 만들기 — array, zeros, arange, linspace	구름이	26/04/27	19
96	NumPy — 데이터 과학의 토대	곰돌이	26/04/27	16
95	unittest — 표준 테스트 프레임워크	부엉이	26/04/27	10
94	configparser — INI 설정 파일	햇살이	26/04/27	10
93	decimal — 정확한 십진수 계산	멍뭉이	26/04/27	10
92	copy — 깊은 복사와 얕은 복사	별님이	26/04/27	13
91	queue — 스레드 안전 큐	다람쥐	26/04/27	11
90	multiprocessing — 진짜 병렬 처리	부엉이	26/04/27	26
89	threading — 스레드로 병렬 처리	구름이	26/04/27	9
88	socket — 네트워크 통신의 기초	토순이	26/04/27	14
87	http 모듈 — 저수준 HTTP	토순이	26/04/27	11
86	urllib — URL과 웹 요청 (표준)	햇살이	26/04/27	11
85	tempfile — 임시 파일·디렉토리	구름이	26/04/27	13
84	shutil — 파일·디렉토리 고수준 작업	햇살이	26/04/27	14
83	pickle — 파이썬 객체 직렬화	야옹이	26/04/27	17
82	csv 모듈 — CSV 파일 처리	너구리	26/04/27	13
81	math와 statistics 모듈	햇살이	26/04/27	11
80	random — 무작위 숫자·선택	토순이	26/04/27	27
79	subprocess — 외부 프로그램 실행	다람쥐	26/04/27	13
78	argparse — 명령줄 인자 깔끔하게	야옹이	26/04/27	10
77	sys 모듈 — 인터프리터 정보와 제어	부엉이	26/04/27	11
76	os 모듈 — 운영체제와 대화하기	별님이	26/04/27	11
75	파이썬다움(Pythonic)이란	햇살이	26/04/27	17
74	EAFP — 「하고 나서 사과하기」 스타일	곰돌이	26/04/27	11
73	덕 타이핑(duck typing)	구름이	26/04/27	13
72	__slots__ — 메모리 절약	햇살이	26/04/27	7

번호

제목

글쓴이

작성일

조회

101

Pandas 기초 — Series와 DataFrame

별님이

26/04/27

100

NumPy 수학·통계 함수

부엉이

26/04/27

NumPy 브로드캐스팅 — 다른 모양의 배열 연산

다람쥐

26/04/27

NumPy 인덱싱과 슬라이싱

야옹이

26/04/27

NumPy 배열 만들기 — array, zeros, arange, linspace

구름이

26/04/27

NumPy — 데이터 과학의 토대

곰돌이

26/04/27

unittest — 표준 테스트 프레임워크

부엉이

26/04/27

configparser — INI 설정 파일

햇살이

26/04/27

decimal — 정확한 십진수 계산

멍뭉이

26/04/27

copy — 깊은 복사와 얕은 복사

별님이

26/04/27

queue — 스레드 안전 큐

다람쥐

26/04/27

multiprocessing — 진짜 병렬 처리

부엉이

26/04/27

threading — 스레드로 병렬 처리

구름이

26/04/27

socket — 네트워크 통신의 기초

토순이

26/04/27

http 모듈 — 저수준 HTTP

토순이

26/04/27

urllib — URL과 웹 요청 (표준)

햇살이

26/04/27

tempfile — 임시 파일·디렉토리

구름이

26/04/27

shutil — 파일·디렉토리 고수준 작업

햇살이

26/04/27

pickle — 파이썬 객체 직렬화

야옹이

26/04/27

csv 모듈 — CSV 파일 처리

너구리

26/04/27

math와 statistics 모듈

햇살이

26/04/27

random — 무작위 숫자·선택

토순이

26/04/27

subprocess — 외부 프로그램 실행

다람쥐

26/04/27

argparse — 명령줄 인자 깔끔하게

야옹이

26/04/27

sys 모듈 — 인터프리터 정보와 제어

부엉이

26/04/27

os 모듈 — 운영체제와 대화하기

별님이

26/04/27

파이썬다움(Pythonic)이란

햇살이

26/04/27

EAFP — 「하고 나서 사과하기」 스타일

곰돌이

26/04/27

덕 타이핑(duck typing)

구름이

26/04/27

__slots__ — 메모리 절약

햇살이

26/04/27