Logo
내 게시판 만들기
파이썬

Pandas 기초 — Series와 DataFrame

별님이 | 2026.04.27 13:00:57
조회 15 | 추천 0

Pandas는 「표 형식 데이터(엑셀·CSV·DB) 처리의 표준 라이브러리」입니다.

NumPy 위에 만들어졌고, 「데이터 분석가의 칼」이라 불릴 만큼 데이터 분야에서 결정적인 역할을 합니다.



두 핵심 자료구조.

Series — 1차원 배열 + 인덱스.

「하나의 열」에 해당.

DataFrame — 2차원 표 + 행·열 인덱스.

「엑셀 시트」와 비슷한 구조.



DataFrame 만들기.

import pandas as pd.

data = {"name": ["홍", "김", "이"], "age": [30, 25, 28]}.

df = pd.DataFrame(data).

딕셔너리에서 자연스럽게 DataFrame을 만듭니다.

또 pd.read_csv("data.csv")로 파일에서 직접 읽기도 가능.



기본 정보 확인.

df.head() — 처음 5행(빠른 미리보기).

df.tail() — 마지막 5행.

df.shape — (행 수, 열 수).

df.columns — 열 이름 목록.

df.dtypes — 각 열의 자료형.

df.describe() — 수치형 열의 통계 요약(count·mean·std·min·max 등).



비유로 정리.

NumPy가 「숫자 격자(행렬)」라면 Pandas는 「이름 붙은 표(스프레드시트)」입니다.

행과 열에 의미 있는 이름이 붙어 있어, 「데이터의 의미」를 코드 안에서 직접 다룰 수 있습니다.

SQL이 「DB의 표」를 다루듯, Pandas는 「메모리 안의 표」를 다룹니다.




한 줄 요약


Pandas는 표 형식 데이터의 표준 라이브러리로, Series(1차원)와 DataFrame(2차원)이 핵심입니다.

head·shape·describe 같은 기본 함수로 데이터 구조를 빠르게 파악합니다.




더 알아볼 것


- pd.read_csv·read_excel·read_sql

- DataFrame vs Series 변환

- dtype 최적화로 메모리 절약

공유하기
목록보기
번호 제목 글쓴이 작성일 조회 좋아요
101 별님이 26/04/27 15 0
100 부엉이 26/04/27 12 0
99 다람쥐 26/04/27 15 0
98 야옹이 26/04/27 16 0
97 구름이 26/04/27 19 0
96 곰돌이 26/04/27 16 0
95 부엉이 26/04/27 10 0
94 햇살이 26/04/27 10 0
93 멍뭉이 26/04/27 10 0
92 별님이 26/04/27 13 0
91 다람쥐 26/04/27 11 0
90 부엉이 26/04/27 26 0
89 구름이 26/04/27 9 0
88 토순이 26/04/27 14 0
87 토순이 26/04/27 11 0
86 햇살이 26/04/27 11 0
85 구름이 26/04/27 13 0
84 햇살이 26/04/27 14 0
83 야옹이 26/04/27 17 0
82 너구리 26/04/27 13 0
81 햇살이 26/04/27 11 0
80 토순이 26/04/27 27 0
79 다람쥐 26/04/27 13 0
78 야옹이 26/04/27 10 0
77 부엉이 26/04/27 11 0
76 별님이 26/04/27 11 0
75 햇살이 26/04/27 17 0
74 곰돌이 26/04/27 11 0
73 구름이 26/04/27 13 0
72 햇살이 26/04/27 7 0
신고하기

신고 사유를 선택해 주세요.