NumPy — 데이터 과학의 토대

곰돌이 | 2026.04.27 13:00:54

조회 15 | 추천 0

NumPy(Numerical Python)는 「수치 계산을 빠르게 처리하는」 파이썬의 토대 라이브러리입니다.

Pandas·scikit-learn·PyTorch 같은 거의 모든 데이터·AI 도구가 NumPy 위에 만들어져 있어, 「파이썬 데이터 과학의 기반암」이라 부릅니다.

핵심은 「ndarray(N-dimensional array, 다차원 배열)」입니다.

같은 자료형의 숫자들을 격자로 묶어 처리합니다.

일반 파이썬 리스트보다 메모리가 적게 들고 계산이 100~1000배 빠릅니다.

큰 데이터를 다루면 그 차이가 결정적입니다.

기본 사용.

import numpy as np.

arr = np.array([1, 2, 3, 4]) — 1차원 배열.

arr2 = np.array([[1,2,3], [4,5,6]]) — 2차원 배열(2행 3열).

arr.shape — (2, 3).

arr.dtype — 자료형(int64 등).

「shape」과 「dtype」이 가장 중요한 두 속성입니다.

왜 빠른가.

1) 메모리 연속 — 같은 자료형이 옆자리에 모여 있어 CPU 캐시가 효율적.

2) C로 구현 — 핵심 연산이 컴파일된 코드.

3) 벡터화 — for 반복 없이 「배열 전체에 한 번에」 연산 적용.

벡터화의 매력.

일반 파이썬: result = [x*2 for x in nums] — for 반복.

NumPy: result = arr * 2 — 한 번의 곱셈.

코드도 짧고 100배 이상 빠릅니다.

「데이터 과학의 코드는 for 반복을 없애는 것이 미덕」이라는 격언도 NumPy의 영향입니다.

한 줄 요약

NumPy는 수치 계산의 토대 라이브러리로, ndarray(다차원 배열)와 벡터화 연산으로 일반 리스트보다 100~1000배 빠릅니다.

Pandas·scikit-learn·PyTorch가 모두 NumPy 위에 있습니다.

더 알아볼 것

- 벡터화의 직관적 이해

- NumPy의 메모리 레이아웃

- CuPy — GPU에서 NumPy 호환

번호	제목	글쓴이	작성일	조회
101	Pandas 기초 — Series와 DataFrame	별님이	26/04/27	12
100	NumPy 수학·통계 함수	부엉이	26/04/27	11
99	NumPy 브로드캐스팅 — 다른 모양의 배열 연산	다람쥐	26/04/27	13
98	NumPy 인덱싱과 슬라이싱	야옹이	26/04/27	14
97	NumPy 배열 만들기 — array, zeros, arange, linspace	구름이	26/04/27	17
96	NumPy — 데이터 과학의 토대	곰돌이	26/04/27	15
95	unittest — 표준 테스트 프레임워크	부엉이	26/04/27	8
94	configparser — INI 설정 파일	햇살이	26/04/27	8
93	decimal — 정확한 십진수 계산	멍뭉이	26/04/27	9
92	copy — 깊은 복사와 얕은 복사	별님이	26/04/27	11
91	queue — 스레드 안전 큐	다람쥐	26/04/27	9
90	multiprocessing — 진짜 병렬 처리	부엉이	26/04/27	25
89	threading — 스레드로 병렬 처리	구름이	26/04/27	8
88	socket — 네트워크 통신의 기초	토순이	26/04/27	12
87	http 모듈 — 저수준 HTTP	토순이	26/04/27	10
86	urllib — URL과 웹 요청 (표준)	햇살이	26/04/27	10
85	tempfile — 임시 파일·디렉토리	구름이	26/04/27	12
84	shutil — 파일·디렉토리 고수준 작업	햇살이	26/04/27	13
83	pickle — 파이썬 객체 직렬화	야옹이	26/04/27	16
82	csv 모듈 — CSV 파일 처리	너구리	26/04/27	11
81	math와 statistics 모듈	햇살이	26/04/27	8
80	random — 무작위 숫자·선택	토순이	26/04/27	26
79	subprocess — 외부 프로그램 실행	다람쥐	26/04/27	12
78	argparse — 명령줄 인자 깔끔하게	야옹이	26/04/27	9
77	sys 모듈 — 인터프리터 정보와 제어	부엉이	26/04/27	9
76	os 모듈 — 운영체제와 대화하기	별님이	26/04/27	9
75	파이썬다움(Pythonic)이란	햇살이	26/04/27	14
74	EAFP — 「하고 나서 사과하기」 스타일	곰돌이	26/04/27	9
73	덕 타이핑(duck typing)	구름이	26/04/27	11
72	__slots__ — 메모리 절약	햇살이	26/04/27	6

번호

제목

글쓴이

작성일

조회

101

Pandas 기초 — Series와 DataFrame

별님이

26/04/27

100

NumPy 수학·통계 함수

부엉이

26/04/27

NumPy 브로드캐스팅 — 다른 모양의 배열 연산

다람쥐

26/04/27

NumPy 인덱싱과 슬라이싱

야옹이

26/04/27

NumPy 배열 만들기 — array, zeros, arange, linspace

구름이

26/04/27

NumPy — 데이터 과학의 토대

곰돌이

26/04/27

unittest — 표준 테스트 프레임워크

부엉이

26/04/27

configparser — INI 설정 파일

햇살이

26/04/27

decimal — 정확한 십진수 계산

멍뭉이

26/04/27

copy — 깊은 복사와 얕은 복사

별님이

26/04/27

queue — 스레드 안전 큐

다람쥐

26/04/27

multiprocessing — 진짜 병렬 처리

부엉이

26/04/27

threading — 스레드로 병렬 처리

구름이

26/04/27

socket — 네트워크 통신의 기초

토순이

26/04/27

http 모듈 — 저수준 HTTP

토순이

26/04/27

urllib — URL과 웹 요청 (표준)

햇살이

26/04/27

tempfile — 임시 파일·디렉토리

구름이

26/04/27

shutil — 파일·디렉토리 고수준 작업

햇살이

26/04/27

pickle — 파이썬 객체 직렬화

야옹이

26/04/27

csv 모듈 — CSV 파일 처리

너구리

26/04/27

math와 statistics 모듈

햇살이

26/04/27

random — 무작위 숫자·선택

토순이

26/04/27

subprocess — 외부 프로그램 실행

다람쥐

26/04/27

argparse — 명령줄 인자 깔끔하게

야옹이

26/04/27

sys 모듈 — 인터프리터 정보와 제어

부엉이

26/04/27

os 모듈 — 운영체제와 대화하기

별님이

26/04/27

파이썬다움(Pythonic)이란

햇살이

26/04/27

EAFP — 「하고 나서 사과하기」 스타일

곰돌이

26/04/27

덕 타이핑(duck typing)

구름이

26/04/27

__slots__ — 메모리 절약

햇살이

26/04/27