NumPy 통계와 집계 — 데이터 요약의 기본

햇살이 | 2026.04.27 13:21:27

조회 75 | 좋아요 0

NumPy는 「수치 계산의 기반」이지만 동시에 「방대한 통계·집계 함수」의 보고이기도 합니다.

pandas도 내부적으로 NumPy를 호출하므로, 통계 함수의 기본을 알면 데이터 분석 전반이 빨라집니다.

기본 통계.

arr = np.array([1, 2, 3, 4, 5]).

arr.mean() — 평균.

arr.median() — 중앙값(np.median(arr) 형태).

arr.std() — 표준편차.

arr.var() — 분산.

arr.min(), arr.max(), arr.sum().

축(axis) 인자.

2차원 이상에서 핵심.

arr2d.sum(axis=0) — 열별 합(세로 방향), axis=1 — 행별 합(가로 방향).

axis 안 주면 전체 단일 값.

「어느 방향으로 합칠 것인가」를 명확히.

고급 통계.

np.percentile(arr, 90) — 90 백분위수.

np.quantile(arr, 0.5) — 분위수(0.5 = 중앙값).

np.corrcoef(x, y) — 상관계수.

np.cov(x, y) — 공분산.

머신러닝 전 데이터 점검에 자주 사용.

결측치 무시.

일반 함수는 NaN이 있으면 결과가 NaN — 「데이터 망가짐」 신호.

np.nanmean·nanmedian·nansum — NaN 무시하고 계산.

불완전한 데이터에서 「의미 있는 통계」를 내는 데 필수.

한 줄 요약

NumPy의 통계 함수는 mean·median·std·percentile 등 풍부.

axis 인자로 방향 지정, NaN 처리는 nan*** 함수.

pandas도 내부적으로 NumPy 호출하므로 기본 알면 분석 빠름.

더 알아볼 것

- np.histogram — 분포 만들기

- scipy.stats — 더 풍부한 통계

- 결측치 처리 — pandas dropna/fillna

번호	제목	글쓴이	작성일	조회
226	파이썬 학습 로드맵 — 입문부터 실무까지	멍뭉이	05.08	120
225	파이썬 가상환경 — venv·conda·poetry	야옹이	05.08	132
224	파이썬 라이브러리 — 분야별 필수 5가지	다람쥐	05.08	109
223	파이썬 기본 문법 — 입문 5가지	토순이	05.08	111
222	파이썬 입문 — 가장 인기 있는 프로그래밍 언어	곰돌이	05.08	108
221	NumPy 통계와 집계 — 데이터 요약의 기본	햇살이	04.27	75
220	파이썬 학습 로드맵 — 어디부터 어디까지	다람쥐	04.27	74
219	한국 파이썬 생태계 — 커뮤니티와 자료	다람쥐	04.27	78
218	파이썬의 미래 — 3.12, 3.13, 그 이후	토순이	04.27	82
217	Python 커뮤니티 — PEP·PSF·PyCon	다람쥐	04.27	68
216	PyCharm vs VS Code — 파이썬 IDE 양강	다람쥐	04.27	70
215	Google Colab — 브라우저만으로 GPU	별님이	04.27	68
214	Jupyter Notebook — 탐색·분석의 표준	별님이	04.27	73
213	Gradio — ML 모델 데모 UI	멍뭉이	04.27	88
212	Streamlit — 데이터 앱 빠른 프로토타입	별님이	04.27	84
211	Prometheus와 Grafana — 메트릭 모니터링	다람쥐	04.27	87
210	Sentry — 에러 자동 추적	햇살이	04.27	90
209	Docker로 파이썬 배포	구름이	04.27	84
208	GitHub Actions — 파이썬 CI/CD 표준	야옹이	04.27	79
207	pre-commit — git 커밋 전 자동 검사	토순이	04.27	95
206	linter — flake8·pylint·ruff	다람쥐	04.27	88
205	Black과 isort — 자동 포매터	곰돌이	04.27	87
204	pyenv — 여러 파이썬 버전 관리	햇살이	04.27	89
203	wheel 배포 — 휠로 빠른 설치	다람쥐	04.27	106
202	패키지 만들기 — pyproject.toml 시대	곰돌이	04.27	104
201	PyPI — 파이썬 패키지의 본가	토순이	04.27	87
200	profile-driven 최적화 — 수치 우선	부엉이	04.27	82
199	PyPy — 빠른 파이썬 인터프리터	다람쥐	04.27	82
198	Numba — JIT 컴파일로 즉시 가속	별님이	04.27	92
197	Cython — 파이썬을 C 속도로	야옹이	04.27	82

번호

제목

글쓴이

작성일

조회

226

파이썬 학습 로드맵 — 입문부터 실무까지

멍뭉이

05.08

120

225

파이썬 가상환경 — venv·conda·poetry

야옹이

05.08

132

224

파이썬 라이브러리 — 분야별 필수 5가지

다람쥐

05.08

109

223

파이썬 기본 문법 — 입문 5가지

토순이

05.08

111

222

파이썬 입문 — 가장 인기 있는 프로그래밍 언어

곰돌이

05.08

108

221

NumPy 통계와 집계 — 데이터 요약의 기본

햇살이

04.27

220

파이썬 학습 로드맵 — 어디부터 어디까지

다람쥐

04.27

219

한국 파이썬 생태계 — 커뮤니티와 자료

다람쥐

04.27

218

파이썬의 미래 — 3.12, 3.13, 그 이후

토순이

04.27

217

Python 커뮤니티 — PEP·PSF·PyCon

다람쥐

04.27

216

PyCharm vs VS Code — 파이썬 IDE 양강

다람쥐

04.27

215

Google Colab — 브라우저만으로 GPU

별님이

04.27

214

Jupyter Notebook — 탐색·분석의 표준

별님이

04.27

213

Gradio — ML 모델 데모 UI

멍뭉이

04.27

212

Streamlit — 데이터 앱 빠른 프로토타입

별님이

04.27

211

Prometheus와 Grafana — 메트릭 모니터링

다람쥐

04.27

210

Sentry — 에러 자동 추적

햇살이

04.27

209

Docker로 파이썬 배포

구름이

04.27

208

GitHub Actions — 파이썬 CI/CD 표준

야옹이

04.27

207

pre-commit — git 커밋 전 자동 검사

토순이

04.27

206

linter — flake8·pylint·ruff

다람쥐

04.27

205

Black과 isort — 자동 포매터

곰돌이

04.27

204

pyenv — 여러 파이썬 버전 관리

햇살이

04.27

203

wheel 배포 — 휠로 빠른 설치

다람쥐

04.27

106

202

패키지 만들기 — pyproject.toml 시대

곰돌이

04.27

104

201

PyPI — 파이썬 패키지의 본가

토순이

04.27

200

profile-driven 최적화 — 수치 우선

부엉이

04.27

199

PyPy — 빠른 파이썬 인터프리터

다람쥐

04.27

198

Numba — JIT 컴파일로 즉시 가속

별님이

04.27

197

Cython — 파이썬을 C 속도로

야옹이

04.27