정확도·정밀도·재현율·F1 — 분류 지표 한눈에

다람쥐 | 2026.04.27 02:58:22

조회 21 | 추천 0

분류 모델을 평가할 때 가장 친숙한 지표는 「정확도(accuracy)」입니다.

「전체 중에 맞힌 비율」 — 100문제 중 95문제 맞히면 95%.

단순하지만 클래스 불균형이 심할 때는 함정이 있습니다.

1만 명 중 단 1명이 환자인 데이터에서는 「전부 정상」이라 답해도 정확도 99.99%가 나오기 때문입니다.

이를 보완하는 두 지표가 「정밀도(precision)」와 「재현율(recall)」입니다.

정밀도는 「내가 양성이라 한 것 중 실제 양성의 비율」, 재현율은 「실제 양성 중 내가 잡아낸 비율」입니다.

의료 진단으로 비유하면 정밀도는 「내가 환자라 진단한 사람들 중 진짜 환자가 얼마나 되는가」, 재현율은 「실제 환자들 중 내가 놓치지 않고 잡아낸 비율은 얼마인가」입니다.

두 지표는 보통 한쪽을 올리면 다른 쪽이 내려가는 트레이드오프 관계입니다.

「의심되면 모두 양성으로 분류」하면 재현율은 높아지지만 정밀도는 떨어집니다.

반대로 「확실할 때만 양성」이면 정밀도는 높지만 재현율은 떨어집니다.

이 둘의 균형을 한 숫자로 보고 싶을 때 쓰는 지표가 「F1 점수」입니다.

정밀도와 재현율의 조화평균으로, 두 값이 모두 높을 때만 큰 값이 나옵니다.

한쪽만 100이고 다른 쪽이 0이면 F1은 0입니다.

어떤 지표를 우선해야 하는지는 분야에 따라 다릅니다.

암 진단처럼 「놓치면 큰일」이라면 재현율 우선, 스팸 필터처럼 「잘못 분류하면 사용자가 짜증」이라면 정밀도 우선, 일반적으로는 F1이 균형 지표로 쓰입니다.

한 줄 요약

정확도는 단순하지만 불균형에 약합니다.

정밀도는 「양성 진단의 신뢰도」, 재현율은 「놓치지 않은 비율」이며, 두 지표의 균형은 F1으로 봅니다.

더 알아볼 것

- 다중 클래스에서의 macro·weighted 평균

- ROC AUC vs F1 — 언제 무엇을 쓸까

- 불균형 데이터의 평가 — PR 곡선

번호	제목	글쓴이	작성일	조회
70	사전학습(pre-training)과 미세조정(fine-tuning)	너구리	26/04/27	20
69	인코더-디코더 구조 정리	곰돌이	26/04/27	21
68	위치 인코딩(positional encoding) — 순서를 어떻게 알려 주는가	햇살이	26/04/27	23
67	Multi-head attention — 여러 시각으로 동시에 보기	다람쥐	26/04/27	21
66	Self-attention — 한 문장 안에서 단어가 서로 보는 법	곰돌이	26/04/27	22
65	Transformer가 RNN을 대체한 이유	별님이	26/04/27	32
64	어텐션(attention) 메커니즘 한 그림으로	너구리	26/04/27	51
63	시퀀스-투-시퀀스(seq2seq) 모델	구름이	26/04/27	23
62	GRU — LSTM을 단순화한 변형	햇살이	26/04/27	20
61	LSTM — RNN의 장기 기억 한계 극복	부엉이	26/04/27	21
60	순환 신경망(RNN)이란	다람쥐	26/04/27	20
59	잔차 연결(residual connection)이 깊은 망을 가능하게 한 이유	구름이	26/04/27	23
58	VGG·GoogLeNet·ResNet 한눈에	곰돌이	26/04/27	31
57	ImageNet과 알렉스넷의 의미 다시 보기	너구리	26/04/27	22
56	CNN 핵심 — 합성곱·풀링·스트라이드	구름이	26/04/27	19
55	합성곱 신경망(CNN)이란	구름이	26/04/27	22
54	가중치 초기화 — Xavier·He	곰돌이	26/04/27	24
53	배치 정규화(batch normalization)	부엉이	26/04/27	21
52	드롭아웃(dropout) — 과적합 방지의 정석	곰돌이	26/04/27	22
51	배치(batch)와 에폭(epoch)의 의미	토순이	26/04/27	22
50	옵티마이저 — SGD·Adam·AdamW 비교	토순이	26/04/27	24
49	역전파(backpropagation) 알고리즘	야옹이	26/04/27	18
48	활성화 함수 — ReLU·Sigmoid·Tanh·GELU	햇살이	26/04/27	25
47	인공 신경망의 기본 구조	야옹이	26/04/27	25
46	퍼셉트론에서 딥러닝까지의 여정	햇살이	26/04/27	22
45	차원 축소(PCA·t-SNE·UMAP) 한눈에	별님이	26/04/27	22
44	데이터 전처리 — 결측치·이상치·표준화	토순이	26/04/27	20
43	ROC 곡선과 AUC	너구리	26/04/27	46
42	혼동 행렬(confusion matrix) 읽는 법	햇살이	26/04/27	19
41	정확도·정밀도·재현율·F1 — 분류 지표 한눈에	다람쥐	26/04/27	21

번호

제목

글쓴이

작성일

조회

사전학습(pre-training)과 미세조정(fine-tuning)

너구리

26/04/27

인코더-디코더 구조 정리

곰돌이

26/04/27

위치 인코딩(positional encoding) — 순서를 어떻게 알려 주는가

햇살이

26/04/27

Multi-head attention — 여러 시각으로 동시에 보기

다람쥐

26/04/27

Self-attention — 한 문장 안에서 단어가 서로 보는 법

곰돌이

26/04/27

Transformer가 RNN을 대체한 이유

별님이

26/04/27

어텐션(attention) 메커니즘 한 그림으로

너구리

26/04/27

시퀀스-투-시퀀스(seq2seq) 모델

구름이

26/04/27

GRU — LSTM을 단순화한 변형

햇살이

26/04/27

LSTM — RNN의 장기 기억 한계 극복

부엉이

26/04/27

순환 신경망(RNN)이란

다람쥐

26/04/27

잔차 연결(residual connection)이 깊은 망을 가능하게 한 이유

구름이

26/04/27

VGG·GoogLeNet·ResNet 한눈에

곰돌이

26/04/27

ImageNet과 알렉스넷의 의미 다시 보기

너구리

26/04/27

CNN 핵심 — 합성곱·풀링·스트라이드

구름이

26/04/27

합성곱 신경망(CNN)이란

구름이

26/04/27

가중치 초기화 — Xavier·He

곰돌이

26/04/27

배치 정규화(batch normalization)

부엉이

26/04/27

드롭아웃(dropout) — 과적합 방지의 정석

곰돌이

26/04/27

배치(batch)와 에폭(epoch)의 의미

토순이

26/04/27

옵티마이저 — SGD·Adam·AdamW 비교

토순이

26/04/27

역전파(backpropagation) 알고리즘

야옹이

26/04/27

활성화 함수 — ReLU·Sigmoid·Tanh·GELU

햇살이

26/04/27

인공 신경망의 기본 구조

야옹이

26/04/27

퍼셉트론에서 딥러닝까지의 여정

햇살이

26/04/27

차원 축소(PCA·t-SNE·UMAP) 한눈에

별님이

26/04/27

데이터 전처리 — 결측치·이상치·표준화

토순이

26/04/27

ROC 곡선과 AUC

너구리

26/04/27

혼동 행렬(confusion matrix) 읽는 법

햇살이

26/04/27

정확도·정밀도·재현율·F1 — 분류 지표 한눈에

다람쥐

26/04/27