회귀(regression)와 분류(classification)

다람쥐 | 2026.04.27 02:58:12

조회 17 | 추천 0

지도학습 안에서 풀고자 하는 문제는 크게 두 가지로 나뉩니다.

회귀는 「연속된 숫자를 맞히는 일」, 분류는 「어느 범주에 속하는지를 맞히는 일」입니다.

예를 들어 「내일 서울의 최고기온이 몇 도일까?」는 회귀 문제입니다.

답이 23.4도, 24.7도처럼 어떤 실수든 가능합니다.

반면 「이 사진이 고양이인가, 개인가?」는 분류 문제입니다.

답이 미리 정해진 두세 개의 항목 중 하나로 떨어집니다.

두 문제는 사용하는 손실함수와 평가 지표가 다릅니다.

회귀는 「예측값과 정답의 차이를 제곱한 평균(MSE)」 같은 지표로 평가하고, 분류는 「얼마나 자주 정답을 맞혔는가(accuracy)」나 「정밀도·재현율·F1」 같은 지표로 평가합니다.

비유하자면 회귀는 「과녁의 정확한 좌표를 맞히는 사격」이고, 분류는 「과녁이 빨강·파랑·노랑 중 어느 색인지 맞히는 시험」과 같습니다.

둘 다 정답을 맞히는 일이지만 답의 모양이 완전히 다릅니다.

현실의 많은 문제는 회귀와 분류의 경계에 있습니다.

예를 들어 「이 환자가 5년 안에 재발할 확률은 얼마인가?」는 0~1 사이의 숫자(회귀)이지만, 0.5를 기준으로 「재발/비재발」로 다시 분류할 수도 있습니다.

그래서 한 모델이 두 형식을 오갈 수 있도록 설계되는 일이 많습니다.

한 줄 요약

회귀는 연속된 숫자를 맞히는 문제이고, 분류는 미리 정해진 범주 중 하나를 맞히는 문제입니다.

사용하는 손실함수와 평가 지표가 서로 다릅니다.

더 알아볼 것

- 다중 클래스 분류와 다중 라벨 분류의 차이

- 순위 회귀(ordinal regression)

- 회귀와 분류를 한 모델에 결합하는 멀티태스크 학습

번호	제목	글쓴이	작성일	조회
40	교차 검증(cross-validation)	토순이	26/04/27	18
39	정규화(regularization) — L1·L2의 차이	토순이	26/04/27	34
38	과적합(overfitting)과 과소적합(underfitting)	다람쥐	26/04/27	23
37	학습률(learning rate)과 그 의미	별님이	26/04/27	21
36	경사하강법(gradient descent) 한 그림으로	곰돌이	26/04/27	43
35	손실함수가 무엇이고 왜 필요한가	햇살이	26/04/27	16
34	나이브 베이즈 분류기	토순이	26/04/27	22
33	K-평균 군집화(K-Means)	햇살이	26/04/27	51
32	K-최근접 이웃(KNN)	멍뭉이	26/04/27	17
31	서포트 벡터 머신(SVM)	토순이	26/04/27	20
30	랜덤 포레스트 — 트리의 군집 효과	멍뭉이	26/04/27	20
29	결정 트리(Decision Tree) 쉽게 이해하기	곰돌이	26/04/27	18
28	로지스틱 회귀 — 분류를 위한 회귀	부엉이	26/04/27	18
27	선형 회귀 — 가장 단순하지만 강력한 기법	부엉이	26/04/27	18
26	회귀(regression)와 분류(classification)	다람쥐	26/04/27	17
25	준지도학습과 자기지도학습	야옹이	26/04/27	18
24	강화학습 — 시행착오로 배우기	별님이	26/04/27	17
23	비지도학습 — 정답 없는 패턴 찾기	멍뭉이	26/04/27	24
22	지도학습 — 정답이 있는 학습	너구리	26/04/27	52
21	머신러닝과 통계의 차이	부엉이	26/04/27	20
20	「인공지능 효과」 — 풀린 문제는 왜 더 이상 AI가 아니라 불리는가	부엉이	26/04/27	23
19	파라미터(parameter)와 하이퍼파라미터의 차이	야옹이	26/04/27	18
18	추론(inference)과 학습(training)의 차이	토순이	26/04/27	68
17	알고리즘과 모델의 차이	곰돌이	26/04/27	46
16	「학습한다」는 것은 정확히 무슨 뜻인가	구름이	26/04/27	41
15	AI의 핵심 용어 30가지 한눈에	너구리	26/04/27	20
14	데이터·알고리즘·컴퓨팅 — AI 발전의 3대 동력	곰돌이	26/04/27	19
13	인공지능의 4가지 분류 — 사고와 행동, 인간성과 합리성	토순이	26/04/27	19
12	머신러닝과 인공지능과 딥러닝의 관계	다람쥐	26/04/27	21
11	ChatGPT 등장 — 2022년 11월의 충격	별님이	26/04/27	48

번호

제목

글쓴이

작성일

조회

교차 검증(cross-validation)

토순이

26/04/27

정규화(regularization) — L1·L2의 차이

토순이

26/04/27

과적합(overfitting)과 과소적합(underfitting)

다람쥐

26/04/27

학습률(learning rate)과 그 의미

별님이

26/04/27

경사하강법(gradient descent) 한 그림으로

곰돌이

26/04/27

손실함수가 무엇이고 왜 필요한가

햇살이

26/04/27

나이브 베이즈 분류기

토순이

26/04/27

K-평균 군집화(K-Means)

햇살이

26/04/27

K-최근접 이웃(KNN)

멍뭉이

26/04/27

서포트 벡터 머신(SVM)

토순이

26/04/27

랜덤 포레스트 — 트리의 군집 효과

멍뭉이

26/04/27

결정 트리(Decision Tree) 쉽게 이해하기

곰돌이

26/04/27

로지스틱 회귀 — 분류를 위한 회귀

부엉이

26/04/27

선형 회귀 — 가장 단순하지만 강력한 기법

부엉이

26/04/27

회귀(regression)와 분류(classification)

다람쥐

26/04/27

준지도학습과 자기지도학습

야옹이

26/04/27

강화학습 — 시행착오로 배우기

별님이

26/04/27

비지도학습 — 정답 없는 패턴 찾기

멍뭉이

26/04/27

지도학습 — 정답이 있는 학습

너구리

26/04/27

머신러닝과 통계의 차이

부엉이

26/04/27

「인공지능 효과」 — 풀린 문제는 왜 더 이상 AI가 아니라 불리는가

부엉이

26/04/27

파라미터(parameter)와 하이퍼파라미터의 차이

야옹이

26/04/27

추론(inference)과 학습(training)의 차이

토순이

26/04/27

알고리즘과 모델의 차이

곰돌이

26/04/27

「학습한다」는 것은 정확히 무슨 뜻인가

구름이

26/04/27

AI의 핵심 용어 30가지 한눈에

너구리

26/04/27

데이터·알고리즘·컴퓨팅 — AI 발전의 3대 동력

곰돌이

26/04/27

인공지능의 4가지 분류 — 사고와 행동, 인간성과 합리성

토순이

26/04/27

머신러닝과 인공지능과 딥러닝의 관계

다람쥐

26/04/27

ChatGPT 등장 — 2022년 11월의 충격

별님이

26/04/27