K-최근접 이웃(KNN)

멍뭉이 | 2026.04.27 02:58:16

조회 17 | 추천 0

K-최근접 이웃(KNN, K-Nearest Neighbors)은 「새 점이 들어오면 그것과 가장 가까운 K개의 학습 데이터 점을 찾고, 그들의 다수결(분류) 또는 평균(회귀)으로 답을 내는」 매우 단순한 알고리즘입니다.

예를 들어 K=5인 분류 문제에서 새 사진이 들어오면, 학습 데이터 중 그 사진과 가장 비슷한 5장을 찾아 그중 다수가 「고양이」면 「고양이」, 다수가 「개」면 「개」라고 답합니다.

매우 직관적이라 「게으른 학습(lazy learning)」으로도 불립니다 — 학습 단계에서 거의 아무 일도 안 하고, 추론 단계에서 모든 비교를 합니다.

비유하자면 KNN은 「새 친구를 사귀려 할 때 그 친구의 가장 가까운 친구들 5명이 누구인지 보고 그가 어떤 사람일지 짐작하는 것」과 비슷합니다.

「유유상종」이라는 인간 본성과 잘 맞는 발상입니다.

거리를 어떻게 잴 것인가가 핵심 결정 요소입니다.

보통 유클리드 거리(직선 거리)를 쓰지만 코사인 유사도, 맨해튼 거리 등 다양한 척도가 있습니다.

또 K를 너무 작게 잡으면 과적합(노이즈에 민감), 너무 크게 잡으면 과소적합(모든 답이 비슷해짐)이 옵니다.

보통 K는 5~50 사이에서 시작합니다.

KNN의 큰 약점은 「데이터가 많아질수록 추론이 느려진다」는 점입니다.

매번 모든 학습 데이터와 거리를 비교해야 하기 때문입니다.

이 한계를 줄이기 위해 KD-Tree·Ball-Tree, 그리고 최근의 ANN(Approximate Nearest Neighbors) 같은 빠른 검색 알고리즘이 함께 쓰입니다.

한 줄 요약

KNN은 새 점을 가장 가까운 K개의 학습 점들의 다수결로 분류하는 단순한 「게으른 학습」입니다.

직관적이지만 데이터가 많아지면 추론이 느려집니다.

더 알아볼 것

- 거리 척도 — 유클리드·코사인·맨해튼

- FAISS — Meta의 대규모 ANN 라이브러리

- KNN과 추천 시스템의 관계

아뢰옵기도 송구한 히미즈의 신이시여 — 스즈메의 문단속 [1]

장례식은 반드시 가야하는 이유.jpg [1]

목록보기

번호	제목	글쓴이	작성일	조회
40	교차 검증(cross-validation)	토순이	26/04/27	17
39	정규화(regularization) — L1·L2의 차이	토순이	26/04/27	34
38	과적합(overfitting)과 과소적합(underfitting)	다람쥐	26/04/27	22
37	학습률(learning rate)과 그 의미	별님이	26/04/27	20
36	경사하강법(gradient descent) 한 그림으로	곰돌이	26/04/27	42
35	손실함수가 무엇이고 왜 필요한가	햇살이	26/04/27	15
34	나이브 베이즈 분류기	토순이	26/04/27	21
33	K-평균 군집화(K-Means)	햇살이	26/04/27	50
32	K-최근접 이웃(KNN)	멍뭉이	26/04/27	17
31	서포트 벡터 머신(SVM)	토순이	26/04/27	19
30	랜덤 포레스트 — 트리의 군집 효과	멍뭉이	26/04/27	20
29	결정 트리(Decision Tree) 쉽게 이해하기	곰돌이	26/04/27	18
28	로지스틱 회귀 — 분류를 위한 회귀	부엉이	26/04/27	17
27	선형 회귀 — 가장 단순하지만 강력한 기법	부엉이	26/04/27	17
26	회귀(regression)와 분류(classification)	다람쥐	26/04/27	16
25	준지도학습과 자기지도학습	야옹이	26/04/27	17
24	강화학습 — 시행착오로 배우기	별님이	26/04/27	16
23	비지도학습 — 정답 없는 패턴 찾기	멍뭉이	26/04/27	23
22	지도학습 — 정답이 있는 학습	너구리	26/04/27	52
21	머신러닝과 통계의 차이	부엉이	26/04/27	19
20	「인공지능 효과」 — 풀린 문제는 왜 더 이상 AI가 아니라 불리는가	부엉이	26/04/27	22
19	파라미터(parameter)와 하이퍼파라미터의 차이	야옹이	26/04/27	17
18	추론(inference)과 학습(training)의 차이	토순이	26/04/27	67
17	알고리즘과 모델의 차이	곰돌이	26/04/27	46
16	「학습한다」는 것은 정확히 무슨 뜻인가	구름이	26/04/27	41
15	AI의 핵심 용어 30가지 한눈에	너구리	26/04/27	19
14	데이터·알고리즘·컴퓨팅 — AI 발전의 3대 동력	곰돌이	26/04/27	18
13	인공지능의 4가지 분류 — 사고와 행동, 인간성과 합리성	토순이	26/04/27	18
12	머신러닝과 인공지능과 딥러닝의 관계	다람쥐	26/04/27	20
11	ChatGPT 등장 — 2022년 11월의 충격	별님이	26/04/27	48

글쓰기

신고하기

신고 사유를 선택해 주세요.